[RFC,0/4] coroutine rwlock downgrade fix, minor VDI changes

Message ID	20210309102157.365356-1-david.edmondson@oracle.com (mailing list archive)
Headers	show Return-Path: <SRS0=D4wg=IH=nongnu.org=qemu-devel-bounces+qemu-devel=archiver.kernel.org@kernel.org> DMARC-Filter: OpenDMARC Filter v1.3.2 mail.kernel.org 47F3C652A4 From: David Edmondson <david.edmondson@oracle.com> To: qemu-devel@nongnu.org Subject: [RFC PATCH 0/4] coroutine rwlock downgrade fix, minor VDI changes Date: Tue, 9 Mar 2021 10:21:53 +0000 Message-Id: <20210309102157.365356-1-david.edmondson@oracle.com> Content-Transfer-Encoding: 8bit Content-Type: text/plain MIME-Version: 1.0 X-MS-Exchange-MessageSentRepresentingType: 1 Received-SPF: pass client-ip=156.151.31.85; envelope-from=david.edmondson@oracle.com; helo=userp2120.oracle.com X-Spam_score_int: -43 X-Spam_score: -4.4 X-Spam_bar: ---- X-Spam_report: (-4.4 / 5.0 requ) BAYES_00=-1.9, DKIM_SIGNED=0.1, DKIM_VALID=-0.1, DKIM_VALID_AU=-0.1, DKIM_VALID_EF=-0.1, MSGID_FROM_MTA_HEADER=0.001, RCVD_IN_DNSWL_MED=-2.3, RCVD_IN_MSPIKE_H2=-0.001, SPF_HELO_PASS=-0.001, SPF_PASS=-0.001, UNPARSEABLE_RELAY=0.001 autolearn=ham autolearn_force=no X-Spam_action: no action Precedence: list Cc: Kevin Wolf <kwolf@redhat.com>, qemu-block@nongnu.org, Stefan Weil <sw@weilnetz.de>, Max Reitz <mreitz@redhat.com>, David Edmondson <david.edmondson@oracle.com>, Stefan Hajnoczi <stefanha@redhat.com> Errors-To: qemu-devel-bounces+qemu-devel=archiver.kernel.org@nongnu.org Sender: "Qemu-devel" <qemu-devel-bounces+qemu-devel=archiver.kernel.org@nongnu.org>
Series	coroutine rwlock downgrade fix, minor VDI changes \| expand [RFC,0/4] coroutine rwlock downgrade fix, minor VDI changes [RFC,1/4] block/vdi: When writing new bmap entry fails, don't leak the buffer [RFC,2/4] block/vdi: Don't assume that blocks are larger than VdiHeader [RFC,3/4] coroutine/mutex: Store the coroutine in the CoWaitRecord only once [RFC,4/4] coroutine/rwlock: Wake writers in preference to readers

Message ID

20210309102157.365356-1-david.edmondson@oracle.com (mailing list archive)

Headers

DMARC-Filter: OpenDMARC Filter v1.3.2 mail.kernel.org 47F3C652A4
From: David Edmondson <david.edmondson@oracle.com>
To: qemu-devel@nongnu.org
Subject: [RFC PATCH 0/4] coroutine rwlock downgrade fix, minor VDI changes
Date: Tue,  9 Mar 2021 10:21:53 +0000
Message-Id: <20210309102157.365356-1-david.edmondson@oracle.com>
Content-Transfer-Encoding: 8bit
Content-Type: text/plain
MIME-Version: 1.0
X-MS-Exchange-MessageSentRepresentingType: 1
Received: from disaster-area.hh.sledj.net (2001:8b0:bb71:7140:64::1) by
 LNXP123CA0017.GBRP123.PROD.OUTLOOK.COM (2603:10a6:600:d2::29) with Microsoft
 SMTP Server (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id
 15.20.3912.26 via Frontend Transport; Tue, 9 Mar 2021 10:22:01 +0000
Received: from localhost (disaster-area.hh.sledj.net [local])	by
 disaster-area.hh.sledj.net (OpenSMTPD) with ESMTPA id 4264daef;
 Tue, 9 Mar 2021 10:21:57 +0000 (UTC)
X-MS-PublicTrafficType: Email
X-MS-Office365-Filtering-Correlation-Id: e42418d4-bdb4-4c0e-4f83-08d8e2e52e74
X-MS-TrafficTypeDiagnostic: DS7PR10MB5184:
X-MS-Exchange-Transport-Forked: True
X-Microsoft-Antispam-PRVS: 
 <DS7PR10MB5184CABB847796E1C4D8BC7888929@DS7PR10MB5184.namprd10.prod.outlook.com>
X-MS-Oob-TLC-OOBClassifiers: OLM:8273;
X-MS-Exchange-SenderADCheck: 1
X-Microsoft-Antispam: BCL:0;
X-Microsoft-Antispam-Message-Info: 
 JF+wIB1nMKHcXno67r9zG931Jv6Y+/YXUM2GSECs2nUD2QqRWwSz0EO/G31eUIPjUfHGofuZRF2alI4DBQfd8uODxT7eldo30xHTnuDX4bOiRNxu6cZmlBFZG1pP9RkrlbdcG+EMQO1z1p3hR2/D3jaKbGsdgGcQA1TszkaL37sT6GJW/Bm5XzaG65Zww5yoLLuc/hATbBngwNoW7gg8rAlLK4TRtvFRqLxgAYdSaxTWqbh1Vu7PjwRlD4J+hILJGdFbBUlsmY+6V2acAsnMxzYFqlN6ySnX5h3FCBL0rn1ihOnzTl6/C3rLkBjD72gUfR058CY6c2+kGiUAIVetkk5U3mW63MB90EjZyORr+38BL/RI/uZd9aR+EMtKiiE/6gtTzyfothpK1c5hrNgM3JGQgCtMmL5Th9sdysVzYvgHd467rp+cTntnrZVJczk6mgA8JWAtbjCrie1AOuIGW+y339xDQeW63i5WoqMn5Tft1KRI4g3kZOvg9MokSw7NqQr7uHIq/zG5W/1yn9fbLQ==
X-Forefront-Antispam-Report: CIP:255.255.255.255; CTRY:; LANG:en; SCL:1; SRV:;
 IPV:NLI; SFV:NSPM; H:DM6PR10MB3148.namprd10.prod.outlook.com; PTR:; CAT:NONE;
 SFS:(376002)(396003)(39860400002)(346002)(366004)(136003)(2616005)(66946007)(6666004)(478600001)(107886003)(86362001)(1076003)(6916009)(66556008)(54906003)(66476007)(8936002)(8676002)(186003)(5660300002)(316002)(44832011)(52116002)(2906002)(4326008)(83380400001)(36756003);
 DIR:OUT; SFP:1101;
X-MS-Exchange-AntiSpam-MessageData: 
 TwZjKrzSmBJXGjKS/7C29s5nGpXXImdD4vNLjU8a1+8s09ZfYKCSr2IzWdXOMq45DIKgTxPy+iT5nyU7JHAf+D8Gbc+/+xDItbNVo4JvKX2duRMdfN6+gIdKt8vUwAziCukkZQbElRAKVSlFhKJkMk56RQgYVk7LZAsk8hrU0LxZq21/ww88kJCX99fRVxpW8n3frzx6Itlsa4bguJn3Ukuagq6gtVGKTUDrJ7b9mhPYqGyt00yL94MhRzneFGT+T9WJmGxcxGIIHFtuRBxpoq61hudsF1KTJOK2guQSxWuLl0l9jWAvVxYUIoj5n9c1Uc7eXingwb8z83latp7Hm5yL2mJZLNGHf1/RnASYGvc1TO6aR0FkhJPmuAmgR0G8aiNcc3Ni1wPR7zij1ZJxs/UBoYo7z3YKZta8nqgFY48iZBZ1UeZA4URKf0ieUhALlbMTQ099OurNPfFpb3UwzPp7dCxzDqw0++7qs5dg5A41MHAF8XyRxr3WILAjvlatQ6Ln3iofZW0LJXAlfsa3iwYGC+qKFmt4Cfa8J2XFC96Uo4sbTGpDsvDhj6BWRwlyE1bYX0md+3oCMIJdd8rqfhDwgxgz+gAKWjDi7UVK9uADHuscifQPWVmQEeexDHjjB2CWwh2RB4IlPRUItwav/OVlZHLDr97wkh++zBIVLGJrM1an9LIHXUyzLtDrvTVbLUbRH/LaC/dMGmgPLThTGNhT5OwekMdHxQwndLDQUPudlBmwcfpPhU4QU3G3+Gm4cRoers9Iq8g5RMzOP1SCLPqhzJvzkrEQm37uwljFFNlG5llm6oWBf+vd6tFE7qmMXzBRQTTg2GZgpea9PVmcqfENNcVKpPy89+18IqtIJjBFHNxbcsFFwjUNPUWY/gMSEobpmhf6U8omgIi0vLy/+E72hHHcgS35Lppzy+R1iCz4dxJR3m968IRy5ErzWi0axnKZnLPMuahnH47TuQcrboWbb/SXsPME3INcXyMrDrZBDGKibAbN9BoGe3T1b6503G/eVmqMxsJ7GbcPyeu6HGNo/gmgcddTgjsjNB7csQJorEuz63cJyjG1Zm5QhSG5cr9MITGEVZyBNqLcgV5b22OvEmbQsEtEooJmF6zbbPDtEHHtBvkOIMiDya4pnKjei7zGa3qHHB4tIhWKQeRo4xITQKoEF4VEes4AEPoIuX2Lkdu6wkIHQf+gC0y29P5TAxT3RfN9avTQsyAz+J19d0LKTwY7A9KQgsz3JSkb4wWgzL2TfUkFlBHHRWDvVTNKnrwSHQx9DY9ye+ifNVHeI9qOIwPw4LI4rALAnK6JeybbCMJyy8UhRm8lYiA5BGHexN33vtf1vJ38XSUbZ2nz0A==
X-OriginatorOrg: oracle.com
X-MS-Exchange-CrossTenant-Network-Message-Id: 
 e42418d4-bdb4-4c0e-4f83-08d8e2e52e74
X-MS-Exchange-CrossTenant-AuthSource: DM6PR10MB3148.namprd10.prod.outlook.com
X-MS-Exchange-CrossTenant-AuthAs: Internal
X-MS-Exchange-CrossTenant-OriginalArrivalTime: 09 Mar 2021 10:22:03.0776 (UTC)
X-MS-Exchange-CrossTenant-FromEntityHeader: Hosted
X-MS-Exchange-CrossTenant-Id: 4e2c6054-71cb-48f1-bd6c-3a9705aca71b
X-MS-Exchange-CrossTenant-MailboxType: HOSTED
X-MS-Exchange-CrossTenant-UserPrincipalName: 
 G78BIzBgx/WJ+3WWa1HYXOnnjCc+2nklBiukHbf5asDqwXC5hwHwuFV22wx67owiiO3oGGrsA8lXCF88uBPGBArXz+xsAqZ2x3TFGJEgveA=
X-MS-Exchange-Transport-CrossTenantHeadersStamped: DS7PR10MB5184
X-Proofpoint-Virus-Version: vendor=nai engine=6200 definitions=9917
 signatures=668683
X-Proofpoint-Spam-Details: rule=notspam policy=default score=0 mlxscore=0
 bulkscore=0 malwarescore=0
 spamscore=0 mlxlogscore=999 phishscore=0 adultscore=0 suspectscore=0
 classifier=spam adjust=0 reason=mlx scancount=1 engine=8.12.0-2009150000
 definitions=main-2103090049
X-Proofpoint-Virus-Version: vendor=nai engine=6200 definitions=9917
 signatures=668683
X-Proofpoint-Spam-Details: rule=notspam policy=default score=0 spamscore=0
 suspectscore=0
 clxscore=1011 phishscore=0 adultscore=0 mlxlogscore=999 priorityscore=1501
 lowpriorityscore=0 bulkscore=0 mlxscore=0 impostorscore=0 malwarescore=0
 classifier=spam adjust=0 reason=mlx scancount=1 engine=8.12.0-2009150000
 definitions=main-2103090049
Received-SPF: pass client-ip=156.151.31.85;
 envelope-from=david.edmondson@oracle.com; helo=userp2120.oracle.com
X-Spam_score_int: -43
X-Spam_score: -4.4
X-Spam_bar: ----
X-Spam_report: (-4.4 / 5.0 requ) BAYES_00=-1.9, DKIM_SIGNED=0.1,
 DKIM_VALID=-0.1, DKIM_VALID_AU=-0.1, DKIM_VALID_EF=-0.1,
 MSGID_FROM_MTA_HEADER=0.001, RCVD_IN_DNSWL_MED=-2.3,
 RCVD_IN_MSPIKE_H2=-0.001,
 SPF_HELO_PASS=-0.001, SPF_PASS=-0.001,
 UNPARSEABLE_RELAY=0.001 autolearn=ham autolearn_force=no
X-Spam_action: no action
X-BeenThere: qemu-devel@nongnu.org
X-Mailman-Version: 2.1.23
Precedence: list
List-Id: <qemu-devel.nongnu.org>
List-Unsubscribe: <https://lists.nongnu.org/mailman/options/qemu-devel>,
 <mailto:qemu-devel-request@nongnu.org?subject=unsubscribe>
List-Archive: <https://lists.nongnu.org/archive/html/qemu-devel>
List-Post: <mailto:qemu-devel@nongnu.org>
List-Help: <mailto:qemu-devel-request@nongnu.org?subject=help>
List-Subscribe: <https://lists.nongnu.org/mailman/listinfo/qemu-devel>,
 <mailto:qemu-devel-request@nongnu.org?subject=subscribe>
Cc: Kevin Wolf <kwolf@redhat.com>, qemu-block@nongnu.org,
 Stefan Weil <sw@weilnetz.de>, Max Reitz <mreitz@redhat.com>,
 David Edmondson <david.edmondson@oracle.com>,
 Stefan Hajnoczi <stefanha@redhat.com>
Errors-To: qemu-devel-bounces+qemu-devel=archiver.kernel.org@nongnu.org
Sender: "Qemu-devel"
 <qemu-devel-bounces+qemu-devel=archiver.kernel.org@nongnu.org>

Series

coroutine rwlock downgrade fix, minor VDI changes | expand

Message

David Edmondson March 9, 2021, 10:21 a.m. UTC

RFC because changing the coroutine code is scary and I'm new to it.

Stressing the VDI code with qemu-img:

  qemu-img convert -p -W -m 16 -O vdi input.qcow2 output.vdi

leads to a hang relatively quickly on a machine with sufficient
CPUs. A similar test targetting either raw or qcow2 formats, or
avoiding out-of-order writes, completes fine.

At the point of the hang all of the coroutines are sitting in
qemu_co_queue_wait_impl(), called from either qemu_co_rwlock_rdlock()
or qemu_co_rwlock_upgrade(), all referencing the same CoRwlock
(BDRVVdiState.bmap_lock).

The comment in the last patch explains what I believe is happening -
downgrading an rwlock from write to read can later result in a failure
to schedule an appropriate coroutine when the read lock is released.

A less invasive change might be to simply have the read side of the
unlock code mark *all* queued coroutines as runnable. This seems
somewhat wasteful, as any read hopefuls that run before a write
hopeful will immediately put themselves back on the queue.

No code other than block/vdi.c appears to use
qemu_co_rwlock_downgrade().

The block/vdi.c changes are small things noticed by inspection when
looking for the cause of the hang.

David Edmondson (4):
  block/vdi: When writing new bmap entry fails, don't leak the buffer
  block/vdi: Don't assume that blocks are larger than VdiHeader
  coroutine/mutex: Store the coroutine in the CoWaitRecord only once
  coroutine/rwlock: Wake writers in preference to readers

 block/vdi.c                | 11 +++++++----
 include/qemu/coroutine.h   |  8 +++++---
 util/qemu-coroutine-lock.c | 25 +++++++++++++++----------
 3 files changed, 27 insertions(+), 17 deletions(-)