[RFC,138/162] drm/i915/dg1: Eliminate eviction mutex

Message ID	20201127120718.454037-139-matthew.auld@intel.com (mailing list archive)
State	New, archived
Headers	show Return-Path: <SRS0=wCRU=FB=lists.freedesktop.org=dri-devel-bounces@kernel.org> DMARC-Filter: OpenDMARC Filter v1.3.2 mail.kernel.org 2322C208D5 IronPort-SDR: RzVG0nduLImn9nH6jN8HBx4J9ki97OQ4ALpGCyoTCla13LJ9m/0IKuVmZs3P4x4wfIcO92RP6r 1uK7ZFmN/6sw== IronPort-SDR: xg4QABFf/BaxphTdJHe3rCkMjsCdjBmNaoItE1GKdCfzBA6iAlz/Bke1SvRDblGpDX86JcBSlj coVWIKDEwh7A== From: Matthew Auld <matthew.auld@intel.com> To: intel-gfx@lists.freedesktop.org Subject: [RFC PATCH 138/162] drm/i915/dg1: Eliminate eviction mutex Date: Fri, 27 Nov 2020 12:06:54 +0000 Message-Id: <20201127120718.454037-139-matthew.auld@intel.com> In-Reply-To: <20201127120718.454037-1-matthew.auld@intel.com> References: <20201127120718.454037-1-matthew.auld@intel.com> MIME-Version: 1.0 Precedence: list Cc: dri-devel@lists.freedesktop.org, Tvrtko Ursulin <tvrtko.ursulin@intel.com> Content-Type: text/plain; charset="us-ascii" Content-Transfer-Encoding: 7bit Errors-To: dri-devel-bounces@lists.freedesktop.org Sender: "dri-devel" <dri-devel-bounces@lists.freedesktop.org>
Series	DG1 + LMEM enabling \| expand [RFC,000/162] DG1 + LMEM enabling [RFC,001/162] drm/i915/selftest: also consider non-contiguous objects [RFC,002/162] drm/i915/selftest: assert we get 2M GTT pages [RFC,003/162] drm/i915/selftest: handle local-memory in perf_memcpy [RFC,004/162] drm/i915/gt: Move move context layout registers and offsets to lrc_reg.h [RFC,005/162] drm/i915/gt: Rename lrc.c to execlists_submission.c [RFC,006/162] drm/i915: split gen8+ flush and bb_start emission functions to their own file [RFC,007/162] drm/i915: split wa_bb code to its own file [RFC,008/162] HAX drm/i915: Work around the selftest timeline lock splat workaround [RFC,009/162] drm/i915: Introduce drm_i915_lock_isolated [RFC,010/162] drm/i915: Lock hwsp objects isolated for pinning at create time [RFC,011/162] drm/i915: Pin timeline map after first timeline pin, v5. [RFC,012/162] drm/i915: Move cmd parser pinning to execbuffer [RFC,013/162] drm/i915: Add missing -EDEADLK handling to execbuf pinning, v2. [RFC,014/162] drm/i915: Ensure we hold the object mutex in pin correctly v2 [RFC,015/162] drm/i915: Add gem object locking to madvise. [RFC,016/162] drm/i915: Move HAS_STRUCT_PAGE to obj->flags [RFC,017/162] drm/i915: Rework struct phys attachment handling [RFC,018/162] drm/i915: Convert i915_gem_object_attach_phys() to ww locking, v2. [RFC,019/162] drm/i915: make lockdep slightly happier about execbuf. [RFC,020/162] drm/i915: Disable userptr pread/pwrite support. [RFC,021/162] drm/i915: No longer allow exporting userptr through dma-buf [RFC,022/162] drm/i915: Reject more ioctls for userptr [RFC,023/162] drm/i915: Reject UNSYNCHRONIZED for userptr, v2. [RFC,024/162] drm/i915: Make compilation of userptr code depend on MMU_NOTIFIER. [RFC,025/162] drm/i915: Fix userptr so we do not have to worry about obj->mm.lock, v5. [RFC,026/162] drm/i915: Flatten obj->mm.lock [RFC,027/162] drm/i915: Populate logical context during first pin. [RFC,028/162] drm/i915: Make ring submission compatible with obj->mm.lock removal, v2. [RFC,029/162] drm/i915: Handle ww locking in init_status_page [RFC,030/162] drm/i915: Rework clflush to work correctly without obj->mm.lock. [RFC,031/162] drm/i915: Pass ww ctx to intel_pin_to_display_plane [RFC,032/162] drm/i915: Add object locking to vm_fault_cpu [RFC,033/162] drm/i915: Move pinning to inside engine_wa_list_verify() [RFC,034/162] drm/i915: Take reservation lock around i915_vma_pin. [RFC,035/162] drm/i915: Make intel_init_workaround_bb more compatible with ww locking. [RFC,036/162] drm/i915: Make __engine_unpark() compatible with ww locking v2 [RFC,037/162] drm/i915: Take obj lock around set_domain ioctl [RFC,038/162] drm/i915: Defer pin calls in buffer pool until first use by caller. [RFC,039/162] drm/i915: Fix pread/pwrite to work with new locking rules. [RFC,040/162] drm/i915: Fix workarounds selftest, part 1 [RFC,041/162] drm/i915: Prepare for obj->mm.lock removal [RFC,042/162] drm/i915: Add igt_spinner_pin() to allow for ww locking around spinner. [RFC,043/162] drm/i915: Add ww locking around vm_access() [RFC,044/162] drm/i915: Increase ww locking for perf. [RFC,045/162] drm/i915: Lock ww in ucode objects correctly [RFC,046/162] drm/i915: Add ww locking to dma-buf ops. [RFC,047/162] drm/i915: Add missing ww lock in intel_dsb_prepare. [RFC,048/162] drm/i915: Fix ww locking in shmem_create_from_object [RFC,049/162] drm/i915: Use a single page table lock for each gtt. [RFC,050/162] drm/i915/selftests: Prepare huge_pages testcases for obj->mm.lock removal. [RFC,051/162] drm/i915/selftests: Prepare client blit for obj->mm.lock removal. [RFC,052/162] drm/i915/selftests: Prepare coherency tests for obj->mm.lock removal. [RFC,053/162] drm/i915/selftests: Prepare context tests for obj->mm.lock removal. [RFC,054/162] drm/i915/selftests: Prepare dma-buf tests for obj->mm.lock removal. [RFC,055/162] drm/i915/selftests: Prepare execbuf tests for obj->mm.lock removal. [RFC,056/162] drm/i915/selftests: Prepare mman testcases for obj->mm.lock removal. [RFC,057/162] drm/i915/selftests: Prepare object tests for obj->mm.lock removal. [RFC,058/162] drm/i915/selftests: Prepare object blit tests for obj->mm.lock removal. [RFC,059/162] drm/i915/selftests: Prepare igt_gem_utils for obj->mm.lock removal [RFC,060/162] drm/i915/selftests: Prepare context selftest for obj->mm.lock removal [RFC,061/162] drm/i915/selftests: Prepare hangcheck for obj->mm.lock removal [RFC,062/162] drm/i915/selftests: Prepare execlists for obj->mm.lock removal [RFC,063/162] drm/i915/selftests: Prepare mocs tests for obj->mm.lock removal [RFC,064/162] drm/i915/selftests: Prepare ring submission for obj->mm.lock removal [RFC,065/162] drm/i915/selftests: Prepare timeline tests for obj->mm.lock removal [RFC,066/162] drm/i915/selftests: Prepare i915_request tests for obj->mm.lock removal [RFC,067/162] drm/i915/selftests: Prepare memory region tests for obj->mm.lock removal [RFC,068/162] drm/i915/selftests: Prepare cs engine tests for obj->mm.lock removal [RFC,069/162] drm/i915/selftests: Prepare gtt tests for obj->mm.lock removal [RFC,070/162] drm/i915: Finally remove obj->mm.lock. [RFC,071/162] drm/i915: Keep userpointer bindings if seqcount is unchanged, v2. [RFC,072/162] drm/i915: Avoid some false positives in assert_object_held() [RFC,073/162] drm/i915: Reference contending lock objects [RFC,074/162] drm/i915: Break out dma_resv ww locking utilities to separate files [RFC,075/162] drm/i915: Introduce a for_i915_gem_ww(){} [RFC,076/162] drm/i915: Untangle the vma pages_mutex [RFC,077/162] drm/i915/fbdev: Use lmem physical addresses for fb_mmap() on discrete [RFC,078/162] drm/i915: Return error value when bo not in LMEM for discrete [RFC,079/162] drm/i915/dmabuf: Disallow LMEM objects from dma-buf [RFC,080/162] drm/i915/lmem: Fail driver init if LMEM training failed [RFC,081/162] HAX drm/i915/lmem: support CPU relocations [RFC,082/162] HAX drm/i915/lmem: support pread and pwrite [RFC,083/162] drm/i915: Update the helper to set correct mapping [RFC,084/162] drm/i915: introduce kernel blitter_context [RFC,085/162] drm/i915/region: support basic eviction [RFC,086/162] drm/i915: Add blit functions that can be called from within a WW transaction [RFC,087/162] drm/i915: Delay publishing objects on the eviction lists [RFC,088/162] drm/i915: support basic object migration [RFC,089/162] drm/i915/dg1: Fix occasional migration error [RFC,090/162] drm/i915/query: Expose memory regions through the query uAPI [RFC,091/162] drm/i915: Store gt in memory region [RFC,092/162] drm/i915/uapi: introduce drm_i915_gem_create_ext [RFC,093/162] drm/i915/lmem: allocate cmd ring in lmem [RFC,094/162] drm/i915/dg1: Do not check r->sgt.pfn for NULL [RFC,095/162] drm/i915/dg1: Introduce dmabuf mmap to LMEM [RFC,096/162] drm/i915: setup the LMEM region [RFC,097/162] drm/i915: Distinction of memory regions [RFC,098/162] drm/i915/gtt: map the PD up front [RFC,099/162] drm/i915/gtt/dgfx: place the PD in LMEM [RFC,100/162] drm/i915/gtt: make flushing conditional [RFC,101/162] drm/i915/gtt/dg1: add PTE_LM plumbing for PPGTT [RFC,102/162] drm/i915/gtt/dg1: add PTE_LM plumbing for GGTT [RFC,103/162] drm/i915: allocate context from LMEM [RFC,104/162] drm/i915: move engine scratch to LMEM [RFC,105/162] drm/i915: Provide a way to disable PCIe relaxed write ordering [RFC,106/162] drm/i915: i915 returns -EBUSY on thread contention [RFC,107/162] drm/i915: setup GPU device lmem region [RFC,108/162] drm/i915: Fix object page offset within a region [RFC,109/162] drm/i915: add i915_gem_object_is_devmem() function [RFC,110/162] drm/i915: finish memory region support for stolen objects. [RFC,111/162] drm/i915/lmem: support optional CPU clearing for special internal use [RFC,112/162] drm/i915/guc: put all guc objects in lmem when available [RFC,113/162] drm/i915: Create stolen memory region from local memory [RFC,114/162] drm/i915/lmem: Bypass aperture when lmem is available [RFC,115/162] drm/i915/lmem: reset the lmem buffer created by fbdev [RFC,116/162] drm/i915/dsb: Enable lmem for dsb [RFC,117/162] drm/i915: Reintroduce mem->reserved [RFC,118/162] drm/i915/dg1: Reserve first 1MB of local memory [RFC,119/162] drm/i915/dg1: Read OPROM via SPI controller [RFC,120/162] drm/i915/oprom: Basic sanitization [RFC,121/162] drm/i915: WA for zero memory channel [RFC,122/162] drm/i915/dg1: Compute MEM Bandwidth using MCHBAR [RFC,123/162] drm/i915/dg1: Double memory bandwidth available [RFC,124/162] drm/i915/lmem: allocate HWSP in lmem [RFC,125/162] drm/i915/lmem: Limit block size to 4G [RFC,126/162] drm/i915/gem: Update shmem available memory [RFC,127/162] drm/i915: Allow non-uniform subslices in gen12+ [RFC,128/162] drm/i915/dg1: intel_memory_region_evict() changes for eviction [RFC,129/162] drm/i915/dg1: i915_gem_object_memcpy(..) infrastructure [RFC,130/162] drm/i915/dg1: Eviction logic [RFC,131/162] drm/i915/dg1: Add enable_eviction modparam [RFC,132/162] drm/i915/dg1: Add lmem_size modparam [RFC,133/162] drm/i915/dg1: Track swap in/out stats via debugfs [RFC,134/162] drm/i915/dg1: Measure swap in/out timing stats [RFC,135/162] drm/i915: define intel_partial_pages_for_sg_table [RFC,136/162] drm/i915: create and destroy dummy vma [RFC,137/162] drm/i915: blt copy between objs using pre-created vma windows [RFC,138/162] drm/i915/dg1: Eliminate eviction mutex [RFC,139/162] drm/i915/dg1: Keep engine awake across whole blit [RFC,140/162] drm/i915: window_blt_copy is used for swapin and swapout [RFC,141/162] drm/i915: Lmem eviction statistics by category [RFC,142/162] drm/i915/gem/selftest: test and measure window based blt cpy [RFC,143/162] drm/i915: suspend/resume eviction [RFC,144/162] drm/i915: Reset blitter context when unpark engine [RFC,145/162] drm/i915/dg1: Add dedicated context for blitter eviction [RFC,146/162] drm/i915/pm: suspend and restore ppgtt mapping [RFC,147/162] drm/i915/gt: Allocate default ctx objects in SMEM [RFC,148/162] drm/i915: suspend/resume enable blitter eviction [RFC,149/162] drm/i915: suspend/resume handling of perma-pinned objects [RFC,150/162] drm/i915: need consider system BO snoop for dgfx [RFC,151/162] drm/i915: move eviction to prepare hook [RFC,152/162] drm/i915: Perform execbuffer object locking as a separate step [RFC,153/162] drm/i915: Implement eviction locking v2 [RFC,154/162] drm/i915: Support ww eviction [RFC,155/162] drm/i915: Use a ww transaction in the fault handler [RFC,156/162] drm/i915: Use a ww transaction in i915_gem_object_pin_map_unlocked() [RFC,157/162] drm/i915: Improve accuracy of eviction stats [RFC,158/162] drm/i915: Support ww locks in suspend/resume [RFC,159/162] drm/i915/dg1: Fix mapping type for default state object [RFC,160/162] drm/i915/dg1: Fix GPU hang due to shmemfs page drop [RFC,161/162] drm/i915/dg1: allow pci to auto probe [RFC,162/162] drm/i915: drop fake lmem

Message ID

20201127120718.454037-139-matthew.auld@intel.com (mailing list archive)

State

New, archived

Headers

DMARC-Filter: OpenDMARC Filter v1.3.2 mail.kernel.org 2322C208D5
IronPort-SDR: 
 RzVG0nduLImn9nH6jN8HBx4J9ki97OQ4ALpGCyoTCla13LJ9m/0IKuVmZs3P4x4wfIcO92RP6r
 1uK7ZFmN/6sw==
IronPort-SDR: 
 xg4QABFf/BaxphTdJHe3rCkMjsCdjBmNaoItE1GKdCfzBA6iAlz/Bke1SvRDblGpDX86JcBSlj
 coVWIKDEwh7A==
From: Matthew Auld <matthew.auld@intel.com>
To: intel-gfx@lists.freedesktop.org
Subject: [RFC PATCH 138/162] drm/i915/dg1: Eliminate eviction mutex
Date: Fri, 27 Nov 2020 12:06:54 +0000
Message-Id: <20201127120718.454037-139-matthew.auld@intel.com>
In-Reply-To: <20201127120718.454037-1-matthew.auld@intel.com>
References: <20201127120718.454037-1-matthew.auld@intel.com>
MIME-Version: 1.0
Precedence: list
Cc: dri-devel@lists.freedesktop.org, Tvrtko Ursulin <tvrtko.ursulin@intel.com>
Content-Type: text/plain; charset="us-ascii"
Content-Transfer-Encoding: 7bit
Errors-To: dri-devel-bounces@lists.freedesktop.org
Sender: "dri-devel" <dri-devel-bounces@lists.freedesktop.org>

Series

DG1 + LMEM enabling | expand

Commit Message

Matthew Auld Nov. 27, 2020, 12:06 p.m. UTC

From: Tvrtko Ursulin <tvrtko.ursulin@intel.com>

We can eliminate the current evict window mutex, held over the whole
eviction process, and replace it with a wait queue which takes over the
role of co-ordinating access to pre-configured window copy vmas.

Apart from the global lock not being held over whole of the copy,
additional benefit is that, since we have two pairs of copy windows, two
evict operations can now progress independently. (One swap-in plus one
swap-out.)

Also consolidate some of the eviction code into helper functions for
readability and fix cleanup if emit_init_breadcrumb fails.

Signed-off-by: Tvrtko Ursulin <tvrtko.ursulin@intel.com>
---
 drivers/gpu/drm/i915/gem/i915_gem_object.c | 144 ++++++++++++---------
 drivers/gpu/drm/i915/i915_drv.h            |   2 +-
 2 files changed, 85 insertions(+), 61 deletions(-)

diff --git a/drivers/gpu/drm/i915/gem/i915_gem_object.c b/drivers/gpu/drm/i915/gem/i915_gem_object.c
index 3943a184fbe3..34bbefa6d67f 100644
--- a/drivers/gpu/drm/i915/gem/i915_gem_object.c
+++ b/drivers/gpu/drm/i915/gem/i915_gem_object.c
@@ -856,7 +856,8 @@  int i915_setup_blt_windows(struct drm_i915_private *i915)
 		return 0;
 	}
 
-	mutex_init(&i915->mm.window_mutex);
+	init_waitqueue_head(&i915->mm.window_queue);
+
 	for (i = 0; i < ARRAY_SIZE(lmem); i++) {
 		lmem[i] = i915_window_vma_init(i915, lmem_region);
 		if (IS_ERR_OR_NULL(lmem[i])) {
@@ -904,7 +905,6 @@  void i915_teardown_blt_windows(struct drm_i915_private *i915)
 			continue;
 		i915_window_vma_teardown(i915->mm.smem_window[i]);
 	}
-	mutex_destroy(&i915->mm.window_mutex);
 }
 
 static int i915_window_blt_copy_prepare_obj(struct drm_i915_gem_object *obj)
@@ -950,6 +950,36 @@  i915_window_blt_copy_batch_prepare(struct i915_request *rq,
 	return 0;
 }
 
+static void prepare_vma(struct i915_vma *vma,
+			struct drm_i915_gem_object *obj,
+			u32 offset,
+			u32 chunk,
+			bool is_lmem)
+{
+	struct scatterlist *sgl;
+	u32 size;
+
+	/*
+	 * Source obj size could be smaller than the dst obj size,
+	 * due to the varying min_page_size of the mem regions the
+	 * obj belongs to. But when we insert the pages into vm,
+	 * the total size of the pages supposed to be multiples of
+	 * the min page size of that mem region.
+	 */
+	size = ALIGN(chunk, obj->mm.region->min_page_size) >> PAGE_SHIFT;
+	intel_partial_pages_for_sg_table(obj, vma->pages, offset, size, &sgl);
+
+	/*
+	 * Insert pages into vm, expects the pages to the full
+	 * length of VMA. But we may have the pages of <= vma_size.
+	 * Hence altering the vma size to match the total size of
+	 * the pages attached.
+	 */
+	vma->size = size << PAGE_SHIFT;
+	i915_insert_vma_pages(vma, is_lmem);
+	sg_unmark_end(sgl);
+}
+
 int i915_window_blt_copy(struct drm_i915_gem_object *dst,
 			 struct drm_i915_gem_object *src)
 {
@@ -957,24 +987,10 @@  int i915_window_blt_copy(struct drm_i915_gem_object *dst,
 	struct intel_context *ce = i915->gt.engine[BCS0]->blitter_context;
 	bool src_is_lmem = i915_gem_object_is_lmem(src);
 	bool dst_is_lmem = i915_gem_object_is_lmem(dst);
-	struct scatterlist *last_sgl;
-	struct i915_vma *src_vma, *dst_vma;
-	struct i915_request *rq;
-	u64 cur_win_sz, blt_copied, offset;
-	long timeout;
-	u32 size;
+	u64 remain = src->base.size, offset = 0;
+	struct i915_vma *src_vma, *dst_vma, **ps, **pd;
 	int err;
 
-	src_vma = src_is_lmem ? i915->mm.lmem_window[0] :
-				i915->mm.smem_window[0];
-	dst_vma = dst_is_lmem ? i915->mm.lmem_window[1] :
-				i915->mm.smem_window[1];
-
-	if (!src_vma || !dst_vma)
-		return -ENODEV;
-
-	blt_copied = 0;
-
 	err = i915_window_blt_copy_prepare_obj(src);
 	if (err)
 		return err;
@@ -985,43 +1001,42 @@  int i915_window_blt_copy(struct drm_i915_gem_object *dst,
 		return err;
 	}
 
-	mutex_lock(&i915->mm.window_mutex);
+	ps = src_is_lmem ? &i915->mm.lmem_window[0] :
+			   &i915->mm.smem_window[0];
+	pd = dst_is_lmem ? &i915->mm.lmem_window[1] :
+			   &i915->mm.smem_window[1];
+
+	spin_lock(&i915->mm.window_queue.lock);
+
+	err = wait_event_interruptible_locked(i915->mm.window_queue,
+					      *ps && *pd);
+	if (err) {
+		spin_unlock(&i915->mm.window_queue.lock);
+		i915_gem_object_unpin_pages(src);
+		i915_gem_object_unpin_pages(dst);
+		return err;
+	}
+
+	src_vma = *ps;
+	dst_vma = *pd;
+
 	src_vma->obj = src;
 	dst_vma->obj = dst;
-	do {
-		cur_win_sz = min_t(u64, BLT_WINDOW_SZ,
-				   (src->base.size - blt_copied));
-		offset = blt_copied >> PAGE_SHIFT;
-		size = ALIGN(cur_win_sz, src->mm.region->min_page_size) >>
-		       PAGE_SHIFT;
-		intel_partial_pages_for_sg_table(src, src_vma->pages, offset,
-						 size, &last_sgl);
 
-		/*
-		 * Insert pages into vm, expects the pages to the full
-		 * length of VMA. But we may have the pages of <= vma_size.
-		 * Hence altering the vma size to match the total size of
-		 * the pages attached.
-		 */
-		src_vma->size = size << PAGE_SHIFT;
-		i915_insert_vma_pages(src_vma, src_is_lmem);
-		sg_unmark_end(last_sgl);
+	*ps = NULL;
+	*pd = NULL;
 
-		/*
-		 * Source obj size could be smaller than the dst obj size,
-		 * due to the varying min_page_size of the mem regions the
-		 * obj belongs to. But when we insert the pages into vm,
-		 * the total size of the pages supposed to be multiples of
-		 * the min page size of that mem region.
-		 */
-		size = ALIGN(cur_win_sz, dst->mm.region->min_page_size) >>
-		       PAGE_SHIFT;
-		intel_partial_pages_for_sg_table(dst, dst_vma->pages, offset,
-						 size, &last_sgl);
+	spin_unlock(&i915->mm.window_queue.lock);
+
+	do {
+		struct i915_request *rq;
+		long timeout;
+		u32 chunk;
 
-		dst_vma->size = size << PAGE_SHIFT;
-		i915_insert_vma_pages(dst_vma, dst_is_lmem);
-		sg_unmark_end(last_sgl);
+		chunk = min_t(u64, BLT_WINDOW_SZ, remain);
+
+		prepare_vma(src_vma, src, offset, chunk, src_is_lmem);
+		prepare_vma(dst_vma, dst, offset, chunk, dst_is_lmem);
 
 		rq = i915_request_create(ce);
 		if (IS_ERR(rq)) {
@@ -1032,11 +1047,14 @@  int i915_window_blt_copy(struct drm_i915_gem_object *dst,
 			err = rq->engine->emit_init_breadcrumb(rq);
 			if (unlikely(err)) {
 				DRM_ERROR("init_breadcrumb failed. %d\n", err);
+				i915_request_set_error_once(rq, err);
+				__i915_request_skip(rq);
+				i915_request_add(rq);
 				break;
 			}
 		}
 		err = i915_window_blt_copy_batch_prepare(rq, src_vma, dst_vma,
-							 cur_win_sz);
+							 chunk);
 		if (err) {
 			DRM_ERROR("Batch preparation failed. %d\n", err);
 			i915_request_set_error_once(rq, -EIO);
@@ -1045,26 +1063,32 @@  int i915_window_blt_copy(struct drm_i915_gem_object *dst,
 		i915_request_get(rq);
 		i915_request_add(rq);
 
-		timeout = i915_request_wait(rq, 0, MAX_SCHEDULE_TIMEOUT);
-		if (timeout < 0) {
+		if (!err)
+			timeout = i915_request_wait(rq, 0,
+						    MAX_SCHEDULE_TIMEOUT);
+		i915_request_put(rq);
+		if (!err && timeout < 0) {
 			DRM_ERROR("BLT Request is not completed. %ld\n",
 				  timeout);
 			err = timeout;
-			i915_request_put(rq);
 			break;
 		}
 
-		blt_copied += cur_win_sz;
-		err = 0;
-		i915_request_put(rq);
-		flush_work(&i915->gt.engine[BCS0]->retire_work);
-	} while (src->base.size != blt_copied);
+		remain -= chunk;
+		offset += chunk >> PAGE_SHIFT;
+
+		flush_work(&ce->engine->retire_work);
+	} while (remain);
 
+	spin_lock(&i915->mm.window_queue.lock);
 	src_vma->size = BLT_WINDOW_SZ;
 	dst_vma->size = BLT_WINDOW_SZ;
 	src_vma->obj = NULL;
 	dst_vma->obj = NULL;
-	mutex_unlock(&i915->mm.window_mutex);
+	*ps = src_vma;
+	*pd = dst_vma;
+	wake_up_locked(&i915->mm.window_queue);
+	spin_unlock(&i915->mm.window_queue.lock);
 
 	dst->mm.dirty = true;
 	i915_gem_object_unpin_pages(src);
diff --git a/drivers/gpu/drm/i915/i915_drv.h b/drivers/gpu/drm/i915/i915_drv.h
index 07da059640a1..82f431cc38cd 100644
--- a/drivers/gpu/drm/i915/i915_drv.h
+++ b/drivers/gpu/drm/i915/i915_drv.h
@@ -600,7 +600,7 @@  struct i915_gem_mm {
 	struct i915_vma *smem_window[2];
 
 	/* To protect above two set of vmas */
-	struct mutex window_mutex;
+	wait_queue_head_t window_queue;
 };
 
 #define I915_IDLE_ENGINES_TIMEOUT (200) /* in ms */

[RFC,138/162] drm/i915/dg1: Eliminate eviction mutex

Commit Message

Patch