1 files changed, 452 insertions, 0 deletions
diff --git a/src/sna/sna_io.c b/src/sna/sna_io.c
new file mode 100644
index 00000000..41f36713
--- /dev/null
+++ b/src/sna/sna_io.c
@@ -0,0 +1,452 @@
+/*
+ * Copyright (c) 2011 Intel Corporation
+ *
+ * Permission is hereby granted, free of charge, to any person obtaining a
+ * copy of this software and associated documentation files (the "Software"),
+ * to deal in the Software without restriction, including without limitation
+ * the rights to use, copy, modify, merge, publish, distribute, sublicense,
+ * and/or sell copies of the Software, and to permit persons to whom the
+ * Software is furnished to do so, subject to the following conditions:
+ *
+ * The above copyright notice and this permission notice (including the next
+ * paragraph) shall be included in all copies or substantial portions of the
+ * Software.
+ *
+ * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
+ * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
+ * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.  IN NO EVENT SHALL
+ * THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
+ * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
+ * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
+ * SOFTWARE.
+ *
+ * Authors:
+ *    Chris Wilson <chris@chris-wilson.co.uk>
+ *
+ */
+
+#ifdef HAVE_CONFIG_H
+#include "config.h"
+#endif
+
+#include "sna.h"
+#include "sna_render.h"
+#include "sna_reg.h"
+
+#include <sys/mman.h>
+
+#if DEBUG_IO
+#undef DBG
+#define DBG(x) ErrorF x
+#else
+#define NDEBUG 1
+#endif
+
+#define PITCH(x, y) ALIGN((x)*(y), 4)
+
+static void read_boxes_inplace(struct kgem *kgem,
+			       struct kgem_bo *bo, int16_t src_dx, int16_t src_dy,
+			       PixmapPtr pixmap, int16_t dst_dx, int16_t dst_dy,
+			       const BoxRec *box, int n)
+{
+	int bpp = pixmap->drawable.bitsPerPixel;
+	void *src, *dst = pixmap->devPrivate.ptr;
+	int src_pitch = bo->pitch;
+	int dst_pitch = pixmap->devKind;
+
+	DBG(("%s x %d, tiling=%d\n", __FUNCTION__, n, bo->tiling));
+
+	kgem_bo_submit(kgem, bo);
+
+	src = kgem_bo_map(kgem, bo, PROT_READ);
+	if (src == NULL)
+		return;
+
+	do {
+		memcpy_blt(src, dst, bpp,
+			   src_pitch, dst_pitch,
+			   box->x1 + src_dx, box->y1 + src_dy,
+			   box->x1 + dst_dx, box->y1 + dst_dy,
+			   box->x2 - box->x1, box->y2 - box->y1);
+		box++;
+	} while (--n);
+
+	munmap(src, bo->size);
+}
+
+void sna_read_boxes(struct sna *sna,
+		    struct kgem_bo *src_bo, int16_t src_dx, int16_t src_dy,
+		    PixmapPtr dst, int16_t dst_dx, int16_t dst_dy,
+		    const BoxRec *box, int nbox)
+{
+	struct kgem *kgem = &sna->kgem;
+	struct kgem_bo *dst_bo;
+	int tmp_nbox;
+	const BoxRec *tmp_box;
+	char *src;
+	void *ptr;
+	int src_pitch, cpp, offset;
+	int n, cmd, br13;
+
+	DBG(("%s x %d, src=(handle=%d, offset=(%d,%d)), dst=(size=(%d, %d), offset=(%d,%d))\n",
+	     __FUNCTION__, nbox, src_bo->handle, src_dx, src_dy,
+	     dst->drawable.width, dst->drawable.height, dst_dx, dst_dy));
+
+	if (DEBUG_NO_IO || kgem->wedged ||
+	    !kgem_bo_is_busy(kgem, src_bo) ||
+	    src_bo->tiling == I915_TILING_Y) {
+		read_boxes_inplace(kgem,
+				   src_bo, src_dx, src_dy,
+				   dst, dst_dx, dst_dy,
+				   box, nbox);
+		return;
+	}
+
+	/* count the total number of bytes to be read and allocate a bo */
+	cpp = dst->drawable.bitsPerPixel / 8;
+	offset = 0;
+	for (n = 0; n < nbox; n++) {
+		int height = box[n].y2 - box[n].y1;
+		int width = box[n].x2 - box[n].x1;
+		offset += PITCH(width, cpp) * height;
+	}
+
+	DBG(("    read buffer size=%d\n", offset));
+
+	dst_bo = kgem_create_buffer(kgem, offset, KGEM_BUFFER_LAST, &ptr);
+	if (!dst_bo) {
+		read_boxes_inplace(kgem,
+				   src_bo, src_dx, src_dy,
+				   dst, dst_dx, dst_dy,
+				   box, nbox);
+		return;
+	}
+
+	cmd = XY_SRC_COPY_BLT_CMD;
+	if (cpp == 4)
+		cmd |= BLT_WRITE_ALPHA | BLT_WRITE_RGB;
+	src_pitch = src_bo->pitch;
+	if (kgem->gen >= 40 && src_bo->tiling) {
+		cmd |= BLT_SRC_TILED;
+		src_pitch >>= 2;
+	}
+
+	br13 = 0xcc << 16;
+	switch (cpp) {
+	default:
+	case 4: br13 |= 1 << 25; /* RGB8888 */
+	case 2: br13 |= 1 << 24; /* RGB565 */
+	case 1: break;
+	}
+
+	kgem_set_mode(kgem, KGEM_BLT);
+	if (kgem->nexec + 2 > KGEM_EXEC_SIZE(kgem) ||
+	    kgem->nreloc + 2 > KGEM_RELOC_SIZE(kgem) ||
+	    !kgem_check_batch(kgem, 8) ||
+	    !kgem_check_bo_fenced(kgem, dst_bo, src_bo, NULL))
+		_kgem_submit(kgem);
+
+	tmp_nbox = nbox;
+	tmp_box = box;
+	offset = 0;
+	do {
+		int nbox_this_time;
+
+		nbox_this_time = tmp_nbox;
+		if (8*nbox_this_time > kgem->surface - kgem->nbatch - KGEM_BATCH_RESERVED)
+			nbox_this_time = (kgem->surface - kgem->nbatch - KGEM_BATCH_RESERVED) / 8;
+		if (2*nbox_this_time > KGEM_RELOC_SIZE(kgem) - kgem->nreloc)
+			nbox_this_time = (KGEM_RELOC_SIZE(kgem) - kgem->nreloc) / 2;
+		assert(nbox_this_time);
+		tmp_nbox -= nbox_this_time;
+
+		for (n = 0; n < nbox_this_time; n++) {
+			int height = tmp_box[n].y2 - tmp_box[n].y1;
+			int width = tmp_box[n].x2 - tmp_box[n].x1;
+			int pitch = PITCH(width, cpp);
+			uint32_t *b = kgem->batch + kgem->nbatch;
+
+			DBG(("    blt offset %x: (%d, %d) x (%d, %d), pitch=%d\n",
+			     offset,
+			     tmp_box[n].x1 + src_dx,
+			     tmp_box[n].y1 + src_dy,
+			     width, height, pitch));
+
+			assert(tmp_box[n].x1 + src_dx >= 0);
+			assert((tmp_box[n].x2 + src_dx) * dst->drawable.bitsPerPixel/8 <= src_bo->pitch);
+			assert(tmp_box[n].y1 + src_dy >= 0);
+			assert((tmp_box[n].y2 + src_dy) * src_bo->pitch <= src_bo->size);
+
+			b[0] = cmd;
+			b[1] = br13 | pitch;
+			b[2] = 0;
+			b[3] = height << 16 | width;
+			b[4] = kgem_add_reloc(kgem, kgem->nbatch + 4, dst_bo,
+					      I915_GEM_DOMAIN_RENDER << 16 |
+					      I915_GEM_DOMAIN_RENDER |
+					      KGEM_RELOC_FENCED,
+					      offset);
+			b[5] = (tmp_box[n].y1 + src_dy) << 16 | (tmp_box[n].x1 + src_dx);
+			b[6] = src_pitch;
+			b[7] = kgem_add_reloc(kgem, kgem->nbatch + 7, src_bo,
+					      I915_GEM_DOMAIN_RENDER << 16 |
+					      KGEM_RELOC_FENCED,
+					      0);
+			kgem->nbatch += 8;
+
+			offset += pitch * height;
+		}
+		tmp_box += nbox_this_time;
+
+		_kgem_submit(kgem);
+	} while (tmp_nbox);
+	assert(offset == dst_bo->size);
+
+	kgem_buffer_sync(kgem, dst_bo);
+
+	src = ptr;
+	do {
+		int height = box->y2 - box->y1;
+		int width  = box->x2 - box->x1;
+		int pitch = PITCH(width, cpp);
+
+		DBG(("    copy offset %lx [%08x...%08x]: (%d, %d) x (%d, %d), src pitch=%d, dst pitch=%d, bpp=%d\n",
+		     (long)((char *)src - (char *)ptr),
+		     *(uint32_t*)src, *(uint32_t*)(src+pitch*height - 4),
+		     box->x1 + dst_dx,
+		     box->y1 + dst_dy,
+		     width, height,
+		     pitch, dst->devKind, cpp*8));
+
+		assert(box->x1 + dst_dx >= 0);
+		assert(box->x2 + dst_dx <= dst->drawable.width);
+		assert(box->y1 + dst_dy >= 0);
+		assert(box->y2 + dst_dy <= dst->drawable.height);
+
+		memcpy_blt(src, dst->devPrivate.ptr, cpp*8,
+			   pitch, dst->devKind,
+			   0, 0,
+			   box->x1 + dst_dx, box->y1 + dst_dy,
+			   width, height);
+		box++;
+
+		src += pitch * height;
+	} while (--nbox);
+	assert(src - (char *)ptr == dst_bo->size);
+	kgem_bo_destroy(kgem, dst_bo);
+}
+
+static void write_boxes_inplace(struct kgem *kgem,
+				const void *src, int stride, int bpp, int16_t src_dx, int16_t src_dy,
+				struct kgem_bo *bo, int16_t dst_dx, int16_t dst_dy,
+				const BoxRec *box, int n)
+{
+	int dst_pitch = bo->pitch;
+	int src_pitch = stride;
+	void *dst;
+
+	DBG(("%s x %d, tiling=%d\n", __FUNCTION__, n, bo->tiling));
+
+	kgem_bo_submit(kgem, bo);
+
+	dst = kgem_bo_map(kgem, bo, PROT_READ | PROT_WRITE);
+	if (dst == NULL)
+		return;
+
+	do {
+		DBG(("%s: (%d, %d) -> (%d, %d) x (%d, %d) [bpp=%d, src_pitch=%d, dst_pitch=%d]\n", __FUNCTION__,
+		     box->x1 + src_dx, box->y1 + src_dy,
+		     box->x1 + dst_dx, box->y1 + dst_dy,
+		     box->x2 - box->x1, box->y2 - box->y1,
+		     bpp, src_pitch, dst_pitch));
+
+		memcpy_blt(src, dst, bpp,
+			   src_pitch, dst_pitch,
+			   box->x1 + src_dx, box->y1 + src_dy,
+			   box->x1 + dst_dx, box->y1 + dst_dy,
+			   box->x2 - box->x1, box->y2 - box->y1);
+		box++;
+	} while (--n);
+
+	munmap(dst, bo->size);
+}
+
+void sna_write_boxes(struct sna *sna,
+		     struct kgem_bo *dst_bo, int16_t dst_dx, int16_t dst_dy,
+		     const void *src, int stride, int bpp, int16_t src_dx, int16_t src_dy,
+		     const BoxRec *box, int nbox)
+{
+	struct kgem *kgem = &sna->kgem;
+	struct kgem_bo *src_bo;
+	void *ptr;
+	int offset;
+	int n, cmd, br13;
+
+	DBG(("%s x %d\n", __FUNCTION__, nbox));
+
+	if (DEBUG_NO_IO || kgem->wedged ||
+	    !kgem_bo_is_busy(kgem, dst_bo) ||
+	    dst_bo->tiling == I915_TILING_Y) {
+		write_boxes_inplace(kgem,
+				    src, stride, bpp, src_dx, src_dy,
+				    dst_bo, dst_dx, dst_dy,
+				    box, nbox);
+		return;
+	}
+
+	cmd = XY_SRC_COPY_BLT_CMD;
+	if (bpp == 32)
+		cmd |= BLT_WRITE_ALPHA | BLT_WRITE_RGB;
+	br13 = dst_bo->pitch;
+	if (kgem->gen >= 40 && dst_bo->tiling) {
+		cmd |= BLT_DST_TILED;
+		br13 >>= 2;
+	}
+	br13 |= 0xcc << 16;
+	switch (bpp) {
+	default:
+	case 32: br13 |= 1 << 25; /* RGB8888 */
+	case 16: br13 |= 1 << 24; /* RGB565 */
+	case 8: break;
+	}
+
+	kgem_set_mode(kgem, KGEM_BLT);
+	if (kgem->nexec + 2 > KGEM_EXEC_SIZE(kgem) ||
+	    kgem->nreloc + 2 > KGEM_RELOC_SIZE(kgem) ||
+	    !kgem_check_batch(kgem, 8) ||
+	    !kgem_check_bo_fenced(kgem, dst_bo, NULL))
+		_kgem_submit(kgem);
+
+	do {
+		int nbox_this_time;
+
+		nbox_this_time = nbox;
+		if (8*nbox_this_time > kgem->surface - kgem->nbatch - KGEM_BATCH_RESERVED)
+			nbox_this_time = (kgem->surface - kgem->nbatch - KGEM_BATCH_RESERVED) / 8;
+		if (2*nbox_this_time > KGEM_RELOC_SIZE(kgem) - kgem->nreloc)
+			nbox_this_time = (KGEM_RELOC_SIZE(kgem) - kgem->nreloc) / 2;
+		assert(nbox_this_time);
+		nbox -= nbox_this_time;
+
+		/* Count the total number of bytes to be read and allocate a
+		 * single buffer large enough. Or if it is very small, combine
+		 * with other allocations. */
+		offset = 0;
+		for (n = 0; n < nbox_this_time; n++) {
+			int height = box[n].y2 - box[n].y1;
+			int width = box[n].x2 - box[n].x1;
+			offset += PITCH(width, bpp >> 3) * height;
+		}
+
+		src_bo = kgem_create_buffer(kgem, offset,
+					    KGEM_BUFFER_WRITE | KGEM_BUFFER_LAST,
+					    &ptr);
+		if (!src_bo)
+			break;
+
+		offset = 0;
+		do {
+			int height = box->y2 - box->y1;
+			int width = box->x2 - box->x1;
+			int pitch = PITCH(width, bpp >> 3);
+			uint32_t *b;
+
+			DBG(("  %s: box src=(%d, %d), dst=(%d, %d) size=(%d, %d), dst offset=%d, dst pitch=%d\n",
+			     __FUNCTION__,
+			     box->x1 + src_dx, box->y1 + src_dy,
+			     box->x1 + dst_dx, box->y1 + dst_dy,
+			     width, height,
+			     offset, pitch));
+
+			assert(box->x1 + src_dx >= 0);
+			assert((box->x2 + src_dx)*bpp <= 8*stride);
+			assert(box->y1 + src_dy >= 0);
+
+			assert(box->x1 + dst_dx >= 0);
+			assert(box->y1 + dst_dy >= 0);
+
+			memcpy_blt(src, (char *)ptr + offset, bpp,
+				   stride, pitch,
+				   box->x1 + src_dx, box->y1 + src_dy,
+				   0, 0,
+				   width, height);
+
+			b = kgem->batch + kgem->nbatch;
+			b[0] = cmd;
+			b[1] = br13;
+			b[2] = (box->y1 + dst_dy) << 16 | (box->x1 + dst_dx);
+			b[3] = (box->y2 + dst_dy) << 16 | (box->x2 + dst_dx);
+			b[4] = kgem_add_reloc(kgem, kgem->nbatch + 4, dst_bo,
+					      I915_GEM_DOMAIN_RENDER << 16 |
+					      I915_GEM_DOMAIN_RENDER |
+					      KGEM_RELOC_FENCED,
+					      0);
+			b[5] = 0;
+			b[6] = pitch;
+			b[7] = kgem_add_reloc(kgem, kgem->nbatch + 7, src_bo,
+					      I915_GEM_DOMAIN_RENDER << 16 |
+					      KGEM_RELOC_FENCED,
+					      offset);
+			kgem->nbatch += 8;
+
+			box++;
+			offset += pitch * height;
+		} while (--nbox_this_time);
+		assert(offset == src_bo->size);
+
+		if (nbox)
+			_kgem_submit(kgem);
+
+		kgem_bo_destroy(kgem, src_bo);
+	} while (nbox);
+
+	_kgem_set_mode(kgem, KGEM_BLT);
+}
+
+struct kgem_bo *sna_replace(struct sna *sna,
+			    struct kgem_bo *bo,
+			    int width, int height, int bpp,
+			    const void *src, int stride)
+{
+	struct kgem *kgem = &sna->kgem;
+	void *dst;
+
+	DBG(("%s(%d, %d)\n", __FUNCTION__, width, height));
+
+	assert(bo->reusable);
+	if (kgem_bo_is_busy(kgem, bo)) {
+		struct kgem_bo *new_bo;
+		int tiling = bo->tiling;
+
+		/* As we use fences for GPU BLTs, we often have
+		 * lots of contention upon the limited number of fences.
+		 */
+		if (sna->kgem.gen < 40)
+			tiling = I915_TILING_NONE;
+
+		new_bo = kgem_create_2d(kgem,
+					width, height, bpp, tiling,
+					CREATE_INACTIVE);
+		if (new_bo) {
+			kgem_bo_destroy(kgem, bo);
+			bo = new_bo;
+		}
+	}
+
+	if (bo->tiling == I915_TILING_NONE && bo->pitch == stride) {
+		kgem_bo_write(kgem, bo, src, (height-1)*stride + width*bpp/8);
+		return bo;
+	}
+
+	dst = kgem_bo_map(kgem, bo, PROT_READ | PROT_WRITE);
+	if (dst) {
+		memcpy_blt(src, dst, bpp,
+			   stride, bo->pitch,
+			   0, 0,
+			   0, 0,
+			   width, height);
+		munmap(dst, bo->size);
+	}
+
+	return bo;
+}