r600g,radeonsi: Inform the kernel if a BO will likely be accessed by the CPU
authorMichel Dänzer <michel.daenzer@amd.com>
Tue, 26 Aug 2014 09:06:49 +0000 (18:06 +0900)
committerMichel Dänzer <michel@daenzer.net>
Tue, 2 Sep 2014 06:24:07 +0000 (15:24 +0900)
This allows the kernel to prevent such BOs from ever being stored in the
CPU inaccessible part of VRAM.

Reviewed-by: Marek Olšák <marek.olsak@amd.com>
src/gallium/drivers/radeon/r600_buffer_common.c
src/gallium/winsys/radeon/drm/radeon_drm_bo.c
src/gallium/winsys/radeon/drm/radeon_winsys.h

index ee05776aed41d894cc65a8580c88101f1dc93600..c4e87a0cd08de1fcba7d24753d8f341673edf1e4 100644 (file)
@@ -124,6 +124,7 @@ bool r600_init_resource(struct r600_common_screen *rscreen,
                        flags = RADEON_FLAG_GTT_WC;
                        break;
                }
+               flags = RADEON_FLAG_CPU_ACCESS;
                /* fall through */
        case PIPE_USAGE_DEFAULT:
        case PIPE_USAGE_IMMUTABLE:
@@ -134,23 +135,27 @@ bool r600_init_resource(struct r600_common_screen *rscreen,
                break;
        }
 
-       /* Use GTT for all persistent mappings with older kernels, because they
-        * didn't always flush the HDP cache before CS execution.
-        *
-        * Write-combined CPU mappings are fine, the kernel ensures all CPU
-        * writes finish before the GPU executes a command stream.
-        */
-       if (rscreen->info.drm_minor < 40 &&
-           res->b.b.target == PIPE_BUFFER &&
+       if (res->b.b.target == PIPE_BUFFER &&
            res->b.b.flags & (PIPE_RESOURCE_FLAG_MAP_PERSISTENT |
                              PIPE_RESOURCE_FLAG_MAP_COHERENT)) {
-               res->domains = RADEON_DOMAIN_GTT;
+               /* Use GTT for all persistent mappings with older kernels,
+                * because they didn't always flush the HDP cache before CS
+                * execution.
+                *
+                * Write-combined CPU mappings are fine, the kernel ensures all CPU
+                * writes finish before the GPU executes a command stream.
+                */
+               if (rscreen->info.drm_minor < 40)
+                       res->domains = RADEON_DOMAIN_GTT;
+               else if (res->domains & RADEON_DOMAIN_VRAM)
+                       flags |= RADEON_FLAG_CPU_ACCESS;
        }
 
        /* Tiled textures are unmappable. Always put them in VRAM. */
        if (res->b.b.target != PIPE_BUFFER &&
            rtex->surface.level[0].mode >= RADEON_SURF_MODE_1D) {
                res->domains = RADEON_DOMAIN_VRAM;
+               flags &= ~RADEON_FLAG_CPU_ACCESS;
        }
 
        /* Allocate a new resource. */
index 73f8d385d7b426304d22b3cb5a52684a7b812a53..03b9b1d075b27629a5c22b046221e6be1b885417 100644 (file)
@@ -478,7 +478,11 @@ const struct pb_vtbl radeon_bo_vtbl = {
 };
 
 #ifndef RADEON_GEM_GTT_WC
-#define RADEON_GEM_GTT_WC (1 << 2)
+#define RADEON_GEM_GTT_WC      (1 << 2)
+#endif
+#ifndef RADEON_GTM_CPU_ACCESS
+/* BO is expected to be accessed by the CPU */
+#define RADEON_GEM_CPU_ACCESS  (1 << 3)
 #endif
 
 static struct pb_buffer *radeon_bomgr_create_bo(struct pb_manager *_mgr,
@@ -505,6 +509,8 @@ static struct pb_buffer *radeon_bomgr_create_bo(struct pb_manager *_mgr,
 
     if (rdesc->flags & RADEON_FLAG_GTT_WC)
         args.flags |= RADEON_GEM_GTT_WC;
+    if (rdesc->flags & RADEON_FLAG_CPU_ACCESS)
+        args.flags |= RADEON_GEM_CPU_ACCESS;
 
     if (drmCommandWriteRead(rws->fd, DRM_RADEON_GEM_CREATE,
                             &args, sizeof(args))) {
index dbd58f1cd8d306e8dda7c47425f2d4f493f4796a..69bf6eddebd2ae8b598a18e29ab7b1ab6d3d6cde 100644 (file)
@@ -66,7 +66,8 @@ enum radeon_bo_domain { /* bitfield */
 };
 
 enum radeon_bo_flag { /* bitfield */
-   RADEON_FLAG_GTT_WC = (1 << 0)
+    RADEON_FLAG_GTT_WC =     (1 << 0),
+    RADEON_FLAG_CPU_ACCESS = (1 << 1),
 };
 
 enum radeon_bo_usage { /* bitfield */