src/gallium/winsys/radeon/drm/radeon_drm_bo.c

   1 /*
   2  * Copyright © 2011 Marek Olšák <maraeo@gmail.com>
   3  * All Rights Reserved.
   4  *
   5  * Permission is hereby granted, free of charge, to any person obtaining
   6  * a copy of this software and associated documentation files (the
   7  * "Software"), to deal in the Software without restriction, including
   8  * without limitation the rights to use, copy, modify, merge, publish,
   9  * distribute, sub license, and/or sell copies of the Software, and to
  10  * permit persons to whom the Software is furnished to do so, subject to
  11  * the following conditions:
  12  *
  13  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,
  14  * EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES
  15  * OF MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND
  16  * NON-INFRINGEMENT. IN NO EVENT SHALL THE COPYRIGHT HOLDERS, AUTHORS
  17  * AND/OR ITS SUPPLIERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
  18  * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE,
  19  * ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE
  20  * USE OR OTHER DEALINGS IN THE SOFTWARE.
  21  *
  22  * The above copyright notice and this permission notice (including the
  23  * next paragraph) shall be included in all copies or substantial portions
  24  * of the Software.
  25  */
  26
  27 #include "radeon_drm_cs.h"
  28
  29 #include "util/u_hash_table.h"
  30 #include "util/u_memory.h"
  31 #include "util/simple_list.h"
  32 #include "os/os_thread.h"
  33 #include "os/os_mman.h"
  34 #include "os/os_time.h"
  35
  36 #include "state_tracker/drm_driver.h"
  37
  38 #include <sys/ioctl.h>
  39 #include <xf86drm.h>
  40 #include <errno.h>
  41 #include <fcntl.h>
  42 #include <stdio.h>
  43
  44 static inline struct radeon_bo *radeon_bo(struct pb_buffer *bo)
  45 {
  46     return (struct radeon_bo *)bo;
  47 }
  48
  49 struct radeon_bo_va_hole {
  50     struct list_head list;
  51     uint64_t         offset;
  52     uint64_t         size;
  53 };
  54
  55 static bool radeon_bo_is_busy(struct radeon_bo *bo)
  56 {
  57     struct drm_radeon_gem_busy args = {0};
  58
  59     args.handle = bo->handle;
  60     return drmCommandWriteRead(bo->rws->fd, DRM_RADEON_GEM_BUSY,
  61                                &args, sizeof(args)) != 0;
  62 }
  63
  64 static void radeon_bo_wait_idle(struct radeon_bo *bo)
  65 {
  66     struct drm_radeon_gem_wait_idle args = {0};
  67
  68     args.handle = bo->handle;
  69     while (drmCommandWrite(bo->rws->fd, DRM_RADEON_GEM_WAIT_IDLE,
  70                            &args, sizeof(args)) == -EBUSY);
  71 }
  72
  73 static bool radeon_bo_wait(struct pb_buffer *_buf, uint64_t timeout,
  74                            enum radeon_bo_usage usage)
  75 {
  76     struct radeon_bo *bo = radeon_bo(_buf);
  77     int64_t abs_timeout;
  78
  79     /* No timeout. Just query. */
  80     if (timeout == 0)
  81         return !bo->num_active_ioctls && !radeon_bo_is_busy(bo);
  82
  83     abs_timeout = os_time_get_absolute_timeout(timeout);
  84
  85     /* Wait if any ioctl is being submitted with this buffer. */
  86     if (!os_wait_until_zero_abs_timeout(&bo->num_active_ioctls, abs_timeout))
  87         return false;
  88
  89     /* Infinite timeout. */
  90     if (abs_timeout == PIPE_TIMEOUT_INFINITE) {
  91         radeon_bo_wait_idle(bo);
  92         return true;
  93     }
  94
  95     /* Other timeouts need to be emulated with a loop. */
  96     while (radeon_bo_is_busy(bo)) {
  97        if (os_time_get_nano() >= abs_timeout)
  98           return false;
  99        os_time_sleep(10);
 100     }
 101
 102     return true;
 103 }
 104
 105 static enum radeon_bo_domain get_valid_domain(enum radeon_bo_domain domain)
 106 {
 107     /* Zero domains the driver doesn't understand. */
 108     domain &= RADEON_DOMAIN_VRAM_GTT;
 109
 110     /* If no domain is set, we must set something... */
 111     if (!domain)
 112         domain = RADEON_DOMAIN_VRAM_GTT;
 113
 114     return domain;
 115 }
 116
 117 static enum radeon_bo_domain radeon_bo_get_initial_domain(
 118                 struct pb_buffer *buf)
 119 {
 120     struct radeon_bo *bo = (struct radeon_bo*)buf;
 121     struct drm_radeon_gem_op args;
 122
 123     if (bo->rws->info.drm_minor < 38)
 124         return RADEON_DOMAIN_VRAM_GTT;
 125
 126     memset(&args, 0, sizeof(args));
 127     args.handle = bo->handle;
 128     args.op = RADEON_GEM_OP_GET_INITIAL_DOMAIN;
 129
 130     drmCommandWriteRead(bo->rws->fd, DRM_RADEON_GEM_OP,
 131                         &args, sizeof(args));
 132
 133     /* GEM domains and winsys domains are defined the same. */
 134     return get_valid_domain(args.value);
 135 }
 136
 137 static uint64_t radeon_bomgr_find_va(struct radeon_drm_winsys *rws,
 138                                      uint64_t size, uint64_t alignment)
 139 {
 140     struct radeon_bo_va_hole *hole, *n;
 141     uint64_t offset = 0, waste = 0;
 142
 143     /* All VM address space holes will implicitly start aligned to the
 144      * size alignment, so we don't need to sanitize the alignment here
 145      */
 146     size = align(size, rws->size_align);
 147
 148     pipe_mutex_lock(rws->bo_va_mutex);
 149     /* first look for a hole */
 150     LIST_FOR_EACH_ENTRY_SAFE(hole, n, &rws->va_holes, list) {
 151         offset = hole->offset;
 152         waste = offset % alignment;
 153         waste = waste ? alignment - waste : 0;
 154         offset += waste;
 155         if (offset >= (hole->offset + hole->size)) {
 156             continue;
 157         }
 158         if (!waste && hole->size == size) {
 159             offset = hole->offset;
 160             list_del(&hole->list);
 161             FREE(hole);
 162             pipe_mutex_unlock(rws->bo_va_mutex);
 163             return offset;
 164         }
 165         if ((hole->size - waste) > size) {
 166             if (waste) {
 167                 n = CALLOC_STRUCT(radeon_bo_va_hole);
 168                 n->size = waste;
 169                 n->offset = hole->offset;
 170                 list_add(&n->list, &hole->list);
 171             }
 172             hole->size -= (size + waste);
 173             hole->offset += size + waste;
 174             pipe_mutex_unlock(rws->bo_va_mutex);
 175             return offset;
 176         }
 177         if ((hole->size - waste) == size) {
 178             hole->size = waste;
 179             pipe_mutex_unlock(rws->bo_va_mutex);
 180             return offset;
 181         }
 182     }
 183
 184     offset = rws->va_offset;
 185     waste = offset % alignment;
 186     waste = waste ? alignment - waste : 0;
 187     if (waste) {
 188         n = CALLOC_STRUCT(radeon_bo_va_hole);
 189         n->size = waste;
 190         n->offset = offset;
 191         list_add(&n->list, &rws->va_holes);
 192     }
 193     offset += waste;
 194     rws->va_offset += size + waste;
 195     pipe_mutex_unlock(rws->bo_va_mutex);
 196     return offset;
 197 }
 198
 199 static void radeon_bomgr_free_va(struct radeon_drm_winsys *rws,
 200                                  uint64_t va, uint64_t size)
 201 {
 202     struct radeon_bo_va_hole *hole;
 203
 204     size = align(size, rws->size_align);
 205
 206     pipe_mutex_lock(rws->bo_va_mutex);
 207     if ((va + size) == rws->va_offset) {
 208         rws->va_offset = va;
 209         /* Delete uppermost hole if it reaches the new top */
 210         if (!LIST_IS_EMPTY(&rws->va_holes)) {
 211             hole = container_of(rws->va_holes.next, hole, list);
 212             if ((hole->offset + hole->size) == va) {
 213                 rws->va_offset = hole->offset;
 214                 list_del(&hole->list);
 215                 FREE(hole);
 216             }
 217         }
 218     } else {
 219         struct radeon_bo_va_hole *next;
 220
 221         hole = container_of(&rws->va_holes, hole, list);
 222         LIST_FOR_EACH_ENTRY(next, &rws->va_holes, list) {
 223             if (next->offset < va)
 224                 break;
 225             hole = next;
 226         }
 227
 228         if (&hole->list != &rws->va_holes) {
 229             /* Grow upper hole if it's adjacent */
 230             if (hole->offset == (va + size)) {
 231                 hole->offset = va;
 232                 hole->size += size;
 233                 /* Merge lower hole if it's adjacent */
 234                 if (next != hole && &next->list != &rws->va_holes &&
 235                     (next->offset + next->size) == va) {
 236                     next->size += hole->size;
 237                     list_del(&hole->list);
 238                     FREE(hole);
 239                 }
 240                 goto out;
 241             }
 242         }
 243
 244         /* Grow lower hole if it's adjacent */
 245         if (next != hole && &next->list != &rws->va_holes &&
 246             (next->offset + next->size) == va) {
 247             next->size += size;
 248             goto out;
 249         }
 250
 251         /* FIXME on allocation failure we just lose virtual address space
 252          * maybe print a warning
 253          */
 254         next = CALLOC_STRUCT(radeon_bo_va_hole);
 255         if (next) {
 256             next->size = size;
 257             next->offset = va;
 258             list_add(&next->list, &hole->list);
 259         }
 260     }
 261 out:
 262     pipe_mutex_unlock(rws->bo_va_mutex);
 263 }
 264
 265 void radeon_bo_destroy(struct pb_buffer *_buf)
 266 {
 267     struct radeon_bo *bo = radeon_bo(_buf);
 268     struct radeon_drm_winsys *rws = bo->rws;
 269     struct drm_gem_close args;
 270
 271     memset(&args, 0, sizeof(args));
 272
 273     pipe_mutex_lock(rws->bo_handles_mutex);
 274     util_hash_table_remove(rws->bo_handles, (void*)(uintptr_t)bo->handle);
 275     if (bo->flink_name) {
 276         util_hash_table_remove(rws->bo_names,
 277                                (void*)(uintptr_t)bo->flink_name);
 278     }
 279     pipe_mutex_unlock(rws->bo_handles_mutex);
 280
 281     if (bo->ptr)
 282         os_munmap(bo->ptr, bo->base.size);
 283
 284     if (rws->info.has_virtual_memory) {
 285         if (rws->va_unmap_working) {
 286             struct drm_radeon_gem_va va;
 287
 288             va.handle = bo->handle;
 289             va.vm_id = 0;
 290             va.operation = RADEON_VA_UNMAP;
 291             va.flags = RADEON_VM_PAGE_READABLE |
 292                        RADEON_VM_PAGE_WRITEABLE |
 293                        RADEON_VM_PAGE_SNOOPED;
 294             va.offset = bo->va;
 295
 296             if (drmCommandWriteRead(rws->fd, DRM_RADEON_GEM_VA, &va,
 297                                     sizeof(va)) != 0 &&
 298                 va.operation == RADEON_VA_RESULT_ERROR) {
 299                 fprintf(stderr, "radeon: Failed to deallocate virtual address for buffer:\n");
 300                 fprintf(stderr, "radeon:    size      : %d bytes\n", bo->base.size);
 301                 fprintf(stderr, "radeon:    va        : 0x%016llx\n", (unsigned long long)bo->va);
 302             }
 303         }
 304
 305         radeon_bomgr_free_va(rws, bo->va, bo->base.size);
 306     }
 307
 308     /* Close object. */
 309     args.handle = bo->handle;
 310     drmIoctl(rws->fd, DRM_IOCTL_GEM_CLOSE, &args);
 311
 312     pipe_mutex_destroy(bo->map_mutex);
 313
 314     if (bo->initial_domain & RADEON_DOMAIN_VRAM)
 315         rws->allocated_vram -= align(bo->base.size, rws->size_align);
 316     else if (bo->initial_domain & RADEON_DOMAIN_GTT)
 317         rws->allocated_gtt -= align(bo->base.size, rws->size_align);
 318     FREE(bo);
 319 }
 320
 321 static void radeon_bo_destroy_or_cache(struct pb_buffer *_buf)
 322 {
 323    struct radeon_bo *bo = radeon_bo(_buf);
 324
 325    if (bo->use_reusable_pool)
 326       pb_cache_add_buffer(&bo->cache_entry);
 327    else
 328       radeon_bo_destroy(_buf);
 329 }
 330
 331 void *radeon_bo_do_map(struct radeon_bo *bo)
 332 {
 333     struct drm_radeon_gem_mmap args = {0};
 334     void *ptr;
 335
 336     /* If the buffer is created from user memory, return the user pointer. */
 337     if (bo->user_ptr)
 338         return bo->user_ptr;
 339
 340     /* Map the buffer. */
 341     pipe_mutex_lock(bo->map_mutex);
 342     /* Return the pointer if it's already mapped. */
 343     if (bo->ptr) {
 344         bo->map_count++;
 345         pipe_mutex_unlock(bo->map_mutex);
 346         return bo->ptr;
 347     }
 348     args.handle = bo->handle;
 349     args.offset = 0;
 350     args.size = (uint64_t)bo->base.size;
 351     if (drmCommandWriteRead(bo->rws->fd,
 352                             DRM_RADEON_GEM_MMAP,
 353                             &args,
 354                             sizeof(args))) {
 355         pipe_mutex_unlock(bo->map_mutex);
 356         fprintf(stderr, "radeon: gem_mmap failed: %p 0x%08X\n",
 357                 bo, bo->handle);
 358         return NULL;
 359     }
 360
 361     ptr = os_mmap(0, args.size, PROT_READ|PROT_WRITE, MAP_SHARED,
 362                bo->rws->fd, args.addr_ptr);
 363     if (ptr == MAP_FAILED) {
 364         /* Clear the cache and try again. */
 365         pb_cache_release_all_buffers(&bo->rws->bo_cache);
 366
 367         ptr = os_mmap(0, args.size, PROT_READ|PROT_WRITE, MAP_SHARED,
 368                       bo->rws->fd, args.addr_ptr);
 369         if (ptr == MAP_FAILED) {
 370             pipe_mutex_unlock(bo->map_mutex);
 371             fprintf(stderr, "radeon: mmap failed, errno: %i\n", errno);
 372             return NULL;
 373         }
 374     }
 375     bo->ptr = ptr;
 376     bo->map_count = 1;
 377     pipe_mutex_unlock(bo->map_mutex);
 378
 379     return bo->ptr;
 380 }
 381
 382 static void *radeon_bo_map(struct pb_buffer *buf,
 383                            struct radeon_winsys_cs *rcs,
 384                            enum pipe_transfer_usage usage)
 385 {
 386     struct radeon_bo *bo = (struct radeon_bo*)buf;
 387     struct radeon_drm_cs *cs = (struct radeon_drm_cs*)rcs;
 388
 389     /* If it's not unsynchronized bo_map, flush CS if needed and then wait. */
 390     if (!(usage & PIPE_TRANSFER_UNSYNCHRONIZED)) {
 391         /* DONTBLOCK doesn't make sense with UNSYNCHRONIZED. */
 392         if (usage & PIPE_TRANSFER_DONTBLOCK) {
 393             if (!(usage & PIPE_TRANSFER_WRITE)) {
 394                 /* Mapping for read.
 395                  *
 396                  * Since we are mapping for read, we don't need to wait
 397                  * if the GPU is using the buffer for read too
 398                  * (neither one is changing it).
 399                  *
 400                  * Only check whether the buffer is being used for write. */
 401                 if (cs && radeon_bo_is_referenced_by_cs_for_write(cs, bo)) {
 402                     cs->flush_cs(cs->flush_data, RADEON_FLUSH_ASYNC, NULL);
 403                     return NULL;
 404                 }
 405
 406                 if (!radeon_bo_wait((struct pb_buffer*)bo, 0,
 407                                     RADEON_USAGE_WRITE)) {
 408                     return NULL;
 409                 }
 410             } else {
 411                 if (cs && radeon_bo_is_referenced_by_cs(cs, bo)) {
 412                     cs->flush_cs(cs->flush_data, RADEON_FLUSH_ASYNC, NULL);
 413                     return NULL;
 414                 }
 415
 416                 if (!radeon_bo_wait((struct pb_buffer*)bo, 0,
 417                                     RADEON_USAGE_READWRITE)) {
 418                     return NULL;
 419                 }
 420             }
 421         } else {
 422             uint64_t time = os_time_get_nano();
 423
 424             if (!(usage & PIPE_TRANSFER_WRITE)) {
 425                 /* Mapping for read.
 426                  *
 427                  * Since we are mapping for read, we don't need to wait
 428                  * if the GPU is using the buffer for read too
 429                  * (neither one is changing it).
 430                  *
 431                  * Only check whether the buffer is being used for write. */
 432                 if (cs && radeon_bo_is_referenced_by_cs_for_write(cs, bo)) {
 433                     cs->flush_cs(cs->flush_data, 0, NULL);
 434                 }
 435                 radeon_bo_wait((struct pb_buffer*)bo, PIPE_TIMEOUT_INFINITE,
 436                                RADEON_USAGE_WRITE);
 437             } else {
 438                 /* Mapping for write. */
 439                 if (cs) {
 440                     if (radeon_bo_is_referenced_by_cs(cs, bo)) {
 441                         cs->flush_cs(cs->flush_data, 0, NULL);
 442                     } else {
 443                         /* Try to avoid busy-waiting in radeon_bo_wait. */
 444                         if (p_atomic_read(&bo->num_active_ioctls))
 445                             radeon_drm_cs_sync_flush(rcs);
 446                     }
 447                 }
 448
 449                 radeon_bo_wait((struct pb_buffer*)bo, PIPE_TIMEOUT_INFINITE,
 450                                RADEON_USAGE_READWRITE);
 451             }
 452
 453             bo->rws->buffer_wait_time += os_time_get_nano() - time;
 454         }
 455     }
 456
 457     return radeon_bo_do_map(bo);
 458 }
 459
 460 static void radeon_bo_unmap(struct pb_buffer *_buf)
 461 {
 462     struct radeon_bo *bo = (struct radeon_bo*)_buf;
 463
 464     if (bo->user_ptr)
 465         return;
 466
 467     pipe_mutex_lock(bo->map_mutex);
 468     if (!bo->ptr) {
 469         pipe_mutex_unlock(bo->map_mutex);
 470         return; /* it's not been mapped */
 471     }
 472
 473     assert(bo->map_count);
 474     if (--bo->map_count) {
 475         pipe_mutex_unlock(bo->map_mutex);
 476         return; /* it's been mapped multiple times */
 477     }
 478
 479     os_munmap(bo->ptr, bo->base.size);
 480     bo->ptr = NULL;
 481     pipe_mutex_unlock(bo->map_mutex);
 482 }
 483
 484 static const struct pb_vtbl radeon_bo_vtbl = {
 485     radeon_bo_destroy_or_cache
 486     /* other functions are never called */
 487 };
 488
 489 #ifndef RADEON_GEM_GTT_WC
 490 #define RADEON_GEM_GTT_WC               (1 << 2)
 491 #endif
 492 #ifndef RADEON_GEM_CPU_ACCESS
 493 /* BO is expected to be accessed by the CPU */
 494 #define RADEON_GEM_CPU_ACCESS           (1 << 3)
 495 #endif
 496 #ifndef RADEON_GEM_NO_CPU_ACCESS
 497 /* CPU access is not expected to work for this BO */
 498 #define RADEON_GEM_NO_CPU_ACCESS        (1 << 4)
 499 #endif
 500
 501 static struct radeon_bo *radeon_create_bo(struct radeon_drm_winsys *rws,
 502                                           unsigned size, unsigned alignment,
 503                                           unsigned usage,
 504                                           unsigned initial_domains,
 505                                           unsigned flags)
 506 {
 507     struct radeon_bo *bo;
 508     struct drm_radeon_gem_create args;
 509     int r;
 510
 511     memset(&args, 0, sizeof(args));
 512
 513     assert(initial_domains);
 514     assert((initial_domains &
 515             ~(RADEON_GEM_DOMAIN_GTT | RADEON_GEM_DOMAIN_VRAM)) == 0);
 516
 517     args.size = size;
 518     args.alignment = alignment;
 519     args.initial_domain = initial_domains;
 520     args.flags = 0;
 521
 522     if (flags & RADEON_FLAG_GTT_WC)
 523         args.flags |= RADEON_GEM_GTT_WC;
 524     if (flags & RADEON_FLAG_CPU_ACCESS)
 525         args.flags |= RADEON_GEM_CPU_ACCESS;
 526     if (flags & RADEON_FLAG_NO_CPU_ACCESS)
 527         args.flags |= RADEON_GEM_NO_CPU_ACCESS;
 528
 529     if (drmCommandWriteRead(rws->fd, DRM_RADEON_GEM_CREATE,
 530                             &args, sizeof(args))) {
 531         fprintf(stderr, "radeon: Failed to allocate a buffer:\n");
 532         fprintf(stderr, "radeon:    size      : %d bytes\n", size);
 533         fprintf(stderr, "radeon:    alignment : %d bytes\n", alignment);
 534         fprintf(stderr, "radeon:    domains   : %d\n", args.initial_domain);
 535         fprintf(stderr, "radeon:    flags     : %d\n", args.flags);
 536         return NULL;
 537     }
 538
 539     bo = CALLOC_STRUCT(radeon_bo);
 540     if (!bo)
 541         return NULL;
 542
 543     pipe_reference_init(&bo->base.reference, 1);
 544     bo->base.alignment = alignment;
 545     bo->base.usage = usage;
 546     bo->base.size = size;
 547     bo->base.vtbl = &radeon_bo_vtbl;
 548     bo->rws = rws;
 549     bo->handle = args.handle;
 550     bo->va = 0;
 551     bo->initial_domain = initial_domains;
 552     pipe_mutex_init(bo->map_mutex);
 553     pb_cache_init_entry(&rws->bo_cache, &bo->cache_entry, &bo->base);
 554
 555     if (rws->info.has_virtual_memory) {
 556         struct drm_radeon_gem_va va;
 557
 558         bo->va = radeon_bomgr_find_va(rws, size, alignment);
 559
 560         va.handle = bo->handle;
 561         va.vm_id = 0;
 562         va.operation = RADEON_VA_MAP;
 563         va.flags = RADEON_VM_PAGE_READABLE |
 564                    RADEON_VM_PAGE_WRITEABLE |
 565                    RADEON_VM_PAGE_SNOOPED;
 566         va.offset = bo->va;
 567         r = drmCommandWriteRead(rws->fd, DRM_RADEON_GEM_VA, &va, sizeof(va));
 568         if (r && va.operation == RADEON_VA_RESULT_ERROR) {
 569             fprintf(stderr, "radeon: Failed to allocate virtual address for buffer:\n");
 570             fprintf(stderr, "radeon:    size      : %d bytes\n", size);
 571             fprintf(stderr, "radeon:    alignment : %d bytes\n", alignment);
 572             fprintf(stderr, "radeon:    domains   : %d\n", args.initial_domain);
 573             fprintf(stderr, "radeon:    va        : 0x%016llx\n", (unsigned long long)bo->va);
 574             radeon_bo_destroy(&bo->base);
 575             return NULL;
 576         }
 577         pipe_mutex_lock(rws->bo_handles_mutex);
 578         if (va.operation == RADEON_VA_RESULT_VA_EXIST) {
 579             struct pb_buffer *b = &bo->base;
 580             struct radeon_bo *old_bo =
 581                 util_hash_table_get(rws->bo_vas, (void*)(uintptr_t)va.offset);
 582
 583             pipe_mutex_unlock(rws->bo_handles_mutex);
 584             pb_reference(&b, &old_bo->base);
 585             return radeon_bo(b);
 586         }
 587
 588         util_hash_table_set(rws->bo_vas, (void*)(uintptr_t)bo->va, bo);
 589         pipe_mutex_unlock(rws->bo_handles_mutex);
 590     }
 591
 592     if (initial_domains & RADEON_DOMAIN_VRAM)
 593         rws->allocated_vram += align(size, rws->size_align);
 594     else if (initial_domains & RADEON_DOMAIN_GTT)
 595         rws->allocated_gtt += align(size, rws->size_align);
 596
 597     return bo;
 598 }
 599
 600 bool radeon_bo_can_reclaim(struct pb_buffer *_buf)
 601 {
 602    struct radeon_bo *bo = radeon_bo(_buf);
 603
 604    if (radeon_bo_is_referenced_by_any_cs(bo))
 605       return false;
 606
 607    return radeon_bo_wait(_buf, 0, RADEON_USAGE_READWRITE);
 608 }
 609
 610 static unsigned eg_tile_split(unsigned tile_split)
 611 {
 612     switch (tile_split) {
 613     case 0:     tile_split = 64;    break;
 614     case 1:     tile_split = 128;   break;
 615     case 2:     tile_split = 256;   break;
 616     case 3:     tile_split = 512;   break;
 617     default:
 618     case 4:     tile_split = 1024;  break;
 619     case 5:     tile_split = 2048;  break;
 620     case 6:     tile_split = 4096;  break;
 621     }
 622     return tile_split;
 623 }
 624
 625 static unsigned eg_tile_split_rev(unsigned eg_tile_split)
 626 {
 627     switch (eg_tile_split) {
 628     case 64:    return 0;
 629     case 128:   return 1;
 630     case 256:   return 2;
 631     case 512:   return 3;
 632     default:
 633     case 1024:  return 4;
 634     case 2048:  return 5;
 635     case 4096:  return 6;
 636     }
 637 }
 638
 639 static void radeon_bo_get_tiling(struct pb_buffer *_buf,
 640                                  struct radeon_bo_metadata *md)
 641 {
 642     struct radeon_bo *bo = radeon_bo(_buf);
 643     struct drm_radeon_gem_set_tiling args;
 644
 645     memset(&args, 0, sizeof(args));
 646
 647     args.handle = bo->handle;
 648
 649     drmCommandWriteRead(bo->rws->fd,
 650                         DRM_RADEON_GEM_GET_TILING,
 651                         &args,
 652                         sizeof(args));
 653
 654     md->microtile = RADEON_LAYOUT_LINEAR;
 655     md->macrotile = RADEON_LAYOUT_LINEAR;
 656     if (args.tiling_flags & RADEON_TILING_MICRO)
 657         md->microtile = RADEON_LAYOUT_TILED;
 658     else if (args.tiling_flags & RADEON_TILING_MICRO_SQUARE)
 659         md->microtile = RADEON_LAYOUT_SQUARETILED;
 660
 661     if (args.tiling_flags & RADEON_TILING_MACRO)
 662         md->macrotile = RADEON_LAYOUT_TILED;
 663
 664     md->bankw = (args.tiling_flags >> RADEON_TILING_EG_BANKW_SHIFT) & RADEON_TILING_EG_BANKW_MASK;
 665     md->bankh = (args.tiling_flags >> RADEON_TILING_EG_BANKH_SHIFT) & RADEON_TILING_EG_BANKH_MASK;
 666     md->tile_split = (args.tiling_flags >> RADEON_TILING_EG_TILE_SPLIT_SHIFT) & RADEON_TILING_EG_TILE_SPLIT_MASK;
 667     md->stencil_tile_split = (args.tiling_flags >> RADEON_TILING_EG_STENCIL_TILE_SPLIT_SHIFT) & RADEON_TILING_EG_STENCIL_TILE_SPLIT_MASK;
 668     md->mtilea = (args.tiling_flags >> RADEON_TILING_EG_MACRO_TILE_ASPECT_SHIFT) & RADEON_TILING_EG_MACRO_TILE_ASPECT_MASK;
 669     md->tile_split = eg_tile_split(md->tile_split);
 670     md->scanout = bo->rws->gen >= DRV_SI && !(args.tiling_flags & RADEON_TILING_R600_NO_SCANOUT);
 671 }
 672
 673 static void radeon_bo_set_tiling(struct pb_buffer *_buf,
 674                                  struct radeon_winsys_cs *rcs,
 675                                  struct radeon_bo_metadata *md)
 676 {
 677     struct radeon_bo *bo = radeon_bo(_buf);
 678     struct radeon_drm_cs *cs = radeon_drm_cs(rcs);
 679     struct drm_radeon_gem_set_tiling args;
 680
 681     memset(&args, 0, sizeof(args));
 682
 683     /* Tiling determines how DRM treats the buffer data.
 684      * We must flush CS when changing it if the buffer is referenced. */
 685     if (cs && radeon_bo_is_referenced_by_cs(cs, bo)) {
 686         cs->flush_cs(cs->flush_data, 0, NULL);
 687     }
 688
 689     os_wait_until_zero(&bo->num_active_ioctls, PIPE_TIMEOUT_INFINITE);
 690
 691     if (md->microtile == RADEON_LAYOUT_TILED)
 692         args.tiling_flags |= RADEON_TILING_MICRO;
 693     else if (md->microtile == RADEON_LAYOUT_SQUARETILED)
 694         args.tiling_flags |= RADEON_TILING_MICRO_SQUARE;
 695
 696     if (md->macrotile == RADEON_LAYOUT_TILED)
 697         args.tiling_flags |= RADEON_TILING_MACRO;
 698
 699     args.tiling_flags |= (md->bankw & RADEON_TILING_EG_BANKW_MASK) <<
 700         RADEON_TILING_EG_BANKW_SHIFT;
 701     args.tiling_flags |= (md->bankh & RADEON_TILING_EG_BANKH_MASK) <<
 702         RADEON_TILING_EG_BANKH_SHIFT;
 703     if (md->tile_split) {
 704         args.tiling_flags |= (eg_tile_split_rev(md->tile_split) &
 705                               RADEON_TILING_EG_TILE_SPLIT_MASK) <<
 706             RADEON_TILING_EG_TILE_SPLIT_SHIFT;
 707     }
 708     args.tiling_flags |= (md->stencil_tile_split &
 709                           RADEON_TILING_EG_STENCIL_TILE_SPLIT_MASK) <<
 710         RADEON_TILING_EG_STENCIL_TILE_SPLIT_SHIFT;
 711     args.tiling_flags |= (md->mtilea & RADEON_TILING_EG_MACRO_TILE_ASPECT_MASK) <<
 712         RADEON_TILING_EG_MACRO_TILE_ASPECT_SHIFT;
 713
 714     if (bo->rws->gen >= DRV_SI && !md->scanout)
 715         args.tiling_flags |= RADEON_TILING_R600_NO_SCANOUT;
 716
 717     args.handle = bo->handle;
 718     args.pitch = md->stride;
 719
 720     drmCommandWriteRead(bo->rws->fd,
 721                         DRM_RADEON_GEM_SET_TILING,
 722                         &args,
 723                         sizeof(args));
 724 }
 725
 726 static struct pb_buffer *
 727 radeon_winsys_bo_create(struct radeon_winsys *rws,
 728                         unsigned size,
 729                         unsigned alignment,
 730                         boolean use_reusable_pool,
 731                         enum radeon_bo_domain domain,
 732                         enum radeon_bo_flag flags)
 733 {
 734     struct radeon_drm_winsys *ws = radeon_drm_winsys(rws);
 735     struct radeon_bo *bo;
 736     unsigned usage = 0;
 737
 738     /* Align size to page size. This is the minimum alignment for normal
 739      * BOs. Aligning this here helps the cached bufmgr. Especially small BOs,
 740      * like constant/uniform buffers, can benefit from better and more reuse.
 741      */
 742     size = align(size, ws->size_align);
 743
 744     /* Only set one usage bit each for domains and flags, or the cache manager
 745      * might consider different sets of domains / flags compatible
 746      */
 747     if (domain == RADEON_DOMAIN_VRAM_GTT)
 748         usage = 1 << 2;
 749     else
 750         usage = domain >> 1;
 751     assert(flags < sizeof(usage) * 8 - 3);
 752     usage |= 1 << (flags + 3);
 753
 754     if (use_reusable_pool) {
 755         bo = radeon_bo(pb_cache_reclaim_buffer(&ws->bo_cache, size, alignment, usage));
 756         if (bo)
 757             return &bo->base;
 758     }
 759
 760     bo = radeon_create_bo(ws, size, alignment, usage, domain, flags);
 761     if (!bo) {
 762         /* Clear the cache and try again. */
 763         pb_cache_release_all_buffers(&ws->bo_cache);
 764         bo = radeon_create_bo(ws, size, alignment, usage, domain, flags);
 765         if (!bo)
 766             return NULL;
 767     }
 768
 769     bo->use_reusable_pool = use_reusable_pool;
 770
 771     pipe_mutex_lock(ws->bo_handles_mutex);
 772     util_hash_table_set(ws->bo_handles, (void*)(uintptr_t)bo->handle, bo);
 773     pipe_mutex_unlock(ws->bo_handles_mutex);
 774
 775     return &bo->base;
 776 }
 777
 778 static struct pb_buffer *radeon_winsys_bo_from_ptr(struct radeon_winsys *rws,
 779                                                    void *pointer, unsigned size)
 780 {
 781     struct radeon_drm_winsys *ws = radeon_drm_winsys(rws);
 782     struct drm_radeon_gem_userptr args;
 783     struct radeon_bo *bo;
 784     int r;
 785
 786     bo = CALLOC_STRUCT(radeon_bo);
 787     if (!bo)
 788         return NULL;
 789
 790     memset(&args, 0, sizeof(args));
 791     args.addr = (uintptr_t)pointer;
 792     args.size = align(size, sysconf(_SC_PAGE_SIZE));
 793     args.flags = RADEON_GEM_USERPTR_ANONONLY |
 794         RADEON_GEM_USERPTR_VALIDATE |
 795         RADEON_GEM_USERPTR_REGISTER;
 796     if (drmCommandWriteRead(ws->fd, DRM_RADEON_GEM_USERPTR,
 797                             &args, sizeof(args))) {
 798         FREE(bo);
 799         return NULL;
 800     }
 801
 802     pipe_mutex_lock(ws->bo_handles_mutex);
 803
 804     /* Initialize it. */
 805     pipe_reference_init(&bo->base.reference, 1);
 806     bo->handle = args.handle;
 807     bo->base.alignment = 0;
 808     bo->base.usage = PB_USAGE_GPU_WRITE | PB_USAGE_GPU_READ;
 809     bo->base.size = size;
 810     bo->base.vtbl = &radeon_bo_vtbl;
 811     bo->rws = ws;
 812     bo->user_ptr = pointer;
 813     bo->va = 0;
 814     bo->initial_domain = RADEON_DOMAIN_GTT;
 815     pipe_mutex_init(bo->map_mutex);
 816
 817     util_hash_table_set(ws->bo_handles, (void*)(uintptr_t)bo->handle, bo);
 818
 819     pipe_mutex_unlock(ws->bo_handles_mutex);
 820
 821     if (ws->info.has_virtual_memory) {
 822         struct drm_radeon_gem_va va;
 823
 824         bo->va = radeon_bomgr_find_va(ws, bo->base.size, 1 << 20);
 825
 826         va.handle = bo->handle;
 827         va.operation = RADEON_VA_MAP;
 828         va.vm_id = 0;
 829         va.offset = bo->va;
 830         va.flags = RADEON_VM_PAGE_READABLE |
 831                    RADEON_VM_PAGE_WRITEABLE |
 832                    RADEON_VM_PAGE_SNOOPED;
 833         va.offset = bo->va;
 834         r = drmCommandWriteRead(ws->fd, DRM_RADEON_GEM_VA, &va, sizeof(va));
 835         if (r && va.operation == RADEON_VA_RESULT_ERROR) {
 836             fprintf(stderr, "radeon: Failed to assign virtual address space\n");
 837             radeon_bo_destroy(&bo->base);
 838             return NULL;
 839         }
 840         pipe_mutex_lock(ws->bo_handles_mutex);
 841         if (va.operation == RADEON_VA_RESULT_VA_EXIST) {
 842             struct pb_buffer *b = &bo->base;
 843             struct radeon_bo *old_bo =
 844                 util_hash_table_get(ws->bo_vas, (void*)(uintptr_t)va.offset);
 845
 846             pipe_mutex_unlock(ws->bo_handles_mutex);
 847             pb_reference(&b, &old_bo->base);
 848             return b;
 849         }
 850
 851         util_hash_table_set(ws->bo_vas, (void*)(uintptr_t)bo->va, bo);
 852         pipe_mutex_unlock(ws->bo_handles_mutex);
 853     }
 854
 855     ws->allocated_gtt += align(bo->base.size, ws->size_align);
 856
 857     return (struct pb_buffer*)bo;
 858 }
 859
 860 static struct pb_buffer *radeon_winsys_bo_from_handle(struct radeon_winsys *rws,
 861                                                       struct winsys_handle *whandle,
 862                                                       unsigned *stride)
 863 {
 864     struct radeon_drm_winsys *ws = radeon_drm_winsys(rws);
 865     struct radeon_bo *bo;
 866     int r;
 867     unsigned handle;
 868     uint64_t size = 0;
 869
 870     /* We must maintain a list of pairs <handle, bo>, so that we always return
 871      * the same BO for one particular handle. If we didn't do that and created
 872      * more than one BO for the same handle and then relocated them in a CS,
 873      * we would hit a deadlock in the kernel.
 874      *
 875      * The list of pairs is guarded by a mutex, of course. */
 876     pipe_mutex_lock(ws->bo_handles_mutex);
 877
 878     if (whandle->type == DRM_API_HANDLE_TYPE_SHARED) {
 879         /* First check if there already is an existing bo for the handle. */
 880         bo = util_hash_table_get(ws->bo_names, (void*)(uintptr_t)whandle->handle);
 881     } else if (whandle->type == DRM_API_HANDLE_TYPE_FD) {
 882         /* We must first get the GEM handle, as fds are unreliable keys */
 883         r = drmPrimeFDToHandle(ws->fd, whandle->handle, &handle);
 884         if (r)
 885             goto fail;
 886         bo = util_hash_table_get(ws->bo_handles, (void*)(uintptr_t)handle);
 887     } else {
 888         /* Unknown handle type */
 889         goto fail;
 890     }
 891
 892     if (bo) {
 893         /* Increase the refcount. */
 894         struct pb_buffer *b = NULL;
 895         pb_reference(&b, &bo->base);
 896         goto done;
 897     }
 898
 899     /* There isn't, create a new one. */
 900     bo = CALLOC_STRUCT(radeon_bo);
 901     if (!bo) {
 902         goto fail;
 903     }
 904
 905     if (whandle->type == DRM_API_HANDLE_TYPE_SHARED) {
 906         struct drm_gem_open open_arg = {};
 907         memset(&open_arg, 0, sizeof(open_arg));
 908         /* Open the BO. */
 909         open_arg.name = whandle->handle;
 910         if (drmIoctl(ws->fd, DRM_IOCTL_GEM_OPEN, &open_arg)) {
 911             FREE(bo);
 912             goto fail;
 913         }
 914         handle = open_arg.handle;
 915         size = open_arg.size;
 916         bo->flink_name = whandle->handle;
 917     } else if (whandle->type == DRM_API_HANDLE_TYPE_FD) {
 918         size = lseek(whandle->handle, 0, SEEK_END);
 919         /*
 920          * Could check errno to determine whether the kernel is new enough, but
 921          * it doesn't really matter why this failed, just that it failed.
 922          */
 923         if (size == (off_t)-1) {
 924             FREE(bo);
 925             goto fail;
 926         }
 927         lseek(whandle->handle, 0, SEEK_SET);
 928     }
 929
 930     bo->handle = handle;
 931
 932     /* Initialize it. */
 933     pipe_reference_init(&bo->base.reference, 1);
 934     bo->base.alignment = 0;
 935     bo->base.usage = PB_USAGE_GPU_WRITE | PB_USAGE_GPU_READ;
 936     bo->base.size = (unsigned) size;
 937     bo->base.vtbl = &radeon_bo_vtbl;
 938     bo->rws = ws;
 939     bo->va = 0;
 940     pipe_mutex_init(bo->map_mutex);
 941
 942     if (bo->flink_name)
 943         util_hash_table_set(ws->bo_names, (void*)(uintptr_t)bo->flink_name, bo);
 944
 945     util_hash_table_set(ws->bo_handles, (void*)(uintptr_t)bo->handle, bo);
 946
 947 done:
 948     pipe_mutex_unlock(ws->bo_handles_mutex);
 949
 950     if (stride)
 951         *stride = whandle->stride;
 952
 953     if (ws->info.has_virtual_memory && !bo->va) {
 954         struct drm_radeon_gem_va va;
 955
 956         bo->va = radeon_bomgr_find_va(ws, bo->base.size, 1 << 20);
 957
 958         va.handle = bo->handle;
 959         va.operation = RADEON_VA_MAP;
 960         va.vm_id = 0;
 961         va.offset = bo->va;
 962         va.flags = RADEON_VM_PAGE_READABLE |
 963                    RADEON_VM_PAGE_WRITEABLE |
 964                    RADEON_VM_PAGE_SNOOPED;
 965         va.offset = bo->va;
 966         r = drmCommandWriteRead(ws->fd, DRM_RADEON_GEM_VA, &va, sizeof(va));
 967         if (r && va.operation == RADEON_VA_RESULT_ERROR) {
 968             fprintf(stderr, "radeon: Failed to assign virtual address space\n");
 969             radeon_bo_destroy(&bo->base);
 970             return NULL;
 971         }
 972         pipe_mutex_lock(ws->bo_handles_mutex);
 973         if (va.operation == RADEON_VA_RESULT_VA_EXIST) {
 974             struct pb_buffer *b = &bo->base;
 975             struct radeon_bo *old_bo =
 976                 util_hash_table_get(ws->bo_vas, (void*)(uintptr_t)va.offset);
 977
 978             pipe_mutex_unlock(ws->bo_handles_mutex);
 979             pb_reference(&b, &old_bo->base);
 980             return b;
 981         }
 982
 983         util_hash_table_set(ws->bo_vas, (void*)(uintptr_t)bo->va, bo);
 984         pipe_mutex_unlock(ws->bo_handles_mutex);
 985     }
 986
 987     bo->initial_domain = radeon_bo_get_initial_domain((void*)bo);
 988
 989     if (bo->initial_domain & RADEON_DOMAIN_VRAM)
 990         ws->allocated_vram += align(bo->base.size, ws->size_align);
 991     else if (bo->initial_domain & RADEON_DOMAIN_GTT)
 992         ws->allocated_gtt += align(bo->base.size, ws->size_align);
 993
 994     return (struct pb_buffer*)bo;
 995
 996 fail:
 997     pipe_mutex_unlock(ws->bo_handles_mutex);
 998     return NULL;
 999 }
1000
1001 static boolean radeon_winsys_bo_get_handle(struct pb_buffer *buffer,
1002                                            unsigned stride,
1003                                            struct winsys_handle *whandle)
1004 {
1005     struct drm_gem_flink flink;
1006     struct radeon_bo *bo = radeon_bo(buffer);
1007     struct radeon_drm_winsys *ws = bo->rws;
1008
1009     memset(&flink, 0, sizeof(flink));
1010
1011     bo->use_reusable_pool = false;
1012
1013     if (whandle->type == DRM_API_HANDLE_TYPE_SHARED) {
1014         if (!bo->flink_name) {
1015             flink.handle = bo->handle;
1016
1017             if (ioctl(ws->fd, DRM_IOCTL_GEM_FLINK, &flink)) {
1018                 return FALSE;
1019             }
1020
1021             bo->flink_name = flink.name;
1022
1023             pipe_mutex_lock(ws->bo_handles_mutex);
1024             util_hash_table_set(ws->bo_names, (void*)(uintptr_t)bo->flink_name, bo);
1025             pipe_mutex_unlock(ws->bo_handles_mutex);
1026         }
1027         whandle->handle = bo->flink_name;
1028     } else if (whandle->type == DRM_API_HANDLE_TYPE_KMS) {
1029         whandle->handle = bo->handle;
1030     } else if (whandle->type == DRM_API_HANDLE_TYPE_FD) {
1031         if (drmPrimeHandleToFD(ws->fd, bo->handle, DRM_CLOEXEC, (int*)&whandle->handle))
1032             return FALSE;
1033     }
1034
1035     whandle->stride = stride;
1036     return TRUE;
1037 }
1038
1039 static bool radeon_winsys_bo_is_user_ptr(struct pb_buffer *buf)
1040 {
1041    return ((struct radeon_bo*)buf)->user_ptr != NULL;
1042 }
1043
1044 static uint64_t radeon_winsys_bo_va(struct pb_buffer *buf)
1045 {
1046     return ((struct radeon_bo*)buf)->va;
1047 }
1048
1049 void radeon_drm_bo_init_functions(struct radeon_drm_winsys *ws)
1050 {
1051     ws->base.buffer_set_tiling = radeon_bo_set_tiling;
1052     ws->base.buffer_get_tiling = radeon_bo_get_tiling;
1053     ws->base.buffer_map = radeon_bo_map;
1054     ws->base.buffer_unmap = radeon_bo_unmap;
1055     ws->base.buffer_wait = radeon_bo_wait;
1056     ws->base.buffer_create = radeon_winsys_bo_create;
1057     ws->base.buffer_from_handle = radeon_winsys_bo_from_handle;
1058     ws->base.buffer_from_ptr = radeon_winsys_bo_from_ptr;
1059     ws->base.buffer_is_user_ptr = radeon_winsys_bo_is_user_ptr;
1060     ws->base.buffer_get_handle = radeon_winsys_bo_get_handle;
1061     ws->base.buffer_get_virtual_address = radeon_winsys_bo_va;
1062     ws->base.buffer_get_initial_domain = radeon_bo_get_initial_domain;
1063 }