[libdrm/intel] Eliminate extra dri_gem_bo_bucket_entry structure
[profile/ivi/libdrm.git] / libdrm / intel / intel_bufmgr_gem.c
1 /**************************************************************************
2  *
3  * Copyright © 2007 Red Hat Inc.
4  * Copyright © 2007 Intel Corporation
5  * Copyright 2006 Tungsten Graphics, Inc., Bismarck, ND., USA
6  * All Rights Reserved.
7  *
8  * Permission is hereby granted, free of charge, to any person obtaining a
9  * copy of this software and associated documentation files (the
10  * "Software"), to deal in the Software without restriction, including
11  * without limitation the rights to use, copy, modify, merge, publish,
12  * distribute, sub license, and/or sell copies of the Software, and to
13  * permit persons to whom the Software is furnished to do so, subject to
14  * the following conditions:
15  *
16  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
17  * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
18  * FITNESS FOR A PARTICULAR PURPOSE AND NON-INFRINGEMENT. IN NO EVENT SHALL
19  * THE COPYRIGHT HOLDERS, AUTHORS AND/OR ITS SUPPLIERS BE LIABLE FOR ANY CLAIM,
20  * DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR
21  * OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE
22  * USE OR OTHER DEALINGS IN THE SOFTWARE.
23  *
24  * The above copyright notice and this permission notice (including the
25  * next paragraph) shall be included in all copies or substantial portions
26  * of the Software.
27  *
28  *
29  **************************************************************************/
30 /*
31  * Authors: Thomas Hellström <thomas-at-tungstengraphics-dot-com>
32  *          Keith Whitwell <keithw-at-tungstengraphics-dot-com>
33  *          Eric Anholt <eric@anholt.net>
34  *          Dave Airlie <airlied@linux.ie>
35  */
36
37 #include <xf86drm.h>
38 #include <stdio.h>
39 #include <stdlib.h>
40 #include <string.h>
41 #include <unistd.h>
42 #include <assert.h>
43 #include <sys/ioctl.h>
44 #include <sys/mman.h>
45
46 #include "errno.h"
47 #include "dri_bufmgr.h"
48 #include "intel_bufmgr.h"
49 #include "string.h"
50
51 #include "i915_drm.h"
52
53 #define DBG(...) do {                                   \
54    if (bufmgr_gem->bufmgr.debug)                        \
55       fprintf(stderr, __VA_ARGS__);                     \
56 } while (0)
57
58 typedef struct _dri_bo_gem dri_bo_gem;
59
60 struct dri_gem_bo_bucket {
61    dri_bo_gem *head, **tail;
62    /**
63     * Limit on the number of entries in this bucket.
64     *
65     * 0 means that this caching at this bucket size is disabled.
66     * -1 means that there is no limit to caching at this size.
67     */
68    int max_entries;
69    int num_entries;
70 };
71
72 /* Arbitrarily chosen, 16 means that the maximum size we'll cache for reuse
73  * is 1 << 16 pages, or 256MB.
74  */
75 #define INTEL_GEM_BO_BUCKETS    16
76 typedef struct _dri_bufmgr_gem {
77     dri_bufmgr bufmgr;
78
79     struct intel_bufmgr intel_bufmgr;
80
81     int fd;
82
83     int max_relocs;
84
85     struct drm_i915_gem_exec_object *exec_objects;
86     dri_bo **exec_bos;
87     int exec_size;
88     int exec_count;
89
90     /** Array of lists of cached gem objects of power-of-two sizes */
91     struct dri_gem_bo_bucket cache_bucket[INTEL_GEM_BO_BUCKETS];
92
93     struct drm_i915_gem_execbuffer exec_arg;
94 } dri_bufmgr_gem;
95
96 struct _dri_bo_gem {
97     dri_bo bo;
98
99     int refcount;
100     /** Boolean whether the mmap ioctl has been called for this buffer yet. */
101     int mapped;
102     uint32_t gem_handle;
103     const char *name;
104
105     /**
106      * Index of the buffer within the validation list while preparing a
107      * batchbuffer execution.
108      */
109     int validate_index;
110
111     /**
112      * Boolean whether set_domain to CPU is current
113      * Set when set_domain has been called
114      * Cleared when a batch has been submitted
115      */
116     int cpu_domain_set;
117
118     /** Array passed to the DRM containing relocation information. */
119     struct drm_i915_gem_relocation_entry *relocs;
120     /** Array of bos corresponding to relocs[i].target_handle */
121     dri_bo **reloc_target_bo;
122     /** Number of entries in relocs */
123     int reloc_count;
124     /** Mapped address for the buffer */
125     void *virtual;
126
127     /** free list */
128     dri_bo_gem *next;
129 };
130
131 static int
132 logbase2(int n)
133 {
134    int i = 1;
135    int log2 = 0;
136
137    while (n > i) {
138       i *= 2;
139       log2++;
140    }
141
142    return log2;
143 }
144
145 static struct dri_gem_bo_bucket *
146 dri_gem_bo_bucket_for_size(dri_bufmgr_gem *bufmgr_gem, unsigned long size)
147 {
148     int i;
149
150     /* We only do buckets in power of two increments */
151     if ((size & (size - 1)) != 0)
152         return NULL;
153
154     /* We should only see sizes rounded to pages. */
155     assert((size % 4096) == 0);
156
157     /* We always allocate in units of pages */
158     i = ffs(size / 4096) - 1;
159     if (i >= INTEL_GEM_BO_BUCKETS)
160         return NULL;
161
162     return &bufmgr_gem->cache_bucket[i];
163 }
164
165
166 static void dri_gem_dump_validation_list(dri_bufmgr_gem *bufmgr_gem)
167 {
168     int i, j;
169
170     for (i = 0; i < bufmgr_gem->exec_count; i++) {
171         dri_bo *bo = bufmgr_gem->exec_bos[i];
172         dri_bo_gem *bo_gem = (dri_bo_gem *)bo;
173
174         if (bo_gem->relocs == NULL) {
175             DBG("%2d: %d (%s)\n", i, bo_gem->gem_handle, bo_gem->name);
176             continue;
177         }
178
179         for (j = 0; j < bo_gem->reloc_count; j++) {
180             dri_bo *target_bo = bo_gem->reloc_target_bo[j];
181             dri_bo_gem *target_gem = (dri_bo_gem *)target_bo;
182
183             DBG("%2d: %d (%s)@0x%08llx -> %d (%s)@0x%08lx + 0x%08x\n",
184                 i,
185                 bo_gem->gem_handle, bo_gem->name, bo_gem->relocs[j].offset,
186                 target_gem->gem_handle, target_gem->name, target_bo->offset,
187                 bo_gem->relocs[j].delta);
188         }
189     }
190 }
191
192 /**
193  * Adds the given buffer to the list of buffers to be validated (moved into the
194  * appropriate memory type) with the next batch submission.
195  *
196  * If a buffer is validated multiple times in a batch submission, it ends up
197  * with the intersection of the memory type flags and the union of the
198  * access flags.
199  */
200 static void
201 intel_add_validate_buffer(dri_bo *bo)
202 {
203     dri_bufmgr_gem *bufmgr_gem = (dri_bufmgr_gem *)bo->bufmgr;
204     dri_bo_gem *bo_gem = (dri_bo_gem *)bo;
205     int index;
206
207     if (bo_gem->validate_index != -1)
208         return;
209
210     /* Extend the array of validation entries as necessary. */
211     if (bufmgr_gem->exec_count == bufmgr_gem->exec_size) {
212         int new_size = bufmgr_gem->exec_size * 2;
213
214         if (new_size == 0)
215             new_size = 5;
216
217         bufmgr_gem->exec_objects =
218             realloc(bufmgr_gem->exec_objects,
219                     sizeof(*bufmgr_gem->exec_objects) * new_size);
220         bufmgr_gem->exec_bos =
221             realloc(bufmgr_gem->exec_bos,
222                     sizeof(*bufmgr_gem->exec_bos) * new_size);
223         bufmgr_gem->exec_size = new_size;
224     }
225
226     index = bufmgr_gem->exec_count;
227     bo_gem->validate_index = index;
228     /* Fill in array entry */
229     bufmgr_gem->exec_objects[index].handle = bo_gem->gem_handle;
230     bufmgr_gem->exec_objects[index].relocation_count = bo_gem->reloc_count;
231     bufmgr_gem->exec_objects[index].relocs_ptr = (uintptr_t)bo_gem->relocs;
232     bufmgr_gem->exec_objects[index].alignment = 0;
233     bufmgr_gem->exec_objects[index].offset = 0;
234     bufmgr_gem->exec_bos[index] = bo;
235     dri_bo_reference(bo);
236     bufmgr_gem->exec_count++;
237 }
238
239
240 #define RELOC_BUF_SIZE(x) ((I915_RELOC_HEADER + x * I915_RELOC0_STRIDE) * \
241         sizeof(uint32_t))
242
243 static int
244 intel_setup_reloc_list(dri_bo *bo)
245 {
246     dri_bo_gem *bo_gem = (dri_bo_gem *)bo;
247     dri_bufmgr_gem *bufmgr_gem = (dri_bufmgr_gem *)bo->bufmgr;
248
249     bo_gem->relocs = malloc(bufmgr_gem->max_relocs *
250                             sizeof(struct drm_i915_gem_relocation_entry));
251     bo_gem->reloc_target_bo = malloc(bufmgr_gem->max_relocs * sizeof(dri_bo *));
252
253     return 0;
254 }
255
256 static dri_bo *
257 dri_gem_bo_alloc(dri_bufmgr *bufmgr, const char *name,
258                  unsigned long size, unsigned int alignment)
259 {
260     dri_bufmgr_gem *bufmgr_gem = (dri_bufmgr_gem *)bufmgr;
261     dri_bo_gem *bo_gem;
262     unsigned int page_size = getpagesize();
263     int ret;
264     struct dri_gem_bo_bucket *bucket;
265     int alloc_from_cache = 0;
266     unsigned long bo_size;
267
268     /* Round the allocated size up to a power of two number of pages. */
269     bo_size = 1 << logbase2(size);
270     if (bo_size < page_size)
271         bo_size = page_size;
272     bucket = dri_gem_bo_bucket_for_size(bufmgr_gem, bo_size);
273
274     /* If we don't have caching at this size, don't actually round the
275      * allocation up.
276      */
277     if (bucket == NULL || bucket->max_entries == 0) {
278         bo_size = size;
279         if (bo_size < page_size)
280             bo_size = page_size;
281     }
282
283     /* Get a buffer out of the cache if available */
284     if (bucket != NULL && bucket->num_entries > 0) {
285         struct drm_i915_gem_busy busy;
286         
287         bo_gem = bucket->head;
288         busy.handle = bo_gem->gem_handle;
289
290         ret = ioctl(bufmgr_gem->fd, DRM_IOCTL_I915_GEM_BUSY, &busy);
291         alloc_from_cache = (ret == 0 && busy.busy == 0);
292
293         if (alloc_from_cache) {
294             bucket->head = bo_gem->next;
295             if (bo_gem->next == NULL)
296                 bucket->tail = &bucket->head;
297             bucket->num_entries--;
298         }
299     }
300
301     if (!alloc_from_cache) {
302         struct drm_gem_create create;
303
304         bo_gem = calloc(1, sizeof(*bo_gem));
305         if (!bo_gem)
306             return NULL;
307
308         bo_gem->bo.size = bo_size;
309         memset(&create, 0, sizeof(create));
310         create.size = bo_size;
311
312         ret = ioctl(bufmgr_gem->fd, DRM_IOCTL_GEM_CREATE, &create);
313         bo_gem->gem_handle = create.handle;
314         if (ret != 0) {
315             free(bo_gem);
316             return NULL;
317         }
318         bo_gem->bo.bufmgr = bufmgr;
319     }
320
321     bo_gem->name = name;
322     bo_gem->refcount = 1;
323     bo_gem->validate_index = -1;
324
325     DBG("bo_create: buf %d (%s) %ldb\n",
326         bo_gem->gem_handle, bo_gem->name, size);
327
328     return &bo_gem->bo;
329 }
330
331 /**
332  * Returns a dri_bo wrapping the given buffer object handle.
333  *
334  * This can be used when one application needs to pass a buffer object
335  * to another.
336  */
337 dri_bo *
338 intel_bo_gem_create_from_name(dri_bufmgr *bufmgr, const char *name,
339                               unsigned int handle)
340 {
341     dri_bufmgr_gem *bufmgr_gem = (dri_bufmgr_gem *)bufmgr;
342     dri_bo_gem *bo_gem;
343     int ret;
344     struct drm_gem_open open_arg;
345
346     bo_gem = calloc(1, sizeof(*bo_gem));
347     if (!bo_gem)
348         return NULL;
349
350     memset(&open_arg, 0, sizeof(open_arg));
351     open_arg.name = handle;
352     ret = ioctl(bufmgr_gem->fd, DRM_IOCTL_GEM_OPEN, &open_arg);
353     if (ret != 0) {
354         fprintf(stderr, "Couldn't reference %s handle 0x%08x: %s\n",
355                name, handle, strerror(-ret));
356         free(bo_gem);
357         return NULL;
358     }
359     bo_gem->bo.size = open_arg.size;
360     bo_gem->bo.offset = 0;
361     bo_gem->bo.virtual = NULL;
362     bo_gem->bo.bufmgr = bufmgr;
363     bo_gem->name = name;
364     bo_gem->refcount = 1;
365     bo_gem->validate_index = -1;
366     bo_gem->gem_handle = open_arg.handle;
367
368     DBG("bo_create_from_handle: %d (%s)\n", handle, bo_gem->name);
369
370     return &bo_gem->bo;
371 }
372
373 static void
374 dri_gem_bo_reference(dri_bo *bo)
375 {
376     dri_bo_gem *bo_gem = (dri_bo_gem *)bo;
377
378     bo_gem->refcount++;
379 }
380
381 static void
382 dri_gem_bo_unreference(dri_bo *bo)
383 {
384     dri_bufmgr_gem *bufmgr_gem = (dri_bufmgr_gem *)bo->bufmgr;
385     dri_bo_gem *bo_gem = (dri_bo_gem *)bo;
386
387     if (!bo)
388         return;
389
390     if (--bo_gem->refcount == 0) {
391         struct dri_gem_bo_bucket *bucket;
392         int ret;
393
394         if (bo_gem->relocs != NULL) {
395             int i;
396
397             /* Unreference all the target buffers */
398             for (i = 0; i < bo_gem->reloc_count; i++)
399                  dri_bo_unreference(bo_gem->reloc_target_bo[i]);
400             free(bo_gem->reloc_target_bo);
401             free(bo_gem->relocs);
402         }
403
404         DBG("bo_unreference final: %d (%s)\n",
405             bo_gem->gem_handle, bo_gem->name);
406
407         bucket = dri_gem_bo_bucket_for_size(bufmgr_gem, bo->size);
408         /* Put the buffer into our internal cache for reuse if we can. */
409         if (bucket != NULL &&
410             (bucket->max_entries == -1 ||
411              (bucket->max_entries > 0 &&
412               bucket->num_entries < bucket->max_entries)))
413         {
414             bo_gem->name = 0;
415             bo_gem->validate_index = -1;
416             bo_gem->relocs = NULL;
417             bo_gem->reloc_target_bo = NULL;
418             bo_gem->reloc_count = 0;
419
420             bo_gem->next = NULL;
421             *bucket->tail = bo_gem;
422             bucket->tail = &bo_gem->next;
423             bucket->num_entries++;
424         } else {
425             struct drm_gem_close close;
426
427             /* Close this object */
428             close.handle = bo_gem->gem_handle;
429             ret = ioctl(bufmgr_gem->fd, DRM_IOCTL_GEM_CLOSE, &close);
430             if (ret != 0) {
431                fprintf(stderr,
432                        "DRM_IOCTL_GEM_CLOSE %d failed (%s): %s\n",
433                        bo_gem->gem_handle, bo_gem->name, strerror(-ret));
434             }
435             free(bo);
436         }
437
438         return;
439     }
440 }
441
442 static int
443 dri_gem_bo_map(dri_bo *bo, int write_enable)
444 {
445     dri_bufmgr_gem *bufmgr_gem;
446     dri_bo_gem *bo_gem = (dri_bo_gem *)bo;
447     struct drm_gem_set_domain set_domain;
448     int ret;
449
450     bufmgr_gem = (dri_bufmgr_gem *)bo->bufmgr;
451
452     /* Allow recursive mapping. Mesa may recursively map buffers with
453      * nested display loops.
454      */
455     if (!bo_gem->mapped) {
456     
457         assert(bo->virtual == NULL);
458     
459         DBG("bo_map: %d (%s)\n", bo_gem->gem_handle, bo_gem->name);
460     
461         if (bo_gem->virtual == NULL) {
462             struct drm_gem_mmap mmap_arg;
463     
464             memset(&mmap_arg, 0, sizeof(mmap_arg));
465             mmap_arg.handle = bo_gem->gem_handle;
466             mmap_arg.offset = 0;
467             mmap_arg.size = bo->size;
468             ret = ioctl(bufmgr_gem->fd, DRM_IOCTL_GEM_MMAP, &mmap_arg);
469             if (ret != 0) {
470                 fprintf(stderr, "%s:%d: Error mapping buffer %d (%s): %s .\n",
471                         __FILE__, __LINE__,
472                         bo_gem->gem_handle, bo_gem->name, strerror(errno));
473             }
474             bo_gem->virtual = (void *)(uintptr_t)mmap_arg.addr_ptr;
475         }
476         bo->virtual = bo_gem->virtual;
477         bo_gem->mapped = 1;
478         DBG("bo_map: %d (%s) -> %p\n", bo_gem->gem_handle, bo_gem->name, bo_gem->virtual);
479     }
480
481     if (!bo_gem->cpu_domain_set) {
482         set_domain.handle = bo_gem->gem_handle;
483         set_domain.read_domains = DRM_GEM_DOMAIN_CPU;
484         set_domain.write_domain = write_enable ? DRM_GEM_DOMAIN_CPU : 0;
485         ret = ioctl (bufmgr_gem->fd, DRM_IOCTL_GEM_SET_DOMAIN, &set_domain);
486         if (ret != 0) {
487             fprintf (stderr, "%s:%d: Error setting memory domains %d (%08x %08x): %s .\n",
488                      __FILE__, __LINE__,
489                      bo_gem->gem_handle, set_domain.read_domains, set_domain.write_domain,
490                      strerror (errno));
491         }
492         bo_gem->cpu_domain_set = 1;
493     }
494
495     return 0;
496 }
497
498 static int
499 dri_gem_bo_unmap(dri_bo *bo)
500 {
501     dri_bo_gem *bo_gem = (dri_bo_gem *)bo;
502
503     if (bo == NULL)
504         return 0;
505
506     assert(bo_gem->mapped);
507
508     return 0;
509 }
510
511 static int
512 dri_gem_bo_subdata (dri_bo *bo, unsigned long offset,
513                     unsigned long size, const void *data)
514 {
515     dri_bufmgr_gem *bufmgr_gem = (dri_bufmgr_gem *)bo->bufmgr;
516     dri_bo_gem *bo_gem = (dri_bo_gem *)bo;
517     struct drm_gem_pwrite pwrite;
518     int ret;
519
520     memset (&pwrite, 0, sizeof (pwrite));
521     pwrite.handle = bo_gem->gem_handle;
522     pwrite.offset = offset;
523     pwrite.size = size;
524     pwrite.data_ptr = (uint64_t) (uintptr_t) data;
525     ret = ioctl (bufmgr_gem->fd, DRM_IOCTL_GEM_PWRITE, &pwrite);
526     if (ret != 0) {
527         fprintf (stderr, "%s:%d: Error writing data to buffer %d: (%d %d) %s .\n",
528                  __FILE__, __LINE__,
529                  bo_gem->gem_handle, (int) offset, (int) size,
530                  strerror (errno));
531     }
532     return 0;
533 }
534
535 static int
536 dri_gem_bo_get_subdata (dri_bo *bo, unsigned long offset,
537                         unsigned long size, void *data)
538 {
539     dri_bufmgr_gem *bufmgr_gem = (dri_bufmgr_gem *)bo->bufmgr;
540     dri_bo_gem *bo_gem = (dri_bo_gem *)bo;
541     struct drm_gem_pread pread;
542     int ret;
543
544     memset (&pread, 0, sizeof (pread));
545     pread.handle = bo_gem->gem_handle;
546     pread.offset = offset;
547     pread.size = size;
548     pread.data_ptr = (uint64_t) (uintptr_t) data;
549     ret = ioctl (bufmgr_gem->fd, DRM_IOCTL_GEM_PREAD, &pread);
550     if (ret != 0) {
551         fprintf (stderr, "%s:%d: Error reading data from buffer %d: (%d %d) %s .\n",
552                  __FILE__, __LINE__,
553                  bo_gem->gem_handle, (int) offset, (int) size,
554                  strerror (errno));
555     }
556     return 0;
557 }
558
559 static void
560 dri_gem_bo_wait_rendering(dri_bo *bo)
561 {
562     dri_bufmgr_gem *bufmgr_gem = (dri_bufmgr_gem *)bo->bufmgr;
563     dri_bo_gem *bo_gem = (dri_bo_gem *)bo;
564     struct drm_gem_set_domain set_domain;
565     int ret;
566
567     set_domain.handle = bo_gem->gem_handle;
568     set_domain.read_domains = DRM_GEM_DOMAIN_CPU;
569     set_domain.write_domain = 0;
570     ret = ioctl (bufmgr_gem->fd, DRM_IOCTL_GEM_SET_DOMAIN, &set_domain);
571     if (ret != 0) {
572         fprintf (stderr, "%s:%d: Error setting memory domains %d (%08x %08x): %s .\n",
573                  __FILE__, __LINE__,
574                  bo_gem->gem_handle, set_domain.read_domains, set_domain.write_domain,
575                  strerror (errno));
576     }
577 }
578
579 static void
580 dri_bufmgr_gem_destroy(dri_bufmgr *bufmgr)
581 {
582     dri_bufmgr_gem *bufmgr_gem = (dri_bufmgr_gem *)bufmgr;
583     int i;
584
585     free(bufmgr_gem->exec_objects);
586     free(bufmgr_gem->exec_bos);
587
588     /* Free any cached buffer objects we were going to reuse */
589     for (i = 0; i < INTEL_GEM_BO_BUCKETS; i++) {
590         struct dri_gem_bo_bucket *bucket = &bufmgr_gem->cache_bucket[i];
591         dri_bo_gem *bo_gem;
592
593         while ((bo_gem = bucket->head) != NULL) {
594             struct drm_gem_close close;
595             int ret;
596
597             bucket->head = bo_gem->next;
598             if (bo_gem->next == NULL)
599                 bucket->tail = &bucket->head;
600             bucket->num_entries--;
601
602             if (bo_gem->mapped)
603                 munmap (bo_gem->virtual, bo_gem->bo.size);
604             
605             /* Close this object */
606             close.handle = bo_gem->gem_handle;
607             ret = ioctl(bufmgr_gem->fd, DRM_IOCTL_GEM_CLOSE, &close);
608             if (ret != 0) {
609                fprintf(stderr, "DRM_IOCTL_GEM_CLOSE failed: %s\n",
610                        strerror(-ret));
611             }
612
613             free(bo_gem);
614         }
615     }
616
617     free(bufmgr);
618 }
619
620 /**
621  * Adds the target buffer to the validation list and adds the relocation
622  * to the reloc_buffer's relocation list.
623  *
624  * The relocation entry at the given offset must already contain the
625  * precomputed relocation value, because the kernel will optimize out
626  * the relocation entry write when the buffer hasn't moved from the
627  * last known offset in target_bo.
628  */
629 static int
630 dri_gem_emit_reloc(dri_bo *bo, uint32_t read_domains, uint32_t write_domain,
631                    uint32_t delta, uint32_t offset, dri_bo *target_bo)
632 {
633     dri_bufmgr_gem *bufmgr_gem = (dri_bufmgr_gem *)bo->bufmgr;
634     dri_bo_gem *bo_gem = (dri_bo_gem *)bo;
635     dri_bo_gem *target_bo_gem = (dri_bo_gem *)target_bo;
636
637     /* Create a new relocation list if needed */
638     if (bo_gem->relocs == NULL)
639         intel_setup_reloc_list(bo);
640
641     /* Check overflow */
642     assert(bo_gem->reloc_count < bufmgr_gem->max_relocs);
643
644     /* Check args */
645     assert (offset <= bo->size - 4);
646     assert ((write_domain & (write_domain-1)) == 0);
647
648     bo_gem->relocs[bo_gem->reloc_count].offset = offset;
649     bo_gem->relocs[bo_gem->reloc_count].delta = delta;
650     bo_gem->relocs[bo_gem->reloc_count].target_handle =
651         target_bo_gem->gem_handle;
652     bo_gem->relocs[bo_gem->reloc_count].read_domains = read_domains;
653     bo_gem->relocs[bo_gem->reloc_count].write_domain = write_domain;
654     bo_gem->relocs[bo_gem->reloc_count].presumed_offset = target_bo->offset;
655
656     bo_gem->reloc_target_bo[bo_gem->reloc_count] = target_bo;
657     dri_bo_reference(target_bo);
658
659     bo_gem->reloc_count++;
660     return 0;
661 }
662
663 /**
664  * Walk the tree of relocations rooted at BO and accumulate the list of
665  * validations to be performed and update the relocation buffers with
666  * index values into the validation list.
667  */
668 static void
669 dri_gem_bo_process_reloc(dri_bo *bo)
670 {
671     dri_bo_gem *bo_gem = (dri_bo_gem *)bo;
672     int i;
673
674     if (bo_gem->relocs == NULL)
675         return;
676
677     for (i = 0; i < bo_gem->reloc_count; i++) {
678         dri_bo *target_bo = bo_gem->reloc_target_bo[i];
679
680         /* Continue walking the tree depth-first. */
681         dri_gem_bo_process_reloc(target_bo);
682
683         /* Add the target to the validate list */
684         intel_add_validate_buffer(target_bo);
685     }
686 }
687
688 static void *
689 dri_gem_process_reloc(dri_bo *batch_buf)
690 {
691     dri_bufmgr_gem *bufmgr_gem = (dri_bufmgr_gem *) batch_buf->bufmgr;
692
693     /* Update indices and set up the validate list. */
694     dri_gem_bo_process_reloc(batch_buf);
695
696     /* Add the batch buffer to the validation list.  There are no relocations
697      * pointing to it.
698      */
699     intel_add_validate_buffer(batch_buf);
700
701     bufmgr_gem->exec_arg.buffers_ptr = (uintptr_t)bufmgr_gem->exec_objects;
702     bufmgr_gem->exec_arg.buffer_count = bufmgr_gem->exec_count;
703     bufmgr_gem->exec_arg.batch_start_offset = 0;
704     bufmgr_gem->exec_arg.batch_len = 0; /* written in intel_exec_ioctl */
705
706     return &bufmgr_gem->exec_arg;
707 }
708
709 static void
710 intel_update_buffer_offsets (dri_bufmgr_gem *bufmgr_gem)
711 {
712     int i;
713
714     for (i = 0; i < bufmgr_gem->exec_count; i++) {
715         dri_bo *bo = bufmgr_gem->exec_bos[i];
716         dri_bo_gem *bo_gem = (dri_bo_gem *)bo;
717
718         /* Update the buffer offset */
719         if (bufmgr_gem->exec_objects[i].offset != bo->offset) {
720             DBG("BO %d (%s) migrated: 0x%08lx -> 0x%08llx\n",
721                 bo_gem->gem_handle, bo_gem->name, bo->offset,
722                 bufmgr_gem->exec_objects[i].offset);
723             bo->offset = bufmgr_gem->exec_objects[i].offset;
724         }
725     }
726 }
727
728 static void
729 dri_gem_post_submit(dri_bo *batch_buf)
730 {
731     dri_bufmgr_gem *bufmgr_gem = (dri_bufmgr_gem *)batch_buf->bufmgr;
732     int i;
733
734     intel_update_buffer_offsets (bufmgr_gem);
735
736     if (bufmgr_gem->bufmgr.debug)
737         dri_gem_dump_validation_list(bufmgr_gem);
738
739     for (i = 0; i < bufmgr_gem->exec_count; i++) {
740         dri_bo *bo = bufmgr_gem->exec_bos[i];
741         dri_bo_gem *bo_gem = (dri_bo_gem *)bo;
742
743         /* Need to call set_domain on next bo_map */
744         bo_gem->cpu_domain_set = 0;
745
746         /* Disconnect the buffer from the validate list */
747         bo_gem->validate_index = -1;
748         dri_bo_unreference(bo);
749         bufmgr_gem->exec_bos[i] = NULL;
750     }
751     bufmgr_gem->exec_count = 0;
752 }
753
754 /**
755  * Enables unlimited caching of buffer objects for reuse.
756  *
757  * This is potentially very memory expensive, as the cache at each bucket
758  * size is only bounded by how many buffers of that size we've managed to have
759  * in flight at once.
760  */
761 void
762 intel_bufmgr_gem_enable_reuse(dri_bufmgr *bufmgr)
763 {
764     dri_bufmgr_gem *bufmgr_gem = (dri_bufmgr_gem *)bufmgr;
765     int i;
766
767     for (i = 0; i < INTEL_GEM_BO_BUCKETS; i++) {
768         bufmgr_gem->cache_bucket[i].max_entries = -1;
769     }
770 }
771
772 /*
773  *
774  */
775 static int
776 dri_gem_check_aperture_space(dri_bo *bo)
777 {
778     return 0;
779 }
780
781 /**
782  * Initializes the GEM buffer manager, which uses the kernel to allocate, map,
783  * and manage map buffer objections.
784  *
785  * \param fd File descriptor of the opened DRM device.
786  */
787 dri_bufmgr *
788 intel_bufmgr_gem_init(int fd, int batch_size)
789 {
790     dri_bufmgr_gem *bufmgr_gem;
791     int i;
792
793     bufmgr_gem = calloc(1, sizeof(*bufmgr_gem));
794     bufmgr_gem->fd = fd;
795
796     /* Let's go with one relocation per every 2 dwords (but round down a bit
797      * since a power of two will mean an extra page allocation for the reloc
798      * buffer).
799      *
800      * Every 4 was too few for the blender benchmark.
801      */
802     bufmgr_gem->max_relocs = batch_size / sizeof(uint32_t) / 2 - 2;
803
804     bufmgr_gem->bufmgr.bo_alloc = dri_gem_bo_alloc;
805     bufmgr_gem->bufmgr.bo_reference = dri_gem_bo_reference;
806     bufmgr_gem->bufmgr.bo_unreference = dri_gem_bo_unreference;
807     bufmgr_gem->bufmgr.bo_map = dri_gem_bo_map;
808     bufmgr_gem->bufmgr.bo_unmap = dri_gem_bo_unmap;
809     bufmgr_gem->bufmgr.bo_subdata = dri_gem_bo_subdata;
810     bufmgr_gem->bufmgr.bo_get_subdata = dri_gem_bo_get_subdata;
811     bufmgr_gem->bufmgr.bo_wait_rendering = dri_gem_bo_wait_rendering;
812     bufmgr_gem->bufmgr.destroy = dri_bufmgr_gem_destroy;
813     bufmgr_gem->bufmgr.process_relocs = dri_gem_process_reloc;
814     bufmgr_gem->bufmgr.post_submit = dri_gem_post_submit;
815     bufmgr_gem->bufmgr.debug = 0;
816     bufmgr_gem->bufmgr.check_aperture_space = dri_gem_check_aperture_space;
817     bufmgr_gem->intel_bufmgr.emit_reloc = dri_gem_emit_reloc;
818     /* Initialize the linked lists for BO reuse cache. */
819     for (i = 0; i < INTEL_GEM_BO_BUCKETS; i++)
820         bufmgr_gem->cache_bucket[i].tail = &bufmgr_gem->cache_bucket[i].head;
821
822     return &bufmgr_gem->bufmgr;
823 }
824
825 int
826 intel_bo_emit_reloc(dri_bo *reloc_buf,
827                     uint32_t read_domains, uint32_t write_domain,
828                     uint32_t delta, uint32_t offset, dri_bo *target_buf)
829 {
830     struct intel_bufmgr *intel_bufmgr;
831
832     intel_bufmgr = (struct intel_bufmgr *)(reloc_buf->bufmgr + 1);
833
834     return intel_bufmgr->emit_reloc(reloc_buf, read_domains, write_domain,
835                                     delta, offset, target_buf);
836 }