vbo: utilize structure padding to optimize indirection cold->prims[0].begin
[platform/upstream/mesa.git] / src / mesa / vbo / vbo_save_api.c
1 /**************************************************************************
2
3 Copyright 2002-2008 VMware, Inc.
4
5 All Rights Reserved.
6
7 Permission is hereby granted, free of charge, to any person obtaining a
8 copy of this software and associated documentation files (the "Software"),
9 to deal in the Software without restriction, including without limitation
10 on the rights to use, copy, modify, merge, publish, distribute, sub
11 license, and/or sell copies of the Software, and to permit persons to whom
12 the Software is furnished to do so, subject to the following conditions:
13
14 The above copyright notice and this permission notice (including the next
15 paragraph) shall be included in all copies or substantial portions of the
16 Software.
17
18 THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
19 IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
20 FITNESS FOR A PARTICULAR PURPOSE AND NON-INFRINGEMENT. IN NO EVENT SHALL
21 VMWARE AND/OR THEIR SUPPLIERS BE LIABLE FOR ANY CLAIM,
22 DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR
23 OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE
24 USE OR OTHER DEALINGS IN THE SOFTWARE.
25
26 **************************************************************************/
27
28 /*
29  * Authors:
30  *   Keith Whitwell <keithw@vmware.com>
31  */
32
33
34
35 /* Display list compiler attempts to store lists of vertices with the
36  * same vertex layout.  Additionally it attempts to minimize the need
37  * for execute-time fixup of these vertex lists, allowing them to be
38  * cached on hardware.
39  *
40  * There are still some circumstances where this can be thwarted, for
41  * example by building a list that consists of one very long primitive
42  * (eg Begin(Triangles), 1000 vertices, End), and calling that list
43  * from inside a different begin/end object (Begin(Lines), CallList,
44  * End).
45  *
46  * In that case the code will have to replay the list as individual
47  * commands through the Exec dispatch table, or fix up the copied
48  * vertices at execute-time.
49  *
50  * The other case where fixup is required is when a vertex attribute
51  * is introduced in the middle of a primitive.  Eg:
52  *  Begin(Lines)
53  *  TexCoord1f()           Vertex2f()
54  *  TexCoord1f() Color3f() Vertex2f()
55  *  End()
56  *
57  *  If the current value of Color isn't known at compile-time, this
58  *  primitive will require fixup.
59  *
60  *
61  * The list compiler currently doesn't attempt to compile lists
62  * containing EvalCoord or EvalPoint commands.  On encountering one of
63  * these, compilation falls back to opcodes.
64  *
65  * This could be improved to fallback only when a mix of EvalCoord and
66  * Vertex commands are issued within a single primitive.
67  *
68  * The compilation process works as follows. All vertex attributes
69  * except position are copied to vbo_save_context::attrptr (see ATTR_UNION).
70  * 'attrptr' are pointers to vbo_save_context::vertex ordered according to the enabled
71  * attributes (se upgrade_vertex).
72  * When the position attribute is received, all the attributes are then 
73  * copied to the vertex_store (see the end of ATTR_UNION).
74  * The vertex_store is simply an extensible float array.
75  * When the vertex list needs to be compiled (see compile_vertex_list),
76  * several transformations are performed:
77  *   - some primitives are merged together (eg: two consecutive GL_TRIANGLES
78  * with 3 vertices can be merged in a single GL_TRIANGLES with 6 vertices).
79  *   - an index buffer is built.
80  *   - identical vertices are detected and only one is kept.
81  * At the end of this transformation, the index buffer and the vertex buffer
82  * are uploaded in vRAM in the same buffer object.
83  * This buffer object is shared between multiple display list to allow
84  * draw calls merging later.
85  *
86  * The layout of this buffer for two display lists is:
87  *    V0A0|V0A1|V1A0|V1A1|P0I0|P0I1|V0A0V0A1V0A2|V1A1V1A1V1A2|...
88  *                                 ` new list starts
89  *        - VxAy: vertex x, attributes y
90  *        - PxIy: draw x, index y
91  *
92  * To allow draw call merging, display list must use the same VAO, including
93  * the same Offset in the buffer object. To achieve this, the start values of
94  * the primitive are shifted and the indices adjusted (see offset_diff and
95  * start_offset in compile_vertex_list).
96  *
97  * Display list using the loopback code (see vbo_save_playback_vertex_list_loopback),
98  * can't be drawn with an index buffer so this transformation is disabled
99  * in this case.
100  */
101
102
103 #include "main/glheader.h"
104 #include "main/arrayobj.h"
105 #include "main/bufferobj.h"
106 #include "main/context.h"
107 #include "main/dlist.h"
108 #include "main/enums.h"
109 #include "main/eval.h"
110 #include "main/macros.h"
111 #include "main/draw_validate.h"
112 #include "main/api_arrayelt.h"
113 #include "main/vtxfmt.h"
114 #include "main/dispatch.h"
115 #include "main/state.h"
116 #include "main/varray.h"
117 #include "util/bitscan.h"
118 #include "util/u_memory.h"
119 #include "util/hash_table.h"
120
121 #include "gallium/include/pipe/p_state.h"
122
123 #include "vbo_noop.h"
124 #include "vbo_private.h"
125
126
127 #ifdef ERROR
128 #undef ERROR
129 #endif
130
131 /* An interesting VBO number/name to help with debugging */
132 #define VBO_BUF_ID  12345
133
134 static void GLAPIENTRY
135 _save_Materialfv(GLenum face, GLenum pname, const GLfloat *params);
136
137 static void GLAPIENTRY
138 _save_EvalCoord1f(GLfloat u);
139
140 static void GLAPIENTRY
141 _save_EvalCoord2f(GLfloat u, GLfloat v);
142
143 static void
144 handle_out_of_memory(struct gl_context *ctx)
145 {
146    struct vbo_save_context *save = &vbo_context(ctx)->save;
147    _mesa_noop_vtxfmt_init(ctx, &save->vtxfmt);
148    save->out_of_memory = true;
149 }
150
151 /*
152  * NOTE: Old 'parity' issue is gone, but copying can still be
153  * wrong-footed on replay.
154  */
155 static GLuint
156 copy_vertices(struct gl_context *ctx,
157               const struct vbo_save_vertex_list *node,
158               const fi_type * src_buffer)
159 {
160    struct vbo_save_context *save = &vbo_context(ctx)->save;
161    struct _mesa_prim *prim = &node->cold->prims[node->cold->prim_count - 1];
162    GLuint sz = save->vertex_size;
163
164    if (prim->end || !prim->count || !sz)
165       return 0;
166
167    const fi_type *src = src_buffer + prim->start * sz;
168    assert(save->copied.buffer == NULL);
169    save->copied.buffer = malloc(sizeof(fi_type) * sz * prim->count);
170
171    unsigned r = vbo_copy_vertices(ctx, prim->mode, prim->start, &prim->count,
172                                   prim->begin, sz, true, save->copied.buffer, src);
173    if (!r) {
174       free(save->copied.buffer);
175       save->copied.buffer = NULL;
176    }
177    return r;
178 }
179
180
181 static struct vbo_save_primitive_store *
182 realloc_prim_store(struct vbo_save_primitive_store *store, int prim_count)
183 {
184    if (store == NULL)
185       store = CALLOC_STRUCT(vbo_save_primitive_store);
186
187    uint32_t old_size = store->size;
188    store->size = prim_count;
189    assert (old_size < store->size);
190    store->prims = realloc(store->prims, store->size * sizeof(struct _mesa_prim));
191    memset(&store->prims[old_size], 0, (store->size - old_size) * sizeof(struct _mesa_prim));
192
193    return store;
194 }
195
196
197 static void
198 reset_counters(struct gl_context *ctx)
199 {
200    struct vbo_save_context *save = &vbo_context(ctx)->save;
201
202    save->vertex_store->used = 0;
203    save->prim_store->used = 0;
204    save->dangling_attr_ref = GL_FALSE;
205 }
206
207 /**
208  * For a list of prims, try merging prims that can just be extensions of the
209  * previous prim.
210  */
211 static void
212 merge_prims(struct gl_context *ctx, struct _mesa_prim *prim_list,
213             GLuint *prim_count)
214 {
215    GLuint i;
216    struct _mesa_prim *prev_prim = prim_list;
217
218    for (i = 1; i < *prim_count; i++) {
219       struct _mesa_prim *this_prim = prim_list + i;
220
221       vbo_try_prim_conversion(&this_prim->mode, &this_prim->count);
222
223       if (vbo_merge_draws(ctx, true,
224                           prev_prim->mode, this_prim->mode,
225                           prev_prim->start, this_prim->start,
226                           &prev_prim->count, this_prim->count,
227                           prev_prim->basevertex, this_prim->basevertex,
228                           &prev_prim->end,
229                           this_prim->begin, this_prim->end)) {
230          /* We've found a prim that just extend the previous one.  Tack it
231           * onto the previous one, and let this primitive struct get dropped.
232           */
233          continue;
234       }
235
236       /* If any previous primitives have been dropped, then we need to copy
237        * this later one into the next available slot.
238        */
239       prev_prim++;
240       if (prev_prim != this_prim)
241          *prev_prim = *this_prim;
242    }
243
244    *prim_count = prev_prim - prim_list + 1;
245 }
246
247
248 /**
249  * Convert GL_LINE_LOOP primitive into GL_LINE_STRIP so that drivers
250  * don't have to worry about handling the _mesa_prim::begin/end flags.
251  * See https://bugs.freedesktop.org/show_bug.cgi?id=81174
252  */
253 static void
254 convert_line_loop_to_strip(struct vbo_save_context *save,
255                            struct vbo_save_vertex_list *node)
256 {
257    struct _mesa_prim *prim = &node->cold->prims[node->cold->prim_count - 1];
258
259    assert(prim->mode == GL_LINE_LOOP);
260
261    if (prim->end) {
262       /* Copy the 0th vertex to end of the buffer and extend the
263        * vertex count by one to finish the line loop.
264        */
265       const GLuint sz = save->vertex_size;
266       /* 0th vertex: */
267       const fi_type *src = save->vertex_store->buffer_in_ram + prim->start * sz;
268       /* end of buffer: */
269       fi_type *dst = save->vertex_store->buffer_in_ram + (prim->start + prim->count) * sz;
270
271       memcpy(dst, src, sz * sizeof(float));
272
273       prim->count++;
274       node->cold->vertex_count++;
275       save->vertex_store->used += sz;
276    }
277
278    if (!prim->begin) {
279       /* Drawing the second or later section of a long line loop.
280        * Skip the 0th vertex.
281        */
282       prim->start++;
283       prim->count--;
284    }
285
286    prim->mode = GL_LINE_STRIP;
287 }
288
289
290 /* Compare the present vao if it has the same setup. */
291 static bool
292 compare_vao(gl_vertex_processing_mode mode,
293             const struct gl_vertex_array_object *vao,
294             const struct gl_buffer_object *bo, GLintptr buffer_offset,
295             GLuint stride, GLbitfield64 vao_enabled,
296             const GLubyte size[VBO_ATTRIB_MAX],
297             const GLenum16 type[VBO_ATTRIB_MAX],
298             const GLuint offset[VBO_ATTRIB_MAX])
299 {
300    if (!vao)
301       return false;
302
303    /* If the enabled arrays are not the same we are not equal. */
304    if (vao_enabled != vao->Enabled)
305       return false;
306
307    /* Check the buffer binding at 0 */
308    if (vao->BufferBinding[0].BufferObj != bo)
309       return false;
310    /* BufferBinding[0].Offset != buffer_offset is checked per attribute */
311    if (vao->BufferBinding[0].Stride != stride)
312       return false;
313    assert(vao->BufferBinding[0].InstanceDivisor == 0);
314
315    /* Retrieve the mapping from VBO_ATTRIB to VERT_ATTRIB space */
316    const GLubyte *const vao_to_vbo_map = _vbo_attribute_alias_map[mode];
317
318    /* Now check the enabled arrays */
319    GLbitfield mask = vao_enabled;
320    while (mask) {
321       const int attr = u_bit_scan(&mask);
322       const unsigned char vbo_attr = vao_to_vbo_map[attr];
323       const GLenum16 tp = type[vbo_attr];
324       const GLintptr off = offset[vbo_attr] + buffer_offset;
325       const struct gl_array_attributes *attrib = &vao->VertexAttrib[attr];
326       if (attrib->RelativeOffset + vao->BufferBinding[0].Offset != off)
327          return false;
328       if (attrib->Format.Type != tp)
329          return false;
330       if (attrib->Format.Size != size[vbo_attr])
331          return false;
332       assert(attrib->Format.Format == GL_RGBA);
333       assert(attrib->Format.Normalized == GL_FALSE);
334       assert(attrib->Format.Integer == vbo_attrtype_to_integer_flag(tp));
335       assert(attrib->Format.Doubles == vbo_attrtype_to_double_flag(tp));
336       assert(attrib->BufferBindingIndex == 0);
337    }
338
339    return true;
340 }
341
342
343 /* Create or reuse the vao for the vertex processing mode. */
344 static void
345 update_vao(struct gl_context *ctx,
346            gl_vertex_processing_mode mode,
347            struct gl_vertex_array_object **vao,
348            struct gl_buffer_object *bo, GLintptr buffer_offset,
349            GLuint stride, GLbitfield64 vbo_enabled,
350            const GLubyte size[VBO_ATTRIB_MAX],
351            const GLenum16 type[VBO_ATTRIB_MAX],
352            const GLuint offset[VBO_ATTRIB_MAX])
353 {
354    /* Compute the bitmasks of vao_enabled arrays */
355    GLbitfield vao_enabled = _vbo_get_vao_enabled_from_vbo(mode, vbo_enabled);
356
357    /*
358     * Check if we can possibly reuse the exisiting one.
359     * In the long term we should reset them when something changes.
360     */
361    if (compare_vao(mode, *vao, bo, buffer_offset, stride,
362                    vao_enabled, size, type, offset))
363       return;
364
365    /* The initial refcount is 1 */
366    _mesa_reference_vao(ctx, vao, NULL);
367    *vao = _mesa_new_vao(ctx, ~((GLuint)0));
368
369    /*
370     * assert(stride <= ctx->Const.MaxVertexAttribStride);
371     * MaxVertexAttribStride is not set for drivers that does not
372     * expose GL 44 or GLES 31.
373     */
374
375    /* Bind the buffer object at binding point 0 */
376    _mesa_bind_vertex_buffer(ctx, *vao, 0, bo, buffer_offset, stride, false,
377                             false);
378
379    /* Retrieve the mapping from VBO_ATTRIB to VERT_ATTRIB space
380     * Note that the position/generic0 aliasing is done in the VAO.
381     */
382    const GLubyte *const vao_to_vbo_map = _vbo_attribute_alias_map[mode];
383    /* Now set the enable arrays */
384    GLbitfield mask = vao_enabled;
385    while (mask) {
386       const int vao_attr = u_bit_scan(&mask);
387       const GLubyte vbo_attr = vao_to_vbo_map[vao_attr];
388       assert(offset[vbo_attr] <= ctx->Const.MaxVertexAttribRelativeOffset);
389
390       _vbo_set_attrib_format(ctx, *vao, vao_attr, buffer_offset,
391                              size[vbo_attr], type[vbo_attr], offset[vbo_attr]);
392       _mesa_vertex_attrib_binding(ctx, *vao, vao_attr, 0);
393    }
394    _mesa_enable_vertex_array_attribs(ctx, *vao, vao_enabled);
395    assert(vao_enabled == (*vao)->Enabled);
396    assert((vao_enabled & ~(*vao)->VertexAttribBufferMask) == 0);
397
398    /* Finalize and freeze the VAO */
399    _mesa_set_vao_immutable(ctx, *vao);
400 }
401
402 static void wrap_filled_vertex(struct gl_context *ctx);
403
404 /* Grow the vertex storage to accomodate for vertex_count new vertices */
405 static void
406 grow_vertex_storage(struct gl_context *ctx, int vertex_count)
407 {
408    struct vbo_save_context *save = &vbo_context(ctx)->save;
409    assert (save->vertex_store);
410
411    int new_size = (save->vertex_store->used +
412                    vertex_count * save->vertex_size) * sizeof(GLfloat);
413
414    /* Limit how much memory we allocate. */
415    if (save->prim_store->used > 0 &&
416        vertex_count > 0 &&
417        new_size > VBO_SAVE_BUFFER_SIZE) {
418       wrap_filled_vertex(ctx);
419       new_size = VBO_SAVE_BUFFER_SIZE;
420    }
421
422    if (new_size > save->vertex_store->buffer_in_ram_size) {
423       save->vertex_store->buffer_in_ram_size = new_size;
424       save->vertex_store->buffer_in_ram = realloc(save->vertex_store->buffer_in_ram,
425                                                   save->vertex_store->buffer_in_ram_size);
426       if (save->vertex_store->buffer_in_ram == NULL)
427          handle_out_of_memory(ctx);
428    }
429
430 }
431
432 struct vertex_key {
433    unsigned vertex_size;
434    fi_type *vertex_attributes;
435 };
436
437 static uint32_t _hash_vertex_key(const void *key)
438 {
439    struct vertex_key *k = (struct vertex_key*)key;
440    unsigned sz = k->vertex_size;
441    assert(sz);
442    return _mesa_hash_data(k->vertex_attributes, sz * sizeof(float));
443 }
444
445 static bool _compare_vertex_key(const void *key1, const void *key2)
446 {
447    struct vertex_key *k1 = (struct vertex_key*)key1;
448    struct vertex_key *k2 = (struct vertex_key*)key2;
449    /* All the compared vertices are going to be drawn with the same VAO,
450     * so we can compare the attributes. */
451    assert (k1->vertex_size == k2->vertex_size);
452    return memcmp(k1->vertex_attributes,
453                  k2->vertex_attributes,
454                  k1->vertex_size * sizeof(float)) == 0;
455 }
456
457 static void _free_entry(struct hash_entry *entry)
458 {
459    free((void*)entry->key);
460 }
461
462 /* Add vertex to the vertex buffer and return its index. If this vertex is a duplicate
463  * of an existing vertex, return the original index instead.
464  */
465 static uint32_t
466 add_vertex(struct vbo_save_context *save, struct hash_table *hash_to_index,
467            uint32_t index, fi_type *new_buffer, uint32_t *max_index)
468 {
469    /* If vertex deduplication is disabled return the original index. */
470    if (!hash_to_index)
471       return index;
472
473    fi_type *vert = save->vertex_store->buffer_in_ram + save->vertex_size * index;
474
475    struct vertex_key *key = malloc(sizeof(struct vertex_key));
476    key->vertex_size = save->vertex_size;
477    key->vertex_attributes = vert;
478
479    struct hash_entry *entry = _mesa_hash_table_search(hash_to_index, key);
480    if (entry) {
481       free(key);
482       /* We found an existing vertex with the same hash, return its index. */
483       return (uintptr_t) entry->data;
484    } else {
485       /* This is a new vertex. Determine a new index and copy its attributes to the vertex
486        * buffer. Note that 'new_buffer' is created at each list compilation so we write vertices
487        * starting at index 0.
488        */
489       uint32_t n = _mesa_hash_table_num_entries(hash_to_index);
490       *max_index = MAX2(n, *max_index);
491
492       memcpy(&new_buffer[save->vertex_size * n],
493              vert,
494              save->vertex_size * sizeof(fi_type));
495
496       _mesa_hash_table_insert(hash_to_index, key, (void*)(uintptr_t)(n));
497
498       /* The index buffer is shared between list compilations, so add the base index to get
499        * the final index.
500        */
501       return n;
502    }
503 }
504
505
506 static uint32_t
507 get_vertex_count(struct vbo_save_context *save)
508 {
509    if (!save->vertex_size)
510       return 0;
511    return save->vertex_store->used / save->vertex_size;
512 }
513
514
515 /**
516  * Insert the active immediate struct onto the display list currently
517  * being built.
518  */
519 static void
520 compile_vertex_list(struct gl_context *ctx)
521 {
522    struct vbo_save_context *save = &vbo_context(ctx)->save;
523    struct vbo_save_vertex_list *node;
524
525    /* Allocate space for this structure in the display list currently
526     * being compiled.
527     */
528    node = (struct vbo_save_vertex_list *)
529       _mesa_dlist_alloc_vertex_list(ctx, !save->dangling_attr_ref && !save->no_current_update);
530
531    if (!node)
532       return;
533
534    node->cold = calloc(1, sizeof(*node->cold));
535
536    /* Make sure the pointer is aligned to the size of a pointer */
537    assert((GLintptr) node % sizeof(void *) == 0);
538
539    const GLsizei stride = save->vertex_size*sizeof(GLfloat);
540
541    node->cold->vertex_count = get_vertex_count(save);
542    node->cold->wrap_count = save->copied.nr;
543    node->cold->prims = malloc(sizeof(struct _mesa_prim) * save->prim_store->used);
544    memcpy(node->cold->prims, save->prim_store->prims, sizeof(struct _mesa_prim) * save->prim_store->used);
545    node->cold->ib.obj = NULL;
546    node->cold->prim_count = save->prim_store->used;
547
548    if (save->no_current_update) {
549       node->cold->current_data = NULL;
550    }
551    else {
552       GLuint current_size = save->vertex_size - save->attrsz[0];
553       node->cold->current_data = NULL;
554
555       if (current_size) {
556          node->cold->current_data = malloc(current_size * sizeof(GLfloat));
557          if (node->cold->current_data) {
558             const char *buffer = (const char *)save->vertex_store->buffer_in_ram;
559             unsigned attr_offset = save->attrsz[0] * sizeof(GLfloat);
560             unsigned vertex_offset = 0;
561
562             if (node->cold->vertex_count)
563                vertex_offset = (node->cold->vertex_count - 1) * stride;
564
565             memcpy(node->cold->current_data, buffer + vertex_offset + attr_offset,
566                    current_size * sizeof(GLfloat));
567          } else {
568             _mesa_error(ctx, GL_OUT_OF_MEMORY, "Current value allocation");
569             handle_out_of_memory(ctx);
570          }
571       }
572    }
573
574    assert(save->attrsz[VBO_ATTRIB_POS] != 0 || node->cold->vertex_count == 0);
575
576    if (save->dangling_attr_ref)
577       ctx->ListState.Current.UseLoopback = true;
578
579    /* Copy duplicated vertices
580     */
581    save->copied.nr = copy_vertices(ctx, node, save->vertex_store->buffer_in_ram);
582
583    if (node->cold->prims[node->cold->prim_count - 1].mode == GL_LINE_LOOP) {
584       convert_line_loop_to_strip(save, node);
585    }
586
587    merge_prims(ctx, node->cold->prims, &node->cold->prim_count);
588
589    GLintptr buffer_offset = 0;
590    GLuint start_offset = 0;
591
592    /* Create an index buffer. */
593    node->cold->min_index = node->cold->max_index = 0;
594    if (node->cold->vertex_count == 0 || node->cold->prim_count == 0)
595       goto end;
596
597    /* We won't modify node->prims, so use a const alias to avoid unintended
598     * writes to it. */
599    const struct _mesa_prim *original_prims = node->cold->prims;
600
601    int end = original_prims[node->cold->prim_count - 1].start +
602              original_prims[node->cold->prim_count - 1].count;
603    int total_vert_count = end - original_prims[0].start;
604
605    node->cold->min_index = node->cold->prims[0].start;
606    node->cold->max_index = end - 1;
607
608    int max_index_count = total_vert_count * 2;
609
610    int size = max_index_count * sizeof(uint32_t);
611    uint32_t* indices = (uint32_t*) malloc(size);
612    struct _mesa_prim *merged_prims = NULL;
613
614    int idx = 0;
615    struct hash_table *vertex_to_index = NULL;
616    fi_type *temp_vertices_buffer = NULL;
617
618    /* The loopback replay code doesn't use the index buffer, so we can't
619     * dedup vertices in this case.
620     */
621    if (!ctx->ListState.Current.UseLoopback) {
622       vertex_to_index = _mesa_hash_table_create(NULL, _hash_vertex_key, _compare_vertex_key);
623       temp_vertices_buffer = malloc(save->vertex_store->buffer_in_ram_size);
624    }
625
626    uint32_t max_index = 0;
627
628    int last_valid_prim = -1;
629    /* Construct indices array. */
630    for (unsigned i = 0; i < node->cold->prim_count; i++) {
631       assert(original_prims[i].basevertex == 0);
632       GLubyte mode = original_prims[i].mode;
633
634       int vertex_count = original_prims[i].count;
635       if (!vertex_count) {
636          continue;
637       }
638
639       /* Line strips may get converted to lines */
640       if (mode == GL_LINE_STRIP)
641          mode = GL_LINES;
642
643       /* If 2 consecutive prims use the same mode => merge them. */
644       bool merge_prims = last_valid_prim >= 0 &&
645                          mode == merged_prims[last_valid_prim].mode &&
646                          mode != GL_LINE_LOOP && mode != GL_TRIANGLE_FAN &&
647                          mode != GL_QUAD_STRIP && mode != GL_POLYGON &&
648                          mode != GL_PATCHES;
649
650       /* To be able to merge consecutive triangle strips we need to insert
651        * a degenerate triangle.
652        */
653       if (merge_prims &&
654           mode == GL_TRIANGLE_STRIP) {
655          /* Insert a degenerate triangle */
656          assert(merged_prims[last_valid_prim].mode == GL_TRIANGLE_STRIP);
657          unsigned tri_count = merged_prims[last_valid_prim].count - 2;
658
659          indices[idx] = indices[idx - 1];
660          indices[idx + 1] = add_vertex(save, vertex_to_index, original_prims[i].start,
661                                        temp_vertices_buffer, &max_index);
662          idx += 2;
663          merged_prims[last_valid_prim].count += 2;
664
665          if (tri_count % 2) {
666             /* Add another index to preserve winding order */
667             indices[idx++] = add_vertex(save, vertex_to_index, original_prims[i].start,
668                                         temp_vertices_buffer, &max_index);
669             merged_prims[last_valid_prim].count++;
670          }
671       }
672
673       int start = idx;
674
675       /* Convert line strips to lines if it'll allow if the previous
676        * prim mode is GL_LINES (so merge_prims is true) or if the next
677        * primitive mode is GL_LINES or GL_LINE_LOOP.
678        */
679       if (original_prims[i].mode == GL_LINE_STRIP &&
680           (merge_prims ||
681            (i < node->cold->prim_count - 1 &&
682             (original_prims[i + 1].mode == GL_LINE_STRIP ||
683              original_prims[i + 1].mode == GL_LINES)))) {
684          for (unsigned j = 0; j < vertex_count; j++) {
685             indices[idx++] = add_vertex(save, vertex_to_index, original_prims[i].start + j,
686                                         temp_vertices_buffer, &max_index);
687             /* Repeat all but the first/last indices. */
688             if (j && j != vertex_count - 1) {
689                indices[idx++] = add_vertex(save, vertex_to_index, original_prims[i].start + j,
690                                            temp_vertices_buffer, &max_index);
691             }
692          }
693       } else {
694          /* We didn't convert to LINES, so restore the original mode */
695          mode = original_prims[i].mode;
696
697          for (unsigned j = 0; j < vertex_count; j++) {
698             indices[idx++] = add_vertex(save, vertex_to_index, original_prims[i].start + j,
699                                         temp_vertices_buffer, &max_index);
700          }
701       }
702
703       if (merge_prims) {
704          /* Update vertex count. */
705          merged_prims[last_valid_prim].count += idx - start;
706       } else {
707          /* Keep this primitive */
708          last_valid_prim += 1;
709          assert(last_valid_prim <= i);
710          merged_prims = realloc(merged_prims, (1 + last_valid_prim) * sizeof(struct _mesa_prim));
711          merged_prims[last_valid_prim] = original_prims[i];
712          merged_prims[last_valid_prim].start = start;
713          merged_prims[last_valid_prim].count = idx - start;
714       }
715       merged_prims[last_valid_prim].mode = mode;
716    }
717
718    assert(idx > 0 && idx <= max_index_count);
719
720    unsigned merged_prim_count = last_valid_prim + 1;
721    node->cold->ib.ptr = NULL;
722    node->cold->ib.count = idx;
723    node->cold->ib.index_size_shift = (GL_UNSIGNED_INT - GL_UNSIGNED_BYTE) >> 1;
724
725    /* How many bytes do we need to store the indices and the vertices */
726    total_vert_count = vertex_to_index ? (max_index + 1) : idx;
727    unsigned total_bytes_needed = idx * sizeof(uint32_t) +
728                                  total_vert_count * save->vertex_size * sizeof(fi_type);
729
730    const GLintptr old_offset = save->VAO[0] ?
731       save->VAO[0]->BufferBinding[0].Offset + save->VAO[0]->VertexAttrib[VERT_ATTRIB_POS].RelativeOffset : 0;
732    if (old_offset != save->current_bo_bytes_used && stride > 0) {
733       GLintptr offset_diff = save->current_bo_bytes_used - old_offset;
734       while (offset_diff > 0 &&
735              save->current_bo_bytes_used < save->current_bo->Size &&
736              offset_diff % stride != 0) {
737          save->current_bo_bytes_used++;
738          offset_diff = save->current_bo_bytes_used - old_offset;
739       }
740    }
741    buffer_offset = save->current_bo_bytes_used;
742
743    /* Can we reuse the previous bo or should we allocate a new one? */
744    int available_bytes = save->current_bo ? save->current_bo->Size - save->current_bo_bytes_used : 0;
745    if (total_bytes_needed > available_bytes) {
746       if (save->current_bo)
747          _mesa_reference_buffer_object(ctx, &save->current_bo, NULL);
748       save->current_bo = ctx->Driver.NewBufferObject(ctx, VBO_BUF_ID + 1);
749       bool success = ctx->Driver.BufferData(ctx,
750                                             GL_ELEMENT_ARRAY_BUFFER_ARB,
751                                             MAX2(total_bytes_needed, VBO_SAVE_BUFFER_SIZE),
752                                             NULL,
753                                             GL_STATIC_DRAW_ARB, GL_MAP_WRITE_BIT |
754                                             MESA_GALLIUM_VERTEX_STATE_STORAGE,
755                                             save->current_bo);
756       if (!success) {
757          _mesa_reference_buffer_object(ctx, &save->current_bo, NULL);
758          _mesa_error(ctx, GL_OUT_OF_MEMORY, "IB allocation");
759          handle_out_of_memory(ctx);
760       } else {
761          save->current_bo_bytes_used = 0;
762          available_bytes = save->current_bo->Size;
763       }
764       buffer_offset = 0;
765    } else {
766       assert(old_offset <= buffer_offset);
767       const GLintptr offset_diff = buffer_offset - old_offset;
768       if (offset_diff > 0 && stride > 0 && offset_diff % stride == 0) {
769          /* The vertex size is an exact multiple of the buffer offset.
770           * This means that we can use zero-based vertex attribute pointers
771           * and specify the start of the primitive with the _mesa_prim::start
772           * field.  This results in issuing several draw calls with identical
773           * vertex attribute information.  This can result in fewer state
774           * changes in drivers.  In particular, the Gallium CSO module will
775           * filter out redundant vertex buffer changes.
776           */
777          /* We cannot immediately update the primitives as some methods below
778           * still need the uncorrected start vertices
779           */
780          start_offset = offset_diff/stride;
781          assert(old_offset == buffer_offset - offset_diff);
782          buffer_offset = old_offset;
783       }
784
785       /* Correct the primitive starts, we can only do this here as copy_vertices
786        * and convert_line_loop_to_strip above consume the uncorrected starts.
787        * On the other hand the _vbo_loopback_vertex_list call below needs the
788        * primitives to be corrected already.
789        */
790       for (unsigned i = 0; i < node->cold->prim_count; i++) {
791          node->cold->prims[i].start += start_offset;
792       }
793       /* start_offset shifts vertices (so v[0] becomes v[start_offset]), so we have
794        * to apply this transformation to all indices and max_index.
795        */
796       for (unsigned i = 0; i < idx; i++)
797          indices[i] += start_offset;
798       max_index += start_offset;
799    }
800
801    _mesa_reference_buffer_object(ctx, &node->cold->ib.obj, save->current_bo);
802
803    /* Upload the vertices first (see buffer_offset) */
804    ctx->Driver.BufferSubData(ctx,
805                              save->current_bo_bytes_used,
806                              total_vert_count * save->vertex_size * sizeof(fi_type),
807                              vertex_to_index ? temp_vertices_buffer : save->vertex_store->buffer_in_ram,
808                              node->cold->ib.obj);
809    save->current_bo_bytes_used += total_vert_count * save->vertex_size * sizeof(fi_type);
810
811   if (vertex_to_index) {
812       _mesa_hash_table_destroy(vertex_to_index, _free_entry);
813       free(temp_vertices_buffer);
814    }
815
816    /* Since we're append the indices to an existing buffer, we need to adjust the start value of each
817     * primitive (not the indices themselves). */
818    save->current_bo_bytes_used += align(save->current_bo_bytes_used, 4) - save->current_bo_bytes_used;
819    int indices_offset = save->current_bo_bytes_used / 4;
820    for (int i = 0; i < merged_prim_count; i++) {
821       merged_prims[i].start += indices_offset;
822    }
823
824    /* Then upload the indices. */
825    if (node->cold->ib.obj) {
826       ctx->Driver.BufferSubData(ctx,
827                                 save->current_bo_bytes_used,
828                                 idx * sizeof(uint32_t),
829                                 indices,
830                                 node->cold->ib.obj);
831       save->current_bo_bytes_used += idx * sizeof(uint32_t);
832    } else {
833       node->cold->vertex_count = 0;
834       node->cold->prim_count = 0;
835    }
836
837    /* Prepare for DrawGallium */
838    memset(&node->cold->info, 0, sizeof(struct pipe_draw_info));
839    /* The other info fields will be updated in vbo_save_playback_vertex_list */
840    node->cold->info.index_size = 4;
841    node->cold->info.instance_count = 1;
842    node->cold->info.index.gl_bo = node->cold->ib.obj;
843    if (merged_prim_count == 1) {
844       node->cold->info.mode = merged_prims[0].mode;
845       node->start_count.start = merged_prims[0].start;
846       node->start_count.count = merged_prims[0].count;
847       node->start_count.index_bias = 0;
848       node->modes = NULL;
849    } else {
850       node->modes = malloc(merged_prim_count * sizeof(unsigned char));
851       node->start_counts = malloc(merged_prim_count * sizeof(struct pipe_draw_start_count_bias));
852       for (unsigned i = 0; i < merged_prim_count; i++) {
853          node->start_counts[i].start = merged_prims[i].start;
854          node->start_counts[i].count = merged_prims[i].count;
855          node->start_counts[i].index_bias = 0;
856          node->modes[i] = merged_prims[i].mode;
857       }
858    }
859    node->num_draws = merged_prim_count;
860    if (node->num_draws > 1) {
861       bool same_mode = true;
862       for (unsigned i = 1; i < node->num_draws && same_mode; i++) {
863          same_mode = node->modes[i] == node->modes[0];
864       }
865       if (same_mode) {
866          /* All primitives use the same mode, so we can simplify a bit */
867          node->cold->info.mode = node->modes[0];
868          free(node->modes);
869          node->modes = NULL;
870       }
871    }
872
873    free(indices);
874    free(merged_prims);
875
876 end:
877    node->draw_begins = node->cold->prims[0].begin;
878
879    if (!save->current_bo) {
880       save->current_bo = ctx->Driver.NewBufferObject(ctx, VBO_BUF_ID + 1);
881       bool success = ctx->Driver.BufferData(ctx,
882                                             GL_ELEMENT_ARRAY_BUFFER_ARB,
883                                             VBO_SAVE_BUFFER_SIZE,
884                                             NULL,
885                                             GL_STATIC_DRAW_ARB, GL_MAP_WRITE_BIT |
886                                             MESA_GALLIUM_VERTEX_STATE_STORAGE,
887                                             save->current_bo);
888       if (!success)
889          handle_out_of_memory(ctx);
890    }
891
892    GLuint offsets[VBO_ATTRIB_MAX];
893    for (unsigned i = 0, offset = 0; i < VBO_ATTRIB_MAX; ++i) {
894       offsets[i] = offset;
895       offset += save->attrsz[i] * sizeof(GLfloat);
896    }
897    /* Create a pair of VAOs for the possible VERTEX_PROCESSING_MODEs
898     * Note that this may reuse the previous one of possible.
899     */
900    for (gl_vertex_processing_mode vpm = VP_MODE_FF; vpm < VP_MODE_MAX; ++vpm) {
901       /* create or reuse the vao */
902       update_vao(ctx, vpm, &save->VAO[vpm],
903                  save->current_bo, buffer_offset, stride,
904                  save->enabled, save->attrsz, save->attrtype, offsets);
905       /* Reference the vao in the dlist */
906       node->cold->VAO[vpm] = NULL;
907       _mesa_reference_vao(ctx, &node->cold->VAO[vpm], save->VAO[vpm]);
908    }
909
910    /* Prepare for DrawGalliumVertexState */
911    if (node->num_draws && ctx->Driver.DrawGalliumVertexState) {
912       for (unsigned i = 0; i < VP_MODE_MAX; i++) {
913          uint32_t enabled_attribs = _vbo_get_vao_filter(i) &
914                                     node->cold->VAO[i]->_EnabledWithMapMode;
915
916          node->state[i] =
917             ctx->Driver.CreateGalliumVertexState(ctx, node->cold->VAO[i],
918                                                  node->cold->ib.obj,
919                                                  enabled_attribs);
920          node->private_refcount[i] = 0;
921          node->enabled_attribs[i] = enabled_attribs;
922       }
923
924       node->ctx = ctx;
925       node->mode = node->cold->info.mode;
926       assert(node->cold->info.index_size == 4);
927    }
928
929    /* Deal with GL_COMPILE_AND_EXECUTE:
930     */
931    if (ctx->ExecuteFlag) {
932       struct _glapi_table *dispatch = GET_DISPATCH();
933
934       _glapi_set_dispatch(ctx->Exec);
935
936       /* _vbo_loopback_vertex_list doesn't use the index buffer, so we have to
937        * use buffer_in_ram instead of current_bo which contains all vertices instead
938        * of the deduplicated vertices only in the !UseLoopback case.
939        *
940        * The problem is that the VAO offset is based on current_bo's layout,
941        * so we have to use a temp value.
942        */
943       struct gl_vertex_array_object *vao = node->cold->VAO[VP_MODE_SHADER];
944       GLintptr original = vao->BufferBinding[0].Offset;
945       if (!ctx->ListState.Current.UseLoopback) {
946          GLintptr new_offset = 0;
947          /* 'start_offset' has been added to all primitives 'start', so undo it here. */
948          new_offset -= start_offset * stride;
949          vao->BufferBinding[0].Offset = new_offset;
950       }
951       _vbo_loopback_vertex_list(ctx, node, save->vertex_store->buffer_in_ram);
952       vao->BufferBinding[0].Offset = original;
953
954       _glapi_set_dispatch(dispatch);
955    }
956
957    /* Reset our structures for the next run of vertices:
958     */
959    reset_counters(ctx);
960 }
961
962
963 /**
964  * This is called when we fill a vertex buffer before we hit a glEnd().
965  * We
966  * TODO -- If no new vertices have been stored, don't bother saving it.
967  */
968 static void
969 wrap_buffers(struct gl_context *ctx)
970 {
971    struct vbo_save_context *save = &vbo_context(ctx)->save;
972    GLint i = save->prim_store->used - 1;
973    GLenum mode;
974
975    assert(i < (GLint) save->prim_store->size);
976    assert(i >= 0);
977
978    /* Close off in-progress primitive.
979     */
980    save->prim_store->prims[i].count = (get_vertex_count(save) - save->prim_store->prims[i].start);
981    mode = save->prim_store->prims[i].mode;
982
983    /* store the copied vertices, and allocate a new list.
984     */
985    compile_vertex_list(ctx);
986
987    /* Restart interrupted primitive
988     */
989    save->prim_store->prims[0].mode = mode;
990    save->prim_store->prims[0].begin = 0;
991    save->prim_store->prims[0].end = 0;
992    save->prim_store->prims[0].start = 0;
993    save->prim_store->prims[0].count = 0;
994    save->prim_store->used = 1;
995 }
996
997
998 /**
999  * Called only when buffers are wrapped as the result of filling the
1000  * vertex_store struct.
1001  */
1002 static void
1003 wrap_filled_vertex(struct gl_context *ctx)
1004 {
1005    struct vbo_save_context *save = &vbo_context(ctx)->save;
1006    unsigned numComponents;
1007
1008    /* Emit a glEnd to close off the last vertex list.
1009     */
1010    wrap_buffers(ctx);
1011
1012    assert(save->vertex_store->used == 0 && save->vertex_store->used == 0);
1013
1014    /* Copy stored stored vertices to start of new list.
1015     */
1016    numComponents = save->copied.nr * save->vertex_size;
1017
1018    fi_type *buffer_ptr = save->vertex_store->buffer_in_ram;
1019    if (numComponents) {
1020       assert(save->copied.buffer);
1021       memcpy(buffer_ptr,
1022              save->copied.buffer,
1023              numComponents * sizeof(fi_type));
1024       free(save->copied.buffer);
1025       save->copied.buffer = NULL;
1026    }
1027    save->vertex_store->used = numComponents;
1028 }
1029
1030
1031 static void
1032 copy_to_current(struct gl_context *ctx)
1033 {
1034    struct vbo_save_context *save = &vbo_context(ctx)->save;
1035    GLbitfield64 enabled = save->enabled & (~BITFIELD64_BIT(VBO_ATTRIB_POS));
1036
1037    while (enabled) {
1038       const int i = u_bit_scan64(&enabled);
1039       assert(save->attrsz[i]);
1040
1041       if (save->attrtype[i] == GL_DOUBLE ||
1042           save->attrtype[i] == GL_UNSIGNED_INT64_ARB)
1043          memcpy(save->current[i], save->attrptr[i], save->attrsz[i] * sizeof(GLfloat));
1044       else
1045          COPY_CLEAN_4V_TYPE_AS_UNION(save->current[i], save->attrsz[i],
1046                                      save->attrptr[i], save->attrtype[i]);
1047    }
1048 }
1049
1050
1051 static void
1052 copy_from_current(struct gl_context *ctx)
1053 {
1054    struct vbo_save_context *save = &vbo_context(ctx)->save;
1055    GLbitfield64 enabled = save->enabled & (~BITFIELD64_BIT(VBO_ATTRIB_POS));
1056
1057    while (enabled) {
1058       const int i = u_bit_scan64(&enabled);
1059
1060       switch (save->attrsz[i]) {
1061       case 4:
1062          save->attrptr[i][3] = save->current[i][3];
1063          FALLTHROUGH;
1064       case 3:
1065          save->attrptr[i][2] = save->current[i][2];
1066          FALLTHROUGH;
1067       case 2:
1068          save->attrptr[i][1] = save->current[i][1];
1069          FALLTHROUGH;
1070       case 1:
1071          save->attrptr[i][0] = save->current[i][0];
1072          break;
1073       case 0:
1074          unreachable("Unexpected vertex attribute size");
1075       }
1076    }
1077 }
1078
1079
1080 /**
1081  * Called when we increase the size of a vertex attribute.  For example,
1082  * if we've seen one or more glTexCoord2f() calls and now we get a
1083  * glTexCoord3f() call.
1084  * Flush existing data, set new attrib size, replay copied vertices.
1085  */
1086 static void
1087 upgrade_vertex(struct gl_context *ctx, GLuint attr, GLuint newsz)
1088 {
1089    struct vbo_save_context *save = &vbo_context(ctx)->save;
1090    GLuint oldsz;
1091    GLuint i;
1092    fi_type *tmp;
1093
1094    /* Store the current run of vertices, and emit a GL_END.  Emit a
1095     * BEGIN in the new buffer.
1096     */
1097    if (save->vertex_store->used)
1098       wrap_buffers(ctx);
1099    else
1100       assert(save->copied.nr == 0);
1101
1102    /* Do a COPY_TO_CURRENT to ensure back-copying works for the case
1103     * when the attribute already exists in the vertex and is having
1104     * its size increased.
1105     */
1106    copy_to_current(ctx);
1107
1108    /* Fix up sizes:
1109     */
1110    oldsz = save->attrsz[attr];
1111    save->attrsz[attr] = newsz;
1112    save->enabled |= BITFIELD64_BIT(attr);
1113
1114    save->vertex_size += newsz - oldsz;
1115
1116    /* Recalculate all the attrptr[] values:
1117     */
1118    tmp = save->vertex;
1119    for (i = 0; i < VBO_ATTRIB_MAX; i++) {
1120       if (save->attrsz[i]) {
1121          save->attrptr[i] = tmp;
1122          tmp += save->attrsz[i];
1123       }
1124       else {
1125          save->attrptr[i] = NULL;       /* will not be dereferenced. */
1126       }
1127    }
1128
1129    /* Copy from current to repopulate the vertex with correct values.
1130     */
1131    copy_from_current(ctx);
1132
1133    /* Replay stored vertices to translate them to new format here.
1134     *
1135     * If there are copied vertices and the new (upgraded) attribute
1136     * has not been defined before, this list is somewhat degenerate,
1137     * and will need fixup at runtime.
1138     */
1139    if (save->copied.nr) {
1140       assert(save->copied.buffer);
1141       const fi_type *data = save->copied.buffer;
1142       grow_vertex_storage(ctx, save->copied.nr);
1143       fi_type *dest = save->vertex_store->buffer_in_ram;
1144
1145       /* Need to note this and fix up at runtime (or loopback):
1146        */
1147       if (attr != VBO_ATTRIB_POS && save->currentsz[attr][0] == 0) {
1148          assert(oldsz == 0);
1149          save->dangling_attr_ref = GL_TRUE;
1150       }
1151
1152       for (i = 0; i < save->copied.nr; i++) {
1153          GLbitfield64 enabled = save->enabled;
1154          while (enabled) {
1155             const int j = u_bit_scan64(&enabled);
1156             assert(save->attrsz[j]);
1157             if (j == attr) {
1158                int k;
1159                const fi_type *src = oldsz ? data : save->current[attr];
1160                int copy = oldsz ? oldsz : newsz;
1161                for (k = 0; k < copy; k++)
1162                   dest[k] = src[k];
1163                for (; k < newsz; k++) {
1164                   switch (save->attrtype[j]) {
1165                      case GL_FLOAT:
1166                         dest[k] = FLOAT_AS_UNION(k == 3);
1167                         break;
1168                      case GL_INT:
1169                         dest[k] = INT_AS_UNION(k == 3);
1170                         break;
1171                      case GL_UNSIGNED_INT:
1172                         dest[k] = UINT_AS_UNION(k == 3);
1173                         break;
1174                      default:
1175                         dest[k] = FLOAT_AS_UNION(k == 3);
1176                         assert(!"Unexpected type in upgrade_vertex");
1177                         break;
1178                   }
1179                }
1180                dest += newsz;
1181                data += oldsz;
1182             } else {
1183                GLint sz = save->attrsz[j];
1184                for (int k = 0; k < sz; k++)
1185                   dest[k] = data[k];
1186                data += sz;
1187                dest += sz;
1188             }
1189          }
1190       }
1191
1192       save->vertex_store->used += save->vertex_size * save->copied.nr;
1193       free(save->copied.buffer);
1194       save->copied.buffer = NULL;
1195    }
1196 }
1197
1198
1199 /**
1200  * This is called when the size of a vertex attribute changes.
1201  * For example, after seeing one or more glTexCoord2f() calls we
1202  * get a glTexCoord4f() or glTexCoord1f() call.
1203  */
1204 static void
1205 fixup_vertex(struct gl_context *ctx, GLuint attr,
1206              GLuint sz, GLenum newType)
1207 {
1208    struct vbo_save_context *save = &vbo_context(ctx)->save;
1209
1210    if (sz > save->attrsz[attr] ||
1211        newType != save->attrtype[attr]) {
1212       /* New size is larger.  Need to flush existing vertices and get
1213        * an enlarged vertex format.
1214        */
1215       upgrade_vertex(ctx, attr, sz);
1216    }
1217    else if (sz < save->active_sz[attr]) {
1218       GLuint i;
1219       const fi_type *id = vbo_get_default_vals_as_union(save->attrtype[attr]);
1220
1221       /* New size is equal or smaller - just need to fill in some
1222        * zeros.
1223        */
1224       for (i = sz; i <= save->attrsz[attr]; i++)
1225          save->attrptr[attr][i - 1] = id[i - 1];
1226    }
1227
1228    save->active_sz[attr] = sz;
1229
1230    grow_vertex_storage(ctx, 1);
1231 }
1232
1233
1234 /**
1235  * Reset the current size of all vertex attributes to the default
1236  * value of 0.  This signals that we haven't yet seen any per-vertex
1237  * commands such as glNormal3f() or glTexCoord2f().
1238  */
1239 static void
1240 reset_vertex(struct gl_context *ctx)
1241 {
1242    struct vbo_save_context *save = &vbo_context(ctx)->save;
1243
1244    while (save->enabled) {
1245       const int i = u_bit_scan64(&save->enabled);
1246       assert(save->attrsz[i]);
1247       save->attrsz[i] = 0;
1248       save->active_sz[i] = 0;
1249    }
1250
1251    save->vertex_size = 0;
1252 }
1253
1254
1255 /**
1256  * If index=0, does glVertexAttrib*() alias glVertex() to emit a vertex?
1257  * It depends on a few things, including whether we're inside or outside
1258  * of glBegin/glEnd.
1259  */
1260 static inline bool
1261 is_vertex_position(const struct gl_context *ctx, GLuint index)
1262 {
1263    return (index == 0 &&
1264            _mesa_attr_zero_aliases_vertex(ctx) &&
1265            _mesa_inside_dlist_begin_end(ctx));
1266 }
1267
1268
1269
1270 #define ERROR(err)   _mesa_compile_error(ctx, err, __func__);
1271
1272
1273 /* Only one size for each attribute may be active at once.  Eg. if
1274  * Color3f is installed/active, then Color4f may not be, even if the
1275  * vertex actually contains 4 color coordinates.  This is because the
1276  * 3f version won't otherwise set color[3] to 1.0 -- this is the job
1277  * of the chooser function when switching between Color4f and Color3f.
1278  */
1279 #define ATTR_UNION(A, N, T, C, V0, V1, V2, V3)                  \
1280 do {                                                            \
1281    struct vbo_save_context *save = &vbo_context(ctx)->save;     \
1282    int sz = (sizeof(C) / sizeof(GLfloat));                      \
1283                                                                 \
1284    if (save->active_sz[A] != N)                                 \
1285       fixup_vertex(ctx, A, N * sz, T);                          \
1286                                                                 \
1287    {                                                            \
1288       C *dest = (C *)save->attrptr[A];                          \
1289       if (N>0) dest[0] = V0;                                    \
1290       if (N>1) dest[1] = V1;                                    \
1291       if (N>2) dest[2] = V2;                                    \
1292       if (N>3) dest[3] = V3;                                    \
1293       save->attrtype[A] = T;                                    \
1294    }                                                            \
1295                                                                 \
1296    if ((A) == VBO_ATTRIB_POS) {                                 \
1297       fi_type *buffer_ptr = save->vertex_store->buffer_in_ram + \
1298                             save->vertex_store->used;           \
1299                                                                 \
1300       for (int i = 0; i < save->vertex_size; i++)               \
1301         buffer_ptr[i] = save->vertex[i];                        \
1302                                                                 \
1303       save->vertex_store->used += save->vertex_size;            \
1304       unsigned used_next = (save->vertex_store->used +          \
1305                             save->vertex_size) * sizeof(float); \
1306       if (used_next > save->vertex_store->buffer_in_ram_size) { \
1307          grow_vertex_storage(ctx, get_vertex_count(save));      \
1308          assert(used_next <=                                    \
1309                 save->vertex_store->buffer_in_ram_size);        \
1310       }                                                         \
1311    }                                                            \
1312 } while (0)
1313
1314 #define TAG(x) _save_##x
1315
1316 #include "vbo_attrib_tmp.h"
1317
1318
1319 #define MAT( ATTR, N, face, params )                            \
1320 do {                                                            \
1321    if (face != GL_BACK)                                         \
1322       MAT_ATTR( ATTR, N, params ); /* front */                  \
1323    if (face != GL_FRONT)                                        \
1324       MAT_ATTR( ATTR + 1, N, params ); /* back */               \
1325 } while (0)
1326
1327
1328 /**
1329  * Save a glMaterial call found between glBegin/End.
1330  * glMaterial calls outside Begin/End are handled in dlist.c.
1331  */
1332 static void GLAPIENTRY
1333 _save_Materialfv(GLenum face, GLenum pname, const GLfloat *params)
1334 {
1335    GET_CURRENT_CONTEXT(ctx);
1336
1337    if (face != GL_FRONT && face != GL_BACK && face != GL_FRONT_AND_BACK) {
1338       _mesa_compile_error(ctx, GL_INVALID_ENUM, "glMaterial(face)");
1339       return;
1340    }
1341
1342    switch (pname) {
1343    case GL_EMISSION:
1344       MAT(VBO_ATTRIB_MAT_FRONT_EMISSION, 4, face, params);
1345       break;
1346    case GL_AMBIENT:
1347       MAT(VBO_ATTRIB_MAT_FRONT_AMBIENT, 4, face, params);
1348       break;
1349    case GL_DIFFUSE:
1350       MAT(VBO_ATTRIB_MAT_FRONT_DIFFUSE, 4, face, params);
1351       break;
1352    case GL_SPECULAR:
1353       MAT(VBO_ATTRIB_MAT_FRONT_SPECULAR, 4, face, params);
1354       break;
1355    case GL_SHININESS:
1356       if (*params < 0 || *params > ctx->Const.MaxShininess) {
1357          _mesa_compile_error(ctx, GL_INVALID_VALUE, "glMaterial(shininess)");
1358       }
1359       else {
1360          MAT(VBO_ATTRIB_MAT_FRONT_SHININESS, 1, face, params);
1361       }
1362       break;
1363    case GL_COLOR_INDEXES:
1364       MAT(VBO_ATTRIB_MAT_FRONT_INDEXES, 3, face, params);
1365       break;
1366    case GL_AMBIENT_AND_DIFFUSE:
1367       MAT(VBO_ATTRIB_MAT_FRONT_AMBIENT, 4, face, params);
1368       MAT(VBO_ATTRIB_MAT_FRONT_DIFFUSE, 4, face, params);
1369       break;
1370    default:
1371       _mesa_compile_error(ctx, GL_INVALID_ENUM, "glMaterial(pname)");
1372       return;
1373    }
1374 }
1375
1376
1377 /* Cope with EvalCoord/CallList called within a begin/end object:
1378  *     -- Flush current buffer
1379  *     -- Fallback to opcodes for the rest of the begin/end object.
1380  */
1381 static void
1382 dlist_fallback(struct gl_context *ctx)
1383 {
1384    struct vbo_save_context *save = &vbo_context(ctx)->save;
1385
1386    if (save->vertex_store->used || save->prim_store->used) {
1387       if (save->prim_store->used > 0 && save->vertex_store->used > 0) {
1388          assert(save->vertex_size);
1389          /* Close off in-progress primitive. */
1390          GLint i = save->prim_store->used - 1;
1391          save->prim_store->prims[i].count =
1392             get_vertex_count(save) -
1393             save->prim_store->prims[i].start;
1394       }
1395
1396       /* Need to replay this display list with loopback,
1397        * unfortunately, otherwise this primitive won't be handled
1398        * properly:
1399        */
1400       save->dangling_attr_ref = GL_TRUE;
1401
1402       compile_vertex_list(ctx);
1403    }
1404
1405    copy_to_current(ctx);
1406    reset_vertex(ctx);
1407    if (save->out_of_memory) {
1408       _mesa_install_save_vtxfmt(ctx, &save->vtxfmt);
1409    }
1410    else {
1411       _mesa_install_save_vtxfmt(ctx, &ctx->ListState.ListVtxfmt);
1412    }
1413    ctx->Driver.SaveNeedFlush = GL_FALSE;
1414 }
1415
1416
1417 static void GLAPIENTRY
1418 _save_EvalCoord1f(GLfloat u)
1419 {
1420    GET_CURRENT_CONTEXT(ctx);
1421    dlist_fallback(ctx);
1422    CALL_EvalCoord1f(ctx->Save, (u));
1423 }
1424
1425 static void GLAPIENTRY
1426 _save_EvalCoord1fv(const GLfloat * v)
1427 {
1428    GET_CURRENT_CONTEXT(ctx);
1429    dlist_fallback(ctx);
1430    CALL_EvalCoord1fv(ctx->Save, (v));
1431 }
1432
1433 static void GLAPIENTRY
1434 _save_EvalCoord2f(GLfloat u, GLfloat v)
1435 {
1436    GET_CURRENT_CONTEXT(ctx);
1437    dlist_fallback(ctx);
1438    CALL_EvalCoord2f(ctx->Save, (u, v));
1439 }
1440
1441 static void GLAPIENTRY
1442 _save_EvalCoord2fv(const GLfloat * v)
1443 {
1444    GET_CURRENT_CONTEXT(ctx);
1445    dlist_fallback(ctx);
1446    CALL_EvalCoord2fv(ctx->Save, (v));
1447 }
1448
1449 static void GLAPIENTRY
1450 _save_EvalPoint1(GLint i)
1451 {
1452    GET_CURRENT_CONTEXT(ctx);
1453    dlist_fallback(ctx);
1454    CALL_EvalPoint1(ctx->Save, (i));
1455 }
1456
1457 static void GLAPIENTRY
1458 _save_EvalPoint2(GLint i, GLint j)
1459 {
1460    GET_CURRENT_CONTEXT(ctx);
1461    dlist_fallback(ctx);
1462    CALL_EvalPoint2(ctx->Save, (i, j));
1463 }
1464
1465 static void GLAPIENTRY
1466 _save_CallList(GLuint l)
1467 {
1468    GET_CURRENT_CONTEXT(ctx);
1469    dlist_fallback(ctx);
1470    CALL_CallList(ctx->Save, (l));
1471 }
1472
1473 static void GLAPIENTRY
1474 _save_CallLists(GLsizei n, GLenum type, const GLvoid * v)
1475 {
1476    GET_CURRENT_CONTEXT(ctx);
1477    dlist_fallback(ctx);
1478    CALL_CallLists(ctx->Save, (n, type, v));
1479 }
1480
1481
1482
1483 /**
1484  * Called when a glBegin is getting compiled into a display list.
1485  * Updating of ctx->Driver.CurrentSavePrimitive is already taken care of.
1486  */
1487 void
1488 vbo_save_NotifyBegin(struct gl_context *ctx, GLenum mode,
1489                      bool no_current_update)
1490 {
1491    struct vbo_save_context *save = &vbo_context(ctx)->save;
1492    const GLuint i = save->prim_store->used++;
1493
1494    ctx->Driver.CurrentSavePrimitive = mode;
1495
1496    if (!save->prim_store || i >= save->prim_store->size) {
1497       save->prim_store = realloc_prim_store(save->prim_store, i * 2);
1498    }
1499    save->prim_store->prims[i].mode = mode & VBO_SAVE_PRIM_MODE_MASK;
1500    save->prim_store->prims[i].begin = 1;
1501    save->prim_store->prims[i].end = 0;
1502    save->prim_store->prims[i].start = get_vertex_count(save);
1503    save->prim_store->prims[i].count = 0;
1504
1505    save->no_current_update = no_current_update;
1506
1507    _mesa_install_save_vtxfmt(ctx, &save->vtxfmt);
1508
1509    /* We need to call vbo_save_SaveFlushVertices() if there's state change */
1510    ctx->Driver.SaveNeedFlush = GL_TRUE;
1511 }
1512
1513
1514 static void GLAPIENTRY
1515 _save_End(void)
1516 {
1517    GET_CURRENT_CONTEXT(ctx);
1518    struct vbo_save_context *save = &vbo_context(ctx)->save;
1519    const GLint i = save->prim_store->used - 1;
1520
1521    ctx->Driver.CurrentSavePrimitive = PRIM_OUTSIDE_BEGIN_END;
1522    save->prim_store->prims[i].end = 1;
1523    save->prim_store->prims[i].count = (get_vertex_count(save) - save->prim_store->prims[i].start);
1524
1525    /* Swap out this vertex format while outside begin/end.  Any color,
1526     * etc. received between here and the next begin will be compiled
1527     * as opcodes.
1528     */
1529    if (save->out_of_memory) {
1530       _mesa_install_save_vtxfmt(ctx, &save->vtxfmt);
1531    }
1532    else {
1533       _mesa_install_save_vtxfmt(ctx, &ctx->ListState.ListVtxfmt);
1534    }
1535 }
1536
1537
1538 static void GLAPIENTRY
1539 _save_Begin(GLenum mode)
1540 {
1541    GET_CURRENT_CONTEXT(ctx);
1542    (void) mode;
1543    _mesa_compile_error(ctx, GL_INVALID_OPERATION, "Recursive glBegin");
1544 }
1545
1546
1547 static void GLAPIENTRY
1548 _save_PrimitiveRestartNV(void)
1549 {
1550    GET_CURRENT_CONTEXT(ctx);
1551    struct vbo_save_context *save = &vbo_context(ctx)->save;
1552
1553    if (save->prim_store->used == 0) {
1554       /* We're not inside a glBegin/End pair, so calling glPrimitiverRestartNV
1555        * is an error.
1556        */
1557       _mesa_compile_error(ctx, GL_INVALID_OPERATION,
1558                           "glPrimitiveRestartNV called outside glBegin/End");
1559    } else {
1560       /* get current primitive mode */
1561       GLenum curPrim = save->prim_store->prims[save->prim_store->used - 1].mode;
1562       bool no_current_update = save->no_current_update;
1563
1564       /* restart primitive */
1565       CALL_End(ctx->CurrentServerDispatch, ());
1566       vbo_save_NotifyBegin(ctx, curPrim, no_current_update);
1567    }
1568 }
1569
1570
1571 /* Unlike the functions above, these are to be hooked into the vtxfmt
1572  * maintained in ctx->ListState, active when the list is known or
1573  * suspected to be outside any begin/end primitive.
1574  * Note: OBE = Outside Begin/End
1575  */
1576 static void GLAPIENTRY
1577 _save_OBE_Rectf(GLfloat x1, GLfloat y1, GLfloat x2, GLfloat y2)
1578 {
1579    GET_CURRENT_CONTEXT(ctx);
1580    struct _glapi_table *dispatch = ctx->CurrentServerDispatch;
1581
1582    vbo_save_NotifyBegin(ctx, GL_QUADS, false);
1583    CALL_Vertex2f(dispatch, (x1, y1));
1584    CALL_Vertex2f(dispatch, (x2, y1));
1585    CALL_Vertex2f(dispatch, (x2, y2));
1586    CALL_Vertex2f(dispatch, (x1, y2));
1587    CALL_End(dispatch, ());
1588 }
1589
1590
1591 static void GLAPIENTRY
1592 _save_OBE_Rectd(GLdouble x1, GLdouble y1, GLdouble x2, GLdouble y2)
1593 {
1594    _save_OBE_Rectf((GLfloat) x1, (GLfloat) y1, (GLfloat) x2, (GLfloat) y2);
1595 }
1596
1597 static void GLAPIENTRY
1598 _save_OBE_Rectdv(const GLdouble *v1, const GLdouble *v2)
1599 {
1600    _save_OBE_Rectf((GLfloat) v1[0], (GLfloat) v1[1], (GLfloat) v2[0], (GLfloat) v2[1]);
1601 }
1602
1603 static void GLAPIENTRY
1604 _save_OBE_Rectfv(const GLfloat *v1, const GLfloat *v2)
1605 {
1606    _save_OBE_Rectf(v1[0], v1[1], v2[0], v2[1]);
1607 }
1608
1609 static void GLAPIENTRY
1610 _save_OBE_Recti(GLint x1, GLint y1, GLint x2, GLint y2)
1611 {
1612    _save_OBE_Rectf((GLfloat) x1, (GLfloat) y1, (GLfloat) x2, (GLfloat) y2);
1613 }
1614
1615 static void GLAPIENTRY
1616 _save_OBE_Rectiv(const GLint *v1, const GLint *v2)
1617 {
1618    _save_OBE_Rectf((GLfloat) v1[0], (GLfloat) v1[1], (GLfloat) v2[0], (GLfloat) v2[1]);
1619 }
1620
1621 static void GLAPIENTRY
1622 _save_OBE_Rects(GLshort x1, GLshort y1, GLshort x2, GLshort y2)
1623 {
1624    _save_OBE_Rectf((GLfloat) x1, (GLfloat) y1, (GLfloat) x2, (GLfloat) y2);
1625 }
1626
1627 static void GLAPIENTRY
1628 _save_OBE_Rectsv(const GLshort *v1, const GLshort *v2)
1629 {
1630    _save_OBE_Rectf((GLfloat) v1[0], (GLfloat) v1[1], (GLfloat) v2[0], (GLfloat) v2[1]);
1631 }
1632
1633 static void GLAPIENTRY
1634 _save_OBE_DrawArrays(GLenum mode, GLint start, GLsizei count)
1635 {
1636    GET_CURRENT_CONTEXT(ctx);
1637    struct gl_vertex_array_object *vao = ctx->Array.VAO;
1638    struct vbo_save_context *save = &vbo_context(ctx)->save;
1639    GLint i;
1640
1641    if (!_mesa_is_valid_prim_mode(ctx, mode)) {
1642       _mesa_compile_error(ctx, GL_INVALID_ENUM, "glDrawArrays(mode)");
1643       return;
1644    }
1645    if (count < 0) {
1646       _mesa_compile_error(ctx, GL_INVALID_VALUE, "glDrawArrays(count<0)");
1647       return;
1648    }
1649
1650    if (save->out_of_memory)
1651       return;
1652
1653    grow_vertex_storage(ctx, count);
1654
1655    /* Make sure to process any VBO binding changes */
1656    _mesa_update_state(ctx);
1657
1658    _mesa_vao_map_arrays(ctx, vao, GL_MAP_READ_BIT);
1659
1660    vbo_save_NotifyBegin(ctx, mode, true);
1661
1662    for (i = 0; i < count; i++)
1663       _mesa_array_element(ctx, start + i);
1664    CALL_End(ctx->CurrentServerDispatch, ());
1665
1666    _mesa_vao_unmap_arrays(ctx, vao);
1667 }
1668
1669
1670 static void GLAPIENTRY
1671 _save_OBE_MultiDrawArrays(GLenum mode, const GLint *first,
1672                           const GLsizei *count, GLsizei primcount)
1673 {
1674    GET_CURRENT_CONTEXT(ctx);
1675    GLint i;
1676
1677    if (!_mesa_is_valid_prim_mode(ctx, mode)) {
1678       _mesa_compile_error(ctx, GL_INVALID_ENUM, "glMultiDrawArrays(mode)");
1679       return;
1680    }
1681
1682    if (primcount < 0) {
1683       _mesa_compile_error(ctx, GL_INVALID_VALUE,
1684                           "glMultiDrawArrays(primcount<0)");
1685       return;
1686    }
1687
1688    unsigned vertcount = 0;
1689    for (i = 0; i < primcount; i++) {
1690       if (count[i] < 0) {
1691          _mesa_compile_error(ctx, GL_INVALID_VALUE,
1692                              "glMultiDrawArrays(count[i]<0)");
1693          return;
1694       }
1695       vertcount += count[i];
1696    }
1697
1698    grow_vertex_storage(ctx, vertcount);
1699
1700    for (i = 0; i < primcount; i++) {
1701       if (count[i] > 0) {
1702          _save_OBE_DrawArrays(mode, first[i], count[i]);
1703       }
1704    }
1705 }
1706
1707
1708 static void
1709 array_element(struct gl_context *ctx,
1710               GLint basevertex, GLuint elt, unsigned index_size_shift)
1711 {
1712    /* Section 10.3.5 Primitive Restart:
1713     * [...]
1714     *    When one of the *BaseVertex drawing commands specified in section 10.5
1715     * is used, the primitive restart comparison occurs before the basevertex
1716     * offset is added to the array index.
1717     */
1718    /* If PrimitiveRestart is enabled and the index is the RestartIndex
1719     * then we call PrimitiveRestartNV and return.
1720     */
1721    if (ctx->Array._PrimitiveRestart[index_size_shift] &&
1722        elt == ctx->Array._RestartIndex[index_size_shift]) {
1723       CALL_PrimitiveRestartNV(ctx->CurrentServerDispatch, ());
1724       return;
1725    }
1726
1727    _mesa_array_element(ctx, basevertex + elt);
1728 }
1729
1730
1731 /* Could do better by copying the arrays and element list intact and
1732  * then emitting an indexed prim at runtime.
1733  */
1734 static void GLAPIENTRY
1735 _save_OBE_DrawElementsBaseVertex(GLenum mode, GLsizei count, GLenum type,
1736                                  const GLvoid * indices, GLint basevertex)
1737 {
1738    GET_CURRENT_CONTEXT(ctx);
1739    struct vbo_save_context *save = &vbo_context(ctx)->save;
1740    struct gl_vertex_array_object *vao = ctx->Array.VAO;
1741    struct gl_buffer_object *indexbuf = vao->IndexBufferObj;
1742    GLint i;
1743
1744    if (!_mesa_is_valid_prim_mode(ctx, mode)) {
1745       _mesa_compile_error(ctx, GL_INVALID_ENUM, "glDrawElements(mode)");
1746       return;
1747    }
1748    if (count < 0) {
1749       _mesa_compile_error(ctx, GL_INVALID_VALUE, "glDrawElements(count<0)");
1750       return;
1751    }
1752    if (type != GL_UNSIGNED_BYTE &&
1753        type != GL_UNSIGNED_SHORT &&
1754        type != GL_UNSIGNED_INT) {
1755       _mesa_compile_error(ctx, GL_INVALID_VALUE, "glDrawElements(count<0)");
1756       return;
1757    }
1758
1759    if (save->out_of_memory)
1760       return;
1761
1762    grow_vertex_storage(ctx, count);
1763
1764    /* Make sure to process any VBO binding changes */
1765    _mesa_update_state(ctx);
1766
1767    _mesa_vao_map(ctx, vao, GL_MAP_READ_BIT);
1768
1769    if (indexbuf)
1770       indices =
1771          ADD_POINTERS(indexbuf->Mappings[MAP_INTERNAL].Pointer, indices);
1772
1773    vbo_save_NotifyBegin(ctx, mode, true);
1774
1775    switch (type) {
1776    case GL_UNSIGNED_BYTE:
1777       for (i = 0; i < count; i++)
1778          array_element(ctx, basevertex, ((GLubyte *) indices)[i], 0);
1779       break;
1780    case GL_UNSIGNED_SHORT:
1781       for (i = 0; i < count; i++)
1782          array_element(ctx, basevertex, ((GLushort *) indices)[i], 1);
1783       break;
1784    case GL_UNSIGNED_INT:
1785       for (i = 0; i < count; i++)
1786          array_element(ctx, basevertex, ((GLuint *) indices)[i], 2);
1787       break;
1788    default:
1789       _mesa_error(ctx, GL_INVALID_ENUM, "glDrawElements(type)");
1790       break;
1791    }
1792
1793    CALL_End(ctx->CurrentServerDispatch, ());
1794
1795    _mesa_vao_unmap(ctx, vao);
1796 }
1797
1798 static void GLAPIENTRY
1799 _save_OBE_DrawElements(GLenum mode, GLsizei count, GLenum type,
1800                        const GLvoid * indices)
1801 {
1802    _save_OBE_DrawElementsBaseVertex(mode, count, type, indices, 0);
1803 }
1804
1805
1806 static void GLAPIENTRY
1807 _save_OBE_DrawRangeElements(GLenum mode, GLuint start, GLuint end,
1808                             GLsizei count, GLenum type,
1809                             const GLvoid * indices)
1810 {
1811    GET_CURRENT_CONTEXT(ctx);
1812    struct vbo_save_context *save = &vbo_context(ctx)->save;
1813
1814    if (!_mesa_is_valid_prim_mode(ctx, mode)) {
1815       _mesa_compile_error(ctx, GL_INVALID_ENUM, "glDrawRangeElements(mode)");
1816       return;
1817    }
1818    if (count < 0) {
1819       _mesa_compile_error(ctx, GL_INVALID_VALUE,
1820                           "glDrawRangeElements(count<0)");
1821       return;
1822    }
1823    if (type != GL_UNSIGNED_BYTE &&
1824        type != GL_UNSIGNED_SHORT &&
1825        type != GL_UNSIGNED_INT) {
1826       _mesa_compile_error(ctx, GL_INVALID_ENUM, "glDrawRangeElements(type)");
1827       return;
1828    }
1829    if (end < start) {
1830       _mesa_compile_error(ctx, GL_INVALID_VALUE,
1831                           "glDrawRangeElements(end < start)");
1832       return;
1833    }
1834
1835    if (save->out_of_memory)
1836       return;
1837
1838    _save_OBE_DrawElements(mode, count, type, indices);
1839 }
1840
1841
1842 static void GLAPIENTRY
1843 _save_OBE_MultiDrawElements(GLenum mode, const GLsizei *count, GLenum type,
1844                             const GLvoid * const *indices, GLsizei primcount)
1845 {
1846    GET_CURRENT_CONTEXT(ctx);
1847    struct _glapi_table *dispatch = ctx->CurrentServerDispatch;
1848    GLsizei i;
1849
1850    int vertcount = 0;
1851    for (i = 0; i < primcount; i++) {
1852       vertcount += count[i];
1853    }
1854    grow_vertex_storage(ctx, vertcount);
1855
1856    for (i = 0; i < primcount; i++) {
1857       if (count[i] > 0) {
1858          CALL_DrawElements(dispatch, (mode, count[i], type, indices[i]));
1859       }
1860    }
1861 }
1862
1863
1864 static void GLAPIENTRY
1865 _save_OBE_MultiDrawElementsBaseVertex(GLenum mode, const GLsizei *count,
1866                                       GLenum type,
1867                                       const GLvoid * const *indices,
1868                                       GLsizei primcount,
1869                                       const GLint *basevertex)
1870 {
1871    GET_CURRENT_CONTEXT(ctx);
1872    struct _glapi_table *dispatch = ctx->CurrentServerDispatch;
1873    GLsizei i;
1874
1875    int vertcount = 0;
1876    for (i = 0; i < primcount; i++) {
1877       vertcount += count[i];
1878    }
1879    grow_vertex_storage(ctx, vertcount);
1880
1881    for (i = 0; i < primcount; i++) {
1882       if (count[i] > 0) {
1883          CALL_DrawElementsBaseVertex(dispatch, (mode, count[i], type,
1884                                      indices[i],
1885                                      basevertex[i]));
1886       }
1887    }
1888 }
1889
1890
1891 static void
1892 vtxfmt_init(struct gl_context *ctx)
1893 {
1894    struct vbo_save_context *save = &vbo_context(ctx)->save;
1895    GLvertexformat *vfmt = &save->vtxfmt;
1896
1897 #define NAME_AE(x) _ae_##x
1898 #define NAME_CALLLIST(x) _save_##x
1899 #define NAME(x) _save_##x
1900 #define NAME_ES(x) _save_##x##ARB
1901
1902 #include "vbo_init_tmp.h"
1903 }
1904
1905
1906 /**
1907  * Initialize the dispatch table with the VBO functions for display
1908  * list compilation.
1909  */
1910 void
1911 vbo_initialize_save_dispatch(const struct gl_context *ctx,
1912                              struct _glapi_table *exec)
1913 {
1914    SET_DrawArrays(exec, _save_OBE_DrawArrays);
1915    SET_MultiDrawArrays(exec, _save_OBE_MultiDrawArrays);
1916    SET_DrawElements(exec, _save_OBE_DrawElements);
1917    SET_DrawElementsBaseVertex(exec, _save_OBE_DrawElementsBaseVertex);
1918    SET_DrawRangeElements(exec, _save_OBE_DrawRangeElements);
1919    SET_MultiDrawElementsEXT(exec, _save_OBE_MultiDrawElements);
1920    SET_MultiDrawElementsBaseVertex(exec, _save_OBE_MultiDrawElementsBaseVertex);
1921    SET_Rectf(exec, _save_OBE_Rectf);
1922    SET_Rectd(exec, _save_OBE_Rectd);
1923    SET_Rectdv(exec, _save_OBE_Rectdv);
1924    SET_Rectfv(exec, _save_OBE_Rectfv);
1925    SET_Recti(exec, _save_OBE_Recti);
1926    SET_Rectiv(exec, _save_OBE_Rectiv);
1927    SET_Rects(exec, _save_OBE_Rects);
1928    SET_Rectsv(exec, _save_OBE_Rectsv);
1929
1930    /* Note: other glDraw functins aren't compiled into display lists */
1931 }
1932
1933
1934
1935 void
1936 vbo_save_SaveFlushVertices(struct gl_context *ctx)
1937 {
1938    struct vbo_save_context *save = &vbo_context(ctx)->save;
1939
1940    /* Noop when we are actually active:
1941     */
1942    if (ctx->Driver.CurrentSavePrimitive <= PRIM_MAX)
1943       return;
1944
1945    if (save->vertex_store->used || save->prim_store->used)
1946       compile_vertex_list(ctx);
1947
1948    copy_to_current(ctx);
1949    reset_vertex(ctx);
1950    ctx->Driver.SaveNeedFlush = GL_FALSE;
1951 }
1952
1953
1954 /**
1955  * Called from glNewList when we're starting to compile a display list.
1956  */
1957 void
1958 vbo_save_NewList(struct gl_context *ctx, GLuint list, GLenum mode)
1959 {
1960    struct vbo_save_context *save = &vbo_context(ctx)->save;
1961
1962    (void) list;
1963    (void) mode;
1964
1965    if (!save->prim_store)
1966       save->prim_store = realloc_prim_store(NULL, 8);
1967
1968    if (!save->vertex_store)
1969       save->vertex_store = CALLOC_STRUCT(vbo_save_vertex_store);
1970
1971    reset_vertex(ctx);
1972    ctx->Driver.SaveNeedFlush = GL_FALSE;
1973 }
1974
1975
1976 /**
1977  * Called from glEndList when we're finished compiling a display list.
1978  */
1979 void
1980 vbo_save_EndList(struct gl_context *ctx)
1981 {
1982    struct vbo_save_context *save = &vbo_context(ctx)->save;
1983
1984    /* EndList called inside a (saved) Begin/End pair?
1985     */
1986    if (_mesa_inside_dlist_begin_end(ctx)) {
1987       if (save->prim_store->used > 0) {
1988          GLint i = save->prim_store->used - 1;
1989          ctx->Driver.CurrentSavePrimitive = PRIM_OUTSIDE_BEGIN_END;
1990          save->prim_store->prims[i].end = 0;
1991          save->prim_store->prims[i].count = get_vertex_count(save) - save->prim_store->prims[i].start;
1992       }
1993
1994       /* Make sure this vertex list gets replayed by the "loopback"
1995        * mechanism:
1996        */
1997       save->dangling_attr_ref = GL_TRUE;
1998       vbo_save_SaveFlushVertices(ctx);
1999
2000       /* Swap out this vertex format while outside begin/end.  Any color,
2001        * etc. received between here and the next begin will be compiled
2002        * as opcodes.
2003        */
2004       _mesa_install_save_vtxfmt(ctx, &ctx->ListState.ListVtxfmt);
2005    }
2006
2007    assert(save->vertex_size == 0);
2008 }
2009
2010 /**
2011  * Called during context creation/init.
2012  */
2013 static void
2014 current_init(struct gl_context *ctx)
2015 {
2016    struct vbo_save_context *save = &vbo_context(ctx)->save;
2017    GLint i;
2018
2019    for (i = VBO_ATTRIB_POS; i <= VBO_ATTRIB_EDGEFLAG; i++) {
2020       const GLuint j = i - VBO_ATTRIB_POS;
2021       assert(j < VERT_ATTRIB_MAX);
2022       save->currentsz[i] = &ctx->ListState.ActiveAttribSize[j];
2023       save->current[i] = (fi_type *) ctx->ListState.CurrentAttrib[j];
2024    }
2025
2026    for (i = VBO_ATTRIB_FIRST_MATERIAL; i <= VBO_ATTRIB_LAST_MATERIAL; i++) {
2027       const GLuint j = i - VBO_ATTRIB_FIRST_MATERIAL;
2028       assert(j < MAT_ATTRIB_MAX);
2029       save->currentsz[i] = &ctx->ListState.ActiveMaterialSize[j];
2030       save->current[i] = (fi_type *) ctx->ListState.CurrentMaterial[j];
2031    }
2032 }
2033
2034
2035 /**
2036  * Initialize the display list compiler.  Called during context creation.
2037  */
2038 void
2039 vbo_save_api_init(struct vbo_save_context *save)
2040 {
2041    struct gl_context *ctx = gl_context_from_vbo_save(save);
2042
2043    vtxfmt_init(ctx);
2044    current_init(ctx);
2045 }