vbo/dlist: use a single buffer object
[platform/upstream/mesa.git] / src / mesa / vbo / vbo_save_api.c
1 /**************************************************************************
2
3 Copyright 2002-2008 VMware, Inc.
4
5 All Rights Reserved.
6
7 Permission is hereby granted, free of charge, to any person obtaining a
8 copy of this software and associated documentation files (the "Software"),
9 to deal in the Software without restriction, including without limitation
10 on the rights to use, copy, modify, merge, publish, distribute, sub
11 license, and/or sell copies of the Software, and to permit persons to whom
12 the Software is furnished to do so, subject to the following conditions:
13
14 The above copyright notice and this permission notice (including the next
15 paragraph) shall be included in all copies or substantial portions of the
16 Software.
17
18 THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
19 IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
20 FITNESS FOR A PARTICULAR PURPOSE AND NON-INFRINGEMENT. IN NO EVENT SHALL
21 VMWARE AND/OR THEIR SUPPLIERS BE LIABLE FOR ANY CLAIM,
22 DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR
23 OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE
24 USE OR OTHER DEALINGS IN THE SOFTWARE.
25
26 **************************************************************************/
27
28 /*
29  * Authors:
30  *   Keith Whitwell <keithw@vmware.com>
31  */
32
33
34
35 /* Display list compiler attempts to store lists of vertices with the
36  * same vertex layout.  Additionally it attempts to minimize the need
37  * for execute-time fixup of these vertex lists, allowing them to be
38  * cached on hardware.
39  *
40  * There are still some circumstances where this can be thwarted, for
41  * example by building a list that consists of one very long primitive
42  * (eg Begin(Triangles), 1000 vertices, End), and calling that list
43  * from inside a different begin/end object (Begin(Lines), CallList,
44  * End).
45  *
46  * In that case the code will have to replay the list as individual
47  * commands through the Exec dispatch table, or fix up the copied
48  * vertices at execute-time.
49  *
50  * The other case where fixup is required is when a vertex attribute
51  * is introduced in the middle of a primitive.  Eg:
52  *  Begin(Lines)
53  *  TexCoord1f()           Vertex2f()
54  *  TexCoord1f() Color3f() Vertex2f()
55  *  End()
56  *
57  *  If the current value of Color isn't known at compile-time, this
58  *  primitive will require fixup.
59  *
60  *
61  * The list compiler currently doesn't attempt to compile lists
62  * containing EvalCoord or EvalPoint commands.  On encountering one of
63  * these, compilation falls back to opcodes.
64  *
65  * This could be improved to fallback only when a mix of EvalCoord and
66  * Vertex commands are issued within a single primitive.
67  */
68
69
70 #include "main/glheader.h"
71 #include "main/arrayobj.h"
72 #include "main/bufferobj.h"
73 #include "main/context.h"
74 #include "main/dlist.h"
75 #include "main/enums.h"
76 #include "main/eval.h"
77 #include "main/macros.h"
78 #include "main/draw_validate.h"
79 #include "main/api_arrayelt.h"
80 #include "main/vtxfmt.h"
81 #include "main/dispatch.h"
82 #include "main/state.h"
83 #include "main/varray.h"
84 #include "util/bitscan.h"
85 #include "util/u_memory.h"
86 #include "util/hash_table.h"
87
88 #include "gallium/include/pipe/p_state.h"
89
90 #include "vbo_noop.h"
91 #include "vbo_private.h"
92
93
94 #ifdef ERROR
95 #undef ERROR
96 #endif
97
98 /* An interesting VBO number/name to help with debugging */
99 #define VBO_BUF_ID  12345
100
101 static void GLAPIENTRY
102 _save_Materialfv(GLenum face, GLenum pname, const GLfloat *params);
103
104 static void GLAPIENTRY
105 _save_EvalCoord1f(GLfloat u);
106
107 static void GLAPIENTRY
108 _save_EvalCoord2f(GLfloat u, GLfloat v);
109
110 /*
111  * NOTE: Old 'parity' issue is gone, but copying can still be
112  * wrong-footed on replay.
113  */
114 static GLuint
115 copy_vertices(struct gl_context *ctx,
116               const struct vbo_save_vertex_list *node,
117               const fi_type * src_buffer)
118 {
119    struct vbo_save_context *save = &vbo_context(ctx)->save;
120    struct _mesa_prim *prim = &node->cold->prims[node->cold->prim_count - 1];
121    GLuint sz = save->vertex_size;
122    const fi_type *src = src_buffer + prim->start * sz;
123    fi_type *dst = save->copied.buffer;
124
125    if (prim->end)
126       return 0;
127
128    return vbo_copy_vertices(ctx, prim->mode, prim->start, &prim->count,
129                             prim->begin, sz, true, dst, src);
130 }
131
132
133 static struct vbo_save_vertex_store *
134 alloc_vertex_store(struct gl_context *ctx, int vertex_count)
135 {
136    struct vbo_save_context *save = &vbo_context(ctx)->save;
137    struct vbo_save_vertex_store *vertex_store =
138       CALLOC_STRUCT(vbo_save_vertex_store);
139
140    int size = MAX2(vertex_count * save->vertex_size, VBO_SAVE_BUFFER_SIZE);
141
142    /* obj->Name needs to be non-zero, but won't ever be examined more
143     * closely than that.  In particular these buffers won't be entered
144     * into the hash and can never be confused with ones visible to the
145     * user.  Perhaps there could be a special number for internal
146     * buffers:
147     */
148    vertex_store->bufferobj = ctx->Driver.NewBufferObject(ctx, VBO_BUF_ID);
149    if (vertex_store->bufferobj) {
150       vertex_store->buffer_in_ram_size = size * sizeof(GLfloat);
151       vertex_store->buffer_in_ram = malloc(vertex_store->buffer_in_ram_size);
152       save->out_of_memory = vertex_store->buffer_in_ram == NULL;
153       save->out_of_memory =
154          !ctx->Driver.BufferData(ctx,
155                                  GL_ARRAY_BUFFER_ARB,
156                                  size * sizeof(GLfloat),
157                                  NULL, GL_STATIC_DRAW_ARB,
158                                  GL_MAP_WRITE_BIT,
159                                  vertex_store->bufferobj);
160    }
161    else {
162       save->out_of_memory = GL_TRUE;
163    }
164
165    if (save->out_of_memory) {
166       _mesa_error(ctx, GL_OUT_OF_MEMORY, "internal VBO allocation");
167       _mesa_install_save_vtxfmt(ctx, &save->vtxfmt_noop);
168    }
169
170    vertex_store->used = 0;
171
172    return vertex_store;
173 }
174
175
176 static void
177 free_vertex_store(struct gl_context *ctx,
178                   struct vbo_save_vertex_store *vertex_store)
179 {
180    free(vertex_store->buffer_in_ram);
181
182    if (vertex_store->bufferobj) {
183       _mesa_reference_buffer_object(ctx, &vertex_store->bufferobj, NULL);
184    }
185
186    free(vertex_store);
187 }
188
189
190 static struct vbo_save_primitive_store *
191 alloc_prim_store(int prim_count)
192 {
193    struct vbo_save_primitive_store *store =
194       CALLOC_STRUCT(vbo_save_primitive_store);
195    store->size = MAX2(prim_count, VBO_SAVE_PRIM_SIZE);
196    store->prims = calloc(store->size, sizeof(struct _mesa_prim));
197    store->used = 0;
198    store->refcount = 1;
199    return store;
200 }
201
202
203 static void
204 reset_counters(struct gl_context *ctx)
205 {
206    struct vbo_save_context *save = &vbo_context(ctx)->save;
207
208    save->prims = save->prim_store->prims + save->prim_store->used;
209    save->buffer_map = save->vertex_store->buffer_in_ram + save->vertex_store->used;
210
211    assert(save->buffer_map == save->buffer_ptr);
212
213    if (save->vertex_size)
214       save->max_vert = (save->vertex_store->buffer_in_ram_size / sizeof(float) - save->vertex_store->used) /
215                         save->vertex_size;
216    else
217       save->max_vert = 0;
218
219    save->vert_count = 0;
220    save->prim_count = 0;
221    save->prim_max = save->prim_store->size - save->prim_store->used;
222    save->dangling_attr_ref = GL_FALSE;
223 }
224
225 /**
226  * For a list of prims, try merging prims that can just be extensions of the
227  * previous prim.
228  */
229 static void
230 merge_prims(struct gl_context *ctx, struct _mesa_prim *prim_list,
231             GLuint *prim_count)
232 {
233    GLuint i;
234    struct _mesa_prim *prev_prim = prim_list;
235
236    for (i = 1; i < *prim_count; i++) {
237       struct _mesa_prim *this_prim = prim_list + i;
238
239       vbo_try_prim_conversion(&this_prim->mode, &this_prim->count);
240
241       if (vbo_merge_draws(ctx, true,
242                           prev_prim->mode, this_prim->mode,
243                           prev_prim->start, this_prim->start,
244                           &prev_prim->count, this_prim->count,
245                           prev_prim->basevertex, this_prim->basevertex,
246                           &prev_prim->end,
247                           this_prim->begin, this_prim->end)) {
248          /* We've found a prim that just extend the previous one.  Tack it
249           * onto the previous one, and let this primitive struct get dropped.
250           */
251          continue;
252       }
253
254       /* If any previous primitives have been dropped, then we need to copy
255        * this later one into the next available slot.
256        */
257       prev_prim++;
258       if (prev_prim != this_prim)
259          *prev_prim = *this_prim;
260    }
261
262    *prim_count = prev_prim - prim_list + 1;
263 }
264
265
266 /**
267  * Convert GL_LINE_LOOP primitive into GL_LINE_STRIP so that drivers
268  * don't have to worry about handling the _mesa_prim::begin/end flags.
269  * See https://bugs.freedesktop.org/show_bug.cgi?id=81174
270  */
271 static void
272 convert_line_loop_to_strip(struct vbo_save_context *save,
273                            struct vbo_save_vertex_list *node)
274 {
275    struct _mesa_prim *prim = &node->cold->prims[node->cold->prim_count - 1];
276
277    assert(prim->mode == GL_LINE_LOOP);
278
279    if (prim->end) {
280       /* Copy the 0th vertex to end of the buffer and extend the
281        * vertex count by one to finish the line loop.
282        */
283       const GLuint sz = save->vertex_size;
284       /* 0th vertex: */
285       const fi_type *src = save->buffer_map + prim->start * sz;
286       /* end of buffer: */
287       fi_type *dst = save->buffer_map + (prim->start + prim->count) * sz;
288
289       memcpy(dst, src, sz * sizeof(float));
290
291       prim->count++;
292       node->cold->vertex_count++;
293       save->vert_count++;
294       save->buffer_ptr += sz;
295       save->vertex_store->used += sz;
296    }
297
298    if (!prim->begin) {
299       /* Drawing the second or later section of a long line loop.
300        * Skip the 0th vertex.
301        */
302       prim->start++;
303       prim->count--;
304    }
305
306    prim->mode = GL_LINE_STRIP;
307 }
308
309
310 /* Compare the present vao if it has the same setup. */
311 static bool
312 compare_vao(gl_vertex_processing_mode mode,
313             const struct gl_vertex_array_object *vao,
314             const struct gl_buffer_object *bo, GLintptr buffer_offset,
315             GLuint stride, GLbitfield64 vao_enabled,
316             const GLubyte size[VBO_ATTRIB_MAX],
317             const GLenum16 type[VBO_ATTRIB_MAX],
318             const GLuint offset[VBO_ATTRIB_MAX])
319 {
320    if (!vao)
321       return false;
322
323    /* If the enabled arrays are not the same we are not equal. */
324    if (vao_enabled != vao->Enabled)
325       return false;
326
327    /* Check the buffer binding at 0 */
328    if (vao->BufferBinding[0].BufferObj != bo)
329       return false;
330    /* BufferBinding[0].Offset != buffer_offset is checked per attribute */
331    if (vao->BufferBinding[0].Stride != stride)
332       return false;
333    assert(vao->BufferBinding[0].InstanceDivisor == 0);
334
335    /* Retrieve the mapping from VBO_ATTRIB to VERT_ATTRIB space */
336    const GLubyte *const vao_to_vbo_map = _vbo_attribute_alias_map[mode];
337
338    /* Now check the enabled arrays */
339    GLbitfield mask = vao_enabled;
340    while (mask) {
341       const int attr = u_bit_scan(&mask);
342       const unsigned char vbo_attr = vao_to_vbo_map[attr];
343       const GLenum16 tp = type[vbo_attr];
344       const GLintptr off = offset[vbo_attr] + buffer_offset;
345       const struct gl_array_attributes *attrib = &vao->VertexAttrib[attr];
346       if (attrib->RelativeOffset + vao->BufferBinding[0].Offset != off)
347          return false;
348       if (attrib->Format.Type != tp)
349          return false;
350       if (attrib->Format.Size != size[vbo_attr])
351          return false;
352       assert(attrib->Format.Format == GL_RGBA);
353       assert(attrib->Format.Normalized == GL_FALSE);
354       assert(attrib->Format.Integer == vbo_attrtype_to_integer_flag(tp));
355       assert(attrib->Format.Doubles == vbo_attrtype_to_double_flag(tp));
356       assert(attrib->BufferBindingIndex == 0);
357    }
358
359    return true;
360 }
361
362
363 /* Create or reuse the vao for the vertex processing mode. */
364 static void
365 update_vao(struct gl_context *ctx,
366            gl_vertex_processing_mode mode,
367            struct gl_vertex_array_object **vao,
368            struct gl_buffer_object *bo, GLintptr buffer_offset,
369            GLuint stride, GLbitfield64 vbo_enabled,
370            const GLubyte size[VBO_ATTRIB_MAX],
371            const GLenum16 type[VBO_ATTRIB_MAX],
372            const GLuint offset[VBO_ATTRIB_MAX])
373 {
374    /* Compute the bitmasks of vao_enabled arrays */
375    GLbitfield vao_enabled = _vbo_get_vao_enabled_from_vbo(mode, vbo_enabled);
376
377    /*
378     * Check if we can possibly reuse the exisiting one.
379     * In the long term we should reset them when something changes.
380     */
381    if (compare_vao(mode, *vao, bo, buffer_offset, stride,
382                    vao_enabled, size, type, offset))
383       return;
384
385    /* The initial refcount is 1 */
386    _mesa_reference_vao(ctx, vao, NULL);
387    *vao = _mesa_new_vao(ctx, ~((GLuint)0));
388
389    /*
390     * assert(stride <= ctx->Const.MaxVertexAttribStride);
391     * MaxVertexAttribStride is not set for drivers that does not
392     * expose GL 44 or GLES 31.
393     */
394
395    /* Bind the buffer object at binding point 0 */
396    _mesa_bind_vertex_buffer(ctx, *vao, 0, bo, buffer_offset, stride, false,
397                             false);
398
399    /* Retrieve the mapping from VBO_ATTRIB to VERT_ATTRIB space
400     * Note that the position/generic0 aliasing is done in the VAO.
401     */
402    const GLubyte *const vao_to_vbo_map = _vbo_attribute_alias_map[mode];
403    /* Now set the enable arrays */
404    GLbitfield mask = vao_enabled;
405    while (mask) {
406       const int vao_attr = u_bit_scan(&mask);
407       const GLubyte vbo_attr = vao_to_vbo_map[vao_attr];
408       assert(offset[vbo_attr] <= ctx->Const.MaxVertexAttribRelativeOffset);
409
410       _vbo_set_attrib_format(ctx, *vao, vao_attr, buffer_offset,
411                              size[vbo_attr], type[vbo_attr], offset[vbo_attr]);
412       _mesa_vertex_attrib_binding(ctx, *vao, vao_attr, 0);
413    }
414    _mesa_enable_vertex_array_attribs(ctx, *vao, vao_enabled);
415    assert(vao_enabled == (*vao)->Enabled);
416    assert((vao_enabled & ~(*vao)->VertexAttribBufferMask) == 0);
417
418    /* Finalize and freeze the VAO */
419    _mesa_set_vao_immutable(ctx, *vao);
420 }
421
422
423 static void
424 realloc_storage(struct gl_context *ctx, int prim_count, int vertex_count)
425 {
426    struct vbo_save_context *save = &vbo_context(ctx)->save;
427    if (vertex_count >= 0) {
428       /* Release old reference:
429        */
430       free_vertex_store(ctx, save->vertex_store);
431       save->vertex_store = NULL;
432       /* When we have a new vbo, we will for sure need a new vao */
433       for (gl_vertex_processing_mode vpm = 0; vpm < VP_MODE_MAX; ++vpm)
434          _mesa_reference_vao(ctx, &save->VAO[vpm], NULL);
435
436       /* Allocate and map new store:
437        */
438       save->vertex_store = alloc_vertex_store(ctx, vertex_count);
439       save->buffer_ptr = save->vertex_store->buffer_in_ram + save->vertex_store->used;
440       save->out_of_memory = save->buffer_ptr == NULL;
441    }
442
443    if (prim_count >= 0) {
444       if (--save->prim_store->refcount == 0) {
445          free(save->prim_store->prims);
446          free(save->prim_store);
447       }
448       save->prim_store = alloc_prim_store(prim_count);
449    }
450 }
451
452 struct vertex_key {
453    unsigned vertex_size;
454    fi_type *vertex_attributes;
455 };
456
457 static uint32_t _hash_vertex_key(const void *key)
458 {
459    struct vertex_key *k = (struct vertex_key*)key;
460    unsigned sz = k->vertex_size;
461    assert(sz);
462    return _mesa_hash_data(k->vertex_attributes, sz * sizeof(float));
463 }
464
465 static bool _compare_vertex_key(const void *key1, const void *key2)
466 {
467    struct vertex_key *k1 = (struct vertex_key*)key1;
468    struct vertex_key *k2 = (struct vertex_key*)key2;
469    /* All the compared vertices are going to be drawn with the same VAO,
470     * so we can compare the attributes. */
471    assert (k1->vertex_size == k2->vertex_size);
472    return memcmp(k1->vertex_attributes,
473                  k2->vertex_attributes,
474                  k1->vertex_size * sizeof(float)) == 0;
475 }
476
477 static void _free_entry(struct hash_entry *entry)
478 {
479    free((void*)entry->key);
480 }
481
482 /* Add vertex to the vertex buffer and return its index. If this vertex is a duplicate
483  * of an existing vertex, return the original index instead.
484  */
485 static uint32_t
486 add_vertex(struct vbo_save_context *save, struct hash_table *hash_to_index,
487            uint32_t index, fi_type *new_buffer, uint32_t *max_index)
488 {
489    /* If vertex deduplication is disabled return the original index. */
490    if (!hash_to_index)
491       return index;
492
493    fi_type *vert = save->buffer_map + save->vertex_size * index;
494
495    struct vertex_key *key = malloc(sizeof(struct vertex_key));
496    key->vertex_size = save->vertex_size;
497    key->vertex_attributes = vert;
498
499    struct hash_entry *entry = _mesa_hash_table_search(hash_to_index, key);
500    if (entry) {
501       free(key);
502       /* We found an existing vertex with the same hash, return its index. */
503       return (uintptr_t) entry->data;
504    } else {
505       /* This is a new vertex. Determine a new index and copy its attributes to the vertex
506        * buffer. Note that 'new_buffer' is created at each list compilation so we write vertices
507        * starting at index 0.
508        */
509       uint32_t n = _mesa_hash_table_num_entries(hash_to_index);
510       *max_index = MAX2(n, *max_index);
511
512       memcpy(&new_buffer[save->vertex_size * n],
513              vert,
514              save->vertex_size * sizeof(fi_type));
515
516       _mesa_hash_table_insert(hash_to_index, key, (void*)(uintptr_t)(n));
517
518       /* The index buffer is shared between list compilations, so add the base index to get
519        * the final index.
520        */
521       return n;
522    }
523 }
524
525
526 /**
527  * Insert the active immediate struct onto the display list currently
528  * being built.
529  */
530 static void
531 compile_vertex_list(struct gl_context *ctx)
532 {
533    struct vbo_save_context *save = &vbo_context(ctx)->save;
534    struct vbo_save_vertex_list *node;
535
536    /* Allocate space for this structure in the display list currently
537     * being compiled.
538     */
539    node = (struct vbo_save_vertex_list *)
540       _mesa_dlist_alloc_vertex_list(ctx, !save->dangling_attr_ref && !save->no_current_update);
541
542    if (!node)
543       return;
544
545    memset(node, 0, sizeof(struct vbo_save_vertex_list));
546    node->cold = calloc(1, sizeof(*node->cold));
547
548    /* Make sure the pointer is aligned to the size of a pointer */
549    assert((GLintptr) node % sizeof(void *) == 0);
550
551    const GLsizei stride = save->vertex_size*sizeof(GLfloat);
552
553    node->cold->vertex_count = save->vert_count;
554    node->cold->wrap_count = save->copied.nr;
555    node->cold->prims = save->prims;
556    node->cold->ib.obj = NULL;
557    node->cold->prim_count = save->prim_count;
558    node->cold->prim_store = save->prim_store;
559    node->cold->prim_store->refcount++;
560
561    if (save->no_current_update) {
562       node->cold->current_data = NULL;
563    }
564    else {
565       GLuint current_size = save->vertex_size - save->attrsz[0];
566       node->cold->current_data = NULL;
567
568       if (current_size) {
569          node->cold->current_data = malloc(current_size * sizeof(GLfloat));
570          if (node->cold->current_data) {
571             const char *buffer = (const char *)save->buffer_map;
572             unsigned attr_offset = save->attrsz[0] * sizeof(GLfloat);
573             unsigned vertex_offset = 0;
574
575             if (node->cold->vertex_count)
576                vertex_offset = (node->cold->vertex_count - 1) * stride;
577
578             memcpy(node->cold->current_data, buffer + vertex_offset + attr_offset,
579                    current_size * sizeof(GLfloat));
580          } else {
581             _mesa_error(ctx, GL_OUT_OF_MEMORY, "Current value allocation");
582          }
583       }
584    }
585
586    assert(save->attrsz[VBO_ATTRIB_POS] != 0 || node->cold->vertex_count == 0);
587
588    if (save->dangling_attr_ref)
589       ctx->ListState.Current.UseLoopback = true;
590
591    save->vertex_store->used += save->vertex_size * node->cold->vertex_count;
592    save->prim_store->used += node->cold->prim_count;
593
594    /* Copy duplicated vertices
595     */
596    save->copied.nr = copy_vertices(ctx, node, save->buffer_map);
597
598    if (node->cold->prims[node->cold->prim_count - 1].mode == GL_LINE_LOOP) {
599       convert_line_loop_to_strip(save, node);
600    }
601
602    merge_prims(ctx, node->cold->prims, &node->cold->prim_count);
603
604    GLintptr buffer_offset = 0;
605    GLuint start_offset = 0;
606
607    /* Create an index buffer. */
608    node->cold->min_index = node->cold->max_index = 0;
609    if (save->vert_count == 0 || save->prim_count == 0)
610       goto end;
611
612    /* We won't modify node->prims, so use a const alias to avoid unintended
613     * writes to it. */
614    const struct _mesa_prim *original_prims = node->cold->prims;
615
616    int end = original_prims[node->cold->prim_count - 1].start +
617              original_prims[node->cold->prim_count - 1].count;
618    int total_vert_count = end - original_prims[0].start;
619
620    node->cold->min_index = node->cold->prims[0].start;
621    node->cold->max_index = end - 1;
622
623    /* Estimate for the worst case: all prims are line strips (the +1 is because
624     * wrap_buffers may call use but the last primitive may not be complete) */
625    int max_indices_count = MAX2(total_vert_count * 2 - (node->cold->prim_count * 2) + 1,
626                                 total_vert_count);
627
628    int size = max_indices_count * sizeof(uint32_t);
629    uint32_t* indices = (uint32_t*) malloc(size);
630    struct _mesa_prim *merged_prims = NULL;
631
632    int idx = 0;
633    struct hash_table *vertex_to_index = NULL;
634    fi_type *temp_vertices_buffer = NULL;
635
636    /* The loopback replay code doesn't use the index buffer, so we can't
637     * dedup vertices in this case.
638     */
639    if (!ctx->ListState.Current.UseLoopback) {
640       vertex_to_index = _mesa_hash_table_create(NULL, _hash_vertex_key, _compare_vertex_key);
641       temp_vertices_buffer = malloc(save->vertex_store->buffer_in_ram_size);
642    }
643
644    uint32_t max_index = 0;
645
646    int last_valid_prim = -1;
647    /* Construct indices array. */
648    for (unsigned i = 0; i < node->cold->prim_count; i++) {
649       assert(original_prims[i].basevertex == 0);
650       GLubyte mode = original_prims[i].mode;
651
652       int vertex_count = original_prims[i].count;
653       if (!vertex_count) {
654          continue;
655       }
656
657       /* Line strips may get converted to lines */
658       if (mode == GL_LINE_STRIP)
659          mode = GL_LINES;
660
661       /* If 2 consecutive prims use the same mode => merge them. */
662       bool merge_prims = last_valid_prim >= 0 &&
663                          mode == merged_prims[last_valid_prim].mode &&
664                          mode != GL_LINE_LOOP && mode != GL_TRIANGLE_FAN &&
665                          mode != GL_QUAD_STRIP && mode != GL_POLYGON &&
666                          mode != GL_PATCHES;
667
668       /* To be able to merge consecutive triangle strips we need to insert
669        * a degenerate triangle.
670        */
671       if (merge_prims &&
672           mode == GL_TRIANGLE_STRIP) {
673          /* Insert a degenerate triangle */
674          assert(merged_prims[last_valid_prim].mode == GL_TRIANGLE_STRIP);
675          unsigned tri_count = merged_prims[last_valid_prim].count - 2;
676
677          indices[idx] = indices[idx - 1];
678          indices[idx + 1] = add_vertex(save, vertex_to_index, original_prims[i].start,
679                                        temp_vertices_buffer, &max_index);
680          idx += 2;
681          merged_prims[last_valid_prim].count += 2;
682
683          if (tri_count % 2) {
684             /* Add another index to preserve winding order */
685             indices[idx++] = add_vertex(save, vertex_to_index, original_prims[i].start,
686                                         temp_vertices_buffer, &max_index);
687             merged_prims[last_valid_prim].count++;
688          }
689       }
690
691       int start = idx;
692
693       /* Convert line strips to lines if it'll allow if the previous
694        * prim mode is GL_LINES (so merge_prims is true) or if the next
695        * primitive mode is GL_LINES or GL_LINE_LOOP.
696        */
697       if (original_prims[i].mode == GL_LINE_STRIP &&
698           (merge_prims ||
699            (i < node->cold->prim_count - 1 &&
700             (original_prims[i + 1].mode == GL_LINE_STRIP ||
701              original_prims[i + 1].mode == GL_LINES)))) {
702          for (unsigned j = 0; j < vertex_count; j++) {
703             indices[idx++] = add_vertex(save, vertex_to_index, original_prims[i].start + j,
704                                         temp_vertices_buffer, &max_index);
705             /* Repeat all but the first/last indices. */
706             if (j && j != vertex_count - 1) {
707                indices[idx++] = add_vertex(save, vertex_to_index, original_prims[i].start + j,
708                                            temp_vertices_buffer, &max_index);
709             }
710          }
711       } else {
712          /* We didn't convert to LINES, so restore the original mode */
713          mode = original_prims[i].mode;
714
715          for (unsigned j = 0; j < vertex_count; j++) {
716             indices[idx++] = add_vertex(save, vertex_to_index, original_prims[i].start + j,
717                                         temp_vertices_buffer, &max_index);
718          }
719       }
720
721       if (merge_prims) {
722          /* Update vertex count. */
723          merged_prims[last_valid_prim].count += idx - start;
724       } else {
725          /* Keep this primitive */
726          last_valid_prim += 1;
727          assert(last_valid_prim <= i);
728          merged_prims = realloc(merged_prims, (1 + last_valid_prim) * sizeof(struct _mesa_prim));
729          merged_prims[last_valid_prim] = original_prims[i];
730          merged_prims[last_valid_prim].start = start;
731          merged_prims[last_valid_prim].count = idx - start;
732       }
733       merged_prims[last_valid_prim].mode = mode;
734    }
735
736    assert(idx > 0 && idx <= max_indices_count);
737
738    unsigned merged_prim_count = last_valid_prim + 1;
739    node->cold->ib.ptr = NULL;
740    node->cold->ib.count = idx;
741    node->cold->ib.index_size_shift = (GL_UNSIGNED_INT - GL_UNSIGNED_BYTE) >> 1;
742
743    /* How many bytes do we need to store the indices and the vertices */
744    total_vert_count = vertex_to_index ? (max_index + 1) : idx;
745    unsigned total_bytes_needed = idx * sizeof(uint32_t) +
746                                  total_vert_count * save->vertex_size * sizeof(fi_type);
747
748    const GLintptr old_offset = save->VAO[0] ?
749       save->VAO[0]->BufferBinding[0].Offset + save->VAO[0]->VertexAttrib[VERT_ATTRIB_POS].RelativeOffset : 0;
750    if (old_offset != save->current_bo_bytes_used && stride > 0) {
751       GLintptr offset_diff = save->current_bo_bytes_used - old_offset;
752       while (offset_diff > 0 &&
753              save->current_bo_bytes_used < save->current_bo->Size &&
754              offset_diff % stride != 0) {
755          save->current_bo_bytes_used++;
756          offset_diff = save->current_bo_bytes_used - old_offset;
757       }
758    }
759    buffer_offset = save->current_bo_bytes_used;
760
761    /* Can we reuse the previous bo or should we allocate a new one? */
762    int available_bytes = save->current_bo ? save->current_bo->Size - save->current_bo_bytes_used : 0;
763    if (total_bytes_needed > available_bytes) {
764       if (save->current_bo)
765          _mesa_reference_buffer_object(ctx, &save->current_bo, NULL);
766       save->current_bo = ctx->Driver.NewBufferObject(ctx, VBO_BUF_ID + 1);
767       bool success = ctx->Driver.BufferData(ctx,
768                                             GL_ELEMENT_ARRAY_BUFFER_ARB,
769                                             MAX2(total_bytes_needed, VBO_SAVE_BUFFER_SIZE * sizeof(uint32_t)),
770                                             NULL,
771                                             GL_STATIC_DRAW_ARB, GL_MAP_WRITE_BIT,
772                                             save->current_bo);
773       if (!success) {
774          _mesa_reference_buffer_object(ctx, &save->current_bo, NULL);
775          _mesa_error(ctx, GL_OUT_OF_MEMORY, "IB allocation");
776       } else {
777          save->current_bo_bytes_used = 0;
778          available_bytes = save->current_bo->Size;
779       }
780       buffer_offset = 0;
781    } else {
782       assert(old_offset <= buffer_offset);
783       const GLintptr offset_diff = buffer_offset - old_offset;
784       if (offset_diff > 0 && stride > 0 && offset_diff % stride == 0) {
785          /* The vertex size is an exact multiple of the buffer offset.
786           * This means that we can use zero-based vertex attribute pointers
787           * and specify the start of the primitive with the _mesa_prim::start
788           * field.  This results in issuing several draw calls with identical
789           * vertex attribute information.  This can result in fewer state
790           * changes in drivers.  In particular, the Gallium CSO module will
791           * filter out redundant vertex buffer changes.
792           */
793          /* We cannot immediately update the primitives as some methods below
794           * still need the uncorrected start vertices
795           */
796          start_offset = offset_diff/stride;
797          assert(old_offset == buffer_offset - offset_diff);
798          buffer_offset = old_offset;
799       }
800
801       /* Correct the primitive starts, we can only do this here as copy_vertices
802        * and convert_line_loop_to_strip above consume the uncorrected starts.
803        * On the other hand the _vbo_loopback_vertex_list call below needs the
804        * primitives to be corrected already.
805        */
806       for (unsigned i = 0; i < node->cold->prim_count; i++) {
807          node->cold->prims[i].start += start_offset;
808       }
809       /* start_offset shifts vertices (so v[0] becomes v[start_offset]), so we have
810        * to apply this transformation to all indices and max_index.
811        */
812       for (unsigned i = 0; i < idx; i++)
813          indices[i] += start_offset;
814       max_index += start_offset;
815    }
816
817    _mesa_reference_buffer_object(ctx, &node->cold->ib.obj, save->current_bo);
818
819    /* Upload the vertices first (see buffer_offset) */
820    ctx->Driver.BufferSubData(ctx,
821                              save->current_bo_bytes_used,
822                              total_vert_count * save->vertex_size * sizeof(fi_type),
823                              vertex_to_index ? temp_vertices_buffer : save->buffer_map,
824                              node->cold->ib.obj);
825    save->current_bo_bytes_used += total_vert_count * save->vertex_size * sizeof(fi_type);
826
827   if (vertex_to_index) {
828       _mesa_hash_table_destroy(vertex_to_index, _free_entry);
829       free(temp_vertices_buffer);
830    }
831
832    /* Since we're append the indices to an existing buffer, we need to adjust the start value of each
833     * primitive (not the indices themselves). */
834    save->current_bo_bytes_used += align(save->current_bo_bytes_used, 4) - save->current_bo_bytes_used;
835    int indices_offset = save->current_bo_bytes_used / 4;
836    for (int i = 0; i < merged_prim_count; i++) {
837       merged_prims[i].start += indices_offset;
838    }
839
840    /* Then upload the indices. */
841    if (node->cold->ib.obj) {
842       ctx->Driver.BufferSubData(ctx,
843                                 save->current_bo_bytes_used,
844                                 idx * sizeof(uint32_t),
845                                 indices,
846                                 node->cold->ib.obj);
847       save->current_bo_bytes_used += idx * sizeof(uint32_t);
848    } else {
849       node->cold->vertex_count = 0;
850       node->cold->prim_count = 0;
851    }
852
853    /* Prepare for DrawGallium */
854    memset(&node->merged.info, 0, sizeof(struct pipe_draw_info));
855    /* The other info fields will be updated in vbo_save_playback_vertex_list */
856    node->merged.info.index_size = 4;
857    node->merged.info.instance_count = 1;
858    node->merged.info.index.gl_bo = node->cold->ib.obj;
859    if (merged_prim_count == 1) {
860       node->merged.info.mode = merged_prims[0].mode;
861       node->merged.start_count.start = merged_prims[0].start;
862       node->merged.start_count.count = merged_prims[0].count;
863       node->merged.start_count.index_bias = 0;
864       node->merged.mode = NULL;
865    } else {
866       node->merged.mode = malloc(merged_prim_count * sizeof(unsigned char));
867       node->merged.start_counts = malloc(merged_prim_count * sizeof(struct pipe_draw_start_count_bias));
868       for (unsigned i = 0; i < merged_prim_count; i++) {
869          node->merged.start_counts[i].start = merged_prims[i].start;
870          node->merged.start_counts[i].count = merged_prims[i].count;
871          node->merged.start_counts[i].index_bias = 0;
872          node->merged.mode[i] = merged_prims[i].mode;
873       }
874    }
875    node->merged.num_draws = merged_prim_count;
876    if (node->merged.num_draws > 1) {
877       bool same_mode = true;
878       for (unsigned i = 1; i < node->merged.num_draws && same_mode; i++) {
879          same_mode = node->merged.mode[i] == node->merged.mode[0];
880       }
881       if (same_mode) {
882          /* All primitives use the same mode, so we can simplify a bit */
883          node->merged.info.mode = node->merged.mode[0];
884          free(node->merged.mode);
885          node->merged.mode = NULL;
886       }
887    }
888
889    free(indices);
890    free(merged_prims);
891
892 end:
893
894    if (!save->current_bo) {
895       save->current_bo = ctx->Driver.NewBufferObject(ctx, VBO_BUF_ID + 1);
896       bool success = ctx->Driver.BufferData(ctx,
897                                             GL_ELEMENT_ARRAY_BUFFER_ARB,
898                                             VBO_SAVE_BUFFER_SIZE * sizeof(uint32_t),
899                                             NULL,
900                                             GL_STATIC_DRAW_ARB, GL_MAP_WRITE_BIT,
901                                             save->current_bo);
902    }
903
904    GLuint offsets[VBO_ATTRIB_MAX];
905    for (unsigned i = 0, offset = 0; i < VBO_ATTRIB_MAX; ++i) {
906       offsets[i] = offset;
907       offset += save->attrsz[i] * sizeof(GLfloat);
908    }
909    /* Create a pair of VAOs for the possible VERTEX_PROCESSING_MODEs
910     * Note that this may reuse the previous one of possible.
911     */
912    for (gl_vertex_processing_mode vpm = VP_MODE_FF; vpm < VP_MODE_MAX; ++vpm) {
913       /* create or reuse the vao */
914       update_vao(ctx, vpm, &save->VAO[vpm],
915                  save->current_bo, buffer_offset, stride,
916                  save->enabled, save->attrsz, save->attrtype, offsets);
917       /* Reference the vao in the dlist */
918       node->VAO[vpm] = NULL;
919       _mesa_reference_vao(ctx, &node->VAO[vpm], save->VAO[vpm]);
920    }
921
922
923    /* Deal with GL_COMPILE_AND_EXECUTE:
924     */
925    if (ctx->ExecuteFlag) {
926       struct _glapi_table *dispatch = GET_DISPATCH();
927
928       _glapi_set_dispatch(ctx->Exec);
929
930       /* _vbo_loopback_vertex_list doesn't use the index buffer, so we have to
931        * use buffer_in_ram instead of current_bo which contains all vertices instead
932        * of the deduplicated vertices only in the !UseLoopback case.
933        *
934        * The problem is that the VAO offset is based on current_bo's layout,
935        * so we have to use a temp value.
936        */
937       struct gl_vertex_array_object *vao = node->VAO[VP_MODE_SHADER];
938       GLintptr original = vao->BufferBinding[0].Offset;
939       if (!ctx->ListState.Current.UseLoopback) {
940          GLintptr new_offset = (save->buffer_map - save->vertex_store->buffer_in_ram) *
941                                sizeof(GLfloat);
942          /* 'start_offset' has been added to all primitives 'start', so undo it here. */
943          new_offset -= start_offset * stride;
944          vao->BufferBinding[0].Offset = new_offset;
945       }
946       _vbo_loopback_vertex_list(ctx, node, save->vertex_store->buffer_in_ram);
947       vao->BufferBinding[0].Offset = original;
948
949       _glapi_set_dispatch(dispatch);
950    }
951
952    /* Decide whether the storage structs are full, or can be used for
953     * the next vertex lists as well.
954     */
955    if (save->vertex_store->used >
956        save->vertex_store->buffer_in_ram_size / sizeof(float) - 16 * (save->vertex_size + 4)) {
957       realloc_storage(ctx, -1, 0);
958    }
959    else {
960       /* update buffer_ptr for next vertex */
961       save->buffer_ptr = save->vertex_store->buffer_in_ram
962          + save->vertex_store->used;
963    }
964
965    if (save->prim_store->used > save->prim_store->size - 6) {
966       realloc_storage(ctx, 0, -1);
967    }
968
969    /* Reset our structures for the next run of vertices:
970     */
971    reset_counters(ctx);
972 }
973
974
975 /**
976  * This is called when we fill a vertex buffer before we hit a glEnd().
977  * We
978  * TODO -- If no new vertices have been stored, don't bother saving it.
979  */
980 static void
981 wrap_buffers(struct gl_context *ctx)
982 {
983    struct vbo_save_context *save = &vbo_context(ctx)->save;
984    GLint i = save->prim_count - 1;
985    GLenum mode;
986
987    assert(i < (GLint) save->prim_max);
988    assert(i >= 0);
989
990    /* Close off in-progress primitive.
991     */
992    save->prims[i].count = (save->vert_count - save->prims[i].start);
993    mode = save->prims[i].mode;
994
995    /* store the copied vertices, and allocate a new list.
996     */
997    compile_vertex_list(ctx);
998
999    /* Restart interrupted primitive
1000     */
1001    save->prims[0].mode = mode;
1002    save->prims[0].begin = 0;
1003    save->prims[0].end = 0;
1004    save->prims[0].start = 0;
1005    save->prims[0].count = 0;
1006    save->prim_count = 1;
1007 }
1008
1009
1010 /**
1011  * Called only when buffers are wrapped as the result of filling the
1012  * vertex_store struct.
1013  */
1014 static void
1015 wrap_filled_vertex(struct gl_context *ctx)
1016 {
1017    struct vbo_save_context *save = &vbo_context(ctx)->save;
1018    unsigned numComponents;
1019
1020    /* Emit a glEnd to close off the last vertex list.
1021     */
1022    wrap_buffers(ctx);
1023
1024    /* Copy stored stored vertices to start of new list.
1025     */
1026    assert(save->max_vert - save->vert_count > save->copied.nr);
1027
1028    numComponents = save->copied.nr * save->vertex_size;
1029    memcpy(save->buffer_ptr,
1030           save->copied.buffer,
1031           numComponents * sizeof(fi_type));
1032    save->buffer_ptr += numComponents;
1033    save->vert_count += save->copied.nr;
1034 }
1035
1036
1037 static void
1038 copy_to_current(struct gl_context *ctx)
1039 {
1040    struct vbo_save_context *save = &vbo_context(ctx)->save;
1041    GLbitfield64 enabled = save->enabled & (~BITFIELD64_BIT(VBO_ATTRIB_POS));
1042
1043    while (enabled) {
1044       const int i = u_bit_scan64(&enabled);
1045       assert(save->attrsz[i]);
1046
1047       if (save->attrtype[i] == GL_DOUBLE ||
1048           save->attrtype[i] == GL_UNSIGNED_INT64_ARB)
1049          memcpy(save->current[i], save->attrptr[i], save->attrsz[i] * sizeof(GLfloat));
1050       else
1051          COPY_CLEAN_4V_TYPE_AS_UNION(save->current[i], save->attrsz[i],
1052                                      save->attrptr[i], save->attrtype[i]);
1053    }
1054 }
1055
1056
1057 static void
1058 copy_from_current(struct gl_context *ctx)
1059 {
1060    struct vbo_save_context *save = &vbo_context(ctx)->save;
1061    GLbitfield64 enabled = save->enabled & (~BITFIELD64_BIT(VBO_ATTRIB_POS));
1062
1063    while (enabled) {
1064       const int i = u_bit_scan64(&enabled);
1065
1066       switch (save->attrsz[i]) {
1067       case 4:
1068          save->attrptr[i][3] = save->current[i][3];
1069          FALLTHROUGH;
1070       case 3:
1071          save->attrptr[i][2] = save->current[i][2];
1072          FALLTHROUGH;
1073       case 2:
1074          save->attrptr[i][1] = save->current[i][1];
1075          FALLTHROUGH;
1076       case 1:
1077          save->attrptr[i][0] = save->current[i][0];
1078          break;
1079       case 0:
1080          unreachable("Unexpected vertex attribute size");
1081       }
1082    }
1083 }
1084
1085
1086 /**
1087  * Called when we increase the size of a vertex attribute.  For example,
1088  * if we've seen one or more glTexCoord2f() calls and now we get a
1089  * glTexCoord3f() call.
1090  * Flush existing data, set new attrib size, replay copied vertices.
1091  */
1092 static void
1093 upgrade_vertex(struct gl_context *ctx, GLuint attr, GLuint newsz)
1094 {
1095    struct vbo_save_context *save = &vbo_context(ctx)->save;
1096    GLuint oldsz;
1097    GLuint i;
1098    fi_type *tmp;
1099
1100    /* Store the current run of vertices, and emit a GL_END.  Emit a
1101     * BEGIN in the new buffer.
1102     */
1103    if (save->vert_count)
1104       wrap_buffers(ctx);
1105    else
1106       assert(save->copied.nr == 0);
1107
1108    /* Do a COPY_TO_CURRENT to ensure back-copying works for the case
1109     * when the attribute already exists in the vertex and is having
1110     * its size increased.
1111     */
1112    copy_to_current(ctx);
1113
1114    /* Fix up sizes:
1115     */
1116    oldsz = save->attrsz[attr];
1117    save->attrsz[attr] = newsz;
1118    save->enabled |= BITFIELD64_BIT(attr);
1119
1120    save->vertex_size += newsz - oldsz;
1121    save->max_vert = ((save->vertex_store->buffer_in_ram_size / sizeof(float) -
1122                       save->vertex_store->used) /
1123                      save->vertex_size);
1124    save->vert_count = 0;
1125
1126    /* Recalculate all the attrptr[] values:
1127     */
1128    tmp = save->vertex;
1129    for (i = 0; i < VBO_ATTRIB_MAX; i++) {
1130       if (save->attrsz[i]) {
1131          save->attrptr[i] = tmp;
1132          tmp += save->attrsz[i];
1133       }
1134       else {
1135          save->attrptr[i] = NULL;       /* will not be dereferenced. */
1136       }
1137    }
1138
1139    /* Copy from current to repopulate the vertex with correct values.
1140     */
1141    copy_from_current(ctx);
1142
1143    /* Replay stored vertices to translate them to new format here.
1144     *
1145     * If there are copied vertices and the new (upgraded) attribute
1146     * has not been defined before, this list is somewhat degenerate,
1147     * and will need fixup at runtime.
1148     */
1149    if (save->copied.nr) {
1150       const fi_type *data = save->copied.buffer;
1151       fi_type *dest = save->buffer_map;
1152
1153       /* Need to note this and fix up at runtime (or loopback):
1154        */
1155       if (attr != VBO_ATTRIB_POS && save->currentsz[attr][0] == 0) {
1156          assert(oldsz == 0);
1157          save->dangling_attr_ref = GL_TRUE;
1158       }
1159
1160       for (i = 0; i < save->copied.nr; i++) {
1161          GLbitfield64 enabled = save->enabled;
1162          while (enabled) {
1163             const int j = u_bit_scan64(&enabled);
1164             assert(save->attrsz[j]);
1165             if (j == attr) {
1166                if (oldsz) {
1167                   COPY_CLEAN_4V_TYPE_AS_UNION(dest, oldsz, data,
1168                                               save->attrtype[j]);
1169                   data += oldsz;
1170                   dest += newsz;
1171                }
1172                else {
1173                   COPY_SZ_4V(dest, newsz, save->current[attr]);
1174                   dest += newsz;
1175                }
1176             }
1177             else {
1178                GLint sz = save->attrsz[j];
1179                COPY_SZ_4V(dest, sz, data);
1180                data += sz;
1181                dest += sz;
1182             }
1183          }
1184       }
1185
1186       save->buffer_ptr = dest;
1187       save->vert_count += save->copied.nr;
1188    }
1189 }
1190
1191
1192 /**
1193  * This is called when the size of a vertex attribute changes.
1194  * For example, after seeing one or more glTexCoord2f() calls we
1195  * get a glTexCoord4f() or glTexCoord1f() call.
1196  */
1197 static void
1198 fixup_vertex(struct gl_context *ctx, GLuint attr,
1199              GLuint sz, GLenum newType)
1200 {
1201    struct vbo_save_context *save = &vbo_context(ctx)->save;
1202
1203    if (sz > save->attrsz[attr] ||
1204        newType != save->attrtype[attr]) {
1205       /* New size is larger.  Need to flush existing vertices and get
1206        * an enlarged vertex format.
1207        */
1208       upgrade_vertex(ctx, attr, sz);
1209    }
1210    else if (sz < save->active_sz[attr]) {
1211       GLuint i;
1212       const fi_type *id = vbo_get_default_vals_as_union(save->attrtype[attr]);
1213
1214       /* New size is equal or smaller - just need to fill in some
1215        * zeros.
1216        */
1217       for (i = sz; i <= save->attrsz[attr]; i++)
1218          save->attrptr[attr][i - 1] = id[i - 1];
1219    }
1220
1221    save->active_sz[attr] = sz;
1222 }
1223
1224
1225 /**
1226  * Reset the current size of all vertex attributes to the default
1227  * value of 0.  This signals that we haven't yet seen any per-vertex
1228  * commands such as glNormal3f() or glTexCoord2f().
1229  */
1230 static void
1231 reset_vertex(struct gl_context *ctx)
1232 {
1233    struct vbo_save_context *save = &vbo_context(ctx)->save;
1234
1235    while (save->enabled) {
1236       const int i = u_bit_scan64(&save->enabled);
1237       assert(save->attrsz[i]);
1238       save->attrsz[i] = 0;
1239       save->active_sz[i] = 0;
1240    }
1241
1242    save->vertex_size = 0;
1243 }
1244
1245
1246 /**
1247  * If index=0, does glVertexAttrib*() alias glVertex() to emit a vertex?
1248  * It depends on a few things, including whether we're inside or outside
1249  * of glBegin/glEnd.
1250  */
1251 static inline bool
1252 is_vertex_position(const struct gl_context *ctx, GLuint index)
1253 {
1254    return (index == 0 &&
1255            _mesa_attr_zero_aliases_vertex(ctx) &&
1256            _mesa_inside_dlist_begin_end(ctx));
1257 }
1258
1259
1260
1261 #define ERROR(err)   _mesa_compile_error(ctx, err, __func__);
1262
1263
1264 /* Only one size for each attribute may be active at once.  Eg. if
1265  * Color3f is installed/active, then Color4f may not be, even if the
1266  * vertex actually contains 4 color coordinates.  This is because the
1267  * 3f version won't otherwise set color[3] to 1.0 -- this is the job
1268  * of the chooser function when switching between Color4f and Color3f.
1269  */
1270 #define ATTR_UNION(A, N, T, C, V0, V1, V2, V3)                  \
1271 do {                                                            \
1272    struct vbo_save_context *save = &vbo_context(ctx)->save;     \
1273    int sz = (sizeof(C) / sizeof(GLfloat));                      \
1274                                                                 \
1275    if (save->active_sz[A] != N)                                 \
1276       fixup_vertex(ctx, A, N * sz, T);                          \
1277                                                                 \
1278    {                                                            \
1279       C *dest = (C *)save->attrptr[A];                          \
1280       if (N>0) dest[0] = V0;                                    \
1281       if (N>1) dest[1] = V1;                                    \
1282       if (N>2) dest[2] = V2;                                    \
1283       if (N>3) dest[3] = V3;                                    \
1284       save->attrtype[A] = T;                                    \
1285    }                                                            \
1286                                                                 \
1287    if ((A) == 0) {                                              \
1288       GLuint i;                                                 \
1289                                                                 \
1290       for (i = 0; i < save->vertex_size; i++)                   \
1291          save->buffer_ptr[i] = save->vertex[i];                 \
1292                                                                 \
1293       save->buffer_ptr += save->vertex_size;                    \
1294                                                                 \
1295       if (++save->vert_count >= save->max_vert)                 \
1296          wrap_filled_vertex(ctx);                               \
1297    }                                                            \
1298 } while (0)
1299
1300 #define TAG(x) _save_##x
1301
1302 #include "vbo_attrib_tmp.h"
1303
1304
1305
1306 #define MAT( ATTR, N, face, params )                    \
1307 do {                                                    \
1308    if (face != GL_BACK)                                 \
1309       MAT_ATTR( ATTR, N, params ); /* front */          \
1310    if (face != GL_FRONT)                                \
1311       MAT_ATTR( ATTR + 1, N, params ); /* back */       \
1312 } while (0)
1313
1314
1315 /**
1316  * Save a glMaterial call found between glBegin/End.
1317  * glMaterial calls outside Begin/End are handled in dlist.c.
1318  */
1319 static void GLAPIENTRY
1320 _save_Materialfv(GLenum face, GLenum pname, const GLfloat *params)
1321 {
1322    GET_CURRENT_CONTEXT(ctx);
1323
1324    if (face != GL_FRONT && face != GL_BACK && face != GL_FRONT_AND_BACK) {
1325       _mesa_compile_error(ctx, GL_INVALID_ENUM, "glMaterial(face)");
1326       return;
1327    }
1328
1329    switch (pname) {
1330    case GL_EMISSION:
1331       MAT(VBO_ATTRIB_MAT_FRONT_EMISSION, 4, face, params);
1332       break;
1333    case GL_AMBIENT:
1334       MAT(VBO_ATTRIB_MAT_FRONT_AMBIENT, 4, face, params);
1335       break;
1336    case GL_DIFFUSE:
1337       MAT(VBO_ATTRIB_MAT_FRONT_DIFFUSE, 4, face, params);
1338       break;
1339    case GL_SPECULAR:
1340       MAT(VBO_ATTRIB_MAT_FRONT_SPECULAR, 4, face, params);
1341       break;
1342    case GL_SHININESS:
1343       if (*params < 0 || *params > ctx->Const.MaxShininess) {
1344          _mesa_compile_error(ctx, GL_INVALID_VALUE, "glMaterial(shininess)");
1345       }
1346       else {
1347          MAT(VBO_ATTRIB_MAT_FRONT_SHININESS, 1, face, params);
1348       }
1349       break;
1350    case GL_COLOR_INDEXES:
1351       MAT(VBO_ATTRIB_MAT_FRONT_INDEXES, 3, face, params);
1352       break;
1353    case GL_AMBIENT_AND_DIFFUSE:
1354       MAT(VBO_ATTRIB_MAT_FRONT_AMBIENT, 4, face, params);
1355       MAT(VBO_ATTRIB_MAT_FRONT_DIFFUSE, 4, face, params);
1356       break;
1357    default:
1358       _mesa_compile_error(ctx, GL_INVALID_ENUM, "glMaterial(pname)");
1359       return;
1360    }
1361 }
1362
1363
1364 /* Cope with EvalCoord/CallList called within a begin/end object:
1365  *     -- Flush current buffer
1366  *     -- Fallback to opcodes for the rest of the begin/end object.
1367  */
1368 static void
1369 dlist_fallback(struct gl_context *ctx)
1370 {
1371    struct vbo_save_context *save = &vbo_context(ctx)->save;
1372
1373    if (save->vert_count || save->prim_count) {
1374       if (save->prim_count > 0) {
1375          /* Close off in-progress primitive. */
1376          GLint i = save->prim_count - 1;
1377          save->prims[i].count = save->vert_count - save->prims[i].start;
1378       }
1379
1380       /* Need to replay this display list with loopback,
1381        * unfortunately, otherwise this primitive won't be handled
1382        * properly:
1383        */
1384       save->dangling_attr_ref = GL_TRUE;
1385
1386       compile_vertex_list(ctx);
1387    }
1388
1389    copy_to_current(ctx);
1390    reset_vertex(ctx);
1391    reset_counters(ctx);
1392    if (save->out_of_memory) {
1393       _mesa_install_save_vtxfmt(ctx, &save->vtxfmt_noop);
1394    }
1395    else {
1396       _mesa_install_save_vtxfmt(ctx, &ctx->ListState.ListVtxfmt);
1397    }
1398    ctx->Driver.SaveNeedFlush = GL_FALSE;
1399 }
1400
1401
1402 static void GLAPIENTRY
1403 _save_EvalCoord1f(GLfloat u)
1404 {
1405    GET_CURRENT_CONTEXT(ctx);
1406    dlist_fallback(ctx);
1407    CALL_EvalCoord1f(ctx->Save, (u));
1408 }
1409
1410 static void GLAPIENTRY
1411 _save_EvalCoord1fv(const GLfloat * v)
1412 {
1413    GET_CURRENT_CONTEXT(ctx);
1414    dlist_fallback(ctx);
1415    CALL_EvalCoord1fv(ctx->Save, (v));
1416 }
1417
1418 static void GLAPIENTRY
1419 _save_EvalCoord2f(GLfloat u, GLfloat v)
1420 {
1421    GET_CURRENT_CONTEXT(ctx);
1422    dlist_fallback(ctx);
1423    CALL_EvalCoord2f(ctx->Save, (u, v));
1424 }
1425
1426 static void GLAPIENTRY
1427 _save_EvalCoord2fv(const GLfloat * v)
1428 {
1429    GET_CURRENT_CONTEXT(ctx);
1430    dlist_fallback(ctx);
1431    CALL_EvalCoord2fv(ctx->Save, (v));
1432 }
1433
1434 static void GLAPIENTRY
1435 _save_EvalPoint1(GLint i)
1436 {
1437    GET_CURRENT_CONTEXT(ctx);
1438    dlist_fallback(ctx);
1439    CALL_EvalPoint1(ctx->Save, (i));
1440 }
1441
1442 static void GLAPIENTRY
1443 _save_EvalPoint2(GLint i, GLint j)
1444 {
1445    GET_CURRENT_CONTEXT(ctx);
1446    dlist_fallback(ctx);
1447    CALL_EvalPoint2(ctx->Save, (i, j));
1448 }
1449
1450 static void GLAPIENTRY
1451 _save_CallList(GLuint l)
1452 {
1453    GET_CURRENT_CONTEXT(ctx);
1454    dlist_fallback(ctx);
1455    CALL_CallList(ctx->Save, (l));
1456 }
1457
1458 static void GLAPIENTRY
1459 _save_CallLists(GLsizei n, GLenum type, const GLvoid * v)
1460 {
1461    GET_CURRENT_CONTEXT(ctx);
1462    dlist_fallback(ctx);
1463    CALL_CallLists(ctx->Save, (n, type, v));
1464 }
1465
1466
1467
1468 /**
1469  * Called when a glBegin is getting compiled into a display list.
1470  * Updating of ctx->Driver.CurrentSavePrimitive is already taken care of.
1471  */
1472 void
1473 vbo_save_NotifyBegin(struct gl_context *ctx, GLenum mode,
1474                      bool no_current_update)
1475 {
1476    struct vbo_save_context *save = &vbo_context(ctx)->save;
1477    const GLuint i = save->prim_count++;
1478
1479    ctx->Driver.CurrentSavePrimitive = mode;
1480
1481    assert(i < save->prim_max);
1482    save->prims[i].mode = mode & VBO_SAVE_PRIM_MODE_MASK;
1483    save->prims[i].begin = 1;
1484    save->prims[i].end = 0;
1485    save->prims[i].start = save->vert_count;
1486    save->prims[i].count = 0;
1487
1488    save->no_current_update = no_current_update;
1489
1490    if (save->out_of_memory) {
1491       _mesa_install_save_vtxfmt(ctx, &save->vtxfmt_noop);
1492    }
1493    else {
1494       _mesa_install_save_vtxfmt(ctx, &save->vtxfmt);
1495    }
1496
1497    /* We need to call vbo_save_SaveFlushVertices() if there's state change */
1498    ctx->Driver.SaveNeedFlush = GL_TRUE;
1499 }
1500
1501
1502 static void GLAPIENTRY
1503 _save_End(void)
1504 {
1505    GET_CURRENT_CONTEXT(ctx);
1506    struct vbo_save_context *save = &vbo_context(ctx)->save;
1507    const GLint i = save->prim_count - 1;
1508
1509    ctx->Driver.CurrentSavePrimitive = PRIM_OUTSIDE_BEGIN_END;
1510    save->prims[i].end = 1;
1511    save->prims[i].count = (save->vert_count - save->prims[i].start);
1512
1513    if (i == (GLint) save->prim_max - 1) {
1514       compile_vertex_list(ctx);
1515       assert(save->copied.nr == 0);
1516    }
1517
1518    /* Swap out this vertex format while outside begin/end.  Any color,
1519     * etc. received between here and the next begin will be compiled
1520     * as opcodes.
1521     */
1522    if (save->out_of_memory) {
1523       _mesa_install_save_vtxfmt(ctx, &save->vtxfmt_noop);
1524    }
1525    else {
1526       _mesa_install_save_vtxfmt(ctx, &ctx->ListState.ListVtxfmt);
1527    }
1528 }
1529
1530
1531 static void GLAPIENTRY
1532 _save_Begin(GLenum mode)
1533 {
1534    GET_CURRENT_CONTEXT(ctx);
1535    (void) mode;
1536    _mesa_compile_error(ctx, GL_INVALID_OPERATION, "Recursive glBegin");
1537 }
1538
1539
1540 static void GLAPIENTRY
1541 _save_PrimitiveRestartNV(void)
1542 {
1543    GET_CURRENT_CONTEXT(ctx);
1544    struct vbo_save_context *save = &vbo_context(ctx)->save;
1545
1546    if (save->prim_count == 0) {
1547       /* We're not inside a glBegin/End pair, so calling glPrimitiverRestartNV
1548        * is an error.
1549        */
1550       _mesa_compile_error(ctx, GL_INVALID_OPERATION,
1551                           "glPrimitiveRestartNV called outside glBegin/End");
1552    } else {
1553       /* get current primitive mode */
1554       GLenum curPrim = save->prims[save->prim_count - 1].mode;
1555       bool no_current_update = save->no_current_update;
1556
1557       /* restart primitive */
1558       CALL_End(ctx->CurrentServerDispatch, ());
1559       vbo_save_NotifyBegin(ctx, curPrim, no_current_update);
1560    }
1561 }
1562
1563
1564 /* Unlike the functions above, these are to be hooked into the vtxfmt
1565  * maintained in ctx->ListState, active when the list is known or
1566  * suspected to be outside any begin/end primitive.
1567  * Note: OBE = Outside Begin/End
1568  */
1569 static void GLAPIENTRY
1570 _save_OBE_Rectf(GLfloat x1, GLfloat y1, GLfloat x2, GLfloat y2)
1571 {
1572    GET_CURRENT_CONTEXT(ctx);
1573    struct _glapi_table *dispatch = ctx->CurrentServerDispatch;
1574
1575    vbo_save_NotifyBegin(ctx, GL_QUADS, false);
1576    CALL_Vertex2f(dispatch, (x1, y1));
1577    CALL_Vertex2f(dispatch, (x2, y1));
1578    CALL_Vertex2f(dispatch, (x2, y2));
1579    CALL_Vertex2f(dispatch, (x1, y2));
1580    CALL_End(dispatch, ());
1581 }
1582
1583
1584 static void GLAPIENTRY
1585 _save_OBE_Rectd(GLdouble x1, GLdouble y1, GLdouble x2, GLdouble y2)
1586 {
1587    _save_OBE_Rectf((GLfloat) x1, (GLfloat) y1, (GLfloat) x2, (GLfloat) y2);
1588 }
1589
1590 static void GLAPIENTRY
1591 _save_OBE_Rectdv(const GLdouble *v1, const GLdouble *v2)
1592 {
1593    _save_OBE_Rectf((GLfloat) v1[0], (GLfloat) v1[1], (GLfloat) v2[0], (GLfloat) v2[1]);
1594 }
1595
1596 static void GLAPIENTRY
1597 _save_OBE_Rectfv(const GLfloat *v1, const GLfloat *v2)
1598 {
1599    _save_OBE_Rectf(v1[0], v1[1], v2[0], v2[1]);
1600 }
1601
1602 static void GLAPIENTRY
1603 _save_OBE_Recti(GLint x1, GLint y1, GLint x2, GLint y2)
1604 {
1605    _save_OBE_Rectf((GLfloat) x1, (GLfloat) y1, (GLfloat) x2, (GLfloat) y2);
1606 }
1607
1608 static void GLAPIENTRY
1609 _save_OBE_Rectiv(const GLint *v1, const GLint *v2)
1610 {
1611    _save_OBE_Rectf((GLfloat) v1[0], (GLfloat) v1[1], (GLfloat) v2[0], (GLfloat) v2[1]);
1612 }
1613
1614 static void GLAPIENTRY
1615 _save_OBE_Rects(GLshort x1, GLshort y1, GLshort x2, GLshort y2)
1616 {
1617    _save_OBE_Rectf((GLfloat) x1, (GLfloat) y1, (GLfloat) x2, (GLfloat) y2);
1618 }
1619
1620 static void GLAPIENTRY
1621 _save_OBE_Rectsv(const GLshort *v1, const GLshort *v2)
1622 {
1623    _save_OBE_Rectf((GLfloat) v1[0], (GLfloat) v1[1], (GLfloat) v2[0], (GLfloat) v2[1]);
1624 }
1625
1626 static void
1627 _ensure_draws_fits_in_storage(struct gl_context *ctx, int primcount, int vertcount)
1628 {
1629    struct vbo_save_context *save = &vbo_context(ctx)->save;
1630
1631    bool realloc_prim = save->prim_count + primcount > save->prim_max;
1632    bool realloc_vert = save->vertex_size && (save->vert_count + vertcount >= save->max_vert);
1633
1634    if (realloc_prim || realloc_vert) {
1635       if (save->vert_count || save->prim_count) {
1636          /* TODO: this really isn't needed. We should realloc only the CPU-side memory. */
1637          compile_vertex_list(ctx);
1638       }
1639       realloc_storage(ctx, realloc_prim ? primcount : -1, realloc_vert ? vertcount : -1);
1640       reset_counters(ctx);
1641       assert(save->prim_max);
1642    }
1643 }
1644
1645
1646 static void GLAPIENTRY
1647 _save_OBE_DrawArrays(GLenum mode, GLint start, GLsizei count)
1648 {
1649    GET_CURRENT_CONTEXT(ctx);
1650    struct gl_vertex_array_object *vao = ctx->Array.VAO;
1651    struct vbo_save_context *save = &vbo_context(ctx)->save;
1652    GLint i;
1653
1654    if (!_mesa_is_valid_prim_mode(ctx, mode)) {
1655       _mesa_compile_error(ctx, GL_INVALID_ENUM, "glDrawArrays(mode)");
1656       return;
1657    }
1658    if (count < 0) {
1659       _mesa_compile_error(ctx, GL_INVALID_VALUE, "glDrawArrays(count<0)");
1660       return;
1661    }
1662
1663    if (save->out_of_memory)
1664       return;
1665
1666    _ensure_draws_fits_in_storage(ctx, 1, count);
1667
1668    /* Make sure to process any VBO binding changes */
1669    _mesa_update_state(ctx);
1670
1671    _mesa_vao_map_arrays(ctx, vao, GL_MAP_READ_BIT);
1672
1673    vbo_save_NotifyBegin(ctx, mode, true);
1674
1675    for (i = 0; i < count; i++)
1676       _mesa_array_element(ctx, start + i);
1677    CALL_End(ctx->CurrentServerDispatch, ());
1678
1679    _mesa_vao_unmap_arrays(ctx, vao);
1680 }
1681
1682
1683 static void GLAPIENTRY
1684 _save_OBE_MultiDrawArrays(GLenum mode, const GLint *first,
1685                           const GLsizei *count, GLsizei primcount)
1686 {
1687    GET_CURRENT_CONTEXT(ctx);
1688    GLint i;
1689
1690    if (!_mesa_is_valid_prim_mode(ctx, mode)) {
1691       _mesa_compile_error(ctx, GL_INVALID_ENUM, "glMultiDrawArrays(mode)");
1692       return;
1693    }
1694
1695    if (primcount < 0) {
1696       _mesa_compile_error(ctx, GL_INVALID_VALUE,
1697                           "glMultiDrawArrays(primcount<0)");
1698       return;
1699    }
1700
1701    unsigned vertcount = 0;
1702    for (i = 0; i < primcount; i++) {
1703       if (count[i] < 0) {
1704          _mesa_compile_error(ctx, GL_INVALID_VALUE,
1705                              "glMultiDrawArrays(count[i]<0)");
1706          return;
1707       }
1708       vertcount += count[i];
1709    }
1710
1711    _ensure_draws_fits_in_storage(ctx, primcount, vertcount);
1712
1713    for (i = 0; i < primcount; i++) {
1714       if (count[i] > 0) {
1715          _save_OBE_DrawArrays(mode, first[i], count[i]);
1716       }
1717    }
1718 }
1719
1720
1721 static void
1722 array_element(struct gl_context *ctx,
1723               GLint basevertex, GLuint elt, unsigned index_size_shift)
1724 {
1725    /* Section 10.3.5 Primitive Restart:
1726     * [...]
1727     *    When one of the *BaseVertex drawing commands specified in section 10.5
1728     * is used, the primitive restart comparison occurs before the basevertex
1729     * offset is added to the array index.
1730     */
1731    /* If PrimitiveRestart is enabled and the index is the RestartIndex
1732     * then we call PrimitiveRestartNV and return.
1733     */
1734    if (ctx->Array._PrimitiveRestart[index_size_shift] &&
1735        elt == ctx->Array._RestartIndex[index_size_shift]) {
1736       CALL_PrimitiveRestartNV(ctx->CurrentServerDispatch, ());
1737       return;
1738    }
1739
1740    _mesa_array_element(ctx, basevertex + elt);
1741 }
1742
1743
1744 /* Could do better by copying the arrays and element list intact and
1745  * then emitting an indexed prim at runtime.
1746  */
1747 static void GLAPIENTRY
1748 _save_OBE_DrawElementsBaseVertex(GLenum mode, GLsizei count, GLenum type,
1749                                  const GLvoid * indices, GLint basevertex)
1750 {
1751    GET_CURRENT_CONTEXT(ctx);
1752    struct vbo_save_context *save = &vbo_context(ctx)->save;
1753    struct gl_vertex_array_object *vao = ctx->Array.VAO;
1754    struct gl_buffer_object *indexbuf = vao->IndexBufferObj;
1755    GLint i;
1756
1757    if (!_mesa_is_valid_prim_mode(ctx, mode)) {
1758       _mesa_compile_error(ctx, GL_INVALID_ENUM, "glDrawElements(mode)");
1759       return;
1760    }
1761    if (count < 0) {
1762       _mesa_compile_error(ctx, GL_INVALID_VALUE, "glDrawElements(count<0)");
1763       return;
1764    }
1765    if (type != GL_UNSIGNED_BYTE &&
1766        type != GL_UNSIGNED_SHORT &&
1767        type != GL_UNSIGNED_INT) {
1768       _mesa_compile_error(ctx, GL_INVALID_VALUE, "glDrawElements(count<0)");
1769       return;
1770    }
1771
1772    if (save->out_of_memory)
1773       return;
1774
1775    _ensure_draws_fits_in_storage(ctx, 1, count);
1776
1777    /* Make sure to process any VBO binding changes */
1778    _mesa_update_state(ctx);
1779
1780    _mesa_vao_map(ctx, vao, GL_MAP_READ_BIT);
1781
1782    if (indexbuf)
1783       indices =
1784          ADD_POINTERS(indexbuf->Mappings[MAP_INTERNAL].Pointer, indices);
1785
1786    vbo_save_NotifyBegin(ctx, mode, true);
1787
1788    switch (type) {
1789    case GL_UNSIGNED_BYTE:
1790       for (i = 0; i < count; i++)
1791          array_element(ctx, basevertex, ((GLubyte *) indices)[i], 0);
1792       break;
1793    case GL_UNSIGNED_SHORT:
1794       for (i = 0; i < count; i++)
1795          array_element(ctx, basevertex, ((GLushort *) indices)[i], 1);
1796       break;
1797    case GL_UNSIGNED_INT:
1798       for (i = 0; i < count; i++)
1799          array_element(ctx, basevertex, ((GLuint *) indices)[i], 2);
1800       break;
1801    default:
1802       _mesa_error(ctx, GL_INVALID_ENUM, "glDrawElements(type)");
1803       break;
1804    }
1805
1806    CALL_End(ctx->CurrentServerDispatch, ());
1807
1808    _mesa_vao_unmap(ctx, vao);
1809 }
1810
1811 static void GLAPIENTRY
1812 _save_OBE_DrawElements(GLenum mode, GLsizei count, GLenum type,
1813                        const GLvoid * indices)
1814 {
1815    _save_OBE_DrawElementsBaseVertex(mode, count, type, indices, 0);
1816 }
1817
1818
1819 static void GLAPIENTRY
1820 _save_OBE_DrawRangeElements(GLenum mode, GLuint start, GLuint end,
1821                             GLsizei count, GLenum type,
1822                             const GLvoid * indices)
1823 {
1824    GET_CURRENT_CONTEXT(ctx);
1825    struct vbo_save_context *save = &vbo_context(ctx)->save;
1826
1827    if (!_mesa_is_valid_prim_mode(ctx, mode)) {
1828       _mesa_compile_error(ctx, GL_INVALID_ENUM, "glDrawRangeElements(mode)");
1829       return;
1830    }
1831    if (count < 0) {
1832       _mesa_compile_error(ctx, GL_INVALID_VALUE,
1833                           "glDrawRangeElements(count<0)");
1834       return;
1835    }
1836    if (type != GL_UNSIGNED_BYTE &&
1837        type != GL_UNSIGNED_SHORT &&
1838        type != GL_UNSIGNED_INT) {
1839       _mesa_compile_error(ctx, GL_INVALID_ENUM, "glDrawRangeElements(type)");
1840       return;
1841    }
1842    if (end < start) {
1843       _mesa_compile_error(ctx, GL_INVALID_VALUE,
1844                           "glDrawRangeElements(end < start)");
1845       return;
1846    }
1847
1848    if (save->out_of_memory)
1849       return;
1850
1851    _save_OBE_DrawElements(mode, count, type, indices);
1852 }
1853
1854
1855 static void GLAPIENTRY
1856 _save_OBE_MultiDrawElements(GLenum mode, const GLsizei *count, GLenum type,
1857                             const GLvoid * const *indices, GLsizei primcount)
1858 {
1859    GET_CURRENT_CONTEXT(ctx);
1860    struct _glapi_table *dispatch = ctx->CurrentServerDispatch;
1861    GLsizei i;
1862
1863    int vertcount = 0;
1864    for (i = 0; i < primcount; i++) {
1865       vertcount += count[i];
1866    }
1867    _ensure_draws_fits_in_storage(ctx, primcount, vertcount);
1868
1869    for (i = 0; i < primcount; i++) {
1870       if (count[i] > 0) {
1871          CALL_DrawElements(dispatch, (mode, count[i], type, indices[i]));
1872       }
1873    }
1874 }
1875
1876
1877 static void GLAPIENTRY
1878 _save_OBE_MultiDrawElementsBaseVertex(GLenum mode, const GLsizei *count,
1879                                       GLenum type,
1880                                       const GLvoid * const *indices,
1881                                       GLsizei primcount,
1882                                       const GLint *basevertex)
1883 {
1884    GET_CURRENT_CONTEXT(ctx);
1885    struct _glapi_table *dispatch = ctx->CurrentServerDispatch;
1886    GLsizei i;
1887
1888    int vertcount = 0;
1889    for (i = 0; i < primcount; i++) {
1890       vertcount += count[i];
1891    }
1892    _ensure_draws_fits_in_storage(ctx, primcount, vertcount);
1893
1894    for (i = 0; i < primcount; i++) {
1895       if (count[i] > 0) {
1896          CALL_DrawElementsBaseVertex(dispatch, (mode, count[i], type,
1897                                                       indices[i],
1898                                                       basevertex[i]));
1899       }
1900    }
1901 }
1902
1903
1904 static void
1905 vtxfmt_init(struct gl_context *ctx)
1906 {
1907    struct vbo_save_context *save = &vbo_context(ctx)->save;
1908    GLvertexformat *vfmt = &save->vtxfmt;
1909
1910 #define NAME_AE(x) _ae_##x
1911 #define NAME_CALLLIST(x) _save_##x
1912 #define NAME(x) _save_##x
1913 #define NAME_ES(x) _save_##x##ARB
1914
1915 #include "vbo_init_tmp.h"
1916 }
1917
1918
1919 /**
1920  * Initialize the dispatch table with the VBO functions for display
1921  * list compilation.
1922  */
1923 void
1924 vbo_initialize_save_dispatch(const struct gl_context *ctx,
1925                              struct _glapi_table *exec)
1926 {
1927    SET_DrawArrays(exec, _save_OBE_DrawArrays);
1928    SET_MultiDrawArrays(exec, _save_OBE_MultiDrawArrays);
1929    SET_DrawElements(exec, _save_OBE_DrawElements);
1930    SET_DrawElementsBaseVertex(exec, _save_OBE_DrawElementsBaseVertex);
1931    SET_DrawRangeElements(exec, _save_OBE_DrawRangeElements);
1932    SET_MultiDrawElementsEXT(exec, _save_OBE_MultiDrawElements);
1933    SET_MultiDrawElementsBaseVertex(exec, _save_OBE_MultiDrawElementsBaseVertex);
1934    SET_Rectf(exec, _save_OBE_Rectf);
1935    SET_Rectd(exec, _save_OBE_Rectd);
1936    SET_Rectdv(exec, _save_OBE_Rectdv);
1937    SET_Rectfv(exec, _save_OBE_Rectfv);
1938    SET_Recti(exec, _save_OBE_Recti);
1939    SET_Rectiv(exec, _save_OBE_Rectiv);
1940    SET_Rects(exec, _save_OBE_Rects);
1941    SET_Rectsv(exec, _save_OBE_Rectsv);
1942
1943    /* Note: other glDraw functins aren't compiled into display lists */
1944 }
1945
1946
1947
1948 void
1949 vbo_save_SaveFlushVertices(struct gl_context *ctx)
1950 {
1951    struct vbo_save_context *save = &vbo_context(ctx)->save;
1952
1953    /* Noop when we are actually active:
1954     */
1955    if (ctx->Driver.CurrentSavePrimitive <= PRIM_MAX)
1956       return;
1957
1958    if (save->vert_count || save->prim_count)
1959       compile_vertex_list(ctx);
1960
1961    copy_to_current(ctx);
1962    reset_vertex(ctx);
1963    reset_counters(ctx);
1964    ctx->Driver.SaveNeedFlush = GL_FALSE;
1965 }
1966
1967
1968 /**
1969  * Called from glNewList when we're starting to compile a display list.
1970  */
1971 void
1972 vbo_save_NewList(struct gl_context *ctx, GLuint list, GLenum mode)
1973 {
1974    struct vbo_save_context *save = &vbo_context(ctx)->save;
1975
1976    (void) list;
1977    (void) mode;
1978
1979    if (!save->prim_store)
1980       save->prim_store = alloc_prim_store(0);
1981
1982    if (!save->vertex_store)
1983       save->vertex_store = alloc_vertex_store(ctx, 0);
1984
1985    save->buffer_ptr = save->vertex_store->buffer_in_ram + save->vertex_store->used;
1986
1987    reset_vertex(ctx);
1988    reset_counters(ctx);
1989    ctx->Driver.SaveNeedFlush = GL_FALSE;
1990 }
1991
1992
1993 /**
1994  * Called from glEndList when we're finished compiling a display list.
1995  */
1996 void
1997 vbo_save_EndList(struct gl_context *ctx)
1998 {
1999    struct vbo_save_context *save = &vbo_context(ctx)->save;
2000
2001    /* EndList called inside a (saved) Begin/End pair?
2002     */
2003    if (_mesa_inside_dlist_begin_end(ctx)) {
2004       if (save->prim_count > 0) {
2005          GLint i = save->prim_count - 1;
2006          ctx->Driver.CurrentSavePrimitive = PRIM_OUTSIDE_BEGIN_END;
2007          save->prims[i].end = 0;
2008          save->prims[i].count = save->vert_count - save->prims[i].start;
2009       }
2010
2011       /* Make sure this vertex list gets replayed by the "loopback"
2012        * mechanism:
2013        */
2014       save->dangling_attr_ref = GL_TRUE;
2015       vbo_save_SaveFlushVertices(ctx);
2016
2017       /* Swap out this vertex format while outside begin/end.  Any color,
2018        * etc. received between here and the next begin will be compiled
2019        * as opcodes.
2020        */
2021       _mesa_install_save_vtxfmt(ctx, &ctx->ListState.ListVtxfmt);
2022    }
2023
2024    assert(save->vertex_size == 0);
2025 }
2026
2027 /**
2028  * Called during context creation/init.
2029  */
2030 static void
2031 current_init(struct gl_context *ctx)
2032 {
2033    struct vbo_save_context *save = &vbo_context(ctx)->save;
2034    GLint i;
2035
2036    for (i = VBO_ATTRIB_POS; i <= VBO_ATTRIB_EDGEFLAG; i++) {
2037       const GLuint j = i - VBO_ATTRIB_POS;
2038       assert(j < VERT_ATTRIB_MAX);
2039       save->currentsz[i] = &ctx->ListState.ActiveAttribSize[j];
2040       save->current[i] = (fi_type *) ctx->ListState.CurrentAttrib[j];
2041    }
2042
2043    for (i = VBO_ATTRIB_FIRST_MATERIAL; i <= VBO_ATTRIB_LAST_MATERIAL; i++) {
2044       const GLuint j = i - VBO_ATTRIB_FIRST_MATERIAL;
2045       assert(j < MAT_ATTRIB_MAX);
2046       save->currentsz[i] = &ctx->ListState.ActiveMaterialSize[j];
2047       save->current[i] = (fi_type *) ctx->ListState.CurrentMaterial[j];
2048    }
2049 }
2050
2051
2052 /**
2053  * Initialize the display list compiler.  Called during context creation.
2054  */
2055 void
2056 vbo_save_api_init(struct vbo_save_context *save)
2057 {
2058    struct gl_context *ctx = gl_context_from_vbo_save(save);
2059
2060    vtxfmt_init(ctx);
2061    current_init(ctx);
2062    _mesa_noop_vtxfmt_init(ctx, &save->vtxfmt_noop);
2063 }