vbo/dlist: add vertices to incomplete primitives
[platform/upstream/mesa.git] / src / mesa / vbo / vbo_save_api.c
1 /**************************************************************************
2
3 Copyright 2002-2008 VMware, Inc.
4
5 All Rights Reserved.
6
7 Permission is hereby granted, free of charge, to any person obtaining a
8 copy of this software and associated documentation files (the "Software"),
9 to deal in the Software without restriction, including without limitation
10 on the rights to use, copy, modify, merge, publish, distribute, sub
11 license, and/or sell copies of the Software, and to permit persons to whom
12 the Software is furnished to do so, subject to the following conditions:
13
14 The above copyright notice and this permission notice (including the next
15 paragraph) shall be included in all copies or substantial portions of the
16 Software.
17
18 THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
19 IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
20 FITNESS FOR A PARTICULAR PURPOSE AND NON-INFRINGEMENT. IN NO EVENT SHALL
21 VMWARE AND/OR THEIR SUPPLIERS BE LIABLE FOR ANY CLAIM,
22 DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR
23 OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE
24 USE OR OTHER DEALINGS IN THE SOFTWARE.
25
26 **************************************************************************/
27
28 /*
29  * Authors:
30  *   Keith Whitwell <keithw@vmware.com>
31  */
32
33
34
35 /* Display list compiler attempts to store lists of vertices with the
36  * same vertex layout.  Additionally it attempts to minimize the need
37  * for execute-time fixup of these vertex lists, allowing them to be
38  * cached on hardware.
39  *
40  * There are still some circumstances where this can be thwarted, for
41  * example by building a list that consists of one very long primitive
42  * (eg Begin(Triangles), 1000 vertices, End), and calling that list
43  * from inside a different begin/end object (Begin(Lines), CallList,
44  * End).
45  *
46  * In that case the code will have to replay the list as individual
47  * commands through the Exec dispatch table, or fix up the copied
48  * vertices at execute-time.
49  *
50  * The other case where fixup is required is when a vertex attribute
51  * is introduced in the middle of a primitive.  Eg:
52  *  Begin(Lines)
53  *  TexCoord1f()           Vertex2f()
54  *  TexCoord1f() Color3f() Vertex2f()
55  *  End()
56  *
57  *  If the current value of Color isn't known at compile-time, this
58  *  primitive will require fixup.
59  *
60  *
61  * The list compiler currently doesn't attempt to compile lists
62  * containing EvalCoord or EvalPoint commands.  On encountering one of
63  * these, compilation falls back to opcodes.
64  *
65  * This could be improved to fallback only when a mix of EvalCoord and
66  * Vertex commands are issued within a single primitive.
67  *
68  * The compilation process works as follows. All vertex attributes
69  * except position are copied to vbo_save_context::attrptr (see ATTR_UNION).
70  * 'attrptr' are pointers to vbo_save_context::vertex ordered according to the enabled
71  * attributes (se upgrade_vertex).
72  * When the position attribute is received, all the attributes are then 
73  * copied to the vertex_store (see the end of ATTR_UNION).
74  * The vertex_store is simply an extensible float array.
75  * When the vertex list needs to be compiled (see compile_vertex_list),
76  * several transformations are performed:
77  *   - some primitives are merged together (eg: two consecutive GL_TRIANGLES
78  * with 3 vertices can be merged in a single GL_TRIANGLES with 6 vertices).
79  *   - an index buffer is built.
80  *   - identical vertices are detected and only one is kept.
81  * At the end of this transformation, the index buffer and the vertex buffer
82  * are uploaded in vRAM in the same buffer object.
83  * This buffer object is shared between multiple display list to allow
84  * draw calls merging later.
85  *
86  * The layout of this buffer for two display lists is:
87  *    V0A0|V0A1|V1A0|V1A1|P0I0|P0I1|V0A0V0A1V0A2|V1A1V1A1V1A2|...
88  *                                 ` new list starts
89  *        - VxAy: vertex x, attributes y
90  *        - PxIy: draw x, index y
91  *
92  * To allow draw call merging, display list must use the same VAO, including
93  * the same Offset in the buffer object. To achieve this, the start values of
94  * the primitive are shifted and the indices adjusted (see offset_diff and
95  * start_offset in compile_vertex_list).
96  *
97  * Display list using the loopback code (see vbo_save_playback_vertex_list_loopback),
98  * can't be drawn with an index buffer so this transformation is disabled
99  * in this case.
100  */
101
102
103 #include "main/glheader.h"
104 #include "main/arrayobj.h"
105 #include "main/bufferobj.h"
106 #include "main/context.h"
107 #include "main/dlist.h"
108 #include "main/enums.h"
109 #include "main/eval.h"
110 #include "main/macros.h"
111 #include "main/draw_validate.h"
112 #include "main/api_arrayelt.h"
113 #include "main/dispatch.h"
114 #include "main/state.h"
115 #include "main/varray.h"
116 #include "util/bitscan.h"
117 #include "util/u_memory.h"
118 #include "util/hash_table.h"
119 #include "util/indices/u_indices.h"
120 #include "util/u_prim.h"
121
122 #include "gallium/include/pipe/p_state.h"
123
124 #include "vbo_private.h"
125 #include "api_exec_decl.h"
126 #include "api_save.h"
127
128 #ifdef ERROR
129 #undef ERROR
130 #endif
131
132 /* An interesting VBO number/name to help with debugging */
133 #define VBO_BUF_ID  12345
134
135 static void GLAPIENTRY
136 _save_Materialfv(GLenum face, GLenum pname, const GLfloat *params);
137
138 static void GLAPIENTRY
139 _save_EvalCoord1f(GLfloat u);
140
141 static void GLAPIENTRY
142 _save_EvalCoord2f(GLfloat u, GLfloat v);
143
144 /*
145  * NOTE: Old 'parity' issue is gone, but copying can still be
146  * wrong-footed on replay.
147  */
148 static GLuint
149 copy_vertices(struct gl_context *ctx,
150               const struct vbo_save_vertex_list *node,
151               const fi_type * src_buffer)
152 {
153    struct vbo_save_context *save = &vbo_context(ctx)->save;
154    struct _mesa_prim *prim = &node->cold->prims[node->cold->prim_count - 1];
155    GLuint sz = save->vertex_size;
156
157    if (prim->end || !prim->count || !sz)
158       return 0;
159
160    const fi_type *src = src_buffer + prim->start * sz;
161    assert(save->copied.buffer == NULL);
162    save->copied.buffer = malloc(sizeof(fi_type) * sz * prim->count);
163
164    unsigned r = vbo_copy_vertices(ctx, prim->mode, prim->start, &prim->count,
165                                   prim->begin, sz, true, save->copied.buffer, src);
166    if (!r) {
167       free(save->copied.buffer);
168       save->copied.buffer = NULL;
169    }
170    return r;
171 }
172
173
174 static struct vbo_save_primitive_store *
175 realloc_prim_store(struct vbo_save_primitive_store *store, int prim_count)
176 {
177    if (store == NULL)
178       store = CALLOC_STRUCT(vbo_save_primitive_store);
179
180    uint32_t old_size = store->size;
181    store->size = prim_count;
182    assert (old_size < store->size);
183    store->prims = realloc(store->prims, store->size * sizeof(struct _mesa_prim));
184    memset(&store->prims[old_size], 0, (store->size - old_size) * sizeof(struct _mesa_prim));
185
186    return store;
187 }
188
189
190 static void
191 reset_counters(struct gl_context *ctx)
192 {
193    struct vbo_save_context *save = &vbo_context(ctx)->save;
194
195    save->vertex_store->used = 0;
196    save->prim_store->used = 0;
197    save->dangling_attr_ref = GL_FALSE;
198 }
199
200 /**
201  * For a list of prims, try merging prims that can just be extensions of the
202  * previous prim.
203  */
204 static void
205 merge_prims(struct gl_context *ctx, struct _mesa_prim *prim_list,
206             GLuint *prim_count)
207 {
208    GLuint i;
209    struct _mesa_prim *prev_prim = prim_list;
210
211    for (i = 1; i < *prim_count; i++) {
212       struct _mesa_prim *this_prim = prim_list + i;
213
214       vbo_try_prim_conversion(&this_prim->mode, &this_prim->count);
215
216       if (vbo_merge_draws(ctx, true,
217                           prev_prim->mode, this_prim->mode,
218                           prev_prim->start, this_prim->start,
219                           &prev_prim->count, this_prim->count,
220                           prev_prim->basevertex, this_prim->basevertex,
221                           &prev_prim->end,
222                           this_prim->begin, this_prim->end)) {
223          /* We've found a prim that just extend the previous one.  Tack it
224           * onto the previous one, and let this primitive struct get dropped.
225           */
226          continue;
227       }
228
229       /* If any previous primitives have been dropped, then we need to copy
230        * this later one into the next available slot.
231        */
232       prev_prim++;
233       if (prev_prim != this_prim)
234          *prev_prim = *this_prim;
235    }
236
237    *prim_count = prev_prim - prim_list + 1;
238 }
239
240
241 /**
242  * Convert GL_LINE_LOOP primitive into GL_LINE_STRIP so that drivers
243  * don't have to worry about handling the _mesa_prim::begin/end flags.
244  * See https://bugs.freedesktop.org/show_bug.cgi?id=81174
245  */
246 static void
247 convert_line_loop_to_strip(struct vbo_save_context *save,
248                            struct vbo_save_vertex_list *node)
249 {
250    struct _mesa_prim *prim = &node->cold->prims[node->cold->prim_count - 1];
251
252    assert(prim->mode == GL_LINE_LOOP);
253
254    if (prim->end) {
255       /* Copy the 0th vertex to end of the buffer and extend the
256        * vertex count by one to finish the line loop.
257        */
258       const GLuint sz = save->vertex_size;
259       /* 0th vertex: */
260       const fi_type *src = save->vertex_store->buffer_in_ram + prim->start * sz;
261       /* end of buffer: */
262       fi_type *dst = save->vertex_store->buffer_in_ram + (prim->start + prim->count) * sz;
263
264       memcpy(dst, src, sz * sizeof(float));
265
266       prim->count++;
267       node->cold->vertex_count++;
268       save->vertex_store->used += sz;
269    }
270
271    if (!prim->begin) {
272       /* Drawing the second or later section of a long line loop.
273        * Skip the 0th vertex.
274        */
275       prim->start++;
276       prim->count--;
277    }
278
279    prim->mode = GL_LINE_STRIP;
280 }
281
282
283 /* Compare the present vao if it has the same setup. */
284 static bool
285 compare_vao(gl_vertex_processing_mode mode,
286             const struct gl_vertex_array_object *vao,
287             const struct gl_buffer_object *bo, GLintptr buffer_offset,
288             GLuint stride, GLbitfield64 vao_enabled,
289             const GLubyte size[VBO_ATTRIB_MAX],
290             const GLenum16 type[VBO_ATTRIB_MAX],
291             const GLuint offset[VBO_ATTRIB_MAX])
292 {
293    if (!vao)
294       return false;
295
296    /* If the enabled arrays are not the same we are not equal. */
297    if (vao_enabled != vao->Enabled)
298       return false;
299
300    /* Check the buffer binding at 0 */
301    if (vao->BufferBinding[0].BufferObj != bo)
302       return false;
303    /* BufferBinding[0].Offset != buffer_offset is checked per attribute */
304    if (vao->BufferBinding[0].Stride != stride)
305       return false;
306    assert(vao->BufferBinding[0].InstanceDivisor == 0);
307
308    /* Retrieve the mapping from VBO_ATTRIB to VERT_ATTRIB space */
309    const GLubyte *const vao_to_vbo_map = _vbo_attribute_alias_map[mode];
310
311    /* Now check the enabled arrays */
312    GLbitfield mask = vao_enabled;
313    while (mask) {
314       const int attr = u_bit_scan(&mask);
315       const unsigned char vbo_attr = vao_to_vbo_map[attr];
316       const GLenum16 tp = type[vbo_attr];
317       const GLintptr off = offset[vbo_attr] + buffer_offset;
318       const struct gl_array_attributes *attrib = &vao->VertexAttrib[attr];
319       if (attrib->RelativeOffset + vao->BufferBinding[0].Offset != off)
320          return false;
321       if (attrib->Format.Type != tp)
322          return false;
323       if (attrib->Format.Size != size[vbo_attr])
324          return false;
325       assert(attrib->Format.Format == GL_RGBA);
326       assert(attrib->Format.Normalized == GL_FALSE);
327       assert(attrib->Format.Integer == vbo_attrtype_to_integer_flag(tp));
328       assert(attrib->Format.Doubles == vbo_attrtype_to_double_flag(tp));
329       assert(attrib->BufferBindingIndex == 0);
330    }
331
332    return true;
333 }
334
335
336 /* Create or reuse the vao for the vertex processing mode. */
337 static void
338 update_vao(struct gl_context *ctx,
339            gl_vertex_processing_mode mode,
340            struct gl_vertex_array_object **vao,
341            struct gl_buffer_object *bo, GLintptr buffer_offset,
342            GLuint stride, GLbitfield64 vbo_enabled,
343            const GLubyte size[VBO_ATTRIB_MAX],
344            const GLenum16 type[VBO_ATTRIB_MAX],
345            const GLuint offset[VBO_ATTRIB_MAX])
346 {
347    /* Compute the bitmasks of vao_enabled arrays */
348    GLbitfield vao_enabled = _vbo_get_vao_enabled_from_vbo(mode, vbo_enabled);
349
350    /*
351     * Check if we can possibly reuse the exisiting one.
352     * In the long term we should reset them when something changes.
353     */
354    if (compare_vao(mode, *vao, bo, buffer_offset, stride,
355                    vao_enabled, size, type, offset))
356       return;
357
358    /* The initial refcount is 1 */
359    _mesa_reference_vao(ctx, vao, NULL);
360    *vao = _mesa_new_vao(ctx, ~((GLuint)0));
361
362    /*
363     * assert(stride <= ctx->Const.MaxVertexAttribStride);
364     * MaxVertexAttribStride is not set for drivers that does not
365     * expose GL 44 or GLES 31.
366     */
367
368    /* Bind the buffer object at binding point 0 */
369    _mesa_bind_vertex_buffer(ctx, *vao, 0, bo, buffer_offset, stride, false,
370                             false);
371
372    /* Retrieve the mapping from VBO_ATTRIB to VERT_ATTRIB space
373     * Note that the position/generic0 aliasing is done in the VAO.
374     */
375    const GLubyte *const vao_to_vbo_map = _vbo_attribute_alias_map[mode];
376    /* Now set the enable arrays */
377    GLbitfield mask = vao_enabled;
378    while (mask) {
379       const int vao_attr = u_bit_scan(&mask);
380       const GLubyte vbo_attr = vao_to_vbo_map[vao_attr];
381       assert(offset[vbo_attr] <= ctx->Const.MaxVertexAttribRelativeOffset);
382
383       _vbo_set_attrib_format(ctx, *vao, vao_attr, buffer_offset,
384                              size[vbo_attr], type[vbo_attr], offset[vbo_attr]);
385       _mesa_vertex_attrib_binding(ctx, *vao, vao_attr, 0);
386    }
387    _mesa_enable_vertex_array_attribs(ctx, *vao, vao_enabled);
388    assert(vao_enabled == (*vao)->Enabled);
389    assert((vao_enabled & ~(*vao)->VertexAttribBufferMask) == 0);
390
391    /* Finalize and freeze the VAO */
392    _mesa_set_vao_immutable(ctx, *vao);
393 }
394
395 static void wrap_filled_vertex(struct gl_context *ctx);
396
397 /* Grow the vertex storage to accomodate for vertex_count new vertices */
398 static void
399 grow_vertex_storage(struct gl_context *ctx, int vertex_count)
400 {
401    struct vbo_save_context *save = &vbo_context(ctx)->save;
402    assert (save->vertex_store);
403
404    int new_size = (save->vertex_store->used +
405                    vertex_count * save->vertex_size) * sizeof(GLfloat);
406
407    /* Limit how much memory we allocate. */
408    if (save->prim_store->used > 0 &&
409        vertex_count > 0 &&
410        new_size > VBO_SAVE_BUFFER_SIZE) {
411       wrap_filled_vertex(ctx);
412       new_size = VBO_SAVE_BUFFER_SIZE;
413    }
414
415    if (new_size > save->vertex_store->buffer_in_ram_size) {
416       save->vertex_store->buffer_in_ram_size = new_size;
417       save->vertex_store->buffer_in_ram = realloc(save->vertex_store->buffer_in_ram,
418                                                   save->vertex_store->buffer_in_ram_size);
419       if (save->vertex_store->buffer_in_ram == NULL)
420          save->out_of_memory = true;
421    }
422 }
423
424 struct vertex_key {
425    unsigned vertex_size;
426    fi_type *vertex_attributes;
427 };
428
429 static uint32_t _hash_vertex_key(const void *key)
430 {
431    struct vertex_key *k = (struct vertex_key*)key;
432    unsigned sz = k->vertex_size;
433    assert(sz);
434    return _mesa_hash_data(k->vertex_attributes, sz * sizeof(float));
435 }
436
437 static bool _compare_vertex_key(const void *key1, const void *key2)
438 {
439    struct vertex_key *k1 = (struct vertex_key*)key1;
440    struct vertex_key *k2 = (struct vertex_key*)key2;
441    /* All the compared vertices are going to be drawn with the same VAO,
442     * so we can compare the attributes. */
443    assert (k1->vertex_size == k2->vertex_size);
444    return memcmp(k1->vertex_attributes,
445                  k2->vertex_attributes,
446                  k1->vertex_size * sizeof(float)) == 0;
447 }
448
449 static void _free_entry(struct hash_entry *entry)
450 {
451    free((void*)entry->key);
452 }
453
454 /* Add vertex to the vertex buffer and return its index. If this vertex is a duplicate
455  * of an existing vertex, return the original index instead.
456  */
457 static uint32_t
458 add_vertex(struct vbo_save_context *save, struct hash_table *hash_to_index,
459            uint32_t index, fi_type *new_buffer, uint32_t *max_index)
460 {
461    /* If vertex deduplication is disabled return the original index. */
462    if (!hash_to_index)
463       return index;
464
465    fi_type *vert = save->vertex_store->buffer_in_ram + save->vertex_size * index;
466
467    struct vertex_key *key = malloc(sizeof(struct vertex_key));
468    key->vertex_size = save->vertex_size;
469    key->vertex_attributes = vert;
470
471    struct hash_entry *entry = _mesa_hash_table_search(hash_to_index, key);
472    if (entry) {
473       free(key);
474       /* We found an existing vertex with the same hash, return its index. */
475       return (uintptr_t) entry->data;
476    } else {
477       /* This is a new vertex. Determine a new index and copy its attributes to the vertex
478        * buffer. Note that 'new_buffer' is created at each list compilation so we write vertices
479        * starting at index 0.
480        */
481       uint32_t n = _mesa_hash_table_num_entries(hash_to_index);
482       *max_index = MAX2(n, *max_index);
483
484       memcpy(&new_buffer[save->vertex_size * n],
485              vert,
486              save->vertex_size * sizeof(fi_type));
487
488       _mesa_hash_table_insert(hash_to_index, key, (void*)(uintptr_t)(n));
489
490       /* The index buffer is shared between list compilations, so add the base index to get
491        * the final index.
492        */
493       return n;
494    }
495 }
496
497
498 static uint32_t
499 get_vertex_count(struct vbo_save_context *save)
500 {
501    if (!save->vertex_size)
502       return 0;
503    return save->vertex_store->used / save->vertex_size;
504 }
505
506
507 /**
508  * Insert the active immediate struct onto the display list currently
509  * being built.
510  */
511 static void
512 compile_vertex_list(struct gl_context *ctx)
513 {
514    struct vbo_save_context *save = &vbo_context(ctx)->save;
515    struct vbo_save_vertex_list *node;
516
517    /* Allocate space for this structure in the display list currently
518     * being compiled.
519     */
520    node = (struct vbo_save_vertex_list *)
521       _mesa_dlist_alloc_vertex_list(ctx, !save->dangling_attr_ref && !save->no_current_update);
522
523    if (!node)
524       return;
525
526    node->cold = calloc(1, sizeof(*node->cold));
527
528    /* Make sure the pointer is aligned to the size of a pointer */
529    assert((GLintptr) node % sizeof(void *) == 0);
530
531    const GLsizei stride = save->vertex_size*sizeof(GLfloat);
532
533    node->cold->vertex_count = get_vertex_count(save);
534    node->cold->wrap_count = save->copied.nr;
535    node->cold->prims = malloc(sizeof(struct _mesa_prim) * save->prim_store->used);
536    memcpy(node->cold->prims, save->prim_store->prims, sizeof(struct _mesa_prim) * save->prim_store->used);
537    node->cold->ib.obj = NULL;
538    node->cold->prim_count = save->prim_store->used;
539
540    if (save->no_current_update) {
541       node->cold->current_data = NULL;
542    }
543    else {
544       GLuint current_size = save->vertex_size - save->attrsz[0];
545       node->cold->current_data = NULL;
546
547       if (current_size) {
548          node->cold->current_data = malloc(current_size * sizeof(GLfloat));
549          if (node->cold->current_data) {
550             const char *buffer = (const char *)save->vertex_store->buffer_in_ram;
551             unsigned attr_offset = save->attrsz[0] * sizeof(GLfloat);
552             unsigned vertex_offset = 0;
553
554             if (node->cold->vertex_count)
555                vertex_offset = (node->cold->vertex_count - 1) * stride;
556
557             memcpy(node->cold->current_data, buffer + vertex_offset + attr_offset,
558                    current_size * sizeof(GLfloat));
559          } else {
560             _mesa_error(ctx, GL_OUT_OF_MEMORY, "Current value allocation");
561             save->out_of_memory = true;
562          }
563       }
564    }
565
566    assert(save->attrsz[VBO_ATTRIB_POS] != 0 || node->cold->vertex_count == 0);
567
568    if (save->dangling_attr_ref)
569       ctx->ListState.Current.UseLoopback = true;
570
571    /* Copy duplicated vertices
572     */
573    save->copied.nr = copy_vertices(ctx, node, save->vertex_store->buffer_in_ram);
574
575    if (node->cold->prims[node->cold->prim_count - 1].mode == GL_LINE_LOOP) {
576       convert_line_loop_to_strip(save, node);
577    }
578
579    merge_prims(ctx, node->cold->prims, &node->cold->prim_count);
580
581    GLintptr buffer_offset = 0;
582    GLuint start_offset = 0;
583
584    /* Create an index buffer. */
585    node->cold->min_index = node->cold->max_index = 0;
586    if (node->cold->vertex_count == 0 || node->cold->prim_count == 0)
587       goto end;
588
589    /* We won't modify node->prims, so use a const alias to avoid unintended
590     * writes to it. */
591    const struct _mesa_prim *original_prims = node->cold->prims;
592
593    int end = original_prims[node->cold->prim_count - 1].start +
594              original_prims[node->cold->prim_count - 1].count;
595    int total_vert_count = end - original_prims[0].start;
596
597    node->cold->min_index = node->cold->prims[0].start;
598    node->cold->max_index = end - 1;
599
600    /* converting primitive types may result in many more indices */
601    bool all_prims_supported = (ctx->Const.DriverSupportedPrimMask & BITFIELD_MASK(PIPE_PRIM_MAX)) == BITFIELD_MASK(PIPE_PRIM_MAX);
602    int max_index_count = total_vert_count * (all_prims_supported ? 2 : 3);
603    uint32_t* indices = (uint32_t*) malloc(max_index_count * sizeof(uint32_t));
604    void *tmp_indices = all_prims_supported ? NULL : malloc(max_index_count * sizeof(uint32_t));
605    struct _mesa_prim *merged_prims = NULL;
606
607    int idx = 0;
608    struct hash_table *vertex_to_index = NULL;
609    fi_type *temp_vertices_buffer = NULL;
610
611    /* The loopback replay code doesn't use the index buffer, so we can't
612     * dedup vertices in this case.
613     */
614    if (!ctx->ListState.Current.UseLoopback) {
615       vertex_to_index = _mesa_hash_table_create(NULL, _hash_vertex_key, _compare_vertex_key);
616       temp_vertices_buffer = malloc(save->vertex_store->buffer_in_ram_size);
617    }
618
619    uint32_t max_index = 0;
620
621    int last_valid_prim = -1;
622    /* Construct indices array. */
623    for (unsigned i = 0; i < node->cold->prim_count; i++) {
624       assert(original_prims[i].basevertex == 0);
625       GLubyte mode = original_prims[i].mode;
626       bool converted_prim = false;
627       unsigned index_size;
628
629       int vertex_count = original_prims[i].count;
630       if (!vertex_count) {
631          continue;
632       }
633
634       /* Increase indices storage if the original estimation was too small. */
635       if (idx + 3 * vertex_count > max_index_count) {
636          max_index_count = max_index_count + 3 * vertex_count;
637          indices = (uint32_t*) realloc(indices, max_index_count * sizeof(uint32_t));
638          tmp_indices = all_prims_supported ? NULL : realloc(tmp_indices, max_index_count * sizeof(uint32_t));
639       }
640
641       /* Line strips may get converted to lines */
642       if (mode == GL_LINE_STRIP)
643          mode = GL_LINES;
644
645       if (!(ctx->Const.DriverSupportedPrimMask & BITFIELD_BIT(mode))) {
646          unsigned new_count;
647          u_generate_func trans_func;
648          enum pipe_prim_type pmode = (enum pipe_prim_type)mode;
649          u_index_generator(ctx->Const.DriverSupportedPrimMask,
650                            pmode, original_prims[i].start, vertex_count,
651                            PV_LAST, PV_LAST,
652                            &pmode, &index_size, &new_count,
653                            &trans_func);
654          if (new_count > 0)
655             trans_func(original_prims[i].start, new_count, tmp_indices);
656          vertex_count = new_count;
657          mode = (GLubyte)pmode;
658          converted_prim = true;
659       }
660
661       /* If 2 consecutive prims use the same mode => merge them. */
662       bool merge_prims = last_valid_prim >= 0 &&
663                          mode == merged_prims[last_valid_prim].mode &&
664                          mode != GL_LINE_LOOP && mode != GL_TRIANGLE_FAN &&
665                          mode != GL_QUAD_STRIP && mode != GL_POLYGON &&
666                          mode != GL_PATCHES;
667
668 /* index generation uses uint16_t if the index count is small enough */
669 #define CAST_INDEX(BASE, SIZE, IDX) ((SIZE == 2 ? (uint32_t)(((uint16_t*)BASE)[IDX]) : ((uint32_t*)BASE)[IDX]))
670       /* To be able to merge consecutive triangle strips we need to insert
671        * a degenerate triangle.
672        */
673       if (merge_prims &&
674           mode == GL_TRIANGLE_STRIP) {
675          /* Insert a degenerate triangle */
676          assert(merged_prims[last_valid_prim].mode == GL_TRIANGLE_STRIP);
677          unsigned tri_count = merged_prims[last_valid_prim].count - 2;
678
679          indices[idx] = indices[idx - 1];
680          indices[idx + 1] = add_vertex(save, vertex_to_index,
681                                        converted_prim ? CAST_INDEX(tmp_indices, index_size, 0) : original_prims[i].start,
682                                        temp_vertices_buffer, &max_index);
683          idx += 2;
684          merged_prims[last_valid_prim].count += 2;
685
686          if (tri_count % 2) {
687             /* Add another index to preserve winding order */
688             indices[idx++] = add_vertex(save, vertex_to_index,
689                                         converted_prim ? CAST_INDEX(tmp_indices, index_size, 0) : original_prims[i].start,
690                                         temp_vertices_buffer, &max_index);
691             merged_prims[last_valid_prim].count++;
692          }
693       }
694
695       int start = idx;
696
697       /* Convert line strips to lines if it'll allow if the previous
698        * prim mode is GL_LINES (so merge_prims is true) or if the next
699        * primitive mode is GL_LINES or GL_LINE_LOOP.
700        */
701       if (original_prims[i].mode == GL_LINE_STRIP &&
702           (merge_prims ||
703            (i < node->cold->prim_count - 1 &&
704             (original_prims[i + 1].mode == GL_LINE_STRIP ||
705              original_prims[i + 1].mode == GL_LINES)))) {
706          for (unsigned j = 0; j < vertex_count; j++) {
707             indices[idx++] = add_vertex(save, vertex_to_index,
708                                         converted_prim ? CAST_INDEX(tmp_indices, index_size, j) : original_prims[i].start + j,
709                                         temp_vertices_buffer, &max_index);
710             /* Repeat all but the first/last indices. */
711             if (j && j != vertex_count - 1) {
712                indices[idx++] = add_vertex(save, vertex_to_index,
713                                            converted_prim ? CAST_INDEX(tmp_indices, index_size, j) : original_prims[i].start + j,
714                                            temp_vertices_buffer, &max_index);
715             }
716          }
717       } else {
718          /* We didn't convert to LINES, so restore the original mode */
719          if (!converted_prim)
720             mode = original_prims[i].mode;
721
722          for (unsigned j = 0; j < vertex_count; j++) {
723             indices[idx++] = add_vertex(save, vertex_to_index,
724                                         converted_prim ? CAST_INDEX(tmp_indices, index_size, j) : original_prims[i].start + j,
725                                         temp_vertices_buffer, &max_index);
726          }
727       }
728
729       /* Duplicate the last vertex for incomplete primitives */
730       unsigned min_vert = u_prim_vertex_count(mode)->min;
731       for (unsigned j = vertex_count; j < min_vert; j++) {
732          indices[idx++] = add_vertex(save, vertex_to_index,
733                                      converted_prim ? CAST_INDEX(tmp_indices, index_size, vertex_count - 1) :
734                                                       original_prims[i].start + vertex_count - 1,
735                                      temp_vertices_buffer, &max_index);
736       }
737
738 #undef CAST_INDEX
739       if (merge_prims) {
740          /* Update vertex count. */
741          merged_prims[last_valid_prim].count += idx - start;
742       } else {
743          /* Keep this primitive */
744          last_valid_prim += 1;
745          assert(last_valid_prim <= i);
746          merged_prims = realloc(merged_prims, (1 + last_valid_prim) * sizeof(struct _mesa_prim));
747          merged_prims[last_valid_prim] = original_prims[i];
748          merged_prims[last_valid_prim].start = start;
749          merged_prims[last_valid_prim].count = idx - start;
750       }
751       merged_prims[last_valid_prim].mode = mode;
752
753       /* converted prims will filter incomplete primitives and may have no indices */
754       assert((idx > 0 || converted_prim) && idx <= max_index_count);
755    }
756
757    unsigned merged_prim_count = last_valid_prim + 1;
758    node->cold->ib.ptr = NULL;
759    node->cold->ib.count = idx;
760    node->cold->ib.index_size_shift = (GL_UNSIGNED_INT - GL_UNSIGNED_BYTE) >> 1;
761
762    /* How many bytes do we need to store the indices and the vertices */
763    total_vert_count = vertex_to_index ? (max_index + 1) : idx;
764    unsigned total_bytes_needed = idx * sizeof(uint32_t) +
765                                  total_vert_count * save->vertex_size * sizeof(fi_type);
766
767    const GLintptr old_offset = save->VAO[0] ?
768       save->VAO[0]->BufferBinding[0].Offset + save->VAO[0]->VertexAttrib[VERT_ATTRIB_POS].RelativeOffset : 0;
769    if (old_offset != save->current_bo_bytes_used && stride > 0) {
770       GLintptr offset_diff = save->current_bo_bytes_used - old_offset;
771       while (offset_diff > 0 &&
772              save->current_bo_bytes_used < save->current_bo->Size &&
773              offset_diff % stride != 0) {
774          save->current_bo_bytes_used++;
775          offset_diff = save->current_bo_bytes_used - old_offset;
776       }
777    }
778    buffer_offset = save->current_bo_bytes_used;
779
780    /* Can we reuse the previous bo or should we allocate a new one? */
781    int available_bytes = save->current_bo ? save->current_bo->Size - save->current_bo_bytes_used : 0;
782    if (total_bytes_needed > available_bytes) {
783       if (save->current_bo)
784          _mesa_reference_buffer_object(ctx, &save->current_bo, NULL);
785       save->current_bo = _mesa_bufferobj_alloc(ctx, VBO_BUF_ID + 1);
786       bool success = _mesa_bufferobj_data(ctx,
787                                           GL_ELEMENT_ARRAY_BUFFER_ARB,
788                                           MAX2(total_bytes_needed, VBO_SAVE_BUFFER_SIZE),
789                                           NULL,
790                                           GL_STATIC_DRAW_ARB, GL_MAP_WRITE_BIT |
791                                           MESA_GALLIUM_VERTEX_STATE_STORAGE,
792                                           save->current_bo);
793       if (!success) {
794          _mesa_reference_buffer_object(ctx, &save->current_bo, NULL);
795          _mesa_error(ctx, GL_OUT_OF_MEMORY, "IB allocation");
796          save->out_of_memory = true;
797       } else {
798          save->current_bo_bytes_used = 0;
799          available_bytes = save->current_bo->Size;
800       }
801       buffer_offset = 0;
802    } else {
803       assert(old_offset <= buffer_offset);
804       const GLintptr offset_diff = buffer_offset - old_offset;
805       if (offset_diff > 0 && stride > 0 && offset_diff % stride == 0) {
806          /* The vertex size is an exact multiple of the buffer offset.
807           * This means that we can use zero-based vertex attribute pointers
808           * and specify the start of the primitive with the _mesa_prim::start
809           * field.  This results in issuing several draw calls with identical
810           * vertex attribute information.  This can result in fewer state
811           * changes in drivers.  In particular, the Gallium CSO module will
812           * filter out redundant vertex buffer changes.
813           */
814          /* We cannot immediately update the primitives as some methods below
815           * still need the uncorrected start vertices
816           */
817          start_offset = offset_diff/stride;
818          assert(old_offset == buffer_offset - offset_diff);
819          buffer_offset = old_offset;
820       }
821
822       /* Correct the primitive starts, we can only do this here as copy_vertices
823        * and convert_line_loop_to_strip above consume the uncorrected starts.
824        * On the other hand the _vbo_loopback_vertex_list call below needs the
825        * primitives to be corrected already.
826        */
827       for (unsigned i = 0; i < node->cold->prim_count; i++) {
828          node->cold->prims[i].start += start_offset;
829       }
830       /* start_offset shifts vertices (so v[0] becomes v[start_offset]), so we have
831        * to apply this transformation to all indices and max_index.
832        */
833       for (unsigned i = 0; i < idx; i++)
834          indices[i] += start_offset;
835       max_index += start_offset;
836    }
837
838    _mesa_reference_buffer_object(ctx, &node->cold->ib.obj, save->current_bo);
839
840    /* Upload the vertices first (see buffer_offset) */
841    _mesa_bufferobj_subdata(ctx,
842                            save->current_bo_bytes_used,
843                            total_vert_count * save->vertex_size * sizeof(fi_type),
844                            vertex_to_index ? temp_vertices_buffer : save->vertex_store->buffer_in_ram,
845                            node->cold->ib.obj);
846    save->current_bo_bytes_used += total_vert_count * save->vertex_size * sizeof(fi_type);
847
848   if (vertex_to_index) {
849       _mesa_hash_table_destroy(vertex_to_index, _free_entry);
850       free(temp_vertices_buffer);
851    }
852
853    /* Since we append the indices to an existing buffer, we need to adjust the start value of each
854     * primitive (not the indices themselves). */
855    if (!ctx->ListState.Current.UseLoopback) {
856       save->current_bo_bytes_used += align(save->current_bo_bytes_used, 4) - save->current_bo_bytes_used;
857       int indices_offset = save->current_bo_bytes_used / 4;
858       for (int i = 0; i < merged_prim_count; i++) {
859          merged_prims[i].start += indices_offset;
860       }
861    }
862
863    /* Then upload the indices. */
864    if (node->cold->ib.obj) {
865       _mesa_bufferobj_subdata(ctx,
866                               save->current_bo_bytes_used,
867                               idx * sizeof(uint32_t),
868                               indices,
869                               node->cold->ib.obj);
870       save->current_bo_bytes_used += idx * sizeof(uint32_t);
871    } else {
872       node->cold->vertex_count = 0;
873       node->cold->prim_count = 0;
874    }
875
876    /* Prepare for DrawGallium */
877    memset(&node->cold->info, 0, sizeof(struct pipe_draw_info));
878    /* The other info fields will be updated in vbo_save_playback_vertex_list */
879    node->cold->info.index_size = 4;
880    node->cold->info.instance_count = 1;
881    node->cold->info.index.gl_bo = node->cold->ib.obj;
882    if (merged_prim_count == 1) {
883       node->cold->info.mode = merged_prims[0].mode;
884       node->start_count.start = merged_prims[0].start;
885       node->start_count.count = merged_prims[0].count;
886       node->start_count.index_bias = 0;
887       node->modes = NULL;
888    } else {
889       node->modes = malloc(merged_prim_count * sizeof(unsigned char));
890       node->start_counts = malloc(merged_prim_count * sizeof(struct pipe_draw_start_count_bias));
891       for (unsigned i = 0; i < merged_prim_count; i++) {
892          node->start_counts[i].start = merged_prims[i].start;
893          node->start_counts[i].count = merged_prims[i].count;
894          node->start_counts[i].index_bias = 0;
895          node->modes[i] = merged_prims[i].mode;
896       }
897    }
898    node->num_draws = merged_prim_count;
899    if (node->num_draws > 1) {
900       bool same_mode = true;
901       for (unsigned i = 1; i < node->num_draws && same_mode; i++) {
902          same_mode = node->modes[i] == node->modes[0];
903       }
904       if (same_mode) {
905          /* All primitives use the same mode, so we can simplify a bit */
906          node->cold->info.mode = node->modes[0];
907          free(node->modes);
908          node->modes = NULL;
909       }
910    }
911
912    free(indices);
913    free(tmp_indices);
914    free(merged_prims);
915
916 end:
917    node->draw_begins = node->cold->prims[0].begin;
918
919    if (!save->current_bo) {
920       save->current_bo = _mesa_bufferobj_alloc(ctx, VBO_BUF_ID + 1);
921       bool success = _mesa_bufferobj_data(ctx,
922                                           GL_ELEMENT_ARRAY_BUFFER_ARB,
923                                           VBO_SAVE_BUFFER_SIZE,
924                                           NULL,
925                                           GL_STATIC_DRAW_ARB, GL_MAP_WRITE_BIT |
926                                           MESA_GALLIUM_VERTEX_STATE_STORAGE,
927                                           save->current_bo);
928       if (!success)
929          save->out_of_memory = true;
930    }
931
932    GLuint offsets[VBO_ATTRIB_MAX];
933    for (unsigned i = 0, offset = 0; i < VBO_ATTRIB_MAX; ++i) {
934       offsets[i] = offset;
935       offset += save->attrsz[i] * sizeof(GLfloat);
936    }
937    /* Create a pair of VAOs for the possible VERTEX_PROCESSING_MODEs
938     * Note that this may reuse the previous one of possible.
939     */
940    for (gl_vertex_processing_mode vpm = VP_MODE_FF; vpm < VP_MODE_MAX; ++vpm) {
941       /* create or reuse the vao */
942       update_vao(ctx, vpm, &save->VAO[vpm],
943                  save->current_bo, buffer_offset, stride,
944                  save->enabled, save->attrsz, save->attrtype, offsets);
945       /* Reference the vao in the dlist */
946       node->cold->VAO[vpm] = NULL;
947       _mesa_reference_vao(ctx, &node->cold->VAO[vpm], save->VAO[vpm]);
948    }
949
950    /* Prepare for DrawGalliumVertexState */
951    if (node->num_draws && ctx->Driver.DrawGalliumVertexState) {
952       for (unsigned i = 0; i < VP_MODE_MAX; i++) {
953          uint32_t enabled_attribs = _vbo_get_vao_filter(i) &
954                                     node->cold->VAO[i]->_EnabledWithMapMode;
955
956          node->state[i] =
957             ctx->Driver.CreateGalliumVertexState(ctx, node->cold->VAO[i],
958                                                  node->cold->ib.obj,
959                                                  enabled_attribs);
960          node->private_refcount[i] = 0;
961          node->enabled_attribs[i] = enabled_attribs;
962       }
963
964       node->ctx = ctx;
965       node->mode = node->cold->info.mode;
966       assert(node->cold->info.index_size == 4);
967    }
968
969    /* Deal with GL_COMPILE_AND_EXECUTE:
970     */
971    if (ctx->ExecuteFlag) {
972       struct _glapi_table *dispatch = GET_DISPATCH();
973
974       _glapi_set_dispatch(ctx->Exec);
975
976       /* _vbo_loopback_vertex_list doesn't use the index buffer, so we have to
977        * use buffer_in_ram (which contains all vertices) instead of current_bo
978        * (which contains deduplicated vertices *when* UseLoopback is false).
979        *
980        * The problem is that the VAO offset is based on current_bo's layout,
981        * so we have to use a temp value.
982        */
983       struct gl_vertex_array_object *vao = node->cold->VAO[VP_MODE_SHADER];
984       GLintptr original = vao->BufferBinding[0].Offset;
985       /* 'start_offset' has been added to all primitives 'start', so undo it here. */
986       vao->BufferBinding[0].Offset = -(GLintptr)(start_offset * stride);
987       _vbo_loopback_vertex_list(ctx, node, save->vertex_store->buffer_in_ram);
988       vao->BufferBinding[0].Offset = original;
989
990       _glapi_set_dispatch(dispatch);
991    }
992
993    /* Reset our structures for the next run of vertices:
994     */
995    reset_counters(ctx);
996 }
997
998
999 /**
1000  * This is called when we fill a vertex buffer before we hit a glEnd().
1001  * We
1002  * TODO -- If no new vertices have been stored, don't bother saving it.
1003  */
1004 static void
1005 wrap_buffers(struct gl_context *ctx)
1006 {
1007    struct vbo_save_context *save = &vbo_context(ctx)->save;
1008    GLint i = save->prim_store->used - 1;
1009    GLenum mode;
1010
1011    assert(i < (GLint) save->prim_store->size);
1012    assert(i >= 0);
1013
1014    /* Close off in-progress primitive.
1015     */
1016    save->prim_store->prims[i].count = (get_vertex_count(save) - save->prim_store->prims[i].start);
1017    mode = save->prim_store->prims[i].mode;
1018
1019    /* store the copied vertices, and allocate a new list.
1020     */
1021    compile_vertex_list(ctx);
1022
1023    /* Restart interrupted primitive
1024     */
1025    save->prim_store->prims[0].mode = mode;
1026    save->prim_store->prims[0].begin = 0;
1027    save->prim_store->prims[0].end = 0;
1028    save->prim_store->prims[0].start = 0;
1029    save->prim_store->prims[0].count = 0;
1030    save->prim_store->used = 1;
1031 }
1032
1033
1034 /**
1035  * Called only when buffers are wrapped as the result of filling the
1036  * vertex_store struct.
1037  */
1038 static void
1039 wrap_filled_vertex(struct gl_context *ctx)
1040 {
1041    struct vbo_save_context *save = &vbo_context(ctx)->save;
1042    unsigned numComponents;
1043
1044    /* Emit a glEnd to close off the last vertex list.
1045     */
1046    wrap_buffers(ctx);
1047
1048    assert(save->vertex_store->used == 0 && save->vertex_store->used == 0);
1049
1050    /* Copy stored stored vertices to start of new list.
1051     */
1052    numComponents = save->copied.nr * save->vertex_size;
1053
1054    fi_type *buffer_ptr = save->vertex_store->buffer_in_ram;
1055    if (numComponents) {
1056       assert(save->copied.buffer);
1057       memcpy(buffer_ptr,
1058              save->copied.buffer,
1059              numComponents * sizeof(fi_type));
1060       free(save->copied.buffer);
1061       save->copied.buffer = NULL;
1062    }
1063    save->vertex_store->used = numComponents;
1064 }
1065
1066
1067 static void
1068 copy_to_current(struct gl_context *ctx)
1069 {
1070    struct vbo_save_context *save = &vbo_context(ctx)->save;
1071    GLbitfield64 enabled = save->enabled & (~BITFIELD64_BIT(VBO_ATTRIB_POS));
1072
1073    while (enabled) {
1074       const int i = u_bit_scan64(&enabled);
1075       assert(save->attrsz[i]);
1076
1077       if (save->attrtype[i] == GL_DOUBLE ||
1078           save->attrtype[i] == GL_UNSIGNED_INT64_ARB)
1079          memcpy(save->current[i], save->attrptr[i], save->attrsz[i] * sizeof(GLfloat));
1080       else
1081          COPY_CLEAN_4V_TYPE_AS_UNION(save->current[i], save->attrsz[i],
1082                                      save->attrptr[i], save->attrtype[i]);
1083    }
1084 }
1085
1086
1087 static void
1088 copy_from_current(struct gl_context *ctx)
1089 {
1090    struct vbo_save_context *save = &vbo_context(ctx)->save;
1091    GLbitfield64 enabled = save->enabled & (~BITFIELD64_BIT(VBO_ATTRIB_POS));
1092
1093    while (enabled) {
1094       const int i = u_bit_scan64(&enabled);
1095
1096       switch (save->attrsz[i]) {
1097       case 4:
1098          save->attrptr[i][3] = save->current[i][3];
1099          FALLTHROUGH;
1100       case 3:
1101          save->attrptr[i][2] = save->current[i][2];
1102          FALLTHROUGH;
1103       case 2:
1104          save->attrptr[i][1] = save->current[i][1];
1105          FALLTHROUGH;
1106       case 1:
1107          save->attrptr[i][0] = save->current[i][0];
1108          break;
1109       case 0:
1110          unreachable("Unexpected vertex attribute size");
1111       }
1112    }
1113 }
1114
1115
1116 /**
1117  * Called when we increase the size of a vertex attribute.  For example,
1118  * if we've seen one or more glTexCoord2f() calls and now we get a
1119  * glTexCoord3f() call.
1120  * Flush existing data, set new attrib size, replay copied vertices.
1121  */
1122 static void
1123 upgrade_vertex(struct gl_context *ctx, GLuint attr, GLuint newsz)
1124 {
1125    struct vbo_save_context *save = &vbo_context(ctx)->save;
1126    GLuint oldsz;
1127    GLuint i;
1128    fi_type *tmp;
1129
1130    /* Store the current run of vertices, and emit a GL_END.  Emit a
1131     * BEGIN in the new buffer.
1132     */
1133    if (save->vertex_store->used)
1134       wrap_buffers(ctx);
1135    else
1136       assert(save->copied.nr == 0);
1137
1138    /* Do a COPY_TO_CURRENT to ensure back-copying works for the case
1139     * when the attribute already exists in the vertex and is having
1140     * its size increased.
1141     */
1142    copy_to_current(ctx);
1143
1144    /* Fix up sizes:
1145     */
1146    oldsz = save->attrsz[attr];
1147    save->attrsz[attr] = newsz;
1148    save->enabled |= BITFIELD64_BIT(attr);
1149
1150    save->vertex_size += newsz - oldsz;
1151
1152    /* Recalculate all the attrptr[] values:
1153     */
1154    tmp = save->vertex;
1155    for (i = 0; i < VBO_ATTRIB_MAX; i++) {
1156       if (save->attrsz[i]) {
1157          save->attrptr[i] = tmp;
1158          tmp += save->attrsz[i];
1159       }
1160       else {
1161          save->attrptr[i] = NULL;       /* will not be dereferenced. */
1162       }
1163    }
1164
1165    /* Copy from current to repopulate the vertex with correct values.
1166     */
1167    copy_from_current(ctx);
1168
1169    /* Replay stored vertices to translate them to new format here.
1170     *
1171     * If there are copied vertices and the new (upgraded) attribute
1172     * has not been defined before, this list is somewhat degenerate,
1173     * and will need fixup at runtime.
1174     */
1175    if (save->copied.nr) {
1176       assert(save->copied.buffer);
1177       const fi_type *data = save->copied.buffer;
1178       grow_vertex_storage(ctx, save->copied.nr);
1179       fi_type *dest = save->vertex_store->buffer_in_ram;
1180
1181       /* Need to note this and fix up at runtime (or loopback):
1182        */
1183       if (attr != VBO_ATTRIB_POS && save->currentsz[attr][0] == 0) {
1184          assert(oldsz == 0);
1185          save->dangling_attr_ref = GL_TRUE;
1186       }
1187
1188       for (i = 0; i < save->copied.nr; i++) {
1189          GLbitfield64 enabled = save->enabled;
1190          while (enabled) {
1191             const int j = u_bit_scan64(&enabled);
1192             assert(save->attrsz[j]);
1193             if (j == attr) {
1194                int k;
1195                const fi_type *src = oldsz ? data : save->current[attr];
1196                int copy = oldsz ? oldsz : newsz;
1197                for (k = 0; k < copy; k++)
1198                   dest[k] = src[k];
1199                for (; k < newsz; k++) {
1200                   switch (save->attrtype[j]) {
1201                      case GL_FLOAT:
1202                         dest[k] = FLOAT_AS_UNION(k == 3);
1203                         break;
1204                      case GL_INT:
1205                         dest[k] = INT_AS_UNION(k == 3);
1206                         break;
1207                      case GL_UNSIGNED_INT:
1208                         dest[k] = UINT_AS_UNION(k == 3);
1209                         break;
1210                      default:
1211                         dest[k] = FLOAT_AS_UNION(k == 3);
1212                         assert(!"Unexpected type in upgrade_vertex");
1213                         break;
1214                   }
1215                }
1216                dest += newsz;
1217                data += oldsz;
1218             } else {
1219                GLint sz = save->attrsz[j];
1220                for (int k = 0; k < sz; k++)
1221                   dest[k] = data[k];
1222                data += sz;
1223                dest += sz;
1224             }
1225          }
1226       }
1227
1228       save->vertex_store->used += save->vertex_size * save->copied.nr;
1229       free(save->copied.buffer);
1230       save->copied.buffer = NULL;
1231    }
1232 }
1233
1234
1235 /**
1236  * This is called when the size of a vertex attribute changes.
1237  * For example, after seeing one or more glTexCoord2f() calls we
1238  * get a glTexCoord4f() or glTexCoord1f() call.
1239  */
1240 static void
1241 fixup_vertex(struct gl_context *ctx, GLuint attr,
1242              GLuint sz, GLenum newType)
1243 {
1244    struct vbo_save_context *save = &vbo_context(ctx)->save;
1245
1246    if (sz > save->attrsz[attr] ||
1247        newType != save->attrtype[attr]) {
1248       /* New size is larger.  Need to flush existing vertices and get
1249        * an enlarged vertex format.
1250        */
1251       upgrade_vertex(ctx, attr, sz);
1252    }
1253    else if (sz < save->active_sz[attr]) {
1254       GLuint i;
1255       const fi_type *id = vbo_get_default_vals_as_union(save->attrtype[attr]);
1256
1257       /* New size is equal or smaller - just need to fill in some
1258        * zeros.
1259        */
1260       for (i = sz; i <= save->attrsz[attr]; i++)
1261          save->attrptr[attr][i - 1] = id[i - 1];
1262    }
1263
1264    save->active_sz[attr] = sz;
1265
1266    grow_vertex_storage(ctx, 1);
1267 }
1268
1269
1270 /**
1271  * Reset the current size of all vertex attributes to the default
1272  * value of 0.  This signals that we haven't yet seen any per-vertex
1273  * commands such as glNormal3f() or glTexCoord2f().
1274  */
1275 static void
1276 reset_vertex(struct gl_context *ctx)
1277 {
1278    struct vbo_save_context *save = &vbo_context(ctx)->save;
1279
1280    while (save->enabled) {
1281       const int i = u_bit_scan64(&save->enabled);
1282       assert(save->attrsz[i]);
1283       save->attrsz[i] = 0;
1284       save->active_sz[i] = 0;
1285    }
1286
1287    save->vertex_size = 0;
1288 }
1289
1290
1291 /**
1292  * If index=0, does glVertexAttrib*() alias glVertex() to emit a vertex?
1293  * It depends on a few things, including whether we're inside or outside
1294  * of glBegin/glEnd.
1295  */
1296 static inline bool
1297 is_vertex_position(const struct gl_context *ctx, GLuint index)
1298 {
1299    return (index == 0 &&
1300            _mesa_attr_zero_aliases_vertex(ctx) &&
1301            _mesa_inside_dlist_begin_end(ctx));
1302 }
1303
1304
1305
1306 #define ERROR(err)   _mesa_compile_error(ctx, err, __func__);
1307
1308
1309 /* Only one size for each attribute may be active at once.  Eg. if
1310  * Color3f is installed/active, then Color4f may not be, even if the
1311  * vertex actually contains 4 color coordinates.  This is because the
1312  * 3f version won't otherwise set color[3] to 1.0 -- this is the job
1313  * of the chooser function when switching between Color4f and Color3f.
1314  */
1315 #define ATTR_UNION(A, N, T, C, V0, V1, V2, V3)                  \
1316 do {                                                            \
1317    struct vbo_save_context *save = &vbo_context(ctx)->save;     \
1318    int sz = (sizeof(C) / sizeof(GLfloat));                      \
1319                                                                 \
1320    if (save->active_sz[A] != N)                                 \
1321       fixup_vertex(ctx, A, N * sz, T);                          \
1322                                                                 \
1323    {                                                            \
1324       C *dest = (C *)save->attrptr[A];                          \
1325       if (N>0) dest[0] = V0;                                    \
1326       if (N>1) dest[1] = V1;                                    \
1327       if (N>2) dest[2] = V2;                                    \
1328       if (N>3) dest[3] = V3;                                    \
1329       save->attrtype[A] = T;                                    \
1330    }                                                            \
1331                                                                 \
1332    if ((A) == VBO_ATTRIB_POS) {                                 \
1333       fi_type *buffer_ptr = save->vertex_store->buffer_in_ram + \
1334                             save->vertex_store->used;           \
1335                                                                 \
1336       for (int i = 0; i < save->vertex_size; i++)               \
1337         buffer_ptr[i] = save->vertex[i];                        \
1338                                                                 \
1339       save->vertex_store->used += save->vertex_size;            \
1340       unsigned used_next = (save->vertex_store->used +          \
1341                             save->vertex_size) * sizeof(float); \
1342       if (used_next > save->vertex_store->buffer_in_ram_size) { \
1343          grow_vertex_storage(ctx, get_vertex_count(save));      \
1344          assert(used_next <=                                    \
1345                 save->vertex_store->buffer_in_ram_size);        \
1346       }                                                         \
1347    }                                                            \
1348 } while (0)
1349
1350 #define TAG(x) _save_##x
1351
1352 #include "vbo_attrib_tmp.h"
1353
1354
1355 #define MAT( ATTR, N, face, params )                            \
1356 do {                                                            \
1357    if (face != GL_BACK)                                         \
1358       MAT_ATTR( ATTR, N, params ); /* front */                  \
1359    if (face != GL_FRONT)                                        \
1360       MAT_ATTR( ATTR + 1, N, params ); /* back */               \
1361 } while (0)
1362
1363
1364 /**
1365  * Save a glMaterial call found between glBegin/End.
1366  * glMaterial calls outside Begin/End are handled in dlist.c.
1367  */
1368 static void GLAPIENTRY
1369 _save_Materialfv(GLenum face, GLenum pname, const GLfloat *params)
1370 {
1371    GET_CURRENT_CONTEXT(ctx);
1372
1373    if (face != GL_FRONT && face != GL_BACK && face != GL_FRONT_AND_BACK) {
1374       _mesa_compile_error(ctx, GL_INVALID_ENUM, "glMaterial(face)");
1375       return;
1376    }
1377
1378    switch (pname) {
1379    case GL_EMISSION:
1380       MAT(VBO_ATTRIB_MAT_FRONT_EMISSION, 4, face, params);
1381       break;
1382    case GL_AMBIENT:
1383       MAT(VBO_ATTRIB_MAT_FRONT_AMBIENT, 4, face, params);
1384       break;
1385    case GL_DIFFUSE:
1386       MAT(VBO_ATTRIB_MAT_FRONT_DIFFUSE, 4, face, params);
1387       break;
1388    case GL_SPECULAR:
1389       MAT(VBO_ATTRIB_MAT_FRONT_SPECULAR, 4, face, params);
1390       break;
1391    case GL_SHININESS:
1392       if (*params < 0 || *params > ctx->Const.MaxShininess) {
1393          _mesa_compile_error(ctx, GL_INVALID_VALUE, "glMaterial(shininess)");
1394       }
1395       else {
1396          MAT(VBO_ATTRIB_MAT_FRONT_SHININESS, 1, face, params);
1397       }
1398       break;
1399    case GL_COLOR_INDEXES:
1400       MAT(VBO_ATTRIB_MAT_FRONT_INDEXES, 3, face, params);
1401       break;
1402    case GL_AMBIENT_AND_DIFFUSE:
1403       MAT(VBO_ATTRIB_MAT_FRONT_AMBIENT, 4, face, params);
1404       MAT(VBO_ATTRIB_MAT_FRONT_DIFFUSE, 4, face, params);
1405       break;
1406    default:
1407       _mesa_compile_error(ctx, GL_INVALID_ENUM, "glMaterial(pname)");
1408       return;
1409    }
1410 }
1411
1412
1413 static void
1414 vbo_install_save_vtxfmt(struct gl_context *ctx);
1415
1416
1417 /* Cope with EvalCoord/CallList called within a begin/end object:
1418  *     -- Flush current buffer
1419  *     -- Fallback to opcodes for the rest of the begin/end object.
1420  */
1421 static void
1422 dlist_fallback(struct gl_context *ctx)
1423 {
1424    struct vbo_save_context *save = &vbo_context(ctx)->save;
1425
1426    if (save->vertex_store->used || save->prim_store->used) {
1427       if (save->prim_store->used > 0 && save->vertex_store->used > 0) {
1428          assert(save->vertex_size);
1429          /* Close off in-progress primitive. */
1430          GLint i = save->prim_store->used - 1;
1431          save->prim_store->prims[i].count =
1432             get_vertex_count(save) -
1433             save->prim_store->prims[i].start;
1434       }
1435
1436       /* Need to replay this display list with loopback,
1437        * unfortunately, otherwise this primitive won't be handled
1438        * properly:
1439        */
1440       save->dangling_attr_ref = GL_TRUE;
1441
1442       compile_vertex_list(ctx);
1443    }
1444
1445    copy_to_current(ctx);
1446    reset_vertex(ctx);
1447    if (save->out_of_memory) {
1448       vbo_install_save_vtxfmt_noop(ctx);
1449    }
1450    else {
1451       _mesa_install_save_vtxfmt(ctx);
1452    }
1453    ctx->Driver.SaveNeedFlush = GL_FALSE;
1454 }
1455
1456
1457 static void GLAPIENTRY
1458 _save_EvalCoord1f(GLfloat u)
1459 {
1460    GET_CURRENT_CONTEXT(ctx);
1461    dlist_fallback(ctx);
1462    CALL_EvalCoord1f(ctx->Save, (u));
1463 }
1464
1465 static void GLAPIENTRY
1466 _save_EvalCoord1fv(const GLfloat * v)
1467 {
1468    GET_CURRENT_CONTEXT(ctx);
1469    dlist_fallback(ctx);
1470    CALL_EvalCoord1fv(ctx->Save, (v));
1471 }
1472
1473 static void GLAPIENTRY
1474 _save_EvalCoord2f(GLfloat u, GLfloat v)
1475 {
1476    GET_CURRENT_CONTEXT(ctx);
1477    dlist_fallback(ctx);
1478    CALL_EvalCoord2f(ctx->Save, (u, v));
1479 }
1480
1481 static void GLAPIENTRY
1482 _save_EvalCoord2fv(const GLfloat * v)
1483 {
1484    GET_CURRENT_CONTEXT(ctx);
1485    dlist_fallback(ctx);
1486    CALL_EvalCoord2fv(ctx->Save, (v));
1487 }
1488
1489 static void GLAPIENTRY
1490 _save_EvalPoint1(GLint i)
1491 {
1492    GET_CURRENT_CONTEXT(ctx);
1493    dlist_fallback(ctx);
1494    CALL_EvalPoint1(ctx->Save, (i));
1495 }
1496
1497 static void GLAPIENTRY
1498 _save_EvalPoint2(GLint i, GLint j)
1499 {
1500    GET_CURRENT_CONTEXT(ctx);
1501    dlist_fallback(ctx);
1502    CALL_EvalPoint2(ctx->Save, (i, j));
1503 }
1504
1505 static void GLAPIENTRY
1506 _save_CallList(GLuint l)
1507 {
1508    GET_CURRENT_CONTEXT(ctx);
1509    dlist_fallback(ctx);
1510    CALL_CallList(ctx->Save, (l));
1511 }
1512
1513 static void GLAPIENTRY
1514 _save_CallLists(GLsizei n, GLenum type, const GLvoid * v)
1515 {
1516    GET_CURRENT_CONTEXT(ctx);
1517    dlist_fallback(ctx);
1518    CALL_CallLists(ctx->Save, (n, type, v));
1519 }
1520
1521
1522
1523 /**
1524  * Called when a glBegin is getting compiled into a display list.
1525  * Updating of ctx->Driver.CurrentSavePrimitive is already taken care of.
1526  */
1527 void
1528 vbo_save_NotifyBegin(struct gl_context *ctx, GLenum mode,
1529                      bool no_current_update)
1530 {
1531    struct vbo_save_context *save = &vbo_context(ctx)->save;
1532    const GLuint i = save->prim_store->used++;
1533
1534    ctx->Driver.CurrentSavePrimitive = mode;
1535
1536    if (!save->prim_store || i >= save->prim_store->size) {
1537       save->prim_store = realloc_prim_store(save->prim_store, i * 2);
1538    }
1539    save->prim_store->prims[i].mode = mode & VBO_SAVE_PRIM_MODE_MASK;
1540    save->prim_store->prims[i].begin = 1;
1541    save->prim_store->prims[i].end = 0;
1542    save->prim_store->prims[i].start = get_vertex_count(save);
1543    save->prim_store->prims[i].count = 0;
1544
1545    save->no_current_update = no_current_update;
1546
1547    vbo_install_save_vtxfmt(ctx);
1548
1549    /* We need to call vbo_save_SaveFlushVertices() if there's state change */
1550    ctx->Driver.SaveNeedFlush = GL_TRUE;
1551 }
1552
1553
1554 static void GLAPIENTRY
1555 _save_End(void)
1556 {
1557    GET_CURRENT_CONTEXT(ctx);
1558    struct vbo_save_context *save = &vbo_context(ctx)->save;
1559    const GLint i = save->prim_store->used - 1;
1560
1561    ctx->Driver.CurrentSavePrimitive = PRIM_OUTSIDE_BEGIN_END;
1562    save->prim_store->prims[i].end = 1;
1563    save->prim_store->prims[i].count = (get_vertex_count(save) - save->prim_store->prims[i].start);
1564
1565    /* Swap out this vertex format while outside begin/end.  Any color,
1566     * etc. received between here and the next begin will be compiled
1567     * as opcodes.
1568     */
1569    if (save->out_of_memory) {
1570       vbo_install_save_vtxfmt_noop(ctx);
1571    }
1572    else {
1573       _mesa_install_save_vtxfmt(ctx);
1574    }
1575 }
1576
1577
1578 static void GLAPIENTRY
1579 _save_Begin(GLenum mode)
1580 {
1581    GET_CURRENT_CONTEXT(ctx);
1582    (void) mode;
1583    _mesa_compile_error(ctx, GL_INVALID_OPERATION, "Recursive glBegin");
1584 }
1585
1586
1587 static void GLAPIENTRY
1588 _save_PrimitiveRestartNV(void)
1589 {
1590    GET_CURRENT_CONTEXT(ctx);
1591    struct vbo_save_context *save = &vbo_context(ctx)->save;
1592
1593    if (save->prim_store->used == 0) {
1594       /* We're not inside a glBegin/End pair, so calling glPrimitiverRestartNV
1595        * is an error.
1596        */
1597       _mesa_compile_error(ctx, GL_INVALID_OPERATION,
1598                           "glPrimitiveRestartNV called outside glBegin/End");
1599    } else {
1600       /* get current primitive mode */
1601       GLenum curPrim = save->prim_store->prims[save->prim_store->used - 1].mode;
1602       bool no_current_update = save->no_current_update;
1603
1604       /* restart primitive */
1605       CALL_End(ctx->CurrentServerDispatch, ());
1606       vbo_save_NotifyBegin(ctx, curPrim, no_current_update);
1607    }
1608 }
1609
1610
1611 /* Unlike the functions above, these are to be hooked into the vtxfmt
1612  * maintained in ctx->ListState, active when the list is known or
1613  * suspected to be outside any begin/end primitive.
1614  * Note: OBE = Outside Begin/End
1615  */
1616 void GLAPIENTRY
1617 save_Rectf(GLfloat x1, GLfloat y1, GLfloat x2, GLfloat y2)
1618 {
1619    GET_CURRENT_CONTEXT(ctx);
1620    struct _glapi_table *dispatch = ctx->CurrentServerDispatch;
1621
1622    vbo_save_NotifyBegin(ctx, GL_QUADS, false);
1623    CALL_Vertex2f(dispatch, (x1, y1));
1624    CALL_Vertex2f(dispatch, (x2, y1));
1625    CALL_Vertex2f(dispatch, (x2, y2));
1626    CALL_Vertex2f(dispatch, (x1, y2));
1627    CALL_End(dispatch, ());
1628 }
1629
1630
1631 void GLAPIENTRY
1632 save_Rectdv(const GLdouble *v1, const GLdouble *v2)
1633 {
1634    save_Rectf((GLfloat) v1[0], (GLfloat) v1[1], (GLfloat) v2[0], (GLfloat) v2[1]);
1635 }
1636
1637 void GLAPIENTRY
1638 save_Rectfv(const GLfloat *v1, const GLfloat *v2)
1639 {
1640    save_Rectf(v1[0], v1[1], v2[0], v2[1]);
1641 }
1642
1643 void GLAPIENTRY
1644 save_Recti(GLint x1, GLint y1, GLint x2, GLint y2)
1645 {
1646    save_Rectf((GLfloat) x1, (GLfloat) y1, (GLfloat) x2, (GLfloat) y2);
1647 }
1648
1649 void GLAPIENTRY
1650 save_Rectiv(const GLint *v1, const GLint *v2)
1651 {
1652    save_Rectf((GLfloat) v1[0], (GLfloat) v1[1], (GLfloat) v2[0], (GLfloat) v2[1]);
1653 }
1654
1655 void GLAPIENTRY
1656 save_Rects(GLshort x1, GLshort y1, GLshort x2, GLshort y2)
1657 {
1658    save_Rectf((GLfloat) x1, (GLfloat) y1, (GLfloat) x2, (GLfloat) y2);
1659 }
1660
1661 void GLAPIENTRY
1662 save_Rectsv(const GLshort *v1, const GLshort *v2)
1663 {
1664    save_Rectf((GLfloat) v1[0], (GLfloat) v1[1], (GLfloat) v2[0], (GLfloat) v2[1]);
1665 }
1666
1667 void GLAPIENTRY
1668 save_DrawArrays(GLenum mode, GLint start, GLsizei count)
1669 {
1670    GET_CURRENT_CONTEXT(ctx);
1671    struct gl_vertex_array_object *vao = ctx->Array.VAO;
1672    struct vbo_save_context *save = &vbo_context(ctx)->save;
1673    GLint i;
1674
1675    if (!_mesa_is_valid_prim_mode(ctx, mode)) {
1676       _mesa_compile_error(ctx, GL_INVALID_ENUM, "glDrawArrays(mode)");
1677       return;
1678    }
1679    if (count < 0) {
1680       _mesa_compile_error(ctx, GL_INVALID_VALUE, "glDrawArrays(count<0)");
1681       return;
1682    }
1683
1684    if (save->out_of_memory)
1685       return;
1686
1687    grow_vertex_storage(ctx, count);
1688
1689    /* Make sure to process any VBO binding changes */
1690    _mesa_update_state(ctx);
1691
1692    _mesa_vao_map_arrays(ctx, vao, GL_MAP_READ_BIT);
1693
1694    vbo_save_NotifyBegin(ctx, mode, true);
1695
1696    for (i = 0; i < count; i++)
1697       _mesa_array_element(ctx, start + i);
1698    CALL_End(ctx->CurrentServerDispatch, ());
1699
1700    _mesa_vao_unmap_arrays(ctx, vao);
1701 }
1702
1703
1704 void GLAPIENTRY
1705 save_MultiDrawArrays(GLenum mode, const GLint *first,
1706                       const GLsizei *count, GLsizei primcount)
1707 {
1708    GET_CURRENT_CONTEXT(ctx);
1709    GLint i;
1710
1711    if (!_mesa_is_valid_prim_mode(ctx, mode)) {
1712       _mesa_compile_error(ctx, GL_INVALID_ENUM, "glMultiDrawArrays(mode)");
1713       return;
1714    }
1715
1716    if (primcount < 0) {
1717       _mesa_compile_error(ctx, GL_INVALID_VALUE,
1718                           "glMultiDrawArrays(primcount<0)");
1719       return;
1720    }
1721
1722    unsigned vertcount = 0;
1723    for (i = 0; i < primcount; i++) {
1724       if (count[i] < 0) {
1725          _mesa_compile_error(ctx, GL_INVALID_VALUE,
1726                              "glMultiDrawArrays(count[i]<0)");
1727          return;
1728       }
1729       vertcount += count[i];
1730    }
1731
1732    grow_vertex_storage(ctx, vertcount);
1733
1734    for (i = 0; i < primcount; i++) {
1735       if (count[i] > 0) {
1736          save_DrawArrays(mode, first[i], count[i]);
1737       }
1738    }
1739 }
1740
1741
1742 static void
1743 array_element(struct gl_context *ctx,
1744               GLint basevertex, GLuint elt, unsigned index_size_shift)
1745 {
1746    /* Section 10.3.5 Primitive Restart:
1747     * [...]
1748     *    When one of the *BaseVertex drawing commands specified in section 10.5
1749     * is used, the primitive restart comparison occurs before the basevertex
1750     * offset is added to the array index.
1751     */
1752    /* If PrimitiveRestart is enabled and the index is the RestartIndex
1753     * then we call PrimitiveRestartNV and return.
1754     */
1755    if (ctx->Array._PrimitiveRestart[index_size_shift] &&
1756        elt == ctx->Array._RestartIndex[index_size_shift]) {
1757       CALL_PrimitiveRestartNV(ctx->CurrentServerDispatch, ());
1758       return;
1759    }
1760
1761    _mesa_array_element(ctx, basevertex + elt);
1762 }
1763
1764
1765 /* Could do better by copying the arrays and element list intact and
1766  * then emitting an indexed prim at runtime.
1767  */
1768 void GLAPIENTRY
1769 save_DrawElementsBaseVertex(GLenum mode, GLsizei count, GLenum type,
1770                              const GLvoid * indices, GLint basevertex)
1771 {
1772    GET_CURRENT_CONTEXT(ctx);
1773    struct vbo_save_context *save = &vbo_context(ctx)->save;
1774    struct gl_vertex_array_object *vao = ctx->Array.VAO;
1775    struct gl_buffer_object *indexbuf = vao->IndexBufferObj;
1776    GLint i;
1777
1778    if (!_mesa_is_valid_prim_mode(ctx, mode)) {
1779       _mesa_compile_error(ctx, GL_INVALID_ENUM, "glDrawElements(mode)");
1780       return;
1781    }
1782    if (count < 0) {
1783       _mesa_compile_error(ctx, GL_INVALID_VALUE, "glDrawElements(count<0)");
1784       return;
1785    }
1786    if (type != GL_UNSIGNED_BYTE &&
1787        type != GL_UNSIGNED_SHORT &&
1788        type != GL_UNSIGNED_INT) {
1789       _mesa_compile_error(ctx, GL_INVALID_VALUE, "glDrawElements(count<0)");
1790       return;
1791    }
1792
1793    if (save->out_of_memory)
1794       return;
1795
1796    grow_vertex_storage(ctx, count);
1797
1798    /* Make sure to process any VBO binding changes */
1799    _mesa_update_state(ctx);
1800
1801    _mesa_vao_map(ctx, vao, GL_MAP_READ_BIT);
1802
1803    if (indexbuf)
1804       indices =
1805          ADD_POINTERS(indexbuf->Mappings[MAP_INTERNAL].Pointer, indices);
1806
1807    vbo_save_NotifyBegin(ctx, mode, true);
1808
1809    switch (type) {
1810    case GL_UNSIGNED_BYTE:
1811       for (i = 0; i < count; i++)
1812          array_element(ctx, basevertex, ((GLubyte *) indices)[i], 0);
1813       break;
1814    case GL_UNSIGNED_SHORT:
1815       for (i = 0; i < count; i++)
1816          array_element(ctx, basevertex, ((GLushort *) indices)[i], 1);
1817       break;
1818    case GL_UNSIGNED_INT:
1819       for (i = 0; i < count; i++)
1820          array_element(ctx, basevertex, ((GLuint *) indices)[i], 2);
1821       break;
1822    default:
1823       _mesa_error(ctx, GL_INVALID_ENUM, "glDrawElements(type)");
1824       break;
1825    }
1826
1827    CALL_End(ctx->CurrentServerDispatch, ());
1828
1829    _mesa_vao_unmap(ctx, vao);
1830 }
1831
1832 void GLAPIENTRY
1833 save_DrawElements(GLenum mode, GLsizei count, GLenum type,
1834                    const GLvoid * indices)
1835 {
1836    save_DrawElementsBaseVertex(mode, count, type, indices, 0);
1837 }
1838
1839
1840 void GLAPIENTRY
1841 save_DrawRangeElements(GLenum mode, GLuint start, GLuint end,
1842                             GLsizei count, GLenum type,
1843                             const GLvoid * indices)
1844 {
1845    GET_CURRENT_CONTEXT(ctx);
1846    struct vbo_save_context *save = &vbo_context(ctx)->save;
1847
1848    if (!_mesa_is_valid_prim_mode(ctx, mode)) {
1849       _mesa_compile_error(ctx, GL_INVALID_ENUM, "glDrawRangeElements(mode)");
1850       return;
1851    }
1852    if (count < 0) {
1853       _mesa_compile_error(ctx, GL_INVALID_VALUE,
1854                           "glDrawRangeElements(count<0)");
1855       return;
1856    }
1857    if (type != GL_UNSIGNED_BYTE &&
1858        type != GL_UNSIGNED_SHORT &&
1859        type != GL_UNSIGNED_INT) {
1860       _mesa_compile_error(ctx, GL_INVALID_ENUM, "glDrawRangeElements(type)");
1861       return;
1862    }
1863    if (end < start) {
1864       _mesa_compile_error(ctx, GL_INVALID_VALUE,
1865                           "glDrawRangeElements(end < start)");
1866       return;
1867    }
1868
1869    if (save->out_of_memory)
1870       return;
1871
1872    save_DrawElements(mode, count, type, indices);
1873 }
1874
1875
1876 void GLAPIENTRY
1877 save_MultiDrawElementsEXT(GLenum mode, const GLsizei *count, GLenum type,
1878                            const GLvoid * const *indices, GLsizei primcount)
1879 {
1880    GET_CURRENT_CONTEXT(ctx);
1881    struct _glapi_table *dispatch = ctx->CurrentServerDispatch;
1882    GLsizei i;
1883
1884    int vertcount = 0;
1885    for (i = 0; i < primcount; i++) {
1886       vertcount += count[i];
1887    }
1888    grow_vertex_storage(ctx, vertcount);
1889
1890    for (i = 0; i < primcount; i++) {
1891       if (count[i] > 0) {
1892          CALL_DrawElements(dispatch, (mode, count[i], type, indices[i]));
1893       }
1894    }
1895 }
1896
1897
1898 void GLAPIENTRY
1899 save_MultiDrawElementsBaseVertex(GLenum mode, const GLsizei *count,
1900                                   GLenum type,
1901                                   const GLvoid * const *indices,
1902                                   GLsizei primcount,
1903                                   const GLint *basevertex)
1904 {
1905    GET_CURRENT_CONTEXT(ctx);
1906    struct _glapi_table *dispatch = ctx->CurrentServerDispatch;
1907    GLsizei i;
1908
1909    int vertcount = 0;
1910    for (i = 0; i < primcount; i++) {
1911       vertcount += count[i];
1912    }
1913    grow_vertex_storage(ctx, vertcount);
1914
1915    for (i = 0; i < primcount; i++) {
1916       if (count[i] > 0) {
1917          CALL_DrawElementsBaseVertex(dispatch, (mode, count[i], type,
1918                                      indices[i],
1919                                      basevertex[i]));
1920       }
1921    }
1922 }
1923
1924
1925 static void
1926 vbo_install_save_vtxfmt(struct gl_context *ctx)
1927 {
1928 #define NAME_AE(x) _mesa_##x
1929 #define NAME_CALLLIST(x) _save_##x
1930 #define NAME(x) _save_##x
1931 #define NAME_ES(x) _save_##x
1932
1933    struct _glapi_table *tab = ctx->Save;
1934    #include "api_vtxfmt_init.h"
1935 }
1936
1937
1938 void
1939 vbo_save_SaveFlushVertices(struct gl_context *ctx)
1940 {
1941    struct vbo_save_context *save = &vbo_context(ctx)->save;
1942
1943    /* Noop when we are actually active:
1944     */
1945    if (ctx->Driver.CurrentSavePrimitive <= PRIM_MAX)
1946       return;
1947
1948    if (save->vertex_store->used || save->prim_store->used)
1949       compile_vertex_list(ctx);
1950
1951    copy_to_current(ctx);
1952    reset_vertex(ctx);
1953    ctx->Driver.SaveNeedFlush = GL_FALSE;
1954 }
1955
1956
1957 /**
1958  * Called from glNewList when we're starting to compile a display list.
1959  */
1960 void
1961 vbo_save_NewList(struct gl_context *ctx, GLuint list, GLenum mode)
1962 {
1963    struct vbo_save_context *save = &vbo_context(ctx)->save;
1964
1965    (void) list;
1966    (void) mode;
1967
1968    if (!save->prim_store)
1969       save->prim_store = realloc_prim_store(NULL, 8);
1970
1971    if (!save->vertex_store)
1972       save->vertex_store = CALLOC_STRUCT(vbo_save_vertex_store);
1973
1974    reset_vertex(ctx);
1975    ctx->Driver.SaveNeedFlush = GL_FALSE;
1976 }
1977
1978
1979 /**
1980  * Called from glEndList when we're finished compiling a display list.
1981  */
1982 void
1983 vbo_save_EndList(struct gl_context *ctx)
1984 {
1985    struct vbo_save_context *save = &vbo_context(ctx)->save;
1986
1987    /* EndList called inside a (saved) Begin/End pair?
1988     */
1989    if (_mesa_inside_dlist_begin_end(ctx)) {
1990       if (save->prim_store->used > 0) {
1991          GLint i = save->prim_store->used - 1;
1992          ctx->Driver.CurrentSavePrimitive = PRIM_OUTSIDE_BEGIN_END;
1993          save->prim_store->prims[i].end = 0;
1994          save->prim_store->prims[i].count = get_vertex_count(save) - save->prim_store->prims[i].start;
1995       }
1996
1997       /* Make sure this vertex list gets replayed by the "loopback"
1998        * mechanism:
1999        */
2000       save->dangling_attr_ref = GL_TRUE;
2001       vbo_save_SaveFlushVertices(ctx);
2002
2003       /* Swap out this vertex format while outside begin/end.  Any color,
2004        * etc. received between here and the next begin will be compiled
2005        * as opcodes.
2006        */
2007       _mesa_install_save_vtxfmt(ctx);
2008    }
2009
2010    assert(save->vertex_size == 0);
2011 }
2012
2013 /**
2014  * Called during context creation/init.
2015  */
2016 static void
2017 current_init(struct gl_context *ctx)
2018 {
2019    struct vbo_save_context *save = &vbo_context(ctx)->save;
2020    GLint i;
2021
2022    for (i = VBO_ATTRIB_POS; i <= VBO_ATTRIB_EDGEFLAG; i++) {
2023       const GLuint j = i - VBO_ATTRIB_POS;
2024       assert(j < VERT_ATTRIB_MAX);
2025       save->currentsz[i] = &ctx->ListState.ActiveAttribSize[j];
2026       save->current[i] = (fi_type *) ctx->ListState.CurrentAttrib[j];
2027    }
2028
2029    for (i = VBO_ATTRIB_FIRST_MATERIAL; i <= VBO_ATTRIB_LAST_MATERIAL; i++) {
2030       const GLuint j = i - VBO_ATTRIB_FIRST_MATERIAL;
2031       assert(j < MAT_ATTRIB_MAX);
2032       save->currentsz[i] = &ctx->ListState.ActiveMaterialSize[j];
2033       save->current[i] = (fi_type *) ctx->ListState.CurrentMaterial[j];
2034    }
2035 }
2036
2037
2038 /**
2039  * Initialize the display list compiler.  Called during context creation.
2040  */
2041 void
2042 vbo_save_api_init(struct vbo_save_context *save)
2043 {
2044    struct gl_context *ctx = gl_context_from_vbo_save(save);
2045
2046    current_init(ctx);
2047 }