Merge branch 'glsl-to-tgsi'
[profile/ivi/mesa.git] / src / mesa / state_tracker / st_program.c
1 /**************************************************************************
2  * 
3  * Copyright 2007 Tungsten Graphics, Inc., Cedar Park, Texas.
4  * All Rights Reserved.
5  * 
6  * Permission is hereby granted, free of charge, to any person obtaining a
7  * copy of this software and associated documentation files (the
8  * "Software"), to deal in the Software without restriction, including
9  * without limitation the rights to use, copy, modify, merge, publish,
10  * distribute, sub license, and/or sell copies of the Software, and to
11  * permit persons to whom the Software is furnished to do so, subject to
12  * the following conditions:
13  * 
14  * The above copyright notice and this permission notice (including the
15  * next paragraph) shall be included in all copies or substantial portions
16  * of the Software.
17  * 
18  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS
19  * OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF
20  * MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND NON-INFRINGEMENT.
21  * IN NO EVENT SHALL TUNGSTEN GRAPHICS AND/OR ITS SUPPLIERS BE LIABLE FOR
22  * ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT,
23  * TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION WITH THE
24  * SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE.
25  * 
26  **************************************************************************/
27  /*
28   * Authors:
29   *   Keith Whitwell <keith@tungstengraphics.com>
30   *   Brian Paul
31   */
32
33
34 #include "main/imports.h"
35 #include "main/hash.h"
36 #include "main/mfeatures.h"
37 #include "main/mtypes.h"
38 #include "program/prog_parameter.h"
39 #include "program/prog_print.h"
40 #include "program/programopt.h"
41
42 #include "pipe/p_context.h"
43 #include "pipe/p_defines.h"
44 #include "pipe/p_shader_tokens.h"
45 #include "draw/draw_context.h"
46 #include "tgsi/tgsi_dump.h"
47 #include "tgsi/tgsi_ureg.h"
48
49 #include "st_debug.h"
50 #include "st_cb_bitmap.h"
51 #include "st_cb_drawpixels.h"
52 #include "st_context.h"
53 #include "st_program.h"
54 #include "st_mesa_to_tgsi.h"
55 #include "cso_cache/cso_context.h"
56
57
58
59 /**
60  * Delete a vertex program variant.  Note the caller must unlink
61  * the variant from the linked list.
62  */
63 static void
64 delete_vp_variant(struct st_context *st, struct st_vp_variant *vpv)
65 {
66    if (vpv->driver_shader) 
67       cso_delete_vertex_shader(st->cso_context, vpv->driver_shader);
68       
69 #if FEATURE_feedback || FEATURE_rastpos
70    if (vpv->draw_shader)
71       draw_delete_vertex_shader( st->draw, vpv->draw_shader );
72 #endif
73       
74    if (vpv->tgsi.tokens)
75       st_free_tokens(vpv->tgsi.tokens);
76       
77    FREE( vpv );
78 }
79
80
81
82 /**
83  * Clean out any old compilations:
84  */
85 void
86 st_release_vp_variants( struct st_context *st,
87                         struct st_vertex_program *stvp )
88 {
89    struct st_vp_variant *vpv;
90
91    for (vpv = stvp->variants; vpv; ) {
92       struct st_vp_variant *next = vpv->next;
93       delete_vp_variant(st, vpv);
94       vpv = next;
95    }
96
97    stvp->variants = NULL;
98 }
99
100
101
102 /**
103  * Delete a fragment program variant.  Note the caller must unlink
104  * the variant from the linked list.
105  */
106 static void
107 delete_fp_variant(struct st_context *st, struct st_fp_variant *fpv)
108 {
109    if (fpv->driver_shader) 
110       cso_delete_fragment_shader(st->cso_context, fpv->driver_shader);
111    if (fpv->parameters)
112       _mesa_free_parameter_list(fpv->parameters);
113       
114    FREE(fpv);
115 }
116
117
118 /**
119  * Free all variants of a fragment program.
120  */
121 void
122 st_release_fp_variants(struct st_context *st, struct st_fragment_program *stfp)
123 {
124    struct st_fp_variant *fpv;
125
126    for (fpv = stfp->variants; fpv; ) {
127       struct st_fp_variant *next = fpv->next;
128       delete_fp_variant(st, fpv);
129       fpv = next;
130    }
131
132    stfp->variants = NULL;
133 }
134
135
136 /**
137  * Delete a geometry program variant.  Note the caller must unlink
138  * the variant from the linked list.
139  */
140 static void
141 delete_gp_variant(struct st_context *st, struct st_gp_variant *gpv)
142 {
143    if (gpv->driver_shader) 
144       cso_delete_geometry_shader(st->cso_context, gpv->driver_shader);
145       
146    FREE(gpv);
147 }
148
149
150 /**
151  * Free all variants of a geometry program.
152  */
153 void
154 st_release_gp_variants(struct st_context *st, struct st_geometry_program *stgp)
155 {
156    struct st_gp_variant *gpv;
157
158    for (gpv = stgp->variants; gpv; ) {
159       struct st_gp_variant *next = gpv->next;
160       delete_gp_variant(st, gpv);
161       gpv = next;
162    }
163
164    stgp->variants = NULL;
165 }
166
167
168
169
170 /**
171  * Translate a Mesa vertex shader into a TGSI shader.
172  * \param outputMapping  to map vertex program output registers (VERT_RESULT_x)
173  *       to TGSI output slots
174  * \param tokensOut  destination for TGSI tokens
175  * \return  pointer to cached pipe_shader object.
176  */
177 void
178 st_prepare_vertex_program(struct gl_context *ctx,
179                             struct st_vertex_program *stvp)
180 {
181    GLuint attr;
182
183    stvp->num_inputs = 0;
184    stvp->num_outputs = 0;
185
186    if (stvp->Base.IsPositionInvariant)
187       _mesa_insert_mvp_code(ctx, &stvp->Base);
188
189    if (!stvp->glsl_to_tgsi)
190       assert(stvp->Base.Base.NumInstructions > 1);
191
192    /*
193     * Determine number of inputs, the mappings between VERT_ATTRIB_x
194     * and TGSI generic input indexes, plus input attrib semantic info.
195     */
196    for (attr = 0; attr < VERT_ATTRIB_MAX; attr++) {
197       if (stvp->Base.Base.InputsRead & (1 << attr)) {
198          stvp->input_to_index[attr] = stvp->num_inputs;
199          stvp->index_to_input[stvp->num_inputs] = attr;
200          stvp->num_inputs++;
201       }
202    }
203    /* bit of a hack, presetup potentially unused edgeflag input */
204    stvp->input_to_index[VERT_ATTRIB_EDGEFLAG] = stvp->num_inputs;
205    stvp->index_to_input[stvp->num_inputs] = VERT_ATTRIB_EDGEFLAG;
206
207    /* Compute mapping of vertex program outputs to slots.
208     */
209    for (attr = 0; attr < VERT_RESULT_MAX; attr++) {
210       if ((stvp->Base.Base.OutputsWritten & BITFIELD64_BIT(attr)) == 0) {
211          stvp->result_to_output[attr] = ~0;
212       }
213       else {
214          unsigned slot = stvp->num_outputs++;
215
216          stvp->result_to_output[attr] = slot;
217
218          switch (attr) {
219          case VERT_RESULT_HPOS:
220             stvp->output_semantic_name[slot] = TGSI_SEMANTIC_POSITION;
221             stvp->output_semantic_index[slot] = 0;
222             break;
223          case VERT_RESULT_COL0:
224             stvp->output_semantic_name[slot] = TGSI_SEMANTIC_COLOR;
225             stvp->output_semantic_index[slot] = 0;
226             break;
227          case VERT_RESULT_COL1:
228             stvp->output_semantic_name[slot] = TGSI_SEMANTIC_COLOR;
229             stvp->output_semantic_index[slot] = 1;
230             break;
231          case VERT_RESULT_BFC0:
232             stvp->output_semantic_name[slot] = TGSI_SEMANTIC_BCOLOR;
233             stvp->output_semantic_index[slot] = 0;
234             break;
235          case VERT_RESULT_BFC1:
236             stvp->output_semantic_name[slot] = TGSI_SEMANTIC_BCOLOR;
237             stvp->output_semantic_index[slot] = 1;
238             break;
239          case VERT_RESULT_FOGC:
240             stvp->output_semantic_name[slot] = TGSI_SEMANTIC_FOG;
241             stvp->output_semantic_index[slot] = 0;
242             break;
243          case VERT_RESULT_PSIZ:
244             stvp->output_semantic_name[slot] = TGSI_SEMANTIC_PSIZE;
245             stvp->output_semantic_index[slot] = 0;
246             break;
247          case VERT_RESULT_EDGE:
248             assert(0);
249             break;
250
251          case VERT_RESULT_TEX0:
252          case VERT_RESULT_TEX1:
253          case VERT_RESULT_TEX2:
254          case VERT_RESULT_TEX3:
255          case VERT_RESULT_TEX4:
256          case VERT_RESULT_TEX5:
257          case VERT_RESULT_TEX6:
258          case VERT_RESULT_TEX7:
259             stvp->output_semantic_name[slot] = TGSI_SEMANTIC_GENERIC;
260             stvp->output_semantic_index[slot] = attr - VERT_RESULT_TEX0;
261             break;
262
263          case VERT_RESULT_VAR0:
264          default:
265             assert(attr < VERT_RESULT_MAX);
266             stvp->output_semantic_name[slot] = TGSI_SEMANTIC_GENERIC;
267             stvp->output_semantic_index[slot] = (FRAG_ATTRIB_VAR0 - 
268                                                 FRAG_ATTRIB_TEX0 +
269                                                 attr - 
270                                                 VERT_RESULT_VAR0);
271             break;
272          }
273       }
274    }
275    /* similar hack to above, presetup potentially unused edgeflag output */
276    stvp->result_to_output[VERT_RESULT_EDGE] = stvp->num_outputs;
277    stvp->output_semantic_name[stvp->num_outputs] = TGSI_SEMANTIC_EDGEFLAG;
278    stvp->output_semantic_index[stvp->num_outputs] = 0;
279 }
280
281
282 /**
283  * Translate a vertex program to create a new variant.
284  */
285 static struct st_vp_variant *
286 st_translate_vertex_program(struct st_context *st,
287                             struct st_vertex_program *stvp,
288                             const struct st_vp_variant_key *key)
289 {
290    struct st_vp_variant *vpv = CALLOC_STRUCT(st_vp_variant);
291    struct pipe_context *pipe = st->pipe;
292    struct ureg_program *ureg;
293    enum pipe_error error;
294    unsigned num_outputs;
295
296    st_prepare_vertex_program(st->ctx, stvp);
297
298    if (!stvp->glsl_to_tgsi)
299    {
300       _mesa_remove_output_reads(&stvp->Base.Base, PROGRAM_OUTPUT);
301       _mesa_remove_output_reads(&stvp->Base.Base, PROGRAM_VARYING);
302    }
303
304    ureg = ureg_create( TGSI_PROCESSOR_VERTEX );
305    if (ureg == NULL) {
306       FREE(vpv);
307       return NULL;
308    }
309
310    vpv->key = *key;
311
312    vpv->num_inputs = stvp->num_inputs;
313    num_outputs = stvp->num_outputs;
314    if (key->passthrough_edgeflags) {
315       vpv->num_inputs++;
316       num_outputs++;
317    }
318
319    if (ST_DEBUG & DEBUG_MESA) {
320       _mesa_print_program(&stvp->Base.Base);
321       _mesa_print_program_parameters(st->ctx, &stvp->Base.Base);
322       debug_printf("\n");
323    }
324
325    if (stvp->glsl_to_tgsi)
326       error = st_translate_program(st->ctx,
327                                    TGSI_PROCESSOR_VERTEX,
328                                    ureg,
329                                    stvp->glsl_to_tgsi,
330                                    &stvp->Base.Base,
331                                    /* inputs */
332                                    stvp->num_inputs,
333                                    stvp->input_to_index,
334                                    NULL, /* input semantic name */
335                                    NULL, /* input semantic index */
336                                    NULL, /* interp mode */
337                                    /* outputs */
338                                    stvp->num_outputs,
339                                    stvp->result_to_output,
340                                    stvp->output_semantic_name,
341                                    stvp->output_semantic_index,
342                                    key->passthrough_edgeflags );
343    else
344       error = st_translate_mesa_program(st->ctx,
345                                         TGSI_PROCESSOR_VERTEX,
346                                         ureg,
347                                         &stvp->Base.Base,
348                                         /* inputs */
349                                         vpv->num_inputs,
350                                         stvp->input_to_index,
351                                         NULL, /* input semantic name */
352                                         NULL, /* input semantic index */
353                                         NULL,
354                                         /* outputs */
355                                         num_outputs,
356                                         stvp->result_to_output,
357                                         stvp->output_semantic_name,
358                                         stvp->output_semantic_index,
359                                         key->passthrough_edgeflags );
360
361    if (error)
362       goto fail;
363
364    vpv->tgsi.tokens = ureg_get_tokens( ureg, NULL );
365    if (!vpv->tgsi.tokens)
366       goto fail;
367
368    ureg_destroy( ureg );
369
370    vpv->driver_shader = pipe->create_vs_state(pipe, &vpv->tgsi);
371
372    if (ST_DEBUG & DEBUG_TGSI) {
373       tgsi_dump( vpv->tgsi.tokens, 0 );
374       debug_printf("\n");
375    }
376
377    return vpv;
378
379 fail:
380    debug_printf("%s: failed to translate Mesa program:\n", __FUNCTION__);
381    _mesa_print_program(&stvp->Base.Base);
382    debug_assert(0);
383
384    ureg_destroy( ureg );
385    return NULL;
386 }
387
388
389 /**
390  * Find/create a vertex program variant.
391  */
392 struct st_vp_variant *
393 st_get_vp_variant(struct st_context *st,
394                   struct st_vertex_program *stvp,
395                   const struct st_vp_variant_key *key)
396 {
397    struct st_vp_variant *vpv;
398
399    /* Search for existing variant */
400    for (vpv = stvp->variants; vpv; vpv = vpv->next) {
401       if (memcmp(&vpv->key, key, sizeof(*key)) == 0) {
402          break;
403       }
404    }
405
406    if (!vpv) {
407       /* create now */
408       vpv = st_translate_vertex_program(st, stvp, key);
409       if (vpv) {
410          /* insert into list */
411          vpv->next = stvp->variants;
412          stvp->variants = vpv;
413       }
414    }
415
416    return vpv;
417 }
418
419 /**
420  * Translate Mesa fragment shader attributes to TGSI attributes.
421  * \return GL_TRUE if color output should be written to all render targets, 
422  *         GL_FALSE if not
423  */
424 GLboolean
425 st_prepare_fragment_program(struct gl_context *ctx,
426                             struct st_fragment_program *stfp)
427 {
428    GLuint attr;
429    const GLbitfield inputsRead = stfp->Base.Base.InputsRead;
430    GLboolean write_all = GL_FALSE;
431
432    /*
433     * Convert Mesa program inputs to TGSI input register semantics.
434     */
435    for (attr = 0; attr < FRAG_ATTRIB_MAX; attr++) {
436       if (inputsRead & (1 << attr)) {
437          const GLuint slot = stfp->num_inputs++;
438
439          stfp->input_to_index[attr] = slot;
440
441          switch (attr) {
442          case FRAG_ATTRIB_WPOS:
443             stfp->input_semantic_name[slot] = TGSI_SEMANTIC_POSITION;
444             stfp->input_semantic_index[slot] = 0;
445             stfp->interp_mode[slot] = TGSI_INTERPOLATE_LINEAR;
446             break;
447          case FRAG_ATTRIB_COL0:
448             stfp->input_semantic_name[slot] = TGSI_SEMANTIC_COLOR;
449             stfp->input_semantic_index[slot] = 0;
450             stfp->interp_mode[slot] = TGSI_INTERPOLATE_LINEAR;
451             break;
452          case FRAG_ATTRIB_COL1:
453             stfp->input_semantic_name[slot] = TGSI_SEMANTIC_COLOR;
454             stfp->input_semantic_index[slot] = 1;
455             stfp->interp_mode[slot] = TGSI_INTERPOLATE_LINEAR;
456             break;
457          case FRAG_ATTRIB_FOGC:
458             stfp->input_semantic_name[slot] = TGSI_SEMANTIC_FOG;
459             stfp->input_semantic_index[slot] = 0;
460             stfp->interp_mode[slot] = TGSI_INTERPOLATE_PERSPECTIVE;
461             break;
462          case FRAG_ATTRIB_FACE:
463             stfp->input_semantic_name[slot] = TGSI_SEMANTIC_FACE;
464             stfp->input_semantic_index[slot] = 0;
465             stfp->interp_mode[slot] = TGSI_INTERPOLATE_CONSTANT;
466             break;
467             /* In most cases, there is nothing special about these
468              * inputs, so adopt a convention to use the generic
469              * semantic name and the mesa FRAG_ATTRIB_ number as the
470              * index. 
471              * 
472              * All that is required is that the vertex shader labels
473              * its own outputs similarly, and that the vertex shader
474              * generates at least every output required by the
475              * fragment shader plus fixed-function hardware (such as
476              * BFC).
477              * 
478              * There is no requirement that semantic indexes start at
479              * zero or be restricted to a particular range -- nobody
480              * should be building tables based on semantic index.
481              */
482          case FRAG_ATTRIB_PNTC:
483          case FRAG_ATTRIB_TEX0:
484          case FRAG_ATTRIB_TEX1:
485          case FRAG_ATTRIB_TEX2:
486          case FRAG_ATTRIB_TEX3:
487          case FRAG_ATTRIB_TEX4:
488          case FRAG_ATTRIB_TEX5:
489          case FRAG_ATTRIB_TEX6:
490          case FRAG_ATTRIB_TEX7:
491          case FRAG_ATTRIB_VAR0:
492          default:
493             /* Actually, let's try and zero-base this just for
494              * readability of the generated TGSI.
495              */
496             assert(attr >= FRAG_ATTRIB_TEX0);
497             stfp->input_semantic_index[slot] = (attr - FRAG_ATTRIB_TEX0);
498             stfp->input_semantic_name[slot] = TGSI_SEMANTIC_GENERIC;
499             if (attr == FRAG_ATTRIB_PNTC)
500                stfp->interp_mode[slot] = TGSI_INTERPOLATE_LINEAR;
501             else
502                stfp->interp_mode[slot] = TGSI_INTERPOLATE_PERSPECTIVE;
503             break;
504          }
505       }
506       else {
507          stfp->input_to_index[attr] = -1;
508       }
509    }
510
511    /*
512     * Semantics and mapping for outputs
513     */
514    {
515       uint numColors = 0;
516       GLbitfield64 outputsWritten = stfp->Base.Base.OutputsWritten;
517
518       /* if z is written, emit that first */
519       if (outputsWritten & BITFIELD64_BIT(FRAG_RESULT_DEPTH)) {
520          stfp->output_semantic_name[stfp->num_outputs] = TGSI_SEMANTIC_POSITION;
521          stfp->output_semantic_index[stfp->num_outputs] = 0;
522          stfp->result_to_output[FRAG_RESULT_DEPTH] = stfp->num_outputs;
523          stfp->num_outputs++;
524          outputsWritten &= ~(1 << FRAG_RESULT_DEPTH);
525       }
526
527       if (outputsWritten & BITFIELD64_BIT(FRAG_RESULT_STENCIL)) {
528          stfp->output_semantic_name[stfp->num_outputs] = TGSI_SEMANTIC_STENCIL;
529          stfp->output_semantic_index[stfp->num_outputs] = 0;
530          stfp->result_to_output[FRAG_RESULT_STENCIL] = stfp->num_outputs;
531          stfp->num_outputs++;
532          outputsWritten &= ~(1 << FRAG_RESULT_STENCIL);
533       }
534
535       /* handle remaning outputs (color) */
536       for (attr = 0; attr < FRAG_RESULT_MAX; attr++) {
537          if (outputsWritten & BITFIELD64_BIT(attr)) {
538             switch (attr) {
539             case FRAG_RESULT_DEPTH:
540             case FRAG_RESULT_STENCIL:
541                /* handled above */
542                assert(0);
543                break;
544             case FRAG_RESULT_COLOR:
545                write_all = GL_TRUE; /* fallthrough */
546             default:
547                assert(attr == FRAG_RESULT_COLOR ||
548                       (FRAG_RESULT_DATA0 <= attr && attr < FRAG_RESULT_MAX));
549                stfp->output_semantic_name[stfp->num_outputs] = TGSI_SEMANTIC_COLOR;
550                stfp->output_semantic_index[stfp->num_outputs] = numColors;
551                stfp->result_to_output[attr] = stfp->num_outputs;
552                numColors++;
553                break;
554             }
555
556             stfp->num_outputs++;
557          }
558       }
559    }
560    
561    return write_all;
562 }
563
564
565 /**
566  * Translate a Mesa fragment shader into a TGSI shader using extra info in
567  * the key.
568  * \return  new fragment program variant
569  */
570 static struct st_fp_variant *
571 st_translate_fragment_program(struct st_context *st,
572                               struct st_fragment_program *stfp,
573                               const struct st_fp_variant_key *key)
574 {
575    struct pipe_context *pipe = st->pipe;
576    struct st_fp_variant *variant = CALLOC_STRUCT(st_fp_variant);
577    GLboolean deleteFP = GL_FALSE;
578
579    if (!variant)
580       return NULL;
581
582    assert(!(key->bitmap && key->drawpixels));
583
584 #if FEATURE_drawpix
585    if (key->bitmap) {
586       /* glBitmap drawing */
587       struct gl_fragment_program *fp; /* we free this temp program below */
588
589       st_make_bitmap_fragment_program(st, &stfp->Base,
590                                       &fp, &variant->bitmap_sampler);
591
592       variant->parameters = _mesa_clone_parameter_list(fp->Base.Parameters);
593       stfp = st_fragment_program(fp);
594       deleteFP = GL_TRUE;
595    }
596    else if (key->drawpixels) {
597       /* glDrawPixels drawing */
598       struct gl_fragment_program *fp; /* we free this temp program below */
599
600       if (key->drawpixels_z || key->drawpixels_stencil) {
601          fp = st_make_drawpix_z_stencil_program(st, key->drawpixels_z,
602                                                 key->drawpixels_stencil);
603       }
604       else {
605          /* RGBA */
606          st_make_drawpix_fragment_program(st, &stfp->Base, &fp);
607          variant->parameters = _mesa_clone_parameter_list(fp->Base.Parameters);
608          deleteFP = GL_TRUE;
609       }
610       stfp = st_fragment_program(fp);
611    }
612 #endif
613
614    if (!stfp->tgsi.tokens) {
615       /* need to translate Mesa instructions to TGSI now */
616       struct ureg_program *ureg;
617       GLboolean write_all = st_prepare_fragment_program(st->ctx, stfp);
618       
619       if (!stfp->glsl_to_tgsi)
620          _mesa_remove_output_reads(&stfp->Base.Base, PROGRAM_OUTPUT);
621
622       ureg = ureg_create( TGSI_PROCESSOR_FRAGMENT );
623       if (ureg == NULL)
624          return NULL;
625
626       if (ST_DEBUG & DEBUG_MESA) {
627          _mesa_print_program(&stfp->Base.Base);
628          _mesa_print_program_parameters(st->ctx, &stfp->Base.Base);
629          debug_printf("\n");
630       }
631       if (write_all == GL_TRUE)
632          ureg_property_fs_color0_writes_all_cbufs(ureg, 1);
633
634       if (stfp->glsl_to_tgsi)
635          st_translate_program(st->ctx,
636                               TGSI_PROCESSOR_FRAGMENT,
637                               ureg,
638                               stfp->glsl_to_tgsi,
639                               &stfp->Base.Base,
640                               /* inputs */
641                               stfp->num_inputs,
642                               stfp->input_to_index,
643                               stfp->input_semantic_name,
644                               stfp->input_semantic_index,
645                               stfp->interp_mode,
646                               /* outputs */
647                               stfp->num_outputs,
648                               stfp->result_to_output,
649                               stfp->output_semantic_name,
650                               stfp->output_semantic_index, FALSE );
651       else
652          st_translate_mesa_program(st->ctx,
653                                    TGSI_PROCESSOR_FRAGMENT,
654                                    ureg,
655                                    &stfp->Base.Base,
656                                    /* inputs */
657                                    stfp->num_inputs,
658                                    stfp->input_to_index,
659                                    stfp->input_semantic_name,
660                                    stfp->input_semantic_index,
661                                    stfp->interp_mode,
662                                    /* outputs */
663                                    stfp->num_outputs,
664                                    stfp->result_to_output,
665                                    stfp->output_semantic_name,
666                                    stfp->output_semantic_index, FALSE );
667
668       stfp->tgsi.tokens = ureg_get_tokens( ureg, NULL );
669       ureg_destroy( ureg );
670    }
671
672    /* fill in variant */
673    variant->driver_shader = pipe->create_fs_state(pipe, &stfp->tgsi);
674    variant->key = *key;
675
676    if (ST_DEBUG & DEBUG_TGSI) {
677       tgsi_dump( stfp->tgsi.tokens, 0/*TGSI_DUMP_VERBOSE*/ );
678       debug_printf("\n");
679    }
680
681    if (deleteFP) {
682       /* Free the temporary program made above */
683       struct gl_fragment_program *fp = &stfp->Base;
684       _mesa_reference_fragprog(st->ctx, &fp, NULL);
685    }
686
687    return variant;
688 }
689
690
691 /**
692  * Translate fragment program if needed.
693  */
694 struct st_fp_variant *
695 st_get_fp_variant(struct st_context *st,
696                   struct st_fragment_program *stfp,
697                   const struct st_fp_variant_key *key)
698 {
699    struct st_fp_variant *fpv;
700
701    /* Search for existing variant */
702    for (fpv = stfp->variants; fpv; fpv = fpv->next) {
703       if (memcmp(&fpv->key, key, sizeof(*key)) == 0) {
704          break;
705       }
706    }
707
708    if (!fpv) {
709       /* create new */
710       fpv = st_translate_fragment_program(st, stfp, key);
711       if (fpv) {
712          /* insert into list */
713          fpv->next = stfp->variants;
714          stfp->variants = fpv;
715       }
716    }
717
718    return fpv;
719 }
720
721
722 /**
723  * Translate a geometry program to create a new variant.
724  */
725 static struct st_gp_variant *
726 st_translate_geometry_program(struct st_context *st,
727                               struct st_geometry_program *stgp,
728                               const struct st_gp_variant_key *key)
729 {
730    GLuint inputMapping[GEOM_ATTRIB_MAX];
731    GLuint outputMapping[GEOM_RESULT_MAX];
732    struct pipe_context *pipe = st->pipe;
733    GLuint attr;
734    const GLbitfield inputsRead = stgp->Base.Base.InputsRead;
735    GLuint vslot = 0;
736    GLuint num_generic = 0;
737
738    uint gs_num_inputs = 0;
739    uint gs_builtin_inputs = 0;
740    uint gs_array_offset = 0;
741
742    ubyte gs_output_semantic_name[PIPE_MAX_SHADER_OUTPUTS];
743    ubyte gs_output_semantic_index[PIPE_MAX_SHADER_OUTPUTS];
744    uint gs_num_outputs = 0;
745
746    GLint i;
747    GLuint maxSlot = 0;
748    struct ureg_program *ureg;
749
750    struct st_gp_variant *gpv;
751
752    gpv = CALLOC_STRUCT(st_gp_variant);
753    if (!gpv)
754       return NULL;
755
756    _mesa_remove_output_reads(&stgp->Base.Base, PROGRAM_OUTPUT);
757    _mesa_remove_output_reads(&stgp->Base.Base, PROGRAM_VARYING);
758
759    ureg = ureg_create( TGSI_PROCESSOR_GEOMETRY );
760    if (ureg == NULL) {
761       FREE(gpv);
762       return NULL;
763    }
764
765    /* which vertex output goes to the first geometry input */
766    vslot = 0;
767
768    memset(inputMapping, 0, sizeof(inputMapping));
769    memset(outputMapping, 0, sizeof(outputMapping));
770
771    /*
772     * Convert Mesa program inputs to TGSI input register semantics.
773     */
774    for (attr = 0; attr < GEOM_ATTRIB_MAX; attr++) {
775       if (inputsRead & (1 << attr)) {
776          const GLuint slot = gs_num_inputs;
777
778          gs_num_inputs++;
779
780          inputMapping[attr] = slot;
781
782          stgp->input_map[slot + gs_array_offset] = vslot - gs_builtin_inputs;
783          stgp->input_to_index[attr] = vslot;
784          stgp->index_to_input[vslot] = attr;
785          ++vslot;
786
787          if (attr != GEOM_ATTRIB_PRIMITIVE_ID) {
788             gs_array_offset += 2;
789          } else
790             ++gs_builtin_inputs;
791
792 #if 0
793          debug_printf("input map at %d = %d\n",
794                       slot + gs_array_offset, stgp->input_map[slot + gs_array_offset]);
795 #endif
796
797          switch (attr) {
798          case GEOM_ATTRIB_PRIMITIVE_ID:
799             stgp->input_semantic_name[slot] = TGSI_SEMANTIC_PRIMID;
800             stgp->input_semantic_index[slot] = 0;
801             break;
802          case GEOM_ATTRIB_POSITION:
803             stgp->input_semantic_name[slot] = TGSI_SEMANTIC_POSITION;
804             stgp->input_semantic_index[slot] = 0;
805             break;
806          case GEOM_ATTRIB_COLOR0:
807             stgp->input_semantic_name[slot] = TGSI_SEMANTIC_COLOR;
808             stgp->input_semantic_index[slot] = 0;
809             break;
810          case GEOM_ATTRIB_COLOR1:
811             stgp->input_semantic_name[slot] = TGSI_SEMANTIC_COLOR;
812             stgp->input_semantic_index[slot] = 1;
813             break;
814          case GEOM_ATTRIB_FOG_FRAG_COORD:
815             stgp->input_semantic_name[slot] = TGSI_SEMANTIC_FOG;
816             stgp->input_semantic_index[slot] = 0;
817             break;
818          case GEOM_ATTRIB_TEX_COORD:
819             stgp->input_semantic_name[slot] = TGSI_SEMANTIC_GENERIC;
820             stgp->input_semantic_index[slot] = num_generic++;
821             break;
822          case GEOM_ATTRIB_VAR0:
823             /* fall-through */
824          default:
825             stgp->input_semantic_name[slot] = TGSI_SEMANTIC_GENERIC;
826             stgp->input_semantic_index[slot] = num_generic++;
827          }
828       }
829    }
830
831    /* initialize output semantics to defaults */
832    for (i = 0; i < PIPE_MAX_SHADER_OUTPUTS; i++) {
833       gs_output_semantic_name[i] = TGSI_SEMANTIC_GENERIC;
834       gs_output_semantic_index[i] = 0;
835    }
836
837    num_generic = 0;
838    /*
839     * Determine number of outputs, the (default) output register
840     * mapping and the semantic information for each output.
841     */
842    for (attr = 0; attr < GEOM_RESULT_MAX; attr++) {
843       if (stgp->Base.Base.OutputsWritten & BITFIELD64_BIT(attr)) {
844          GLuint slot;
845
846          slot = gs_num_outputs;
847          gs_num_outputs++;
848          outputMapping[attr] = slot;
849
850          switch (attr) {
851          case GEOM_RESULT_POS:
852             assert(slot == 0);
853             gs_output_semantic_name[slot] = TGSI_SEMANTIC_POSITION;
854             gs_output_semantic_index[slot] = 0;
855             break;
856          case GEOM_RESULT_COL0:
857             gs_output_semantic_name[slot] = TGSI_SEMANTIC_COLOR;
858             gs_output_semantic_index[slot] = 0;
859             break;
860          case GEOM_RESULT_COL1:
861             gs_output_semantic_name[slot] = TGSI_SEMANTIC_COLOR;
862             gs_output_semantic_index[slot] = 1;
863             break;
864          case GEOM_RESULT_SCOL0:
865             gs_output_semantic_name[slot] = TGSI_SEMANTIC_BCOLOR;
866             gs_output_semantic_index[slot] = 0;
867             break;
868          case GEOM_RESULT_SCOL1:
869             gs_output_semantic_name[slot] = TGSI_SEMANTIC_BCOLOR;
870             gs_output_semantic_index[slot] = 1;
871             break;
872          case GEOM_RESULT_FOGC:
873             gs_output_semantic_name[slot] = TGSI_SEMANTIC_FOG;
874             gs_output_semantic_index[slot] = 0;
875             break;
876          case GEOM_RESULT_PSIZ:
877             gs_output_semantic_name[slot] = TGSI_SEMANTIC_PSIZE;
878             gs_output_semantic_index[slot] = 0;
879             break;
880          case GEOM_RESULT_TEX0:
881          case GEOM_RESULT_TEX1:
882          case GEOM_RESULT_TEX2:
883          case GEOM_RESULT_TEX3:
884          case GEOM_RESULT_TEX4:
885          case GEOM_RESULT_TEX5:
886          case GEOM_RESULT_TEX6:
887          case GEOM_RESULT_TEX7:
888             /* fall-through */
889          case GEOM_RESULT_VAR0:
890             /* fall-through */
891          default:
892             assert(slot < Elements(gs_output_semantic_name));
893             /* use default semantic info */
894             gs_output_semantic_name[slot] = TGSI_SEMANTIC_GENERIC;
895             gs_output_semantic_index[slot] = num_generic++;
896          }
897       }
898    }
899
900    assert(gs_output_semantic_name[0] == TGSI_SEMANTIC_POSITION);
901
902    /* find max output slot referenced to compute gs_num_outputs */
903    for (attr = 0; attr < GEOM_RESULT_MAX; attr++) {
904       if (outputMapping[attr] != ~0 && outputMapping[attr] > maxSlot)
905          maxSlot = outputMapping[attr];
906    }
907    gs_num_outputs = maxSlot + 1;
908
909 #if 0 /* debug */
910    {
911       GLuint i;
912       printf("outputMapping? %d\n", outputMapping ? 1 : 0);
913       if (outputMapping) {
914          printf("attr -> slot\n");
915          for (i = 0; i < 16;  i++) {
916             printf(" %2d       %3d\n", i, outputMapping[i]);
917          }
918       }
919       printf("slot    sem_name  sem_index\n");
920       for (i = 0; i < gs_num_outputs; i++) {
921          printf(" %2d         %d         %d\n",
922                 i,
923                 gs_output_semantic_name[i],
924                 gs_output_semantic_index[i]);
925       }
926    }
927 #endif
928
929    /* free old shader state, if any */
930    if (stgp->tgsi.tokens) {
931       st_free_tokens(stgp->tgsi.tokens);
932       stgp->tgsi.tokens = NULL;
933    }
934
935    ureg_property_gs_input_prim(ureg, stgp->Base.InputType);
936    ureg_property_gs_output_prim(ureg, stgp->Base.OutputType);
937    ureg_property_gs_max_vertices(ureg, stgp->Base.VerticesOut);
938
939    st_translate_mesa_program(st->ctx,
940                              TGSI_PROCESSOR_GEOMETRY,
941                              ureg,
942                              &stgp->Base.Base,
943                              /* inputs */
944                              gs_num_inputs,
945                              inputMapping,
946                              stgp->input_semantic_name,
947                              stgp->input_semantic_index,
948                              NULL,
949                              /* outputs */
950                              gs_num_outputs,
951                              outputMapping,
952                              gs_output_semantic_name,
953                              gs_output_semantic_index,
954                              FALSE);
955
956    stgp->num_inputs = gs_num_inputs;
957    stgp->tgsi.tokens = ureg_get_tokens( ureg, NULL );
958    ureg_destroy( ureg );
959
960    /* fill in new variant */
961    gpv->driver_shader = pipe->create_gs_state(pipe, &stgp->tgsi);
962    gpv->key = *key;
963
964    if ((ST_DEBUG & DEBUG_TGSI) && (ST_DEBUG & DEBUG_MESA)) {
965       _mesa_print_program(&stgp->Base.Base);
966       debug_printf("\n");
967    }
968
969    if (ST_DEBUG & DEBUG_TGSI) {
970       tgsi_dump(stgp->tgsi.tokens, 0);
971       debug_printf("\n");
972    }
973
974    return gpv;
975 }
976
977
978 /**
979  * Get/create geometry program variant.
980  */
981 struct st_gp_variant *
982 st_get_gp_variant(struct st_context *st,
983                   struct st_geometry_program *stgp,
984                   const struct st_gp_variant_key *key)
985 {
986    struct st_gp_variant *gpv;
987
988    /* Search for existing variant */
989    for (gpv = stgp->variants; gpv; gpv = gpv->next) {
990       if (memcmp(&gpv->key, key, sizeof(*key)) == 0) {
991          break;
992       }
993    }
994
995    if (!gpv) {
996       /* create new */
997       gpv = st_translate_geometry_program(st, stgp, key);
998       if (gpv) {
999          /* insert into list */
1000          gpv->next = stgp->variants;
1001          stgp->variants = gpv;
1002       }
1003    }
1004
1005    return gpv;
1006 }
1007
1008
1009
1010
1011 /**
1012  * Debug- print current shader text
1013  */
1014 void
1015 st_print_shaders(struct gl_context *ctx)
1016 {
1017    struct gl_shader_program *shProg[3] = {
1018       ctx->Shader.CurrentVertexProgram,
1019       ctx->Shader.CurrentGeometryProgram,
1020       ctx->Shader.CurrentFragmentProgram,
1021    };
1022    unsigned j;
1023
1024    for (j = 0; j < 3; j++) {
1025       unsigned i;
1026
1027       if (shProg[j] == NULL)
1028          continue;
1029
1030       for (i = 0; i < shProg[j]->NumShaders; i++) {
1031          struct gl_shader *sh;
1032
1033          switch (shProg[j]->Shaders[i]->Type) {
1034          case GL_VERTEX_SHADER:
1035             sh = (i != 0) ? NULL : shProg[j]->Shaders[i];
1036             break;
1037          case GL_GEOMETRY_SHADER_ARB:
1038             sh = (i != 1) ? NULL : shProg[j]->Shaders[i];
1039             break;
1040          case GL_FRAGMENT_SHADER:
1041             sh = (i != 2) ? NULL : shProg[j]->Shaders[i];
1042             break;
1043          default:
1044             assert(0);
1045             sh = NULL;
1046             break;
1047          }
1048
1049          if (sh != NULL) {
1050             printf("GLSL shader %u of %u:\n", i, shProg[j]->NumShaders);
1051             printf("%s\n", sh->Source);
1052          }
1053       }
1054    }
1055 }
1056
1057
1058 /**
1059  * Vert/Geom/Frag programs have per-context variants.  Free all the
1060  * variants attached to the given program which match the given context.
1061  */
1062 static void
1063 destroy_program_variants(struct st_context *st, struct gl_program *program)
1064 {
1065    if (!program)
1066       return;
1067
1068    switch (program->Target) {
1069    case GL_VERTEX_PROGRAM_ARB:
1070       {
1071          struct st_vertex_program *stvp = (struct st_vertex_program *) program;
1072          struct st_vp_variant *vpv, **prevPtr = &stvp->variants;
1073
1074          for (vpv = stvp->variants; vpv; ) {
1075             struct st_vp_variant *next = vpv->next;
1076             if (vpv->key.st == st) {
1077                /* unlink from list */
1078                *prevPtr = next;
1079                /* destroy this variant */
1080                delete_vp_variant(st, vpv);
1081             }
1082             else {
1083                prevPtr = &vpv->next;
1084             }
1085             vpv = next;
1086          }
1087       }
1088       break;
1089    case GL_FRAGMENT_PROGRAM_ARB:
1090       {
1091          struct st_fragment_program *stfp =
1092             (struct st_fragment_program *) program;
1093          struct st_fp_variant *fpv, **prevPtr = &stfp->variants;
1094
1095          for (fpv = stfp->variants; fpv; ) {
1096             struct st_fp_variant *next = fpv->next;
1097             if (fpv->key.st == st) {
1098                /* unlink from list */
1099                *prevPtr = next;
1100                /* destroy this variant */
1101                delete_fp_variant(st, fpv);
1102             }
1103             else {
1104                prevPtr = &fpv->next;
1105             }
1106             fpv = next;
1107          }
1108       }
1109       break;
1110    case MESA_GEOMETRY_PROGRAM:
1111       {
1112          struct st_geometry_program *stgp =
1113             (struct st_geometry_program *) program;
1114          struct st_gp_variant *gpv, **prevPtr = &stgp->variants;
1115
1116          for (gpv = stgp->variants; gpv; ) {
1117             struct st_gp_variant *next = gpv->next;
1118             if (gpv->key.st == st) {
1119                /* unlink from list */
1120                *prevPtr = next;
1121                /* destroy this variant */
1122                delete_gp_variant(st, gpv);
1123             }
1124             else {
1125                prevPtr = &gpv->next;
1126             }
1127             gpv = next;
1128          }
1129       }
1130       break;
1131    default:
1132       _mesa_problem(NULL, "Unexpected program target 0x%x in "
1133                     "destroy_program_variants_cb()", program->Target);
1134    }
1135 }
1136
1137
1138 /**
1139  * Callback for _mesa_HashWalk.  Free all the shader's program variants
1140  * which match the given context.
1141  */
1142 static void
1143 destroy_shader_program_variants_cb(GLuint key, void *data, void *userData)
1144 {
1145    struct st_context *st = (struct st_context *) userData;
1146    struct gl_shader *shader = (struct gl_shader *) data;
1147
1148    switch (shader->Type) {
1149    case GL_SHADER_PROGRAM_MESA:
1150       {
1151          struct gl_shader_program *shProg = (struct gl_shader_program *) data;
1152          GLuint i;
1153
1154          for (i = 0; i < shProg->NumShaders; i++) {
1155             destroy_program_variants(st, shProg->Shaders[i]->Program);
1156          }
1157
1158          destroy_program_variants(st, (struct gl_program *)
1159                                   shProg->VertexProgram);
1160          destroy_program_variants(st, (struct gl_program *)
1161                                   shProg->FragmentProgram);
1162          destroy_program_variants(st, (struct gl_program *)
1163                                   shProg->GeometryProgram);
1164       }
1165       break;
1166    case GL_VERTEX_SHADER:
1167    case GL_FRAGMENT_SHADER:
1168    case GL_GEOMETRY_SHADER:
1169       {
1170          destroy_program_variants(st, shader->Program);
1171       }
1172       break;
1173    default:
1174       assert(0);
1175    }
1176 }
1177
1178
1179 /**
1180  * Callback for _mesa_HashWalk.  Free all the program variants which match
1181  * the given context.
1182  */
1183 static void
1184 destroy_program_variants_cb(GLuint key, void *data, void *userData)
1185 {
1186    struct st_context *st = (struct st_context *) userData;
1187    struct gl_program *program = (struct gl_program *) data;
1188    destroy_program_variants(st, program);
1189 }
1190
1191
1192 /**
1193  * Walk over all shaders and programs to delete any variants which
1194  * belong to the given context.
1195  * This is called during context tear-down.
1196  */
1197 void
1198 st_destroy_program_variants(struct st_context *st)
1199 {
1200    /* ARB vert/frag program */
1201    _mesa_HashWalk(st->ctx->Shared->Programs,
1202                   destroy_program_variants_cb, st);
1203
1204    /* GLSL vert/frag/geom shaders */
1205    _mesa_HashWalk(st->ctx->Shared->ShaderObjects,
1206                   destroy_shader_program_variants_cb, st);
1207 }