re PR tree-optimization/60902 (ffmpeg built with gcc 4.9 RC produces incorrect flac...
[platform/upstream/gcc.git] / gcc / tree-ssa-threadedge.c
1 /* SSA Jump Threading
2    Copyright (C) 2005-2014 Free Software Foundation, Inc.
3    Contributed by Jeff Law  <law@redhat.com>
4
5 This file is part of GCC.
6
7 GCC is free software; you can redistribute it and/or modify
8 it under the terms of the GNU General Public License as published by
9 the Free Software Foundation; either version 3, or (at your option)
10 any later version.
11
12 GCC is distributed in the hope that it will be useful,
13 but WITHOUT ANY WARRANTY; without even the implied warranty of
14 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15 GNU General Public License for more details.
16
17 You should have received a copy of the GNU General Public License
18 along with GCC; see the file COPYING3.  If not see
19 <http://www.gnu.org/licenses/>.  */
20
21 #include "config.h"
22 #include "system.h"
23 #include "coretypes.h"
24 #include "tm.h"
25 #include "tree.h"
26 #include "flags.h"
27 #include "tm_p.h"
28 #include "basic-block.h"
29 #include "cfgloop.h"
30 #include "function.h"
31 #include "timevar.h"
32 #include "dumpfile.h"
33 #include "pointer-set.h"
34 #include "tree-ssa-alias.h"
35 #include "internal-fn.h"
36 #include "gimple-expr.h"
37 #include "is-a.h"
38 #include "gimple.h"
39 #include "gimple-iterator.h"
40 #include "gimple-ssa.h"
41 #include "tree-cfg.h"
42 #include "tree-phinodes.h"
43 #include "ssa-iterators.h"
44 #include "stringpool.h"
45 #include "tree-ssanames.h"
46 #include "tree-ssa-propagate.h"
47 #include "tree-ssa-threadupdate.h"
48 #include "langhooks.h"
49 #include "params.h"
50 #include "tree-ssa-threadedge.h"
51
52 /* To avoid code explosion due to jump threading, we limit the
53    number of statements we are going to copy.  This variable
54    holds the number of statements currently seen that we'll have
55    to copy as part of the jump threading process.  */
56 static int stmt_count;
57
58 /* Array to record value-handles per SSA_NAME.  */
59 vec<tree> ssa_name_values;
60
61 /* Set the value for the SSA name NAME to VALUE.  */
62
63 void
64 set_ssa_name_value (tree name, tree value)
65 {
66   if (SSA_NAME_VERSION (name) >= ssa_name_values.length ())
67     ssa_name_values.safe_grow_cleared (SSA_NAME_VERSION (name) + 1);
68   if (value && TREE_OVERFLOW_P (value))
69     value = drop_tree_overflow (value);
70   ssa_name_values[SSA_NAME_VERSION (name)] = value;
71 }
72
73 /* Initialize the per SSA_NAME value-handles array.  Returns it.  */
74 void
75 threadedge_initialize_values (void)
76 {
77   gcc_assert (!ssa_name_values.exists ());
78   ssa_name_values.create (num_ssa_names);
79 }
80
81 /* Free the per SSA_NAME value-handle array.  */
82 void
83 threadedge_finalize_values (void)
84 {
85   ssa_name_values.release ();
86 }
87
88 /* Return TRUE if we may be able to thread an incoming edge into
89    BB to an outgoing edge from BB.  Return FALSE otherwise.  */
90
91 bool
92 potentially_threadable_block (basic_block bb)
93 {
94   gimple_stmt_iterator gsi;
95
96   /* If BB has a single successor or a single predecessor, then
97      there is no threading opportunity.  */
98   if (single_succ_p (bb) || single_pred_p (bb))
99     return false;
100
101   /* If BB does not end with a conditional, switch or computed goto,
102      then there is no threading opportunity.  */
103   gsi = gsi_last_bb (bb);
104   if (gsi_end_p (gsi)
105       || ! gsi_stmt (gsi)
106       || (gimple_code (gsi_stmt (gsi)) != GIMPLE_COND
107           && gimple_code (gsi_stmt (gsi)) != GIMPLE_GOTO
108           && gimple_code (gsi_stmt (gsi)) != GIMPLE_SWITCH))
109     return false;
110
111   return true;
112 }
113
114 /* Return the LHS of any ASSERT_EXPR where OP appears as the first
115    argument to the ASSERT_EXPR and in which the ASSERT_EXPR dominates
116    BB.  If no such ASSERT_EXPR is found, return OP.  */
117
118 static tree
119 lhs_of_dominating_assert (tree op, basic_block bb, gimple stmt)
120 {
121   imm_use_iterator imm_iter;
122   gimple use_stmt;
123   use_operand_p use_p;
124
125   FOR_EACH_IMM_USE_FAST (use_p, imm_iter, op)
126     {
127       use_stmt = USE_STMT (use_p);
128       if (use_stmt != stmt
129           && gimple_assign_single_p (use_stmt)
130           && TREE_CODE (gimple_assign_rhs1 (use_stmt)) == ASSERT_EXPR
131           && TREE_OPERAND (gimple_assign_rhs1 (use_stmt), 0) == op
132           && dominated_by_p (CDI_DOMINATORS, bb, gimple_bb (use_stmt)))
133         {
134           return gimple_assign_lhs (use_stmt);
135         }
136     }
137   return op;
138 }
139
140 /* We record temporary equivalences created by PHI nodes or
141    statements within the target block.  Doing so allows us to
142    identify more jump threading opportunities, even in blocks
143    with side effects.
144
145    We keep track of those temporary equivalences in a stack
146    structure so that we can unwind them when we're done processing
147    a particular edge.  This routine handles unwinding the data
148    structures.  */
149
150 static void
151 remove_temporary_equivalences (vec<tree> *stack)
152 {
153   while (stack->length () > 0)
154     {
155       tree prev_value, dest;
156
157       dest = stack->pop ();
158
159       /* A NULL value indicates we should stop unwinding, otherwise
160          pop off the next entry as they're recorded in pairs.  */
161       if (dest == NULL)
162         break;
163
164       prev_value = stack->pop ();
165       set_ssa_name_value (dest, prev_value);
166     }
167 }
168
169 /* Record a temporary equivalence, saving enough information so that
170    we can restore the state of recorded equivalences when we're
171    done processing the current edge.  */
172
173 static void
174 record_temporary_equivalence (tree x, tree y, vec<tree> *stack)
175 {
176   tree prev_x = SSA_NAME_VALUE (x);
177
178   /* Y may be NULL if we are invalidating entries in the table.  */
179   if (y && TREE_CODE (y) == SSA_NAME)
180     {
181       tree tmp = SSA_NAME_VALUE (y);
182       y = tmp ? tmp : y;
183     }
184
185   set_ssa_name_value (x, y);
186   stack->reserve (2);
187   stack->quick_push (prev_x);
188   stack->quick_push (x);
189 }
190
191 /* Record temporary equivalences created by PHIs at the target of the
192    edge E.  Record unwind information for the equivalences onto STACK.
193
194    If a PHI which prevents threading is encountered, then return FALSE
195    indicating we should not thread this edge, else return TRUE. 
196
197    If SRC_MAP/DST_MAP exist, then mark the source and destination SSA_NAMEs
198    of any equivalences recorded.  We use this to make invalidation after
199    traversing back edges less painful.  */
200
201 static bool
202 record_temporary_equivalences_from_phis (edge e, vec<tree> *stack,
203                                          bool backedge_seen,
204                                          bitmap src_map, bitmap dst_map)
205 {
206   gimple_stmt_iterator gsi;
207
208   /* Each PHI creates a temporary equivalence, record them.
209      These are context sensitive equivalences and will be removed
210      later.  */
211   for (gsi = gsi_start_phis (e->dest); !gsi_end_p (gsi); gsi_next (&gsi))
212     {
213       gimple phi = gsi_stmt (gsi);
214       tree src = PHI_ARG_DEF_FROM_EDGE (phi, e);
215       tree dst = gimple_phi_result (phi);
216
217       /* If the desired argument is not the same as this PHI's result
218          and it is set by a PHI in E->dest, then we can not thread
219          through E->dest.  */
220       if (src != dst
221           && TREE_CODE (src) == SSA_NAME
222           && gimple_code (SSA_NAME_DEF_STMT (src)) == GIMPLE_PHI
223           && gimple_bb (SSA_NAME_DEF_STMT (src)) == e->dest)
224         return false;
225
226       /* We consider any non-virtual PHI as a statement since it
227          count result in a constant assignment or copy operation.  */
228       if (!virtual_operand_p (dst))
229         stmt_count++;
230
231       record_temporary_equivalence (dst, src, stack);
232
233       /* If we have crossed a backedge, then start recording equivalences
234          we might need to invalidate.  */
235       if (backedge_seen && TREE_CODE (src) == SSA_NAME)
236         {
237           bitmap_set_bit (src_map, SSA_NAME_VERSION (src));
238           bitmap_set_bit (dst_map, SSA_NAME_VERSION (dst));
239         }
240     }
241   return true;
242 }
243
244 /* Fold the RHS of an assignment statement and return it as a tree.
245    May return NULL_TREE if no simplification is possible.  */
246
247 static tree
248 fold_assignment_stmt (gimple stmt)
249 {
250   enum tree_code subcode = gimple_assign_rhs_code (stmt);
251
252   switch (get_gimple_rhs_class (subcode))
253     {
254     case GIMPLE_SINGLE_RHS:
255       return fold (gimple_assign_rhs1 (stmt));
256
257     case GIMPLE_UNARY_RHS:
258       {
259         tree lhs = gimple_assign_lhs (stmt);
260         tree op0 = gimple_assign_rhs1 (stmt);
261         return fold_unary (subcode, TREE_TYPE (lhs), op0);
262       }
263
264     case GIMPLE_BINARY_RHS:
265       {
266         tree lhs = gimple_assign_lhs (stmt);
267         tree op0 = gimple_assign_rhs1 (stmt);
268         tree op1 = gimple_assign_rhs2 (stmt);
269         return fold_binary (subcode, TREE_TYPE (lhs), op0, op1);
270       }
271
272     case GIMPLE_TERNARY_RHS:
273       {
274         tree lhs = gimple_assign_lhs (stmt);
275         tree op0 = gimple_assign_rhs1 (stmt);
276         tree op1 = gimple_assign_rhs2 (stmt);
277         tree op2 = gimple_assign_rhs3 (stmt);
278
279         /* Sadly, we have to handle conditional assignments specially
280            here, because fold expects all the operands of an expression
281            to be folded before the expression itself is folded, but we
282            can't just substitute the folded condition here.  */
283         if (gimple_assign_rhs_code (stmt) == COND_EXPR)
284           op0 = fold (op0);
285
286         return fold_ternary (subcode, TREE_TYPE (lhs), op0, op1, op2);
287       }
288
289     default:
290       gcc_unreachable ();
291     }
292 }
293
294 /* A new value has been assigned to LHS.  If necessary, invalidate any
295    equivalences that are no longer valid.  */
296 static void
297 invalidate_equivalences (tree lhs, vec<tree> *stack,
298                          bitmap src_map, bitmap dst_map)
299 {
300   /* SRC_MAP contains the source SSA_NAMEs for equivalences created by PHI
301      nodes.  If an entry in SRC_MAP changes, there's some destination that
302      has been recorded as equivalent to the source and that equivalency
303      needs to be eliminated.  */
304   if (bitmap_bit_p (src_map, SSA_NAME_VERSION (lhs)))
305     {
306       unsigned int i;
307       bitmap_iterator bi;
308
309       /* We know that the LHS of STMT was used as the RHS in an equivalency
310          created by a PHI.  All the LHS of such PHIs were recorded into DST_MAP.
311          So we can iterate over them to see if any have the LHS of STMT as
312          an equivalence, and if so, remove the equivalence as it is no longer
313          valid.  */
314       EXECUTE_IF_SET_IN_BITMAP (dst_map, 0, i, bi)
315         {
316           if (SSA_NAME_VALUE (ssa_name (i)) == lhs)
317             record_temporary_equivalence (ssa_name (i), NULL_TREE, stack);
318         }
319     }
320 }
321
322 /* Try to simplify each statement in E->dest, ultimately leading to
323    a simplification of the COND_EXPR at the end of E->dest.
324
325    Record unwind information for temporary equivalences onto STACK.
326
327    Use SIMPLIFY (a pointer to a callback function) to further simplify
328    statements using pass specific information.
329
330    We might consider marking just those statements which ultimately
331    feed the COND_EXPR.  It's not clear if the overhead of bookkeeping
332    would be recovered by trying to simplify fewer statements.
333
334    If we are able to simplify a statement into the form
335    SSA_NAME = (SSA_NAME | gimple invariant), then we can record
336    a context sensitive equivalence which may help us simplify
337    later statements in E->dest.  */
338
339 static gimple
340 record_temporary_equivalences_from_stmts_at_dest (edge e,
341                                                   vec<tree> *stack,
342                                                   tree (*simplify) (gimple,
343                                                                     gimple),
344                                                   bool backedge_seen,
345                                                   bitmap src_map,
346                                                   bitmap dst_map)
347 {
348   gimple stmt = NULL;
349   gimple_stmt_iterator gsi;
350   int max_stmt_count;
351
352   max_stmt_count = PARAM_VALUE (PARAM_MAX_JUMP_THREAD_DUPLICATION_STMTS);
353
354   /* Walk through each statement in the block recording equivalences
355      we discover.  Note any equivalences we discover are context
356      sensitive (ie, are dependent on traversing E) and must be unwound
357      when we're finished processing E.  */
358   for (gsi = gsi_start_bb (e->dest); !gsi_end_p (gsi); gsi_next (&gsi))
359     {
360       tree cached_lhs = NULL;
361
362       stmt = gsi_stmt (gsi);
363
364       /* Ignore empty statements and labels.  */
365       if (gimple_code (stmt) == GIMPLE_NOP
366           || gimple_code (stmt) == GIMPLE_LABEL
367           || is_gimple_debug (stmt))
368         continue;
369
370       /* If the statement has volatile operands, then we assume we
371          can not thread through this block.  This is overly
372          conservative in some ways.  */
373       if (gimple_code (stmt) == GIMPLE_ASM && gimple_asm_volatile_p (stmt))
374         return NULL;
375
376       /* If duplicating this block is going to cause too much code
377          expansion, then do not thread through this block.  */
378       stmt_count++;
379       if (stmt_count > max_stmt_count)
380         return NULL;
381
382       /* If this is not a statement that sets an SSA_NAME to a new
383          value, then do not try to simplify this statement as it will
384          not simplify in any way that is helpful for jump threading.  */
385       if ((gimple_code (stmt) != GIMPLE_ASSIGN
386            || TREE_CODE (gimple_assign_lhs (stmt)) != SSA_NAME)
387           && (gimple_code (stmt) != GIMPLE_CALL
388               || gimple_call_lhs (stmt) == NULL_TREE
389               || TREE_CODE (gimple_call_lhs (stmt)) != SSA_NAME))
390         {
391           /* STMT might still have DEFS and we need to invalidate any known
392              equivalences for them.
393
394              Consider if STMT is a GIMPLE_ASM with one or more outputs that
395              feeds a conditional inside a loop.  We might derive an equivalence
396              due to the conditional.  */
397           tree op;
398           ssa_op_iter iter;
399
400           if (backedge_seen)
401             FOR_EACH_SSA_TREE_OPERAND (op, stmt, iter, SSA_OP_DEF)
402               {
403                 /* This call only invalidates equivalences created by
404                    PHI nodes.  This is by design to keep the cost of
405                    of invalidation reasonable.  */
406                 invalidate_equivalences (op, stack, src_map, dst_map);
407
408                 /* However, conditionals can imply values for real
409                    operands as well.  And those won't be recorded in the
410                    maps.  In fact, those equivalences may be recorded totally
411                    outside the threading code.  We can just create a new
412                    temporary NULL equivalence here.  */
413                 record_temporary_equivalence (op, NULL_TREE, stack);
414               }
415
416           continue;
417         }
418
419       /* The result of __builtin_object_size depends on all the arguments
420          of a phi node. Temporarily using only one edge produces invalid
421          results. For example
422
423          if (x < 6)
424            goto l;
425          else
426            goto l;
427
428          l:
429          r = PHI <&w[2].a[1](2), &a.a[6](3)>
430          __builtin_object_size (r, 0)
431
432          The result of __builtin_object_size is defined to be the maximum of
433          remaining bytes. If we use only one edge on the phi, the result will
434          change to be the remaining bytes for the corresponding phi argument.
435
436          Similarly for __builtin_constant_p:
437
438          r = PHI <1(2), 2(3)>
439          __builtin_constant_p (r)
440
441          Both PHI arguments are constant, but x ? 1 : 2 is still not
442          constant.  */
443
444       if (is_gimple_call (stmt))
445         {
446           tree fndecl = gimple_call_fndecl (stmt);
447           if (fndecl
448               && (DECL_FUNCTION_CODE (fndecl) == BUILT_IN_OBJECT_SIZE
449                   || DECL_FUNCTION_CODE (fndecl) == BUILT_IN_CONSTANT_P))
450             {
451               if (backedge_seen)
452                 {
453                   tree lhs = gimple_get_lhs (stmt);
454                   record_temporary_equivalence (lhs, NULL_TREE, stack);
455                   invalidate_equivalences (lhs, stack, src_map, dst_map);
456                 }
457               continue;
458             }
459         }
460
461       /* At this point we have a statement which assigns an RHS to an
462          SSA_VAR on the LHS.  We want to try and simplify this statement
463          to expose more context sensitive equivalences which in turn may
464          allow us to simplify the condition at the end of the loop.
465
466          Handle simple copy operations as well as implied copies from
467          ASSERT_EXPRs.  */
468       if (gimple_assign_single_p (stmt)
469           && TREE_CODE (gimple_assign_rhs1 (stmt)) == SSA_NAME)
470         cached_lhs = gimple_assign_rhs1 (stmt);
471       else if (gimple_assign_single_p (stmt)
472                && TREE_CODE (gimple_assign_rhs1 (stmt)) == ASSERT_EXPR)
473         cached_lhs = TREE_OPERAND (gimple_assign_rhs1 (stmt), 0);
474       else
475         {
476           /* A statement that is not a trivial copy or ASSERT_EXPR.
477              We're going to temporarily copy propagate the operands
478              and see if that allows us to simplify this statement.  */
479           tree *copy;
480           ssa_op_iter iter;
481           use_operand_p use_p;
482           unsigned int num, i = 0;
483
484           num = NUM_SSA_OPERANDS (stmt, (SSA_OP_USE | SSA_OP_VUSE));
485           copy = XCNEWVEC (tree, num);
486
487           /* Make a copy of the uses & vuses into USES_COPY, then cprop into
488              the operands.  */
489           FOR_EACH_SSA_USE_OPERAND (use_p, stmt, iter, SSA_OP_USE | SSA_OP_VUSE)
490             {
491               tree tmp = NULL;
492               tree use = USE_FROM_PTR (use_p);
493
494               copy[i++] = use;
495               if (TREE_CODE (use) == SSA_NAME)
496                 tmp = SSA_NAME_VALUE (use);
497               if (tmp)
498                 SET_USE (use_p, tmp);
499             }
500
501           /* Try to fold/lookup the new expression.  Inserting the
502              expression into the hash table is unlikely to help.  */
503           if (is_gimple_call (stmt))
504             cached_lhs = fold_call_stmt (stmt, false);
505           else
506             cached_lhs = fold_assignment_stmt (stmt);
507
508           if (!cached_lhs
509               || (TREE_CODE (cached_lhs) != SSA_NAME
510                   && !is_gimple_min_invariant (cached_lhs)))
511             cached_lhs = (*simplify) (stmt, stmt);
512
513           /* Restore the statement's original uses/defs.  */
514           i = 0;
515           FOR_EACH_SSA_USE_OPERAND (use_p, stmt, iter, SSA_OP_USE | SSA_OP_VUSE)
516             SET_USE (use_p, copy[i++]);
517
518           free (copy);
519         }
520
521       /* Record the context sensitive equivalence if we were able
522          to simplify this statement. 
523
524          If we have traversed a backedge at some point during threading,
525          then always enter something here.  Either a real equivalence, 
526          or a NULL_TREE equivalence which is effectively invalidation of
527          prior equivalences.  */
528       if (cached_lhs
529           && (TREE_CODE (cached_lhs) == SSA_NAME
530               || is_gimple_min_invariant (cached_lhs)))
531         record_temporary_equivalence (gimple_get_lhs (stmt), cached_lhs, stack);
532       else if (backedge_seen)
533         record_temporary_equivalence (gimple_get_lhs (stmt), NULL_TREE, stack);
534
535       if (backedge_seen)
536         invalidate_equivalences (gimple_get_lhs (stmt), stack,
537                                  src_map, dst_map);
538     }
539   return stmt;
540 }
541
542 /* Once we have passed a backedge in the CFG when threading, we do not want to
543    utilize edge equivalences for simplification purpose.  They are no longer
544    necessarily valid.  We use this callback rather than the ones provided by
545    DOM/VRP to achieve that effect.  */
546 static tree
547 dummy_simplify (gimple stmt1 ATTRIBUTE_UNUSED, gimple stmt2 ATTRIBUTE_UNUSED)
548 {
549   return NULL_TREE;
550 }
551
552 /* Simplify the control statement at the end of the block E->dest.
553
554    To avoid allocating memory unnecessarily, a scratch GIMPLE_COND
555    is available to use/clobber in DUMMY_COND.
556
557    Use SIMPLIFY (a pointer to a callback function) to further simplify
558    a condition using pass specific information.
559
560    Return the simplified condition or NULL if simplification could
561    not be performed.  */
562
563 static tree
564 simplify_control_stmt_condition (edge e,
565                                  gimple stmt,
566                                  gimple dummy_cond,
567                                  tree (*simplify) (gimple, gimple),
568                                  bool handle_dominating_asserts)
569 {
570   tree cond, cached_lhs;
571   enum gimple_code code = gimple_code (stmt);
572
573   /* For comparisons, we have to update both operands, then try
574      to simplify the comparison.  */
575   if (code == GIMPLE_COND)
576     {
577       tree op0, op1;
578       enum tree_code cond_code;
579
580       op0 = gimple_cond_lhs (stmt);
581       op1 = gimple_cond_rhs (stmt);
582       cond_code = gimple_cond_code (stmt);
583
584       /* Get the current value of both operands.  */
585       if (TREE_CODE (op0) == SSA_NAME)
586         {
587           tree tmp = SSA_NAME_VALUE (op0);
588           if (tmp)
589             op0 = tmp;
590         }
591
592       if (TREE_CODE (op1) == SSA_NAME)
593         {
594           tree tmp = SSA_NAME_VALUE (op1);
595           if (tmp)
596             op1 = tmp;
597         }
598
599       if (handle_dominating_asserts)
600         {
601           /* Now see if the operand was consumed by an ASSERT_EXPR
602              which dominates E->src.  If so, we want to replace the
603              operand with the LHS of the ASSERT_EXPR.  */
604           if (TREE_CODE (op0) == SSA_NAME)
605             op0 = lhs_of_dominating_assert (op0, e->src, stmt);
606
607           if (TREE_CODE (op1) == SSA_NAME)
608             op1 = lhs_of_dominating_assert (op1, e->src, stmt);
609         }
610
611       /* We may need to canonicalize the comparison.  For
612          example, op0 might be a constant while op1 is an
613          SSA_NAME.  Failure to canonicalize will cause us to
614          miss threading opportunities.  */
615       if (tree_swap_operands_p (op0, op1, false))
616         {
617           tree tmp;
618           cond_code = swap_tree_comparison (cond_code);
619           tmp = op0;
620           op0 = op1;
621           op1 = tmp;
622         }
623
624       /* Stuff the operator and operands into our dummy conditional
625          expression.  */
626       gimple_cond_set_code (dummy_cond, cond_code);
627       gimple_cond_set_lhs (dummy_cond, op0);
628       gimple_cond_set_rhs (dummy_cond, op1);
629
630       /* We absolutely do not care about any type conversions
631          we only care about a zero/nonzero value.  */
632       fold_defer_overflow_warnings ();
633
634       cached_lhs = fold_binary (cond_code, boolean_type_node, op0, op1);
635       if (cached_lhs)
636         while (CONVERT_EXPR_P (cached_lhs))
637           cached_lhs = TREE_OPERAND (cached_lhs, 0);
638
639       fold_undefer_overflow_warnings ((cached_lhs
640                                        && is_gimple_min_invariant (cached_lhs)),
641                                       stmt, WARN_STRICT_OVERFLOW_CONDITIONAL);
642
643       /* If we have not simplified the condition down to an invariant,
644          then use the pass specific callback to simplify the condition.  */
645       if (!cached_lhs
646           || !is_gimple_min_invariant (cached_lhs))
647         cached_lhs = (*simplify) (dummy_cond, stmt);
648
649       return cached_lhs;
650     }
651
652   if (code == GIMPLE_SWITCH)
653     cond = gimple_switch_index (stmt);
654   else if (code == GIMPLE_GOTO)
655     cond = gimple_goto_dest (stmt);
656   else
657     gcc_unreachable ();
658
659   /* We can have conditionals which just test the state of a variable
660      rather than use a relational operator.  These are simpler to handle.  */
661   if (TREE_CODE (cond) == SSA_NAME)
662     {
663       cached_lhs = cond;
664
665       /* Get the variable's current value from the equivalence chains.
666
667          It is possible to get loops in the SSA_NAME_VALUE chains
668          (consider threading the backedge of a loop where we have
669          a loop invariant SSA_NAME used in the condition.  */
670       if (cached_lhs
671           && TREE_CODE (cached_lhs) == SSA_NAME
672           && SSA_NAME_VALUE (cached_lhs))
673         cached_lhs = SSA_NAME_VALUE (cached_lhs);
674
675       /* If we're dominated by a suitable ASSERT_EXPR, then
676          update CACHED_LHS appropriately.  */
677       if (handle_dominating_asserts && TREE_CODE (cached_lhs) == SSA_NAME)
678         cached_lhs = lhs_of_dominating_assert (cached_lhs, e->src, stmt);
679
680       /* If we haven't simplified to an invariant yet, then use the
681          pass specific callback to try and simplify it further.  */
682       if (cached_lhs && ! is_gimple_min_invariant (cached_lhs))
683         cached_lhs = (*simplify) (stmt, stmt);
684     }
685   else
686     cached_lhs = NULL;
687
688   return cached_lhs;
689 }
690
691 /* Copy debug stmts from DEST's chain of single predecessors up to
692    SRC, so that we don't lose the bindings as PHI nodes are introduced
693    when DEST gains new predecessors.  */
694 void
695 propagate_threaded_block_debug_into (basic_block dest, basic_block src)
696 {
697   if (!MAY_HAVE_DEBUG_STMTS)
698     return;
699
700   if (!single_pred_p (dest))
701     return;
702
703   gcc_checking_assert (dest != src);
704
705   gimple_stmt_iterator gsi = gsi_after_labels (dest);
706   int i = 0;
707   const int alloc_count = 16; // ?? Should this be a PARAM?
708
709   /* Estimate the number of debug vars overridden in the beginning of
710      DEST, to tell how many we're going to need to begin with.  */
711   for (gimple_stmt_iterator si = gsi;
712        i * 4 <= alloc_count * 3 && !gsi_end_p (si); gsi_next (&si))
713     {
714       gimple stmt = gsi_stmt (si);
715       if (!is_gimple_debug (stmt))
716         break;
717       i++;
718     }
719
720   auto_vec<tree, alloc_count> fewvars;
721   pointer_set_t *vars = NULL;
722
723   /* If we're already starting with 3/4 of alloc_count, go for a
724      pointer_set, otherwise start with an unordered stack-allocated
725      VEC.  */
726   if (i * 4 > alloc_count * 3)
727     vars = pointer_set_create ();
728
729   /* Now go through the initial debug stmts in DEST again, this time
730      actually inserting in VARS or FEWVARS.  Don't bother checking for
731      duplicates in FEWVARS.  */
732   for (gimple_stmt_iterator si = gsi; !gsi_end_p (si); gsi_next (&si))
733     {
734       gimple stmt = gsi_stmt (si);
735       if (!is_gimple_debug (stmt))
736         break;
737
738       tree var;
739
740       if (gimple_debug_bind_p (stmt))
741         var = gimple_debug_bind_get_var (stmt);
742       else if (gimple_debug_source_bind_p (stmt))
743         var = gimple_debug_source_bind_get_var (stmt);
744       else
745         gcc_unreachable ();
746
747       if (vars)
748         pointer_set_insert (vars, var);
749       else
750         fewvars.quick_push (var);
751     }
752
753   basic_block bb = dest;
754
755   do
756     {
757       bb = single_pred (bb);
758       for (gimple_stmt_iterator si = gsi_last_bb (bb);
759            !gsi_end_p (si); gsi_prev (&si))
760         {
761           gimple stmt = gsi_stmt (si);
762           if (!is_gimple_debug (stmt))
763             continue;
764
765           tree var;
766
767           if (gimple_debug_bind_p (stmt))
768             var = gimple_debug_bind_get_var (stmt);
769           else if (gimple_debug_source_bind_p (stmt))
770             var = gimple_debug_source_bind_get_var (stmt);
771           else
772             gcc_unreachable ();
773
774           /* Discard debug bind overlaps.  ??? Unlike stmts from src,
775              copied into a new block that will precede BB, debug bind
776              stmts in bypassed BBs may actually be discarded if
777              they're overwritten by subsequent debug bind stmts, which
778              might be a problem once we introduce stmt frontier notes
779              or somesuch.  Adding `&& bb == src' to the condition
780              below will preserve all potentially relevant debug
781              notes.  */
782           if (vars && pointer_set_insert (vars, var))
783             continue;
784           else if (!vars)
785             {
786               int i = fewvars.length ();
787               while (i--)
788                 if (fewvars[i] == var)
789                   break;
790               if (i >= 0)
791                 continue;
792
793               if (fewvars.length () < (unsigned) alloc_count)
794                 fewvars.quick_push (var);
795               else
796                 {
797                   vars = pointer_set_create ();
798                   for (i = 0; i < alloc_count; i++)
799                     pointer_set_insert (vars, fewvars[i]);
800                   fewvars.release ();
801                   pointer_set_insert (vars, var);
802                 }
803             }
804
805           stmt = gimple_copy (stmt);
806           /* ??? Should we drop the location of the copy to denote
807              they're artificial bindings?  */
808           gsi_insert_before (&gsi, stmt, GSI_NEW_STMT);
809         }
810     }
811   while (bb != src && single_pred_p (bb));
812
813   if (vars)
814     pointer_set_destroy (vars);
815   else if (fewvars.exists ())
816     fewvars.release ();
817 }
818
819 /* See if TAKEN_EDGE->dest is a threadable block with no side effecs (ie, it
820    need not be duplicated as part of the CFG/SSA updating process).
821
822    If it is threadable, add it to PATH and VISITED and recurse, ultimately
823    returning TRUE from the toplevel call.   Otherwise do nothing and
824    return false.
825
826    DUMMY_COND, HANDLE_DOMINATING_ASSERTS and SIMPLIFY are used to
827    try and simplify the condition at the end of TAKEN_EDGE->dest.  */
828 static bool
829 thread_around_empty_blocks (edge taken_edge,
830                             gimple dummy_cond,
831                             bool handle_dominating_asserts,
832                             tree (*simplify) (gimple, gimple),
833                             bitmap visited,
834                             vec<jump_thread_edge *> *path,
835                             bool *backedge_seen_p)
836 {
837   basic_block bb = taken_edge->dest;
838   gimple_stmt_iterator gsi;
839   gimple stmt;
840   tree cond;
841
842   /* The key property of these blocks is that they need not be duplicated
843      when threading.  Thus they can not have visible side effects such
844      as PHI nodes.  */
845   if (!gsi_end_p (gsi_start_phis (bb)))
846     return false;
847
848   /* Skip over DEBUG statements at the start of the block.  */
849   gsi = gsi_start_nondebug_bb (bb);
850
851   /* If the block has no statements, but does have a single successor, then
852      it's just a forwarding block and we can thread through it trivially.
853
854      However, note that just threading through empty blocks with single
855      successors is not inherently profitable.  For the jump thread to
856      be profitable, we must avoid a runtime conditional.
857
858      By taking the return value from the recursive call, we get the
859      desired effect of returning TRUE when we found a profitable jump
860      threading opportunity and FALSE otherwise.
861
862      This is particularly important when this routine is called after
863      processing a joiner block.  Returning TRUE too aggressively in
864      that case results in pointless duplication of the joiner block.  */
865   if (gsi_end_p (gsi))
866     {
867       if (single_succ_p (bb))
868         {
869           taken_edge = single_succ_edge (bb);
870           if (!bitmap_bit_p (visited, taken_edge->dest->index))
871             {
872               jump_thread_edge *x
873                 = new jump_thread_edge (taken_edge, EDGE_NO_COPY_SRC_BLOCK);
874               path->safe_push (x);
875               bitmap_set_bit (visited, taken_edge->dest->index);
876               *backedge_seen_p |= ((taken_edge->flags & EDGE_DFS_BACK) != 0);
877               if (*backedge_seen_p)
878                 simplify = dummy_simplify;
879               return thread_around_empty_blocks (taken_edge,
880                                                  dummy_cond,
881                                                  handle_dominating_asserts,
882                                                  simplify,
883                                                  visited,
884                                                  path,
885                                                  backedge_seen_p);
886             }
887         }
888
889       /* We have a block with no statements, but multiple successors?  */
890       return false;
891     }
892
893   /* The only real statements this block can have are a control
894      flow altering statement.  Anything else stops the thread.  */
895   stmt = gsi_stmt (gsi);
896   if (gimple_code (stmt) != GIMPLE_COND
897       && gimple_code (stmt) != GIMPLE_GOTO
898       && gimple_code (stmt) != GIMPLE_SWITCH)
899     return false;
900
901   /* If we have traversed a backedge, then we do not want to look
902      at certain expressions in the table that can not be relied upon.
903      Luckily the only code that looked at those expressions is the
904      SIMPLIFY callback, which we replace if we can no longer use it.  */
905   if (*backedge_seen_p)
906     simplify = dummy_simplify;
907
908   /* Extract and simplify the condition.  */
909   cond = simplify_control_stmt_condition (taken_edge, stmt, dummy_cond,
910                                           simplify, handle_dominating_asserts);
911
912   /* If the condition can be statically computed and we have not already
913      visited the destination edge, then add the taken edge to our thread
914      path.  */
915   if (cond && is_gimple_min_invariant (cond))
916     {
917       taken_edge = find_taken_edge (bb, cond);
918
919       if (bitmap_bit_p (visited, taken_edge->dest->index))
920         return false;
921       bitmap_set_bit (visited, taken_edge->dest->index);
922
923       jump_thread_edge *x
924         = new jump_thread_edge (taken_edge, EDGE_NO_COPY_SRC_BLOCK);
925       path->safe_push (x);
926       *backedge_seen_p |= ((taken_edge->flags & EDGE_DFS_BACK) != 0);
927       if (*backedge_seen_p)
928         simplify = dummy_simplify;
929
930       thread_around_empty_blocks (taken_edge,
931                                   dummy_cond,
932                                   handle_dominating_asserts,
933                                   simplify,
934                                   visited,
935                                   path,
936                                   backedge_seen_p);
937       return true;
938     }
939
940   return false;
941 }
942
943 /* We are exiting E->src, see if E->dest ends with a conditional
944    jump which has a known value when reached via E.
945
946    E->dest can have arbitrary side effects which, if threading is
947    successful, will be maintained.
948
949    Special care is necessary if E is a back edge in the CFG as we
950    may have already recorded equivalences for E->dest into our
951    various tables, including the result of the conditional at
952    the end of E->dest.  Threading opportunities are severely
953    limited in that case to avoid short-circuiting the loop
954    incorrectly.
955
956    DUMMY_COND is a shared cond_expr used by condition simplification as scratch,
957    to avoid allocating memory.
958
959    HANDLE_DOMINATING_ASSERTS is true if we should try to replace operands of
960    the simplified condition with left-hand sides of ASSERT_EXPRs they are
961    used in.
962
963    STACK is used to undo temporary equivalences created during the walk of
964    E->dest.
965
966    SIMPLIFY is a pass-specific function used to simplify statements.
967
968    Our caller is responsible for restoring the state of the expression
969    and const_and_copies stacks.  */
970
971 static bool
972 thread_through_normal_block (edge e,
973                              gimple dummy_cond,
974                              bool handle_dominating_asserts,
975                              vec<tree> *stack,
976                              tree (*simplify) (gimple, gimple),
977                              vec<jump_thread_edge *> *path,
978                              bitmap visited,
979                              bool *backedge_seen_p,
980                              bitmap src_map,
981                              bitmap dst_map)
982 {
983   /* If we have traversed a backedge, then we do not want to look
984      at certain expressions in the table that can not be relied upon.
985      Luckily the only code that looked at those expressions is the
986      SIMPLIFY callback, which we replace if we can no longer use it.  */
987   if (*backedge_seen_p)
988     simplify = dummy_simplify;
989
990   /* PHIs create temporary equivalences.  */
991   if (!record_temporary_equivalences_from_phis (e, stack, *backedge_seen_p,
992                                                 src_map, dst_map))
993     return false;
994
995   /* Now walk each statement recording any context sensitive
996      temporary equivalences we can detect.  */
997   gimple stmt
998     = record_temporary_equivalences_from_stmts_at_dest (e, stack, simplify,
999                                                         *backedge_seen_p,
1000                                                         src_map, dst_map);
1001   if (!stmt)
1002     return false;
1003
1004   /* If we stopped at a COND_EXPR or SWITCH_EXPR, see if we know which arm
1005      will be taken.  */
1006   if (gimple_code (stmt) == GIMPLE_COND
1007       || gimple_code (stmt) == GIMPLE_GOTO
1008       || gimple_code (stmt) == GIMPLE_SWITCH)
1009     {
1010       tree cond;
1011
1012       /* Extract and simplify the condition.  */
1013       cond = simplify_control_stmt_condition (e, stmt, dummy_cond, simplify,
1014                                               handle_dominating_asserts);
1015
1016       if (cond && is_gimple_min_invariant (cond))
1017         {
1018           edge taken_edge = find_taken_edge (e->dest, cond);
1019           basic_block dest = (taken_edge ? taken_edge->dest : NULL);
1020
1021           /* DEST could be NULL for a computed jump to an absolute
1022              address.  */
1023           if (dest == NULL
1024               || dest == e->dest
1025               || bitmap_bit_p (visited, dest->index))
1026             return false;
1027
1028           /* Only push the EDGE_START_JUMP_THREAD marker if this is
1029              first edge on the path.  */
1030           if (path->length () == 0)
1031             {
1032               jump_thread_edge *x
1033                 = new jump_thread_edge (e, EDGE_START_JUMP_THREAD);
1034               path->safe_push (x);
1035               *backedge_seen_p |= ((e->flags & EDGE_DFS_BACK) != 0);
1036             }
1037
1038           jump_thread_edge *x
1039             = new jump_thread_edge (taken_edge, EDGE_COPY_SRC_BLOCK);
1040           path->safe_push (x);
1041           *backedge_seen_p |= ((taken_edge->flags & EDGE_DFS_BACK) != 0);
1042           if (*backedge_seen_p)
1043             simplify = dummy_simplify;
1044
1045           /* See if we can thread through DEST as well, this helps capture
1046              secondary effects of threading without having to re-run DOM or
1047              VRP. 
1048
1049              We don't want to thread back to a block we have already
1050              visited.  This may be overly conservative.  */
1051           bitmap_set_bit (visited, dest->index);
1052           bitmap_set_bit (visited, e->dest->index);
1053           thread_around_empty_blocks (taken_edge,
1054                                       dummy_cond,
1055                                       handle_dominating_asserts,
1056                                       simplify,
1057                                       visited,
1058                                       path,
1059                                       backedge_seen_p);
1060           return true;
1061         }
1062     }
1063   return false;
1064 }
1065
1066 /* We are exiting E->src, see if E->dest ends with a conditional
1067    jump which has a known value when reached via E.
1068
1069    Special care is necessary if E is a back edge in the CFG as we
1070    may have already recorded equivalences for E->dest into our
1071    various tables, including the result of the conditional at
1072    the end of E->dest.  Threading opportunities are severely
1073    limited in that case to avoid short-circuiting the loop
1074    incorrectly.
1075
1076    Note it is quite common for the first block inside a loop to
1077    end with a conditional which is either always true or always
1078    false when reached via the loop backedge.  Thus we do not want
1079    to blindly disable threading across a loop backedge.
1080
1081    DUMMY_COND is a shared cond_expr used by condition simplification as scratch,
1082    to avoid allocating memory.
1083
1084    HANDLE_DOMINATING_ASSERTS is true if we should try to replace operands of
1085    the simplified condition with left-hand sides of ASSERT_EXPRs they are
1086    used in.
1087
1088    STACK is used to undo temporary equivalences created during the walk of
1089    E->dest.
1090
1091    SIMPLIFY is a pass-specific function used to simplify statements.  */
1092
1093 void
1094 thread_across_edge (gimple dummy_cond,
1095                     edge e,
1096                     bool handle_dominating_asserts,
1097                     vec<tree> *stack,
1098                     tree (*simplify) (gimple, gimple))
1099 {
1100   bitmap visited = BITMAP_ALLOC (NULL);
1101   bitmap src_map = BITMAP_ALLOC (NULL);
1102   bitmap dst_map = BITMAP_ALLOC (NULL);
1103   bool backedge_seen;
1104
1105   stmt_count = 0;
1106
1107   vec<jump_thread_edge *> *path = new vec<jump_thread_edge *> ();
1108   bitmap_clear (visited);
1109   bitmap_set_bit (visited, e->src->index);
1110   bitmap_set_bit (visited, e->dest->index);
1111   backedge_seen = ((e->flags & EDGE_DFS_BACK) != 0);
1112   if (backedge_seen)
1113     simplify = dummy_simplify;
1114
1115   if (thread_through_normal_block (e, dummy_cond, handle_dominating_asserts,
1116                                    stack, simplify, path, visited,
1117                                    &backedge_seen, src_map, dst_map))
1118     {
1119       propagate_threaded_block_debug_into (path->last ()->e->dest,
1120                                            e->dest);
1121       remove_temporary_equivalences (stack);
1122       BITMAP_FREE (visited);
1123       BITMAP_FREE (src_map);
1124       BITMAP_FREE (dst_map);
1125       register_jump_thread (path);
1126       return;
1127     }
1128   else
1129     {
1130       /* There should be no edges on the path, so no need to walk through
1131          the vector entries.  */
1132       gcc_assert (path->length () == 0);
1133       path->release ();
1134     }
1135
1136  /* We were unable to determine what out edge from E->dest is taken.  However,
1137     we might still be able to thread through successors of E->dest.  This
1138     often occurs when E->dest is a joiner block which then fans back out
1139     based on redundant tests.
1140
1141     If so, we'll copy E->dest and redirect the appropriate predecessor to
1142     the copy.  Within the copy of E->dest, we'll thread one or more edges
1143     to points deeper in the CFG.
1144
1145     This is a stopgap until we have a more structured approach to path
1146     isolation.  */
1147   {
1148     edge taken_edge;
1149     edge_iterator ei;
1150     bool found;
1151
1152     /* If E->dest has abnormal outgoing edges, then there's no guarantee
1153        we can safely redirect any of the edges.  Just punt those cases.  */
1154     FOR_EACH_EDGE (taken_edge, ei, e->dest->succs)
1155       if (taken_edge->flags & EDGE_ABNORMAL)
1156         {
1157           remove_temporary_equivalences (stack);
1158           BITMAP_FREE (visited);
1159           BITMAP_FREE (src_map);
1160           BITMAP_FREE (dst_map);
1161           return;
1162         }
1163
1164     /* We need to restore the state of the maps to this point each loop
1165        iteration.  */
1166     bitmap src_map_copy = BITMAP_ALLOC (NULL);
1167     bitmap dst_map_copy = BITMAP_ALLOC (NULL);
1168     bitmap_copy (src_map_copy, src_map);
1169     bitmap_copy (dst_map_copy, dst_map);
1170
1171     /* Look at each successor of E->dest to see if we can thread through it.  */
1172     FOR_EACH_EDGE (taken_edge, ei, e->dest->succs)
1173       {
1174         /* Push a fresh marker so we can unwind the equivalences created
1175            for each of E->dest's successors.  */
1176         stack->safe_push (NULL_TREE);
1177         bitmap_copy (src_map, src_map_copy);
1178         bitmap_copy (dst_map, dst_map_copy);
1179      
1180         /* Avoid threading to any block we have already visited.  */
1181         bitmap_clear (visited);
1182         bitmap_set_bit (visited, e->src->index);
1183         bitmap_set_bit (visited, e->dest->index);
1184         bitmap_set_bit (visited, taken_edge->dest->index);
1185         vec<jump_thread_edge *> *path = new vec<jump_thread_edge *> ();
1186
1187         /* Record whether or not we were able to thread through a successor
1188            of E->dest.  */
1189         jump_thread_edge *x = new jump_thread_edge (e, EDGE_START_JUMP_THREAD);
1190         path->safe_push (x);
1191
1192         x = new jump_thread_edge (taken_edge, EDGE_COPY_SRC_JOINER_BLOCK);
1193         path->safe_push (x);
1194         found = false;
1195         backedge_seen = ((e->flags & EDGE_DFS_BACK) != 0);
1196         backedge_seen |= ((taken_edge->flags & EDGE_DFS_BACK) != 0);
1197         if (backedge_seen)
1198           simplify = dummy_simplify;
1199         found = thread_around_empty_blocks (taken_edge,
1200                                             dummy_cond,
1201                                             handle_dominating_asserts,
1202                                             simplify,
1203                                             visited,
1204                                             path,
1205                                             &backedge_seen);
1206
1207         if (backedge_seen)
1208           simplify = dummy_simplify;
1209
1210         if (!found)
1211           found = thread_through_normal_block (path->last ()->e, dummy_cond,
1212                                                handle_dominating_asserts,
1213                                                stack, simplify, path, visited,
1214                                                &backedge_seen,
1215                                                src_map, dst_map);
1216
1217         /* If we were able to thread through a successor of E->dest, then
1218            record the jump threading opportunity.  */
1219         if (found)
1220           {
1221             propagate_threaded_block_debug_into (path->last ()->e->dest,
1222                                                  taken_edge->dest);
1223             register_jump_thread (path);
1224           }
1225         else
1226           {
1227             delete_jump_thread_path (path);
1228           }
1229
1230         /* And unwind the equivalence table.  */
1231         remove_temporary_equivalences (stack);
1232       }
1233     BITMAP_FREE (visited);
1234     BITMAP_FREE (src_map);
1235     BITMAP_FREE (dst_map);
1236     BITMAP_FREE (src_map_copy);
1237     BITMAP_FREE (dst_map_copy);
1238   }
1239
1240   remove_temporary_equivalences (stack);
1241 }