* config/i386/sse.md (*vec_concatv2sf_sse4_1): Do not allow both
authoruros <uros@138bc75d-0d04-0410-961f-82ee72b054a4>
Fri, 24 Apr 2015 06:01:34 +0000 (06:01 +0000)
committeruros <uros@138bc75d-0d04-0410-961f-82ee72b054a4>
Fri, 24 Apr 2015 06:01:34 +0000 (06:01 +0000)
input operands in memory.
(*vec_concatv2si_sse4_1): Ditto.
(*vec_concatv2df): Ditto, except for SSE3 and equal input operands.
(vec_extract_lo_<mode><mask_name>): Change operand 1 predicate to
register_operand.
(vec_extract_hi_v32hi): Ditto.
(vec_extract_hi_v64hi): Ditto.
(<mask_codefor>avx512f_unpckhpd512<mask_name>): Ditto.

git-svn-id: svn+ssh://gcc.gnu.org/svn/gcc/trunk@222400 138bc75d-0d04-0410-961f-82ee72b054a4

gcc/ChangeLog
gcc/config/i386/sse.md

index 7f2d944..5cbb130 100644 (file)
@@ -1,3 +1,15 @@
+2015-04-24  Uros Bizjak  <ubizjak@gmail.com>
+
+       * config/i386/sse.md (*vec_concatv2sf_sse4_1): Do not allow both
+       input operands in memory.
+       (*vec_concatv2si_sse4_1): Ditto.
+       (*vec_concatv2df): Ditto, except for SSE3 and equal input operands.
+       (vec_extract_lo_<mode><mask_name>): Change operand 1 predicate to
+       register_operand.
+       (vec_extract_hi_v32hi): Ditto.
+       (vec_extract_hi_v64hi): Ditto.
+       (<mask_codefor>avx512f_unpckhpd512<mask_name>): Ditto.
+
 2015-04-24  Thomas Preud'homme  <thomas.preudhomme@arm.com>
            Steven Bosscher <steven@gcc.gnu.org>
 
index 6d3b54a..16db216 100644 (file)
 ;; Although insertps takes register source, we prefer
 ;; unpcklps with register source since it is shorter.
 (define_insn "*vec_concatv2sf_sse4_1"
-  [(set (match_operand:V2SF 0 "register_operand"     "=Yr,*x,x,Yr,*x,x,x,*y ,*y")
+  [(set (match_operand:V2SF 0 "register_operand"
+         "=Yr,*x,x,Yr,*x,x,x,*y ,*y")
        (vec_concat:V2SF
-         (match_operand:SF 1 "nonimmediate_operand" "  0, 0,x, 0,0, x,m, 0 , m")
-         (match_operand:SF 2 "vector_move_operand"  " Yr,*x,x, m,m, m,C,*ym, C")))]
-  "TARGET_SSE4_1"
+         (match_operand:SF 1 "nonimmediate_operand"
+         "  0, 0,x, 0,0, x,m, 0 , m")
+         (match_operand:SF 2 "vector_move_operand"
+         " Yr,*x,x, m,m, m,C,*ym, C")))]
+  "TARGET_SSE4_1 && !(MEM_P (operands[1]) && MEM_P (operands[2]))"
   "@
    unpcklps\t{%2, %0|%0, %2}
    unpcklps\t{%2, %0|%0, %2}
 (define_insn "vec_extract_lo_<mode><mask_name>"
   [(set (match_operand:<ssehalfvecmode> 0 "<store_mask_predicate>" "=<store_mask_constraint>")
        (vec_select:<ssehalfvecmode>
-         (match_operand:VI4F_256 1 "nonimmediate_operand" "v")
+         (match_operand:VI4F_256 1 "register_operand" "v")
          (parallel [(const_int 0) (const_int 1)
                     (const_int 2) (const_int 3)])))]
   "TARGET_AVX && <mask_avx512vl_condition> && <mask_avx512dq_condition>"
 (define_insn "vec_extract_hi_v32hi"
   [(set (match_operand:V16HI 0 "nonimmediate_operand" "=v,m")
        (vec_select:V16HI
-         (match_operand:V32HI 1 "nonimmediate_operand" "v,v")
+         (match_operand:V32HI 1 "register_operand" "v,v")
          (parallel [(const_int 16) (const_int 17)
                     (const_int 18) (const_int 19)
                     (const_int 20) (const_int 21)
 (define_insn "vec_extract_hi_v64qi"
   [(set (match_operand:V32QI 0 "nonimmediate_operand" "=v,m")
        (vec_select:V32QI
-         (match_operand:V64QI 1 "nonimmediate_operand" "v,v")
+         (match_operand:V64QI 1 "register_operand" "v,v")
          (parallel [(const_int 32) (const_int 33)
                     (const_int 34) (const_int 35)
                     (const_int 36) (const_int 37)
   [(set (match_operand:V8DF 0 "register_operand" "=v")
        (vec_select:V8DF
          (vec_concat:V16DF
-           (match_operand:V8DF 1 "nonimmediate_operand" "v")
+           (match_operand:V8DF 1 "register_operand" "v")
            (match_operand:V8DF 2 "nonimmediate_operand" "vm"))
          (parallel [(const_int 1) (const_int 9)
                     (const_int 3) (const_int 11)
        (vec_concat:V2DF
          (match_operand:DF 1 "nonimmediate_operand" " 0,v,m,0,x,m,0,0")
          (match_operand:DF 2 "vector_move_operand"  " x,v,1,m,m,C,x,m")))]
-  "TARGET_SSE"
+  "TARGET_SSE
+   && (!(MEM_P (operands[1]) && MEM_P (operands[2]))
+       || (TARGET_SSE3 && rtx_equal_p (operands[1], operands[2])))"
   "@
    unpcklpd\t{%2, %0|%0, %2}
    vunpcklpd\t{%2, %1, %0|%0, %1, %2}
        (mult:V4DI
          (sign_extend:V4DI
            (vec_select:V4SI
-             (match_operand:V8SI 1 "nonimmediate_operand" "v")
+             (match_operand:V8SI 1 "nonimmediate_operand" "%v")
              (parallel [(const_int 0) (const_int 2)
                         (const_int 4) (const_int 6)])))
          (sign_extend:V4DI
 })
 
 (define_insn "*vec_concatv2si_sse4_1"
-  [(set (match_operand:V2SI 0 "register_operand"     "=Yr,*x,x, Yr,*x,x, x, *y,*y")
+  [(set (match_operand:V2SI 0 "register_operand"
+         "=Yr,*x,x, Yr,*x,x, x, *y,*y")
        (vec_concat:V2SI
-         (match_operand:SI 1 "nonimmediate_operand" "  0, 0,x,  0,0, x,rm,  0,rm")
-         (match_operand:SI 2 "vector_move_operand"  " rm,rm,rm,Yr,*x,x, C,*ym, C")))]
-  "TARGET_SSE4_1"
+         (match_operand:SI 1 "nonimmediate_operand"
+         "  0, 0,x,  0,0, x,rm,  0,rm")
+         (match_operand:SI 2 "vector_move_operand"
+         " rm,rm,rm,Yr,*x,x, C,*ym, C")))]
+  "TARGET_SSE4_1 && !(MEM_P (operands[1]) && MEM_P (operands[2]))"
   "@
    pinsrd\t{$1, %2, %0|%0, %2, 1}
    pinsrd\t{$1, %2, %0|%0, %2, 1}