[turbofan] Optimize division/modulus by constant.
[platform/upstream/v8.git] / src / compiler / x64 / code-generator-x64.cc
1 // Copyright 2013 the V8 project authors. All rights reserved.
2 // Use of this source code is governed by a BSD-style license that can be
3 // found in the LICENSE file.
4
5 #include "src/compiler/code-generator.h"
6
7 #include "src/compiler/code-generator-impl.h"
8 #include "src/compiler/gap-resolver.h"
9 #include "src/compiler/node-matchers.h"
10 #include "src/compiler/node-properties-inl.h"
11 #include "src/scopes.h"
12 #include "src/x64/assembler-x64.h"
13 #include "src/x64/macro-assembler-x64.h"
14
15 namespace v8 {
16 namespace internal {
17 namespace compiler {
18
19 #define __ masm()->
20
21
22 // Adds X64 specific methods for decoding operands.
23 class X64OperandConverter : public InstructionOperandConverter {
24  public:
25   X64OperandConverter(CodeGenerator* gen, Instruction* instr)
26       : InstructionOperandConverter(gen, instr) {}
27
28   Immediate InputImmediate(int index) {
29     return ToImmediate(instr_->InputAt(index));
30   }
31
32   Operand InputOperand(int index) { return ToOperand(instr_->InputAt(index)); }
33
34   Operand OutputOperand() { return ToOperand(instr_->Output()); }
35
36   Immediate ToImmediate(InstructionOperand* operand) {
37     Constant constant = ToConstant(operand);
38     if (constant.type() == Constant::kInt32) {
39       return Immediate(constant.ToInt32());
40     }
41     UNREACHABLE();
42     return Immediate(-1);
43   }
44
45   Operand ToOperand(InstructionOperand* op, int extra = 0) {
46     DCHECK(op->IsStackSlot() || op->IsDoubleStackSlot());
47     // The linkage computes where all spill slots are located.
48     FrameOffset offset = linkage()->GetFrameOffset(op->index(), frame(), extra);
49     return Operand(offset.from_stack_pointer() ? rsp : rbp, offset.offset());
50   }
51
52   static int NextOffset(int* offset) {
53     int i = *offset;
54     (*offset)++;
55     return i;
56   }
57
58   static ScaleFactor ScaleFor(AddressingMode one, AddressingMode mode) {
59     STATIC_ASSERT(0 == static_cast<int>(times_1));
60     STATIC_ASSERT(1 == static_cast<int>(times_2));
61     STATIC_ASSERT(2 == static_cast<int>(times_4));
62     STATIC_ASSERT(3 == static_cast<int>(times_8));
63     int scale = static_cast<int>(mode - one);
64     DCHECK(scale >= 0 && scale < 4);
65     return static_cast<ScaleFactor>(scale);
66   }
67
68   Operand MemoryOperand(int* offset) {
69     AddressingMode mode = AddressingModeField::decode(instr_->opcode());
70     switch (mode) {
71       case kMode_MR: {
72         Register base = InputRegister(NextOffset(offset));
73         int32_t disp = 0;
74         return Operand(base, disp);
75       }
76       case kMode_MRI: {
77         Register base = InputRegister(NextOffset(offset));
78         int32_t disp = InputInt32(NextOffset(offset));
79         return Operand(base, disp);
80       }
81       case kMode_MR1:
82       case kMode_MR2:
83       case kMode_MR4:
84       case kMode_MR8: {
85         Register base = InputRegister(NextOffset(offset));
86         Register index = InputRegister(NextOffset(offset));
87         ScaleFactor scale = ScaleFor(kMode_MR1, mode);
88         int32_t disp = 0;
89         return Operand(base, index, scale, disp);
90       }
91       case kMode_MR1I:
92       case kMode_MR2I:
93       case kMode_MR4I:
94       case kMode_MR8I: {
95         Register base = InputRegister(NextOffset(offset));
96         Register index = InputRegister(NextOffset(offset));
97         ScaleFactor scale = ScaleFor(kMode_MR1I, mode);
98         int32_t disp = InputInt32(NextOffset(offset));
99         return Operand(base, index, scale, disp);
100       }
101       case kMode_M1:
102       case kMode_M2:
103       case kMode_M4:
104       case kMode_M8: {
105         Register index = InputRegister(NextOffset(offset));
106         ScaleFactor scale = ScaleFor(kMode_M1, mode);
107         int32_t disp = 0;
108         return Operand(index, scale, disp);
109       }
110       case kMode_M1I:
111       case kMode_M2I:
112       case kMode_M4I:
113       case kMode_M8I: {
114         Register index = InputRegister(NextOffset(offset));
115         ScaleFactor scale = ScaleFor(kMode_M1I, mode);
116         int32_t disp = InputInt32(NextOffset(offset));
117         return Operand(index, scale, disp);
118       }
119       case kMode_None:
120         UNREACHABLE();
121         return Operand(no_reg, 0);
122     }
123     UNREACHABLE();
124     return Operand(no_reg, 0);
125   }
126
127   Operand MemoryOperand() {
128     int first_input = 0;
129     return MemoryOperand(&first_input);
130   }
131 };
132
133
134 static bool HasImmediateInput(Instruction* instr, int index) {
135   return instr->InputAt(index)->IsImmediate();
136 }
137
138
139 #define ASSEMBLE_UNOP(asm_instr)         \
140   do {                                   \
141     if (instr->Output()->IsRegister()) { \
142       __ asm_instr(i.OutputRegister());  \
143     } else {                             \
144       __ asm_instr(i.OutputOperand());   \
145     }                                    \
146   } while (0)
147
148
149 #define ASSEMBLE_BINOP(asm_instr)                              \
150   do {                                                         \
151     if (HasImmediateInput(instr, 1)) {                         \
152       if (instr->InputAt(0)->IsRegister()) {                   \
153         __ asm_instr(i.InputRegister(0), i.InputImmediate(1)); \
154       } else {                                                 \
155         __ asm_instr(i.InputOperand(0), i.InputImmediate(1));  \
156       }                                                        \
157     } else {                                                   \
158       if (instr->InputAt(1)->IsRegister()) {                   \
159         __ asm_instr(i.InputRegister(0), i.InputRegister(1));  \
160       } else {                                                 \
161         __ asm_instr(i.InputRegister(0), i.InputOperand(1));   \
162       }                                                        \
163     }                                                          \
164   } while (0)
165
166
167 #define ASSEMBLE_MULT(asm_instr)                              \
168   do {                                                        \
169     if (HasImmediateInput(instr, 1)) {                        \
170       if (instr->InputAt(0)->IsRegister()) {                  \
171         __ asm_instr(i.OutputRegister(), i.InputRegister(0),  \
172                      i.InputImmediate(1));                    \
173       } else {                                                \
174         __ asm_instr(i.OutputRegister(), i.InputOperand(0),   \
175                      i.InputImmediate(1));                    \
176       }                                                       \
177     } else {                                                  \
178       if (instr->InputAt(1)->IsRegister()) {                  \
179         __ asm_instr(i.OutputRegister(), i.InputRegister(1)); \
180       } else {                                                \
181         __ asm_instr(i.OutputRegister(), i.InputOperand(1));  \
182       }                                                       \
183     }                                                         \
184   } while (0)
185
186
187 #define ASSEMBLE_SHIFT(asm_instr, width)                                   \
188   do {                                                                     \
189     if (HasImmediateInput(instr, 1)) {                                     \
190       if (instr->Output()->IsRegister()) {                                 \
191         __ asm_instr(i.OutputRegister(), Immediate(i.InputInt##width(1))); \
192       } else {                                                             \
193         __ asm_instr(i.OutputOperand(), Immediate(i.InputInt##width(1)));  \
194       }                                                                    \
195     } else {                                                               \
196       if (instr->Output()->IsRegister()) {                                 \
197         __ asm_instr##_cl(i.OutputRegister());                             \
198       } else {                                                             \
199         __ asm_instr##_cl(i.OutputOperand());                              \
200       }                                                                    \
201     }                                                                      \
202   } while (0)
203
204
205 // Assembles an instruction after register allocation, producing machine code.
206 void CodeGenerator::AssembleArchInstruction(Instruction* instr) {
207   X64OperandConverter i(this, instr);
208
209   switch (ArchOpcodeField::decode(instr->opcode())) {
210     case kArchCallCodeObject: {
211       EnsureSpaceForLazyDeopt();
212       if (HasImmediateInput(instr, 0)) {
213         Handle<Code> code = Handle<Code>::cast(i.InputHeapObject(0));
214         __ Call(code, RelocInfo::CODE_TARGET);
215       } else {
216         Register reg = i.InputRegister(0);
217         int entry = Code::kHeaderSize - kHeapObjectTag;
218         __ Call(Operand(reg, entry));
219       }
220       AddSafepointAndDeopt(instr);
221       break;
222     }
223     case kArchCallJSFunction: {
224       EnsureSpaceForLazyDeopt();
225       Register func = i.InputRegister(0);
226       if (FLAG_debug_code) {
227         // Check the function's context matches the context argument.
228         __ cmpp(rsi, FieldOperand(func, JSFunction::kContextOffset));
229         __ Assert(equal, kWrongFunctionContext);
230       }
231       __ Call(FieldOperand(func, JSFunction::kCodeEntryOffset));
232       AddSafepointAndDeopt(instr);
233       break;
234     }
235     case kArchJmp:
236       __ jmp(code_->GetLabel(i.InputRpo(0)));
237       break;
238     case kArchNop:
239       // don't emit code for nops.
240       break;
241     case kArchRet:
242       AssembleReturn();
243       break;
244     case kArchStackPointer:
245       __ movq(i.OutputRegister(), rsp);
246       break;
247     case kArchTruncateDoubleToI:
248       __ TruncateDoubleToI(i.OutputRegister(), i.InputDoubleRegister(0));
249       break;
250     case kX64Add32:
251       ASSEMBLE_BINOP(addl);
252       break;
253     case kX64Add:
254       ASSEMBLE_BINOP(addq);
255       break;
256     case kX64Sub32:
257       ASSEMBLE_BINOP(subl);
258       break;
259     case kX64Sub:
260       ASSEMBLE_BINOP(subq);
261       break;
262     case kX64And32:
263       ASSEMBLE_BINOP(andl);
264       break;
265     case kX64And:
266       ASSEMBLE_BINOP(andq);
267       break;
268     case kX64Cmp32:
269       ASSEMBLE_BINOP(cmpl);
270       break;
271     case kX64Cmp:
272       ASSEMBLE_BINOP(cmpq);
273       break;
274     case kX64Test32:
275       ASSEMBLE_BINOP(testl);
276       break;
277     case kX64Test:
278       ASSEMBLE_BINOP(testq);
279       break;
280     case kX64Imul32:
281       ASSEMBLE_MULT(imull);
282       break;
283     case kX64Imul:
284       ASSEMBLE_MULT(imulq);
285       break;
286     case kX64ImulHigh32:
287       __ imull(i.InputRegister(1));
288       break;
289     case kX64Idiv32:
290       __ cdq();
291       __ idivl(i.InputRegister(1));
292       break;
293     case kX64Idiv:
294       __ cqo();
295       __ idivq(i.InputRegister(1));
296       break;
297     case kX64Udiv32:
298       __ xorl(rdx, rdx);
299       __ divl(i.InputRegister(1));
300       break;
301     case kX64Udiv:
302       __ xorq(rdx, rdx);
303       __ divq(i.InputRegister(1));
304       break;
305     case kX64Not:
306       ASSEMBLE_UNOP(notq);
307       break;
308     case kX64Not32:
309       ASSEMBLE_UNOP(notl);
310       break;
311     case kX64Neg:
312       ASSEMBLE_UNOP(negq);
313       break;
314     case kX64Neg32:
315       ASSEMBLE_UNOP(negl);
316       break;
317     case kX64Or32:
318       ASSEMBLE_BINOP(orl);
319       break;
320     case kX64Or:
321       ASSEMBLE_BINOP(orq);
322       break;
323     case kX64Xor32:
324       ASSEMBLE_BINOP(xorl);
325       break;
326     case kX64Xor:
327       ASSEMBLE_BINOP(xorq);
328       break;
329     case kX64Shl32:
330       ASSEMBLE_SHIFT(shll, 5);
331       break;
332     case kX64Shl:
333       ASSEMBLE_SHIFT(shlq, 6);
334       break;
335     case kX64Shr32:
336       ASSEMBLE_SHIFT(shrl, 5);
337       break;
338     case kX64Shr:
339       ASSEMBLE_SHIFT(shrq, 6);
340       break;
341     case kX64Sar32:
342       ASSEMBLE_SHIFT(sarl, 5);
343       break;
344     case kX64Sar:
345       ASSEMBLE_SHIFT(sarq, 6);
346       break;
347     case kX64Ror32:
348       ASSEMBLE_SHIFT(rorl, 5);
349       break;
350     case kX64Ror:
351       ASSEMBLE_SHIFT(rorq, 6);
352       break;
353     case kSSEFloat64Cmp:
354       if (instr->InputAt(1)->IsDoubleRegister()) {
355         __ ucomisd(i.InputDoubleRegister(0), i.InputDoubleRegister(1));
356       } else {
357         __ ucomisd(i.InputDoubleRegister(0), i.InputOperand(1));
358       }
359       break;
360     case kSSEFloat64Add:
361       __ addsd(i.InputDoubleRegister(0), i.InputDoubleRegister(1));
362       break;
363     case kSSEFloat64Sub:
364       __ subsd(i.InputDoubleRegister(0), i.InputDoubleRegister(1));
365       break;
366     case kSSEFloat64Mul:
367       __ mulsd(i.InputDoubleRegister(0), i.InputDoubleRegister(1));
368       break;
369     case kSSEFloat64Div:
370       __ divsd(i.InputDoubleRegister(0), i.InputDoubleRegister(1));
371       break;
372     case kSSEFloat64Mod: {
373       __ subq(rsp, Immediate(kDoubleSize));
374       // Move values to st(0) and st(1).
375       __ movsd(Operand(rsp, 0), i.InputDoubleRegister(1));
376       __ fld_d(Operand(rsp, 0));
377       __ movsd(Operand(rsp, 0), i.InputDoubleRegister(0));
378       __ fld_d(Operand(rsp, 0));
379       // Loop while fprem isn't done.
380       Label mod_loop;
381       __ bind(&mod_loop);
382       // This instructions traps on all kinds inputs, but we are assuming the
383       // floating point control word is set to ignore them all.
384       __ fprem();
385       // The following 2 instruction implicitly use rax.
386       __ fnstsw_ax();
387       if (CpuFeatures::IsSupported(SAHF) && masm()->IsEnabled(SAHF)) {
388         __ sahf();
389       } else {
390         __ shrl(rax, Immediate(8));
391         __ andl(rax, Immediate(0xFF));
392         __ pushq(rax);
393         __ popfq();
394       }
395       __ j(parity_even, &mod_loop);
396       // Move output to stack and clean up.
397       __ fstp(1);
398       __ fstp_d(Operand(rsp, 0));
399       __ movsd(i.OutputDoubleRegister(), Operand(rsp, 0));
400       __ addq(rsp, Immediate(kDoubleSize));
401       break;
402     }
403     case kSSEFloat64Sqrt:
404       if (instr->InputAt(0)->IsDoubleRegister()) {
405         __ sqrtsd(i.OutputDoubleRegister(), i.InputDoubleRegister(0));
406       } else {
407         __ sqrtsd(i.OutputDoubleRegister(), i.InputOperand(0));
408       }
409       break;
410     case kSSECvtss2sd:
411       if (instr->InputAt(0)->IsDoubleRegister()) {
412         __ cvtss2sd(i.OutputDoubleRegister(), i.InputDoubleRegister(0));
413       } else {
414         __ cvtss2sd(i.OutputDoubleRegister(), i.InputOperand(0));
415       }
416       break;
417     case kSSECvtsd2ss:
418       if (instr->InputAt(0)->IsDoubleRegister()) {
419         __ cvtsd2ss(i.OutputDoubleRegister(), i.InputDoubleRegister(0));
420       } else {
421         __ cvtsd2ss(i.OutputDoubleRegister(), i.InputOperand(0));
422       }
423       break;
424     case kSSEFloat64ToInt32:
425       if (instr->InputAt(0)->IsDoubleRegister()) {
426         __ cvttsd2si(i.OutputRegister(), i.InputDoubleRegister(0));
427       } else {
428         __ cvttsd2si(i.OutputRegister(), i.InputOperand(0));
429       }
430       break;
431     case kSSEFloat64ToUint32:
432       if (instr->InputAt(0)->IsDoubleRegister()) {
433         __ cvttsd2siq(i.OutputRegister(), i.InputDoubleRegister(0));
434       } else {
435         __ cvttsd2siq(i.OutputRegister(), i.InputOperand(0));
436       }
437       __ andl(i.OutputRegister(), i.OutputRegister());  // clear upper bits.
438       // TODO(turbofan): generated code should not look at the upper 32 bits
439       // of the result, but those bits could escape to the outside world.
440       break;
441     case kSSEInt32ToFloat64:
442       if (instr->InputAt(0)->IsRegister()) {
443         __ cvtlsi2sd(i.OutputDoubleRegister(), i.InputRegister(0));
444       } else {
445         __ cvtlsi2sd(i.OutputDoubleRegister(), i.InputOperand(0));
446       }
447       break;
448     case kSSEUint32ToFloat64:
449       if (instr->InputAt(0)->IsRegister()) {
450         __ cvtqsi2sd(i.OutputDoubleRegister(), i.InputRegister(0));
451       } else {
452         __ cvtqsi2sd(i.OutputDoubleRegister(), i.InputOperand(0));
453       }
454       break;
455     case kX64Movsxbl:
456       __ movsxbl(i.OutputRegister(), i.MemoryOperand());
457       break;
458     case kX64Movzxbl:
459       __ movzxbl(i.OutputRegister(), i.MemoryOperand());
460       break;
461     case kX64Movb: {
462       int index = 0;
463       Operand operand = i.MemoryOperand(&index);
464       if (HasImmediateInput(instr, index)) {
465         __ movb(operand, Immediate(i.InputInt8(index)));
466       } else {
467         __ movb(operand, i.InputRegister(index));
468       }
469       break;
470     }
471     case kX64Movsxwl:
472       __ movsxwl(i.OutputRegister(), i.MemoryOperand());
473       break;
474     case kX64Movzxwl:
475       __ movzxwl(i.OutputRegister(), i.MemoryOperand());
476       break;
477     case kX64Movw: {
478       int index = 0;
479       Operand operand = i.MemoryOperand(&index);
480       if (HasImmediateInput(instr, index)) {
481         __ movw(operand, Immediate(i.InputInt16(index)));
482       } else {
483         __ movw(operand, i.InputRegister(index));
484       }
485       break;
486     }
487     case kX64Movl:
488       if (instr->HasOutput()) {
489         if (instr->addressing_mode() == kMode_None) {
490           if (instr->InputAt(0)->IsRegister()) {
491             __ movl(i.OutputRegister(), i.InputRegister(0));
492           } else {
493             __ movl(i.OutputRegister(), i.InputOperand(0));
494           }
495         } else {
496           __ movl(i.OutputRegister(), i.MemoryOperand());
497         }
498       } else {
499         int index = 0;
500         Operand operand = i.MemoryOperand(&index);
501         if (HasImmediateInput(instr, index)) {
502           __ movl(operand, i.InputImmediate(index));
503         } else {
504           __ movl(operand, i.InputRegister(index));
505         }
506       }
507       break;
508     case kX64Movsxlq: {
509       if (instr->InputAt(0)->IsRegister()) {
510         __ movsxlq(i.OutputRegister(), i.InputRegister(0));
511       } else {
512         __ movsxlq(i.OutputRegister(), i.InputOperand(0));
513       }
514       break;
515     }
516     case kX64Movq:
517       if (instr->HasOutput()) {
518         __ movq(i.OutputRegister(), i.MemoryOperand());
519       } else {
520         int index = 0;
521         Operand operand = i.MemoryOperand(&index);
522         if (HasImmediateInput(instr, index)) {
523           __ movq(operand, i.InputImmediate(index));
524         } else {
525           __ movq(operand, i.InputRegister(index));
526         }
527       }
528       break;
529     case kX64Movss:
530       if (instr->HasOutput()) {
531         __ movss(i.OutputDoubleRegister(), i.MemoryOperand());
532       } else {
533         int index = 0;
534         Operand operand = i.MemoryOperand(&index);
535         __ movss(operand, i.InputDoubleRegister(index));
536       }
537       break;
538     case kX64Movsd:
539       if (instr->HasOutput()) {
540         __ movsd(i.OutputDoubleRegister(), i.MemoryOperand());
541       } else {
542         int index = 0;
543         Operand operand = i.MemoryOperand(&index);
544         __ movsd(operand, i.InputDoubleRegister(index));
545       }
546       break;
547     case kX64Lea32:
548       __ leal(i.OutputRegister(), i.MemoryOperand());
549       break;
550     case kX64Lea:
551       __ leaq(i.OutputRegister(), i.MemoryOperand());
552       break;
553     case kX64Push:
554       if (HasImmediateInput(instr, 0)) {
555         __ pushq(i.InputImmediate(0));
556       } else {
557         if (instr->InputAt(0)->IsRegister()) {
558           __ pushq(i.InputRegister(0));
559         } else {
560           __ pushq(i.InputOperand(0));
561         }
562       }
563       break;
564     case kX64StoreWriteBarrier: {
565       Register object = i.InputRegister(0);
566       Register index = i.InputRegister(1);
567       Register value = i.InputRegister(2);
568       __ movsxlq(index, index);
569       __ movq(Operand(object, index, times_1, 0), value);
570       __ leaq(index, Operand(object, index, times_1, 0));
571       SaveFPRegsMode mode = code_->frame()->DidAllocateDoubleRegisters()
572                                 ? kSaveFPRegs
573                                 : kDontSaveFPRegs;
574       __ RecordWrite(object, index, value, mode);
575       break;
576     }
577   }
578 }
579
580
581 // Assembles branches after this instruction.
582 void CodeGenerator::AssembleArchBranch(Instruction* instr,
583                                        FlagsCondition condition) {
584   X64OperandConverter i(this, instr);
585   Label done;
586
587   // Emit a branch. The true and false targets are always the last two inputs
588   // to the instruction.
589   BasicBlock::RpoNumber tblock =
590       i.InputRpo(static_cast<int>(instr->InputCount()) - 2);
591   BasicBlock::RpoNumber fblock =
592       i.InputRpo(static_cast<int>(instr->InputCount()) - 1);
593   bool fallthru = IsNextInAssemblyOrder(fblock);
594   Label* tlabel = code()->GetLabel(tblock);
595   Label* flabel = fallthru ? &done : code()->GetLabel(fblock);
596   Label::Distance flabel_distance = fallthru ? Label::kNear : Label::kFar;
597   switch (condition) {
598     case kUnorderedEqual:
599       __ j(parity_even, flabel, flabel_distance);
600     // Fall through.
601     case kEqual:
602       __ j(equal, tlabel);
603       break;
604     case kUnorderedNotEqual:
605       __ j(parity_even, tlabel);
606     // Fall through.
607     case kNotEqual:
608       __ j(not_equal, tlabel);
609       break;
610     case kSignedLessThan:
611       __ j(less, tlabel);
612       break;
613     case kSignedGreaterThanOrEqual:
614       __ j(greater_equal, tlabel);
615       break;
616     case kSignedLessThanOrEqual:
617       __ j(less_equal, tlabel);
618       break;
619     case kSignedGreaterThan:
620       __ j(greater, tlabel);
621       break;
622     case kUnorderedLessThan:
623       __ j(parity_even, flabel, flabel_distance);
624     // Fall through.
625     case kUnsignedLessThan:
626       __ j(below, tlabel);
627       break;
628     case kUnorderedGreaterThanOrEqual:
629       __ j(parity_even, tlabel);
630     // Fall through.
631     case kUnsignedGreaterThanOrEqual:
632       __ j(above_equal, tlabel);
633       break;
634     case kUnorderedLessThanOrEqual:
635       __ j(parity_even, flabel, flabel_distance);
636     // Fall through.
637     case kUnsignedLessThanOrEqual:
638       __ j(below_equal, tlabel);
639       break;
640     case kUnorderedGreaterThan:
641       __ j(parity_even, tlabel);
642     // Fall through.
643     case kUnsignedGreaterThan:
644       __ j(above, tlabel);
645       break;
646     case kOverflow:
647       __ j(overflow, tlabel);
648       break;
649     case kNotOverflow:
650       __ j(no_overflow, tlabel);
651       break;
652   }
653   if (!fallthru) __ jmp(flabel, flabel_distance);  // no fallthru to flabel.
654   __ bind(&done);
655 }
656
657
658 // Assembles boolean materializations after this instruction.
659 void CodeGenerator::AssembleArchBoolean(Instruction* instr,
660                                         FlagsCondition condition) {
661   X64OperandConverter i(this, instr);
662   Label done;
663
664   // Materialize a full 64-bit 1 or 0 value. The result register is always the
665   // last output of the instruction.
666   Label check;
667   DCHECK_NE(0, static_cast<int>(instr->OutputCount()));
668   Register reg = i.OutputRegister(static_cast<int>(instr->OutputCount() - 1));
669   Condition cc = no_condition;
670   switch (condition) {
671     case kUnorderedEqual:
672       __ j(parity_odd, &check, Label::kNear);
673       __ movl(reg, Immediate(0));
674       __ jmp(&done, Label::kNear);
675     // Fall through.
676     case kEqual:
677       cc = equal;
678       break;
679     case kUnorderedNotEqual:
680       __ j(parity_odd, &check, Label::kNear);
681       __ movl(reg, Immediate(1));
682       __ jmp(&done, Label::kNear);
683     // Fall through.
684     case kNotEqual:
685       cc = not_equal;
686       break;
687     case kSignedLessThan:
688       cc = less;
689       break;
690     case kSignedGreaterThanOrEqual:
691       cc = greater_equal;
692       break;
693     case kSignedLessThanOrEqual:
694       cc = less_equal;
695       break;
696     case kSignedGreaterThan:
697       cc = greater;
698       break;
699     case kUnorderedLessThan:
700       __ j(parity_odd, &check, Label::kNear);
701       __ movl(reg, Immediate(0));
702       __ jmp(&done, Label::kNear);
703     // Fall through.
704     case kUnsignedLessThan:
705       cc = below;
706       break;
707     case kUnorderedGreaterThanOrEqual:
708       __ j(parity_odd, &check, Label::kNear);
709       __ movl(reg, Immediate(1));
710       __ jmp(&done, Label::kNear);
711     // Fall through.
712     case kUnsignedGreaterThanOrEqual:
713       cc = above_equal;
714       break;
715     case kUnorderedLessThanOrEqual:
716       __ j(parity_odd, &check, Label::kNear);
717       __ movl(reg, Immediate(0));
718       __ jmp(&done, Label::kNear);
719     // Fall through.
720     case kUnsignedLessThanOrEqual:
721       cc = below_equal;
722       break;
723     case kUnorderedGreaterThan:
724       __ j(parity_odd, &check, Label::kNear);
725       __ movl(reg, Immediate(1));
726       __ jmp(&done, Label::kNear);
727     // Fall through.
728     case kUnsignedGreaterThan:
729       cc = above;
730       break;
731     case kOverflow:
732       cc = overflow;
733       break;
734     case kNotOverflow:
735       cc = no_overflow;
736       break;
737   }
738   __ bind(&check);
739   __ setcc(cc, reg);
740   __ movzxbl(reg, reg);
741   __ bind(&done);
742 }
743
744
745 void CodeGenerator::AssembleDeoptimizerCall(int deoptimization_id) {
746   Address deopt_entry = Deoptimizer::GetDeoptimizationEntry(
747       isolate(), deoptimization_id, Deoptimizer::LAZY);
748   __ call(deopt_entry, RelocInfo::RUNTIME_ENTRY);
749 }
750
751
752 void CodeGenerator::AssemblePrologue() {
753   CallDescriptor* descriptor = linkage()->GetIncomingDescriptor();
754   int stack_slots = frame()->GetSpillSlotCount();
755   if (descriptor->kind() == CallDescriptor::kCallAddress) {
756     __ pushq(rbp);
757     __ movq(rbp, rsp);
758     const RegList saves = descriptor->CalleeSavedRegisters();
759     if (saves != 0) {  // Save callee-saved registers.
760       int register_save_area_size = 0;
761       for (int i = Register::kNumRegisters - 1; i >= 0; i--) {
762         if (!((1 << i) & saves)) continue;
763         __ pushq(Register::from_code(i));
764         register_save_area_size += kPointerSize;
765       }
766       frame()->SetRegisterSaveAreaSize(register_save_area_size);
767     }
768   } else if (descriptor->IsJSFunctionCall()) {
769     CompilationInfo* info = linkage()->info();
770     __ Prologue(info->IsCodePreAgingActive());
771     frame()->SetRegisterSaveAreaSize(
772         StandardFrameConstants::kFixedFrameSizeFromFp);
773
774     // Sloppy mode functions and builtins need to replace the receiver with the
775     // global proxy when called as functions (without an explicit receiver
776     // object).
777     // TODO(mstarzinger/verwaest): Should this be moved back into the CallIC?
778     if (info->strict_mode() == SLOPPY && !info->is_native()) {
779       Label ok;
780       StackArgumentsAccessor args(rbp, info->scope()->num_parameters());
781       __ movp(rcx, args.GetReceiverOperand());
782       __ CompareRoot(rcx, Heap::kUndefinedValueRootIndex);
783       __ j(not_equal, &ok, Label::kNear);
784       __ movp(rcx, GlobalObjectOperand());
785       __ movp(rcx, FieldOperand(rcx, GlobalObject::kGlobalProxyOffset));
786       __ movp(args.GetReceiverOperand(), rcx);
787       __ bind(&ok);
788     }
789
790   } else {
791     __ StubPrologue();
792     frame()->SetRegisterSaveAreaSize(
793         StandardFrameConstants::kFixedFrameSizeFromFp);
794   }
795   if (stack_slots > 0) {
796     __ subq(rsp, Immediate(stack_slots * kPointerSize));
797   }
798 }
799
800
801 void CodeGenerator::AssembleReturn() {
802   CallDescriptor* descriptor = linkage()->GetIncomingDescriptor();
803   if (descriptor->kind() == CallDescriptor::kCallAddress) {
804     if (frame()->GetRegisterSaveAreaSize() > 0) {
805       // Remove this frame's spill slots first.
806       int stack_slots = frame()->GetSpillSlotCount();
807       if (stack_slots > 0) {
808         __ addq(rsp, Immediate(stack_slots * kPointerSize));
809       }
810       const RegList saves = descriptor->CalleeSavedRegisters();
811       // Restore registers.
812       if (saves != 0) {
813         for (int i = 0; i < Register::kNumRegisters; i++) {
814           if (!((1 << i) & saves)) continue;
815           __ popq(Register::from_code(i));
816         }
817       }
818       __ popq(rbp);  // Pop caller's frame pointer.
819       __ ret(0);
820     } else {
821       // No saved registers.
822       __ movq(rsp, rbp);  // Move stack pointer back to frame pointer.
823       __ popq(rbp);       // Pop caller's frame pointer.
824       __ ret(0);
825     }
826   } else {
827     __ movq(rsp, rbp);  // Move stack pointer back to frame pointer.
828     __ popq(rbp);       // Pop caller's frame pointer.
829     int pop_count = descriptor->IsJSFunctionCall()
830                         ? static_cast<int>(descriptor->JSParameterCount())
831                         : 0;
832     __ ret(pop_count * kPointerSize);
833   }
834 }
835
836
837 void CodeGenerator::AssembleMove(InstructionOperand* source,
838                                  InstructionOperand* destination) {
839   X64OperandConverter g(this, NULL);
840   // Dispatch on the source and destination operand kinds.  Not all
841   // combinations are possible.
842   if (source->IsRegister()) {
843     DCHECK(destination->IsRegister() || destination->IsStackSlot());
844     Register src = g.ToRegister(source);
845     if (destination->IsRegister()) {
846       __ movq(g.ToRegister(destination), src);
847     } else {
848       __ movq(g.ToOperand(destination), src);
849     }
850   } else if (source->IsStackSlot()) {
851     DCHECK(destination->IsRegister() || destination->IsStackSlot());
852     Operand src = g.ToOperand(source);
853     if (destination->IsRegister()) {
854       Register dst = g.ToRegister(destination);
855       __ movq(dst, src);
856     } else {
857       // Spill on demand to use a temporary register for memory-to-memory
858       // moves.
859       Register tmp = kScratchRegister;
860       Operand dst = g.ToOperand(destination);
861       __ movq(tmp, src);
862       __ movq(dst, tmp);
863     }
864   } else if (source->IsConstant()) {
865     ConstantOperand* constant_source = ConstantOperand::cast(source);
866     Constant src = g.ToConstant(constant_source);
867     if (destination->IsRegister() || destination->IsStackSlot()) {
868       Register dst = destination->IsRegister() ? g.ToRegister(destination)
869                                                : kScratchRegister;
870       switch (src.type()) {
871         case Constant::kInt32:
872           // TODO(dcarney): don't need scratch in this case.
873           __ movq(dst, Immediate(src.ToInt32()));
874           break;
875         case Constant::kInt64:
876           __ Set(dst, src.ToInt64());
877           break;
878         case Constant::kFloat32:
879           __ Move(dst,
880                   isolate()->factory()->NewNumber(src.ToFloat32(), TENURED));
881           break;
882         case Constant::kFloat64:
883           __ Move(dst,
884                   isolate()->factory()->NewNumber(src.ToFloat64(), TENURED));
885           break;
886         case Constant::kExternalReference:
887           __ Move(dst, src.ToExternalReference());
888           break;
889         case Constant::kHeapObject:
890           __ Move(dst, src.ToHeapObject());
891           break;
892       }
893       if (destination->IsStackSlot()) {
894         __ movq(g.ToOperand(destination), kScratchRegister);
895       }
896     } else if (src.type() == Constant::kFloat32) {
897       // TODO(turbofan): Can we do better here?
898       __ movl(kScratchRegister, Immediate(bit_cast<int32_t>(src.ToFloat32())));
899       if (destination->IsDoubleRegister()) {
900         XMMRegister dst = g.ToDoubleRegister(destination);
901         __ movq(dst, kScratchRegister);
902       } else {
903         DCHECK(destination->IsDoubleStackSlot());
904         Operand dst = g.ToOperand(destination);
905         __ movl(dst, kScratchRegister);
906       }
907     } else {
908       DCHECK_EQ(Constant::kFloat64, src.type());
909       __ movq(kScratchRegister, bit_cast<int64_t>(src.ToFloat64()));
910       if (destination->IsDoubleRegister()) {
911         __ movq(g.ToDoubleRegister(destination), kScratchRegister);
912       } else {
913         DCHECK(destination->IsDoubleStackSlot());
914         __ movq(g.ToOperand(destination), kScratchRegister);
915       }
916     }
917   } else if (source->IsDoubleRegister()) {
918     XMMRegister src = g.ToDoubleRegister(source);
919     if (destination->IsDoubleRegister()) {
920       XMMRegister dst = g.ToDoubleRegister(destination);
921       __ movsd(dst, src);
922     } else {
923       DCHECK(destination->IsDoubleStackSlot());
924       Operand dst = g.ToOperand(destination);
925       __ movsd(dst, src);
926     }
927   } else if (source->IsDoubleStackSlot()) {
928     DCHECK(destination->IsDoubleRegister() || destination->IsDoubleStackSlot());
929     Operand src = g.ToOperand(source);
930     if (destination->IsDoubleRegister()) {
931       XMMRegister dst = g.ToDoubleRegister(destination);
932       __ movsd(dst, src);
933     } else {
934       // We rely on having xmm0 available as a fixed scratch register.
935       Operand dst = g.ToOperand(destination);
936       __ movsd(xmm0, src);
937       __ movsd(dst, xmm0);
938     }
939   } else {
940     UNREACHABLE();
941   }
942 }
943
944
945 void CodeGenerator::AssembleSwap(InstructionOperand* source,
946                                  InstructionOperand* destination) {
947   X64OperandConverter g(this, NULL);
948   // Dispatch on the source and destination operand kinds.  Not all
949   // combinations are possible.
950   if (source->IsRegister() && destination->IsRegister()) {
951     // Register-register.
952     __ xchgq(g.ToRegister(source), g.ToRegister(destination));
953   } else if (source->IsRegister() && destination->IsStackSlot()) {
954     Register src = g.ToRegister(source);
955     Operand dst = g.ToOperand(destination);
956     __ xchgq(src, dst);
957   } else if ((source->IsStackSlot() && destination->IsStackSlot()) ||
958              (source->IsDoubleStackSlot() &&
959               destination->IsDoubleStackSlot())) {
960     // Memory-memory.
961     Register tmp = kScratchRegister;
962     Operand src = g.ToOperand(source);
963     Operand dst = g.ToOperand(destination);
964     __ movq(tmp, dst);
965     __ xchgq(tmp, src);
966     __ movq(dst, tmp);
967   } else if (source->IsDoubleRegister() && destination->IsDoubleRegister()) {
968     // XMM register-register swap. We rely on having xmm0
969     // available as a fixed scratch register.
970     XMMRegister src = g.ToDoubleRegister(source);
971     XMMRegister dst = g.ToDoubleRegister(destination);
972     __ movsd(xmm0, src);
973     __ movsd(src, dst);
974     __ movsd(dst, xmm0);
975   } else if (source->IsDoubleRegister() && destination->IsDoubleRegister()) {
976     // XMM register-memory swap.  We rely on having xmm0
977     // available as a fixed scratch register.
978     XMMRegister src = g.ToDoubleRegister(source);
979     Operand dst = g.ToOperand(destination);
980     __ movsd(xmm0, src);
981     __ movsd(src, dst);
982     __ movsd(dst, xmm0);
983   } else {
984     // No other combinations are possible.
985     UNREACHABLE();
986   }
987 }
988
989
990 void CodeGenerator::AddNopForSmiCodeInlining() { __ nop(); }
991
992
993 void CodeGenerator::EnsureSpaceForLazyDeopt() {
994   int space_needed = Deoptimizer::patch_size();
995   if (!linkage()->info()->IsStub()) {
996     // Ensure that we have enough space after the previous lazy-bailout
997     // instruction for patching the code here.
998     int current_pc = masm()->pc_offset();
999     if (current_pc < last_lazy_deopt_pc_ + space_needed) {
1000       int padding_size = last_lazy_deopt_pc_ + space_needed - current_pc;
1001       __ Nop(padding_size);
1002     }
1003   }
1004   MarkLazyDeoptSite();
1005 }
1006
1007 #undef __
1008
1009 }  // namespace internal
1010 }  // namespace compiler
1011 }  // namespace v8