platform/upstream/llvm.git
4 years ago[libc++] Fixed copy/copy_n/copy_backward for compilers that do not support is_constan...
Louis Dionne [Thu, 7 Nov 2019 12:30:32 +0000 (12:30 +0000)]
[libc++] Fixed copy/copy_n/copy_backward for compilers that do not support is_constant_evaluated.

Differential Revision: https://reviews.llvm.org/D69940

4 years ago[libc++] Fix some constexpr tests broken by D68837
Louis Dionne [Wed, 6 Nov 2019 14:52:26 +0000 (14:52 +0000)]
[libc++] Fix some constexpr tests broken by D68837

This doesn't fix all the issues with D68837

4 years ago[ThinLTO] Import readonly vars with refs
evgeny [Thu, 7 Nov 2019 12:13:35 +0000 (15:13 +0300)]
[ThinLTO] Import readonly vars with refs

Patch allows importing declarations of functions and variables, referenced
by the initializer of some other readonly variable.
Differential revision: https://reviews.llvm.org/D69561

4 years ago[SLP] allow forming 2-way reduction patterns
Sanjay Patel [Wed, 6 Nov 2019 22:24:09 +0000 (17:24 -0500)]
[SLP] allow forming 2-way reduction patterns

We have a vector compare reduction problem seen in PR39665 comment 2:
https://bugs.llvm.org/show_bug.cgi?id=39665#c2

Or slightly reduced here:

define i1 @cmp2(<2 x double> %a0) {
  %a = fcmp ogt <2 x double> %a0, <double 1.0, double 1.0>
  %b = extractelement <2 x i1> %a, i32 0
  %c = extractelement <2 x i1> %a, i32 1
  %d = and i1 %b, %c
  ret i1 %d
}

SLP would not attempt to turn this into a vector reduction because there is an
artificial lower limit on that transform. We can not completely remove that limit
without inducing regressions though, so this patch just hacks an extra attempt at
creating a 2-way reduction to the end of the analysis.

As shown in the test file, we are still not getting some of the motivating cases,
so follow-on patches will be needed to solve those cases.

Differential Revision: https://reviews.llvm.org/D59710

4 years ago[NFC][CVP] Add some tests for `sub` with preexisting no-wrap flags
Roman Lebedev [Thu, 7 Nov 2019 10:59:26 +0000 (13:59 +0300)]
[NFC][CVP] Add some tests for `sub` with preexisting no-wrap flags

We can use those to further limit the ranges in LVI.

4 years ago[mips] Set macros for Octeon+ CPU
Simon Atanasyan [Tue, 5 Nov 2019 08:21:04 +0000 (11:21 +0300)]
[mips] Set macros for Octeon+ CPU

4 years ago[mips] Add `octeon+` to the list of CPUs accepted by the driver
Simon Atanasyan [Mon, 4 Nov 2019 23:21:16 +0000 (02:21 +0300)]
[mips] Add `octeon+` to the list of CPUs accepted by the driver

4 years ago[mips] Write `AFL_EXT_OCTEONP` flag to the `.MIPS.abiflags` section
Simon Atanasyan [Mon, 4 Nov 2019 22:26:24 +0000 (01:26 +0300)]
[mips] Write `AFL_EXT_OCTEONP` flag to the `.MIPS.abiflags` section

Differential Revision: https://reviews.llvm.org/D69851

4 years ago[mips] Support `octeon+` CPU in the `.set arch=` directive
Simon Atanasyan [Mon, 4 Nov 2019 22:23:59 +0000 (01:23 +0300)]
[mips] Support `octeon+` CPU in the `.set arch=` directive

Differential Revision: https://reviews.llvm.org/D69850

4 years ago[mips] Implement Octeon+ `saa` and `saad` instructions
Simon Atanasyan [Mon, 4 Nov 2019 22:12:10 +0000 (01:12 +0300)]
[mips] Implement Octeon+ `saa` and `saad` instructions

`saa` and `saad` are 32-bit and 64-bit store atomic add instructions.

   memory[base] = memory[base] + rt

These instructions are available for "Octeon+" CPU. The patch adds support
for both instructions to MIPS assembler and diassembler and introduces new
CPU type - "octeon+".

Next patches will implement `.set arch=octeon+` directive and `AFL_EXT_OCTEONP`
ISA extension flag support.

Differential Revision: https://reviews.llvm.org/D69849

4 years agoRevert f0c2a5a "[LV] Generalize conditions for sinking instrs for first order recurre...
Hans Wennborg [Thu, 7 Nov 2019 10:00:02 +0000 (11:00 +0100)]
Revert f0c2a5a "[LV] Generalize conditions for sinking instrs for first order recurrences."

It broke Chromium, causing "Instruction does not dominate all uses!" errors.
See https://bugs.chromium.org/p/chromium/issues/detail?id=1022297#c1 for a
reproducer.

> If the recurrence PHI node has a single user, we can sink any
> instruction without side effects, given that all users are dominated by
> the instruction computing the incoming value of the next iteration
> ('Previous'). We can sink instructions that may cause traps, because
> that only causes the trap to occur later, but not on any new paths.
>
> With the relaxed check, we also have to make sure that we do not have a
> direct cycle (meaning PHI user == 'Previous), which indicates a
> reduction relation, which potentially gets missed by
> ReductionDescriptor.
>
> As follow-ups, we can also sink stores, iff they do not alias with
> other instructions we move them across and we could also support sinking
> chains of instructions and multiple users of the PHI.
>
> Fixes PR43398.
>
> Reviewers: hsaito, dcaballe, Ayal, rengolin
>
> Reviewed By: Ayal
>
> Differential Revision: https://reviews.llvm.org/D69228

4 years ago[clangd] NFC, hide the internal-only utility function lex.
Haojian Wu [Thu, 7 Nov 2019 09:53:19 +0000 (10:53 +0100)]
[clangd] NFC, hide the internal-only utility function lex.

To avoid any potential ODR violations.

4 years ago[lldb-server] Add setting to force 'g' packet use
Guilherme Andrade [Thu, 7 Nov 2019 09:38:25 +0000 (10:38 +0100)]
[lldb-server] Add setting to force 'g' packet use

Following up on https://reviews.llvm.org/D62221, this change introduces
the settings plugin.process.gdb-remote.use-g-packet-for-reading.  When
they are on, 'g' packets are used for reading registers.

Using 'g' packets can improve performance by reducing the number of
packets exchanged between client and server when a large number of
registers needs to be fetched.

Differential revision: https://reviews.llvm.org/D62931

4 years ago[clang-rename] Respect the traversal scope when traversing the entire AST.
Haojian Wu [Wed, 6 Nov 2019 14:21:40 +0000 (15:21 +0100)]
[clang-rename] Respect the traversal scope when traversing the entire AST.

Summary:
This should be NFC to clang-rename, by default the traversal scope is
TUDecl. Traversing the TUDecl in clangd is a performance cliff, we should
avoid it.

Reviewers: ilya-biryukov

Subscribers: kadircet, usaxena95, cfe-commits

Tags: #clang

Differential Revision: https://reviews.llvm.org/D69892

4 years agoRevert a5c8ec4 "[CGDebugInfo] Emit subprograms for decls when AT_tail_call is understood"
Hans Wennborg [Thu, 7 Nov 2019 09:23:24 +0000 (10:23 +0100)]
Revert a5c8ec4 "[CGDebugInfo] Emit subprograms for decls when AT_tail_call is understood"

This caused Chromium builds to fail with "inlinable function call in a function
with debug info must have a !dbg location" errors. See
https://bugs.chromium.org/p/chromium/issues/detail?id=1022296#c1 for a
reproducer.

> Currently, clang emits subprograms for declared functions when the
> target debugger or DWARF standard is known to support entry values
> (DW_OP_entry_value & the GNU equivalent).
>
> Treat DW_AT_tail_call the same way to allow debuggers to follow cross-TU
> tail calls.
>
> Pre-patch debug session with a cross-TU tail call:
>
> ```
>   * frame #0: 0x0000000100000fa4 main`target at b.c:4:3 [opt]
>     frame #1: 0x0000000100000f99 main`main at a.c:8:10 [opt]
> ```
>
> Post-patch (note that the tail-calling frame, "helper", is visible):
>
> ```
>   * frame #0: 0x0000000100000fa4 main`target at b.c:4:3 [opt]
>     frame #1: 0x0000000100000f80 main`helper [opt] [artificial]
>     frame #2: 0x0000000100000f99 main`main at a.c:8:10 [opt]
> ```
>
> rdar://46577651
>
> Differential Revision: https://reviews.llvm.org/D69743

4 years ago[clangd] Add unit tests for comments in system headers
Ilya Biryukov [Thu, 7 Nov 2019 08:59:36 +0000 (09:59 +0100)]
[clangd] Add unit tests for comments in system headers

4 years ago[clang-format] Make '.clang-format' variants finding a loop (NFC)
Anders Waldenborg [Thu, 7 Nov 2019 08:59:34 +0000 (09:59 +0100)]
[clang-format] Make '.clang-format' variants finding a loop (NFC)

This simplifies logic making it trivial to add searching for other
files later.

Differential revision: https://reviews.llvm.org/D68568

4 years ago[clangd] Set RetainCommentsFromSystemHeaders to true
Ilya Biryukov [Thu, 7 Nov 2019 08:53:07 +0000 (09:53 +0100)]
[clangd] Set RetainCommentsFromSystemHeaders to true

clangd should retain comments from system headers.

fixes https://github.com/clangd/clangd/issues/96

Patch by lh123!

Differential revision: https://reviews.llvm.org/D69928

4 years ago[AMDGPU] Fix bug introduced in 47a5c36b37f0
dfukalov [Wed, 6 Nov 2019 19:05:58 +0000 (22:05 +0300)]
[AMDGPU] Fix bug introduced in 47a5c36b37f0

Summary: [AMDGPU] Fix bug introduced in 47a5c36b37f0

Reviewers: foad, arsenm

Reviewed By: arsenm

Subscribers: arsenm, kzhuravl, jvesely, wdng, nhaehnle, yaxunl, dstuttard, tpr, t-tye, hiraditya, llvm-commits

Tags: #llvm

Differential Revision: https://reviews.llvm.org/D69915

4 years ago[Syntax] Silence "unused function" warning in no-assert builds. NFC
Ilya Biryukov [Thu, 7 Nov 2019 08:37:25 +0000 (09:37 +0100)]
[Syntax] Silence "unused function" warning in no-assert builds. NFC

A helper `isImpicitExpr` is only used inside assert.

4 years ago[llvm-readobj] - Simplify elf-hash-symbols.test. NFCI.
Georgii Rymar [Wed, 6 Nov 2019 09:11:44 +0000 (12:11 +0300)]
[llvm-readobj] - Simplify elf-hash-symbols.test. NFCI.

It converts binary contents of .hash and .gnu.hash that were generated by a linker
to YAML descriptions.
I've also dropped Shift2 and BloomFilter values because they are not needed here.

Differential revision: https://reviews.llvm.org/D69881

4 years ago[X86] Remove unused variable. NFC
Craig Topper [Thu, 7 Nov 2019 06:53:48 +0000 (22:53 -0800)]
[X86] Remove unused variable. NFC

4 years ago[X86] Remove dead code from combineStore.
Craig Topper [Thu, 7 Nov 2019 06:24:05 +0000 (22:24 -0800)]
[X86] Remove dead code from combineStore.

Leftovers from before we switched to widening legalization.

Fixes PR43919.

4 years ago[Clang] Add ENABLE_LINKER_BUILD_ID to Hurd driver.
kristina [Thu, 7 Nov 2019 05:38:24 +0000 (05:38 +0000)]
[Clang] Add ENABLE_LINKER_BUILD_ID to Hurd driver.

This was added for Linux toolchains in rC271692, this
patch extends this to the Hurd toolchain.

Patch by sthibaul (Samuel Thibault)

Differential Revision: https://reviews.llvm.org/D69754

4 years agoTemporarily Revert "[LV] Apply sink-after & interleave-groups as VPlan transformation...
Eric Christopher [Thu, 7 Nov 2019 05:58:28 +0000 (21:58 -0800)]
Temporarily Revert "[LV] Apply sink-after & interleave-groups as VPlan transformations (NFC)"
as it's causing assert failures.

This reverts commit 100e797adb433724a17c9b42b6533cd634cb796b.

4 years ago[OPENMP] [DOCS] fix section formatting issues [NFC]
Kelvin Li [Wed, 6 Nov 2019 18:25:16 +0000 (13:25 -0500)]
[OPENMP] [DOCS] fix section formatting issues [NFC]

Differential Revision: https://reviews.llvm.org/D69909

4 years agoKeep import function list for inlinee profile update
Wenlei He [Fri, 1 Nov 2019 19:57:23 +0000 (12:57 -0700)]
Keep import function list for inlinee profile update

Summary:
When adjusting function entry counts after inlining, Funciton::setEntryCount is called without providing an import function list. The side effect of that is the previously set import function list will be dropped. The import function list is used by ThinLTO to help import hot cross module callee for LTO inlining, so dropping that during ThinLTO pre-link may adversely affect LTO inlining. The fix is to keep the list while updating entry counts for inlining.

Reviewers: wmi, davidxl, tejohnson

Subscribers: mehdi_amini, hiraditya, dexonsmith, llvm-commits

Tags: #llvm

Differential Revision: https://reviews.llvm.org/D69736

4 years ago[AArch64][SVE] Add remaining patterns and intrinsics for add/sub/mad patterns
Danilo Carvalho Grael [Wed, 6 Nov 2019 22:02:58 +0000 (17:02 -0500)]
[AArch64][SVE] Add remaining patterns and intrinsics for add/sub/mad patterns

Add pattern matching and intrinsics for the following instructions:

predicated orr, eor, and, bic
predicated mul, smulh, umulh, sdiv, udiv, sdivr, udivr
predicated smax, umax, smin, umin, sabd, uabd
mad, msb, mla, mls

https://reviews.llvm.org/D69588

4 years agoRevert "gn build: (manually) merge b5913e6d2f"
Nico Weber [Thu, 7 Nov 2019 01:52:29 +0000 (20:52 -0500)]
Revert "gn build: (manually) merge b5913e6d2f"

This reverts commit c52efdc52cef2597a1d21595a9685e2f798025b8,
because b5913e6d2f got reverted.

4 years agoRevert "Introduce llvm-install-name-tool"
Alexander Shaposhnikov [Thu, 7 Nov 2019 01:04:04 +0000 (17:04 -0800)]
Revert "Introduce llvm-install-name-tool"

This reverts commit b5913e6d2f6d13fb753df701619731ca11936316.

4 years agoAMDGPU: Select global atomicrmw fadd
Matt Arsenault [Thu, 29 Aug 2019 18:53:17 +0000 (14:53 -0400)]
AMDGPU: Select global atomicrmw fadd

This only works if there is no use of the return value.

4 years agoTableGen: Remove assert that pattern results match input number
Matt Arsenault [Thu, 29 Aug 2019 19:10:12 +0000 (15:10 -0400)]
TableGen: Remove assert that pattern results match input number

AMDGPU has some atomic instructions that do not return the previous
result, and can only be selected if there are no uses. The source
pattern will only match if the use is empty, so it should be safe to
discard the result.

4 years agoTemporarily Revert:
Eric Christopher [Wed, 6 Nov 2019 23:56:41 +0000 (15:56 -0800)]
Temporarily Revert:

 "[SLP] Generalization of stores vectorization."
 "[SLP] Fix -Wunused-variable. NFC"
 "[SLP] Vectorize jumbled stores."

As they're causing significant (10-30x) compile time regressions on
vectorizable code.

The primary cause of the compile-time regression is f228b5371647f471853c5fb3e6719823a42fe451.

This reverts commits:

f228b5371647f471853c5fb3e6719823a42fe451
5503455ccb3f5fcedced158332c016c8d3a7fa81
21d498c9c0f32dcab5bc89ac593aa813b533b43a

4 years ago[LLDB] Adding caching to libc++ std::function formatter for lookups that require...
shafik [Wed, 6 Nov 2019 23:57:52 +0000 (15:57 -0800)]
[LLDB] Adding caching to libc++ std::function formatter for lookups that require scanning symbols

Performance issues lead to the libc++ std::function formatter to be disabled.
This change is the first of two changes that should address the performance issues and allow us to enable the formatter again.
In some cases we end up scanning the symbol table for the callable wrapped by std::function for those cases we will now cache the results and used the cache in subsequent look-ups. This still leaves a large cost for the initial lookup which will be addressed in the next change.

Differential Revision: https://reviews.llvm.org/D67111

4 years ago[AMDGPU] Add handling of 160 bit registers in analyzeResourceUsage
Stanislav Mekhanoshin [Wed, 6 Nov 2019 20:39:38 +0000 (12:39 -0800)]
[AMDGPU] Add handling of 160 bit registers in analyzeResourceUsage

This was omitted. Also SReg_96Reg missed IsSGPR assignment.

Differential Revision: https://reviews.llvm.org/D69919

4 years agounwind: restore the LINKER_LANGUAGE
Saleem Abdulrasool [Wed, 6 Nov 2019 23:40:07 +0000 (15:40 -0800)]
unwind: restore the LINKER_LANGUAGE

Have CMake treat the unwind libraries as C libraries rather than C++.
There is no C++ runtime dependency at runtime.  This ensures that we do
not accidentally end up with a link against the C++ runtime.

We need to explicitly reset the implicitly linked libraries for C++ to
ensure that we do not have CMake force the link against the C++ runtime.
This adjustment should enable the NetBSD bots to be happy with this
change.

4 years agounwind: reflow some of the build rules (NFC)
Saleem Abdulrasool [Wed, 6 Nov 2019 23:38:25 +0000 (15:38 -0800)]
unwind: reflow some of the build rules (NFC)

Reflow the CMake properties to take less vertical space.  This just
makes it easier to read.  NFC.

4 years ago[LoopPred] Enable new transformation by default
Philip Reames [Wed, 6 Nov 2019 23:30:47 +0000 (15:30 -0800)]
[LoopPred] Enable new transformation by default

The basic idea of the transform is to convert variant loop exit conditions into invariant exit conditions by changing the iteration on which the exit is taken when we know that the trip count is unobservable.  See the original patch which introduced the code for a more complete explanation.

The individual parts of this have been reviewed, the result has been fuzzed, and then further analyzed by hand, but despite all of that, I will not be suprised to see breakage here.  If you see problems, please don't hesitate to revert - though please do provide a test case.  The most likely class of issues are latent SCEV bugs and without a reduced test case, I'll be essentially stuck on reducing them.

(Note: A bunch of tests were opted out of the new transform to preserve coverage.  That landed in a previous commit to simplify revert cycles if they turn out to be needed.)

4 years ago[LoopPred] Selectively disable to preserve test cases
Philip Reames [Wed, 6 Nov 2019 23:16:43 +0000 (15:16 -0800)]
[LoopPred] Selectively disable to preserve test cases

I'm about to enable the new loop predication transform by default.  It has the effect of completely destroying many read only loops - which happen to be a super common idiom in our test cases.  So as to preserve test coverage of other transforms, disable the new transform where it would cause sharp test coverage regressions.

(This is semantically part of the enabling commit.  It's committed separate to ease revert if the actual flag flip gets reverted.)

4 years agogn build: (manually) merge b5913e6d2f
Nico Weber [Wed, 6 Nov 2019 23:26:36 +0000 (18:26 -0500)]
gn build: (manually) merge b5913e6d2f

4 years agoWhen lowering calls and tail calls in AArch64, the register mask and
Eric Christopher [Wed, 6 Nov 2019 23:16:19 +0000 (15:16 -0800)]
When lowering calls and tail calls in AArch64, the register mask and
return value location depends on the calling convention of the callee.
`F.getCallingConv()`, however, is the caller CC. Correct it to the
callee CC from `CallLoweringInfo`.

Fixes PR43449

Patch by Shu-Chun Weng!

4 years ago[lldb] Mark ASan & TSan as test dependencies
Jonas Devlieghere [Wed, 6 Nov 2019 23:22:17 +0000 (15:22 -0800)]
[lldb] Mark ASan & TSan as test dependencies

Without asan and tsan as test dependencies, you might end up with a
clang that points to sanitizer runtime library that hasn't been build
yet.

4 years ago[test] Fix apple_simulator_test decorator when simulators are unavailable
Alex Langford [Wed, 6 Nov 2019 23:12:31 +0000 (15:12 -0800)]
[test] Fix apple_simulator_test decorator when simulators are unavailable

In the case where xcodebuild fails as you set up simulator tests, you
would fail because `feature` is never defined.

4 years ago[lldb] Remove dead code from STLUtils.h
Jonas Devlieghere [Wed, 6 Nov 2019 22:44:39 +0000 (14:44 -0800)]
[lldb] Remove dead code from STLUtils.h

4 years ago[docs] Fix references to a renamed flag.
Lang Hames [Wed, 6 Nov 2019 22:37:04 +0000 (14:37 -0800)]
[docs] Fix references to a renamed flag.

The -use-mcjit option was replaced with -jit-kind=mcjit a while back. This patch
updates the docs to reflect that.

Patch by Yu Jian. Thanks Jian!

4 years ago[ConstantRange] Add `subWithNoWrap()` method
Roman Lebedev [Wed, 6 Nov 2019 22:21:29 +0000 (01:21 +0300)]
[ConstantRange] Add `subWithNoWrap()` method

Summary:
Much like D67339, adds ConstantRange handling for
when we know no-wrap behavior of the `sub`.

Unlike addWithNoWrap(), we only get lucky re returning empty set
for signed wrap. For unsigned, we must perform overflow check manually.

A patch that makes use of this in LVI (CVP) to be posted later.

Reviewers: nikic, shchenz, efriedma

Reviewed By: nikic

Subscribers: hiraditya, llvm-commits

Tags: #llvm

Differential Revision: https://reviews.llvm.org/D69918

4 years ago[ConstantRange] Cleanup addWithNoWrap() by just piggybacking on sadd_sat()/uadd_sat()
Roman Lebedev [Wed, 6 Nov 2019 22:19:54 +0000 (01:19 +0300)]
[ConstantRange] Cleanup addWithNoWrap() by just piggybacking on sadd_sat()/uadd_sat()

As discussed in https://reviews.llvm.org/D69918
that happens to work as intended, and returns empty set if
there is always an overflow because we get lucky with intersection.
Since there's now an explicit test for that, let's prefer cleaner code.

4 years ago[ConstantRange] TestAddWithNo*WrapExhaustive: check that all overflow means empty set
Roman Lebedev [Wed, 6 Nov 2019 22:16:01 +0000 (01:16 +0300)]
[ConstantRange] TestAddWithNo*WrapExhaustive: check that all overflow means empty set

As disscussed in https://reviews.llvm.org/D69918 / https://reviews.llvm.org/D67339
that is an implied postcondition, but it's not really fully tested.

4 years ago[JITLink] Refactor EH-frame handling to support eh-frames with existing relocs.
Lang Hames [Tue, 5 Nov 2019 00:00:09 +0000 (16:00 -0800)]
[JITLink] Refactor EH-frame handling to support eh-frames with existing relocs.

Some targets (E.g. MachO/arm64) use relocations to fix some CFI record fields
in the eh-frame section. When relocations are used the initial (pre-relocation)
content of the eh-frame section can no longer be interpreted by following the
eh-frame specification. This causes errors in the existing eh-frame parser.

This patch moves eh-frame handling into two LinkGraph passes that are run after
relocations have been parsed (but before they are applied). The first] pass
breaks up blocks in the eh-frame section into per-CFI-record blocks, and the
second parses blocks of (potentially multiple) CFI records and adds the
appropriate edges to any CFI fields that do not have existing relocations.
These passes can be run independently of one another. By handling eh-frame
splitting/fixing with LinkGraph passes we can both re-use existing relocations
for CFI record fields and avoid applying eh-frame fixups before parsing the
section (which would complicate the linker and require extra temporary
allocations of working memory).

4 years agoTestuite: Support Asan test with remote testing
Fred Riss [Wed, 6 Nov 2019 21:53:14 +0000 (13:53 -0800)]
Testuite: Support Asan test with remote testing

To do so, we need to register the sanitizer libraries with the target
so that they get uploaded before running. This patch adds a helper to
the test class to this effect.

4 years ago[LLDB] Fix handling for the clang name mangling extension for block invocations
shafik [Wed, 6 Nov 2019 22:06:56 +0000 (14:06 -0800)]
[LLDB] Fix handling for the clang name mangling extension for block invocations

Add support for clangs  mangling extension for block invocations.

Differential Revision: https://reviews.llvm.org/D69738

4 years ago[Orc] Fix iterator usage after remove
Alexandre Ganea [Wed, 6 Nov 2019 22:11:12 +0000 (17:11 -0500)]
[Orc] Fix iterator usage after remove

Differential Revision: https://reviews.llvm.org/D69805

4 years ago[JumpThreading] Factor out code to clone instructions (NFC)
Kazu Hirata [Wed, 6 Nov 2019 22:16:48 +0000 (14:16 -0800)]
[JumpThreading] Factor out code to clone instructions (NFC)

Summary:
This patch factors out code to clone instructions -- partly for
readability and partly to facilitate an upcoming patch of my own.

Reviewers: wmi

Subscribers: hiraditya, jfb, llvm-commits

Tags: #llvm

Differential Revision: https://reviews.llvm.org/D69861

4 years ago[WC] Fix a subtle bug in our definition of widenable branch
Philip Reames [Wed, 6 Nov 2019 22:05:59 +0000 (14:05 -0800)]
[WC] Fix a subtle bug in our definition of widenable branch

We had a subtle, but nasty bug in our definition of a widenable branch, and thus in the transforms which used that utility. Specifically, we returned true for any branch which included a widenable condition within it's condition, regardless of whether that widenable condition also had other uses.

The problem is that the result of the WC() call is defined to be one particular value. As such, all users must agree as to what that value is. If we widen a branch without also updating *all other users* of the WC in the same way, we have broken the required semantics.

Most of the textual diff is updating existing transforms not to leave dead uses hanging around. They're largely NFC as the dead instructions would be immediately deleted by other passes. The reason to make these changes is so that the transforms preserve the widenable branch form.

In practice, we don't get bitten by this only because it isn't profitable to CSE WC() calls and the lowering pass from guards uses distinct WC calls per branch.

Differential Revision: https://reviews.llvm.org/D69916

4 years ago[Analysis] Attribute deref/deref_or_null should not prevent tail call optimization
Dávid Bolvanský [Wed, 6 Nov 2019 22:07:17 +0000 (23:07 +0100)]
[Analysis] Attribute deref/deref_or_null should not prevent tail call optimization

4 years ago[lldb] Record framework build path and use it everywhere
Haibo Huang [Wed, 30 Oct 2019 17:33:05 +0000 (10:33 -0700)]
[lldb] Record framework build path and use it everywhere

This avoids config time dependencies on liblldb. And enables other refactoring.

4 years ago[LoopPred] Fix two subtle issues found by inspection
Philip Reames [Wed, 6 Nov 2019 20:36:28 +0000 (12:36 -0800)]
[LoopPred] Fix two subtle issues found by inspection

This patch fixes two issues noticed by inspection when going to enable the loop predication code in IndVarSimplify.

Issue 1 - Both the LoopPredication transform, and the already on by default optimizeLoopExits transform, modify the exit count of the exits they modify. (either to 0 or Infinity) Looking at the code more closely, this was not reflected into SCEV and we were instead running later transforms with incorrect SCEVs. Fixing this requires forgetting the loop, weakening a too strong assert, and updating SCEV to not pessimize results when a loop is provable untaken. I haven't been able to find a test case to demonstrate the miscompile.

Issue 2 - For modules without a data layout, we can end up with unsized pointer typed exit counts. Just bail out of this case.

I think these are the last two issues which need addressed before we enable this by default. The code has already survived a decent amount of fuzzing without revealing either of the above.

Differential Revision: https://reviews.llvm.org/D69695

4 years ago[lit] Protect full test suite from FILECHECK_OPTS
Joel E. Denny [Thu, 25 Jul 2019 03:14:32 +0000 (03:14 +0000)]
[lit] Protect full test suite from FILECHECK_OPTS

lit's test suite calls lit multiple times for various sample test
suites.  `FILECHECK_OPTS` is safe for FileCheck calls in lit's test
suite.  It's not safe for FileCheck calls in the sample test suites,
whose output affects the results of lit's test suite.

Without this patch, only one such sample test suite is protected from
`FILECHECK_OPTS`, and currently `shtest-shell.py` breaks with
`FILECHECK_OPTS=-vv`.  Moreover, it's hard to predict the future,
especially false passes.  Thus, this patch protects all existing and
future sample test suites from `FILECHECK_OPTS` (and the deprecated
`FILECHECK_DUMP_INPUT_ON_FAILURE`).

Reviewed By: probinson

Differential Revision: https://reviews.llvm.org/D65156

4 years ago[X86] Clamp large constant shift amounts for MMX shift intrinsics to 8-bits.
Craig Topper [Wed, 6 Nov 2019 20:39:09 +0000 (12:39 -0800)]
[X86] Clamp large constant shift amounts for MMX shift intrinsics to 8-bits.

The MMX intrinsics for shift by immediate take a 32-bit shift
amount but the hardware for shifting by immediate only encodes
8-bits. For the intrinsic we don't require the shift amount to
fit in 8-bits in the frontend because we don't check that its an
immediate in the frontend. If its is not an immediate we move it
to an MMX register and use the shift by register.

But if it is an immediate we'll use the shift by immediate
instruction. But we need to change the shift amount to 8-bits.
We were previously doing this accidentally by masking it in the
encoder. But this can make a large shift amount into a small
in bounds shift amount. Instead we should clamp larger shift
amounts to 255 so that the they don't become in bounds.

Fixes PR43922

4 years ago[AArch64] Re-add patterns for (s/u)mull2.
Eli Friedman [Mon, 4 Nov 2019 22:46:42 +0000 (14:46 -0800)]
[AArch64] Re-add patterns for (s/u)mull2.

These patterns were added in D46009, but removed in D54276 due to
missing test coverage.

Differential Revision: https://reviews.llvm.org/D69831

4 years ago[clang-format] [NFC] update the documentation in Format.h to allow dump_format_style...
paulhoad [Wed, 6 Nov 2019 20:02:16 +0000 (20:02 +0000)]
[clang-format] [NFC] update the documentation in Format.h to allow dump_format_style.py to get a little closer to being correct. (part 2)

Summary:
a change {D67541} cause LanguageStandard to now be subtly different from all other clang-format options, in that the Enum value (less the prefix) is not always allowed as valid as the configuration option.

This caused the ClangFormatStyleOptions.rst and the Format.h to diverge so that the ClangFormatStyleOptions.rst could no longer be generated from the Format.h using dump_format_stlye.py

This fix tried to remedy that:

1) by allowing an additional comment (in Format.h) after the enum to be used as the `in configuration ( XXXX )`  text, and changing the dump_format_style.py to support that.

This makes the following code:

```
enum {
...
LS_Cpp03, // c++03
LS_Cpp11, // c++11
...
};
```

would render as:

```* ``LS_Cpp03`` (in configuration: ``c++03``)
* ``LS_Cpp11`` (in configuration: ``c++11``)
```

And we also  move the deprecated alias into the text of the enum (otherwise it won't be added at the end as an option)

This patch includes a couple of other whitespace changes which help bring Format.h and ClangFormatStyleOptions.rst almost back into line and regeneratable...  (there is still one more)

Reviewers: klimek, mitchell-stellar, sammccall

Reviewed By: mitchell-stellar, sammccall

Subscribers: mrexodia, cfe-commits

Tags: #clang, #clang-format

Differential Revision: https://reviews.llvm.org/D69433

4 years agoIntroduce llvm-install-name-tool
Alexander Shaposhnikov [Thu, 17 Oct 2019 22:12:55 +0000 (15:12 -0700)]
Introduce llvm-install-name-tool

This diff adds a new "driver" for llvm-objcopy
which is supposed to emulate the behavior of install-name-tool.

Differential revision: https://reviews.llvm.org/D69146

Test plan: make check-all

4 years agoFix a typo in my previous commit
Steven Wu [Wed, 6 Nov 2019 19:42:21 +0000 (11:42 -0800)]
Fix a typo in my previous commit

4 years ago[NFC] Add SUPPORT_PLUGINS to add_llvm_executable()
David Tenty [Wed, 6 Nov 2019 18:05:32 +0000 (13:05 -0500)]
[NFC] Add SUPPORT_PLUGINS to add_llvm_executable()

Summary:
this allows us to move logic about when it is appropriate set
LLVM_NO_DEAD_STRIP out of each tool and into add_llvm_executable,
which will enable future platform specific handling.

This is a follow on to the reverted D69356

Reviewers: hubert.reinterpretcast, beanz, lhames

Reviewed By: beanz

Subscribers: mgorny, cfe-commits, llvm-commits

Tags: #clang, #llvm

Differential Revision: https://reviews.llvm.org/D69638

4 years ago[GISel][ArtifactCombiner] Relax the constraint to combine unmerge with concat_vectors
Quentin Colombet [Wed, 6 Nov 2019 19:09:12 +0000 (11:09 -0800)]
[GISel][ArtifactCombiner] Relax the constraint to combine unmerge with concat_vectors

The combine G_UNMERGE_VALUES with G_CONCAT_VECTORS used to only be performed
when the result type of the G_UNMERGE_VALUES was a vector type.
In other words, we were expecting that the G_UNMERGE_VALUES was effectively
the exact opposite of the G_CONCAT_VECTORS.

Lift that constraint by allowing any G_UNMERGE_VALUES to be combined
with any G_CONCAT_VECTORS (as long as the size of the different pieces
that we merge/unmerge match).

Differential Revision: https://reviews.llvm.org/D69288

4 years ago[Object][MachO] Rewrite macho-invalid-fat-arch-size into YAML
Steven Wu [Wed, 6 Nov 2019 19:25:50 +0000 (11:25 -0800)]
[Object][MachO] Rewrite macho-invalid-fat-arch-size into YAML

Summary:
Rewrite one of the invalid macho test input file with YAML file. The
original invalid macho is breaking our internal test infrastusture
because it is too broken to be copy around.

Need to relax an assertion in the YAML/MachoEmitter to allow yaml2obj to
write an invalid object like this.

rdar://problem/56879982

Reviewers: beanz, mtrent

Reviewed By: beanz

Subscribers: hiraditya, jkorous, dexonsmith, ributzka, llvm-commits

Tags: #llvm

Differential Revision: https://reviews.llvm.org/D69856

4 years ago[X86TargetTransformInfo] Fixed warning: Expression 'ISD == ISD::UREM' is always true...
Dávid Bolvanský [Wed, 6 Nov 2019 19:10:13 +0000 (20:10 +0100)]
[X86TargetTransformInfo] Fixed warning: Expression 'ISD == ISD::UREM' is always true. NFCI.

4 years ago[X86] Fix SLM v2i64 ADD/Sub/CMPEQ instruction schedules
Simon Pilgrim [Wed, 6 Nov 2019 19:07:54 +0000 (19:07 +0000)]
[X86] Fix SLM v2i64 ADD/Sub/CMPEQ instruction schedules

Noticed while fixing the reduction costs for D59710 - the SLM model doesn't account for the poor throughput of v2i64 ops.

Numbers taken from Intel AOM (+ checked against Agner)

4 years ago[X86] Fix SLM v2f64 ADD/MUL + FP BLEND/HADD instruction schedules
Simon Pilgrim [Wed, 6 Nov 2019 18:59:45 +0000 (18:59 +0000)]
[X86] Fix SLM v2f64 ADD/MUL + FP BLEND/HADD instruction schedules

Noticed while fixing the reduction costs for D59710 - the SLM model doesn't account for the poor throughput of v2f64/v2i64 ops.

4 years ago[X86ISelLowering] Fixed typo in assert. NFCI.
Dávid Bolvanský [Wed, 6 Nov 2019 19:04:15 +0000 (20:04 +0100)]
[X86ISelLowering] Fixed typo in assert. NFCI.

4 years agounwind: disable RTTI during the build of libunwind
Saleem Abdulrasool [Wed, 6 Nov 2019 18:51:42 +0000 (10:51 -0800)]
unwind: disable RTTI during the build of libunwind

Disable the type information emission for libunwind.  libunwind does not
use `dynamic_cast`.  This results in a smaller binary, and more
importantly, avoids the dependency on libc++abi.  This ensures that we
have complete symbol resolution of symbols on ELF targets without
linking to the C++ runtime support library.  This change avoids the
emission of a reference to `__si_class_type_info`.

4 years ago[X86] Add 'fxsr' feature to -march=pentium2 to match X86.td and gcc.
Craig Topper [Wed, 6 Nov 2019 18:27:53 +0000 (10:27 -0800)]
[X86] Add 'fxsr' feature to -march=pentium2 to match X86.td and gcc.

4 years ago[X86] Add 'mmx' to all CPUs that have a version of 'sse' and weren't already enabling...
Craig Topper [Wed, 6 Nov 2019 17:58:51 +0000 (09:58 -0800)]
[X86] Add 'mmx' to all CPUs that have a version of 'sse' and weren't already enabling '3dnow'

All SSE capable CPUs have MMX. 3dnow implicitly enables MMX.

We have code that detects if sse is enabled and implicitly enables
MMX unless -mno-mmx is passed. So in most cases we were already
enabling MMX if march passed a CPU that supported SSE.

The exception to this is if you pass -march for a cpu supports SSE
and also pass -mno-sse. We should still enable MMX since its part
of the CPU capability.

4 years ago[CostModel][X86] Improve add vXi64 + fadd vXf64 reduction tests for SLM
Simon Pilgrim [Wed, 6 Nov 2019 17:55:23 +0000 (17:55 +0000)]
[CostModel][X86] Improve add vXi64 + fadd vXf64 reduction tests for SLM

As noted on D59710 we weren't handling the high costs of these operations on SLM.

4 years ago[clang-format] [RELAND] Remove the dependency on frontend
paulhoad [Wed, 6 Nov 2019 17:33:37 +0000 (17:33 +0000)]
[clang-format] [RELAND] Remove the dependency on frontend

Summary: relanding {D68969} after it failed UBSAN build caused by the passing of an invalid SMLoc() (nullptr)

Reviewers: thakis, vlad.tsyrklevich, klimek, mitchell-stellar

Reviewed By: thakis

Subscribers: merge_guards_bot, mgorny, cfe-commits

Tags: #clang-format, #clang

Differential Revision: https://reviews.llvm.org/D69854

4 years ago[clang-format] Assert that filenames are not empty
paulhoad [Wed, 6 Nov 2019 17:24:10 +0000 (17:24 +0000)]
[clang-format] Assert that filenames are not empty

Summary:
Adds asserts to catch empty filenames, which otherwise will cause a crash in SourceManager.
The clang-format tool now outputs an error if an empty filename is used.
Fixes bug: 34667

Reviewers: krasimir, djasper, MyDeveloperDay

Reviewed By: MyDeveloperDay

Subscribers: cfe-commits

Patch by: @jr

Tags: #clang-format, #clang

Differential Revision: https://reviews.llvm.org/D56345

4 years ago[CostModel][X86] Add add/fadd reduction tests for SLM
Simon Pilgrim [Wed, 6 Nov 2019 17:04:07 +0000 (17:04 +0000)]
[CostModel][X86] Add add/fadd reduction tests for SLM

4 years agoCodeGenInstruction - fix uninitialized variable warnings. NFCI.
Simon Pilgrim [Wed, 6 Nov 2019 16:30:04 +0000 (16:30 +0000)]
CodeGenInstruction - fix uninitialized variable warnings. NFCI.

4 years agoLoopAccessAnalysis - fix uninitialized variable warnings. NFCI.
Simon Pilgrim [Wed, 6 Nov 2019 16:29:08 +0000 (16:29 +0000)]
LoopAccessAnalysis - fix uninitialized variable warnings. NFCI.

4 years agoBranchProbabilityInfo - fix uninitialized variable warning. NFCI.
Simon Pilgrim [Wed, 6 Nov 2019 16:26:11 +0000 (16:26 +0000)]
BranchProbabilityInfo - fix uninitialized variable warning. NFCI.

4 years ago[libcxx] Make generate_feature_test_macro_components script compatible with Python 3.
Louis Dionne [Wed, 6 Nov 2019 16:44:14 +0000 (16:44 +0000)]
[libcxx] Make generate_feature_test_macro_components script compatible with Python 3.

The script is still compatible with Python 2 as well.
Thanks to Marek Kurdej for the patch.

Differential Revision: https://reviews.llvm.org/D69884

4 years agoRevert "build: explicitly set the linker language for unwind"
Saleem Abdulrasool [Wed, 6 Nov 2019 16:31:27 +0000 (08:31 -0800)]
Revert "build: explicitly set the linker language for unwind"

This reverts commit 6db7a5cd7c800a588e94ce5c1ef24ae4d60ecdd3.
This adversely impacted the NetBSD libc++ bot for some reason, reverting
while investigating.

4 years ago[libTooling] Fix breakage from change #84922
Yitzhak Mandelbaum [Wed, 6 Nov 2019 16:30:02 +0000 (11:30 -0500)]
[libTooling] Fix breakage from change #84922

4 years ago[CommandLine] Add inline ArgName printing
Don Hinton [Wed, 6 Nov 2019 15:43:00 +0000 (07:43 -0800)]
[CommandLine] Add inline ArgName printing

Summary:
This patch adds PrintArgInline (after PrintArg) that strips the
leading spaces from an argument before printing them, for usage
inline.

Related bug: PR42943 <https://bugs.llvm.org/show_bug.cgi?id=42943>

Patch by Daan Sprenkels!

Reviewers: jhenderson, chandlerc, hintonda

Reviewed By: jhenderson

Subscribers: hiraditya, kristina, llvm-commits, dsprenkels

Tags: #llvm

Differential Revision: https://reviews.llvm.org/D69501

4 years ago[libTooling] Small changes in Transformer API.
Yitzhak Mandelbaum [Mon, 4 Nov 2019 15:02:35 +0000 (10:02 -0500)]
[libTooling] Small changes in Transformer API.

Summary:
* Rename `transformer::change` to `transformer::changeTo`, make `change` forward
  to `changeTo` and mark it deprecated.

* Mark `transformer::text` and `transformer::selection` deprecated and migrate
  references to them in tests.

Reviewers: ilya-biryukov

Subscribers: gribozavr, cfe-commits

Tags: #clang

Differential Revision: https://reviews.llvm.org/D69896

4 years ago[libomptarget] Revert all improvements to support
Jon Chesterfield [Wed, 6 Nov 2019 15:43:46 +0000 (15:43 +0000)]
[libomptarget] Revert all improvements to support

Summary:
[libomptarget] Revert all improvements to support

The change to unity build for nvcc has broken the build for some developers.
This patch reverts to a known-working state.

There has been some confusion over exactly how the build broke. I think we
have reached a common understanding that the disappearing symbols are from
the bitcode library built by clang. The static archive built by nvcc may show the
same problem. Some of the confusion arose from building the deviceRTL twice
and using one or the other library based on various environmental factors.

I'm pretty sure the problem is clang expanding `__forceinline__` into both `__inline__`
and `attribute(("always_inline"))`. The `__inline__` attribute resolves to linkonce_odr
which is not safe for exporting symbols from translation units.

"always_inline" is the desired semantic for small functions defined in one translation
unit that are intended to be inlined at link time. "inline" is not.

This therefore reintroduces the dependency hazard of supporti.h and some code
duplication, and blocks progress separating deviceRTL into reusable components.

See also D69857, D69859 for attempts at a fix instead of a revert.

Reviewers: ABataev, jdoerfert, grokos, ikitayama, tianshilei1992

Reviewed By: ABataev

Subscribers: mgorny, jfb, openmp-commits

Tags: #openmp

Differential Revision: https://reviews.llvm.org/D69885

4 years ago[libTooling] Simplify type structure of `Stencil`s.
Yitzhak Mandelbaum [Wed, 30 Oct 2019 00:26:34 +0000 (20:26 -0400)]
[libTooling] Simplify type structure of `Stencil`s.

Summary:
Currently, stencils are defined as a sequence of `StencilParts`. This
differentiation adds an unneeded layer of complexity to the definition of
Stencils. This change significantly simplifies the type structure: a stencil is
now conceptually any object implementing `StencilInterface` and `Stencil` is
just a thin wrapper for pointers to this interface.

To account for the sequencing that was supported by the old `Stencil` type, we
introduce a sequencing class that implements `StencilInterface`. That is,
sequences are just another kind of Stencil and no longer have any special
status.

Corresponding to this change in the type structure, we change the way `cat` is
used (and defined). `cat` bundles multiple features: it builds a stencil from a
sequence of subcomponents and admits multiple different types for its arguments,
while coercing them into the right type. Previously, `cat` was also used to
coerce a single `StencilPart` into a `Stencil`. With that distinction gone, many
uses of `cat` (e.g. in the tests) are unnecessary and have, therefore, been
removed.

Reviewers: gribozavr

Subscribers: cfe-commits

Tags: #clang

Differential Revision: https://reviews.llvm.org/D69613

4 years agoDWARFDebugLoclists: Move to a incremental parsing model
Pavel Labath [Thu, 31 Oct 2019 14:05:33 +0000 (15:05 +0100)]
DWARFDebugLoclists: Move to a incremental parsing model

Summary:
This patch stems from the discussion D68270 (including some offline
talks). The idea is to provide an "incremental" api for parsing location
lists, which will avoid caching or materializing parsed data. An
additional goal is to provide a high level location list api, which
abstracts the differences between different encoding schemes, and can be
used by users which don't care about those (such as LLDB).

This patch implements the first part. It implements a call-back based
"visitLocationList" api. This function parses a single location list,
calling a user-specified callback for each entry. This is going to be
the base api, which other location list functions (right now, just the
dumping code) are going to be based on.

Future patches will do something similar for the v4 location lists, and
add a mechanism to translate raw entries into concrete address ranges.

Reviewers: dblaikie, probinson, JDevlieghere, aprantl, SouraVX

Subscribers: hiraditya, llvm-commits

Tags: #llvm

Differential Revision: https://reviews.llvm.org/D69672

4 years ago[clang-tidy] Update TransformerClangTidyCheck to use new Transformer bindings.
Yitzhak Mandelbaum [Mon, 4 Nov 2019 15:15:35 +0000 (10:15 -0500)]
[clang-tidy] Update TransformerClangTidyCheck to use new Transformer bindings.

Summary:
Updates the relevant source files to use bindings in `clang::transformer` rather
than `clang::tooling`.

Reviewers: gribozavr

Subscribers: xazax.hun, cfe-commits

Tags: #clang

Differential Revision: https://reviews.llvm.org/D69804

4 years ago[NFC][APInt] Fix typos in comments.
Miloš Stojanović [Wed, 6 Nov 2019 10:13:15 +0000 (11:13 +0100)]
[NFC][APInt] Fix typos in comments.

Testing git commit access.

4 years agolldb/docs: update the lldb-x86_64-debian bot url
Pavel Labath [Wed, 6 Nov 2019 15:02:23 +0000 (16:02 +0100)]
lldb/docs: update the lldb-x86_64-debian bot url

It is on the "stable" master now.

4 years agolldb: Skip reproducer+expression evaluation test on linux
Pavel Labath [Wed, 6 Nov 2019 14:47:11 +0000 (15:47 +0100)]
lldb: Skip reproducer+expression evaluation test on linux

It's flaky.

4 years ago[clangd] Improve the output of rename tests where there are failures.
Haojian Wu [Wed, 6 Nov 2019 14:08:59 +0000 (15:08 +0100)]
[clangd] Improve the output of rename tests where there are failures.

Summary:
Previously, we match ranges, which is hard to spot the difference.
Now, we diff the code after rename against the expected result, it
produces much nicer output.

Reviewers: ilya-biryukov

Subscribers: MaskRay, jkorous, arphaman, kadircet, usaxena95, cfe-commits

Tags: #clang

Differential Revision: https://reviews.llvm.org/D69890

4 years ago[x86] avoid crashing when splitting AVX stores with non-simple type (PR43916)
Sanjay Patel [Wed, 6 Nov 2019 14:06:48 +0000 (09:06 -0500)]
[x86] avoid crashing when splitting AVX stores with non-simple type (PR43916)

The store splitting transform was assuming a simple type (MVT),
but that's not necessarily the case as shown in the test.

4 years ago[Support] fix mingw-w64 build
Ilya Biryukov [Wed, 6 Nov 2019 13:25:33 +0000 (14:25 +0100)]
[Support] fix mingw-w64 build

Older versions of Mingw-w64 do not define _beginthreadex_proc_type,
so we replace it with `unsigned (__stdcall *ThreadFunc)(void *)`.

Fixes https://github.com/clangd/clangd/issues/188

Patch by lh123!

Differential Revision: https://reviews.llvm.org/D69879

4 years ago[X86] Fix uninitialized variable warnings. NFCI.
Simon Pilgrim [Wed, 6 Nov 2019 14:02:43 +0000 (14:02 +0000)]
[X86] Fix uninitialized variable warnings. NFCI.

4 years agoX86FoldTablesEmitter - fix static analyzer potential invalid iterator warning. NFCI.
Simon Pilgrim [Wed, 6 Nov 2019 13:31:00 +0000 (13:31 +0000)]
X86FoldTablesEmitter - fix static analyzer potential invalid iterator warning. NFCI.

4 years ago[X86] LowerAVXExtend - fix dodgy self-comparison assert.
Simon Pilgrim [Wed, 6 Nov 2019 12:50:09 +0000 (12:50 +0000)]
[X86] LowerAVXExtend - fix dodgy self-comparison assert.

PVS Studio noticed that we were asserting "VT.getVectorNumElements() == VT.getVectorNumElements()" instead of "VT.getVectorNumElements() == InVT.getVectorNumElements()".

4 years ago[AArch64] Move the branch relaxation pass after BTI insertion
Momchil Velikov [Wed, 6 Nov 2019 10:58:43 +0000 (10:58 +0000)]
[AArch64] Move the branch relaxation pass after BTI insertion

Summary:
Inserting BTI instructions can push branch destinations out of range.

The branch relaxation pass itself cannot insert indirect branches since `TargetInstrInfo::insertIndirecrtBranch` is not implemented for AArch64 (guess +/-128 MB direct branch range is more than enough in practice).

Testing this is a bit tricky.

The original test case we have is 155kloc/6.1M. I've generated a test case using this program:
```

int main() {
  std::cout << R"src(int test();
void g0(), g1(), g2(), g3(), g4(), e();

void f(int v) {
  if ((test() & 2) == 0) {
  switch (v) {
  case 0:
    g0();
  case 1:
    g1();
  case 2:
    g2();
  case 3:
    g3();
  }
)src";

  const int N = 8176;

  for (int i = 0; i < N; ++i)
    std::cout << "    void h" << i << "();\n";
  for (int i = 0; i < N; ++i)
    std::cout << "    h" << i << "();\n";

  std::cout << R"src(
  } else {
    e();
  }
}
)src";
}
```
which is still a bit too much to commit as a regression test, IMHO.

Reviewers: t.p.northover, ostannard

Reviewed By: ostannard

Subscribers: kristof.beyls, hiraditya, llvm-commits

Tags: #llvm

Differential Revision: https://reviews.llvm.org/D69118

Change-Id: Ide5c922bcde08ff4cf635da5e52365525a997a0a

4 years ago[APInt] Fix implicit truncation warning in bitsToFloat(). NFCI.
Simon Pilgrim [Wed, 6 Nov 2019 12:29:43 +0000 (12:29 +0000)]
[APInt] Fix implicit truncation warning in bitsToFloat(). NFCI.