platform/upstream/llvm.git
3 years ago[ARMInstPrinter] Print the target address of a branch instruction
Igor Kudrin [Wed, 30 Jun 2021 09:34:52 +0000 (16:34 +0700)]
[ARMInstPrinter] Print the target address of a branch instruction

This follows other patches that changed printing immediate values of
branch instructions to target addresses, see D76580 (x86), D76591 (PPC),
D77853 (AArch64).

As observing immediate values might sometimes be useful, they are
printed as comments for branch instructions.

// llvm-objdump -d output (before)
000200b4 <_start>:
   200b4: ff ff ff fa   blx     #-4 <thumb>
000200b8 <thumb>:
   200b8: ff f7 fc ef   blx     #-8 <_start>

// llvm-objdump -d output (after)
000200b4 <_start>:
   200b4: ff ff ff fa   blx     0x200b8 <thumb>         @ imm = #-4
000200b8 <thumb>:
   200b8: ff f7 fc ef   blx     0x200b4 <_start>        @ imm = #-8

// GNU objdump -d.
000200b4 <_start>:
   200b4:       faffffff        blx     200b8 <thumb>
000200b8 <thumb>:
   200b8:       f7ff effc       blx     200b4 <_start>

Differential Revision: https://reviews.llvm.org/D104701

3 years ago[mlir][linalg][python] Explicit shape and dimension order in OpDSL.
Tobias Gysi [Wed, 30 Jun 2021 08:59:22 +0000 (08:59 +0000)]
[mlir][linalg][python] Explicit shape and dimension order in OpDSL.

Extend the OpDSL syntax with an optional `domain` function to specify an explicit dimension order. The extension is needed to provide more control over the dimension order instead of deducing it implicitly depending on the formulation of the tensor comprehension. Additionally, the patch also ensures the symbols are ordered according to the operand definitions of the operation.

Differential Revision: https://reviews.llvm.org/D105117

3 years ago[ARM][NFC] Remove an unused method
Igor Kudrin [Wed, 30 Jun 2021 08:54:53 +0000 (15:54 +0700)]
[ARM][NFC] Remove an unused method

`ARMInstPrinter::printMveAddrModeQOperand()` was added in D62680, but
was never used. It looks like `printT2AddrModeImm8Operand<false>()` is
used instead.

Differential Revision: https://reviews.llvm.org/D105124

3 years ago[mlir][llvm] Add a test for memref.copy lowering to llvm
Stephan Herhut [Tue, 29 Jun 2021 14:47:58 +0000 (16:47 +0200)]
[mlir][llvm] Add a test for memref.copy lowering to llvm

This was missing and also there was a bug in the lowering itself, which went unnoticed due to it.

Differential Revision: https://reviews.llvm.org/D105122

3 years agoRecommit "[AArch64] Custom lower <4 x i8> loads"
Sjoerd Meijer [Tue, 29 Jun 2021 10:33:14 +0000 (11:33 +0100)]
Recommit "[AArch64] Custom lower <4 x i8> loads"

This recommits D104782 including a fix for adding a wrong operand to the new
load node.

Differential Revision: https://reviews.llvm.org/D105110

3 years ago[clang] Fix UB when string.front() is used for the empty string
Dmitry Polukhin [Tue, 29 Jun 2021 12:57:14 +0000 (05:57 -0700)]
[clang] Fix UB when string.front() is used for the empty string

Compilation database might have empty string as a command line argument.
But ExpandResponseFilesDatabase::expand doesn't expect this and assumes
that string.front() can be used for any argument. It is undefined behaviour if
string is empty. With debug build mode it causes crash in clangd.

Test Plan: check-clang

Differential Revision: https://reviews.llvm.org/D105120

3 years ago[PowerPC][AIX] Re-generate test aix-framepointer-save-restore.ll. NFC.
Kai Luo [Wed, 30 Jun 2021 05:36:26 +0000 (05:36 +0000)]
[PowerPC][AIX] Re-generate test aix-framepointer-save-restore.ll. NFC.

3 years ago[MLIR] Fix generateCopyForMemRefRegion
Uday Bondhugula [Wed, 30 Jun 2021 04:20:33 +0000 (09:50 +0530)]
[MLIR] Fix generateCopyForMemRefRegion

Fix generateCopyForMemRefRegion for a missing check: in some cases, when
the thing to generate copies for itself is empty, no fast buffer/copy
loops would have been allocated/generated. Add an extra assertion there
while at this.

Differential Revision: https://reviews.llvm.org/D105170

3 years ago[PowerPC][AIX] Pre-commit tracetable test for D100167. NFC.
Kai Luo [Wed, 30 Jun 2021 04:39:31 +0000 (04:39 +0000)]
[PowerPC][AIX] Pre-commit tracetable test for D100167. NFC.

3 years agoFix test pass registration to use the new API / not use the deprecated one (NFC)
Mehdi Amini [Wed, 30 Jun 2021 04:08:36 +0000 (04:08 +0000)]
Fix test pass registration to use the new API / not use the deprecated one (NFC)

3 years ago[AMDGPU] Update gfx90a memory model support
Tony Tye [Fri, 7 May 2021 20:55:23 +0000 (20:55 +0000)]
[AMDGPU] Update gfx90a memory model support

Update AMDGPU gfx90a memory model to make coarse grain memory allocations
consistent when fine grained system scope atomic acquire and release is
performed.

Reviewed By: rampitec

Differential Revision: https://reviews.llvm.org/D105137

3 years ago[FuncSpec] Add an option to specializing literal constant
Chuanqi Xu [Wed, 30 Jun 2021 03:24:44 +0000 (11:24 +0800)]
[FuncSpec] Add an option to specializing literal constant

Now the option is off by default. Since we are not sure if this option
would make the compile time increase aggressively. Although we tested it
on SPEC2017, we may need to test more to make it on by default.

Reviewed By: SjoerdMeijer

Differential Revision: https://reviews.llvm.org/D104365

3 years ago[Coroutine] Add statistics for the number of elided coroutine
Chuanqi Xu [Wed, 30 Jun 2021 03:20:51 +0000 (11:20 +0800)]
[Coroutine] Add statistics for the number of elided coroutine

Now we lack a benchmark to measure the performance change for each
commit.
Since coro elide is the main optimization in coroutine module, I wonder
it may be an estimation to count the number of elided coroutine in
private code bases.
e.g., for a certain commit, if we found that the number of elided goes
down, we could find it before the commit check-in.

Reviewed By: lxfind

Differential Revision: https://reviews.llvm.org/D105095

3 years ago[llvm-objcopy][MachO] Support LC_LINKER_OPTIMIZATION_HINT load command
Fangrui Song [Wed, 30 Jun 2021 01:47:55 +0000 (18:47 -0700)]
[llvm-objcopy][MachO] Support LC_LINKER_OPTIMIZATION_HINT load command

The load command is currently specific to arm64 and holds information
for instruction rewriting, e.g.  converting a GOT load to an ADR to
compute a local address.
(On ELF the information is usually conveyed by relocations, e.g.
R_X86_64_REX_GOTPCRELX, R_PPC64_TOC16_HA)

Reviewed By: alexander-shaposhnikov

Differential Revision: https://reviews.llvm.org/D104968

3 years agoFix buildbot compile error for https://reviews.llvm.org/D105160.
Greg Clayton [Wed, 30 Jun 2021 01:03:25 +0000 (18:03 -0700)]
Fix buildbot compile error for https://reviews.llvm.org/D105160.

3 years agoCreate synthetic symbol names on demand to improve memory consumption and startup...
Greg Clayton [Tue, 29 Jun 2021 20:12:36 +0000 (13:12 -0700)]
Create synthetic symbol names on demand to improve memory consumption and startup times.

This fix was created after profiling the target creation of a large C/C++/ObjC application that contained almost 4,000,000 redacted symbol names. The symbol table parsing code was creating names for each of these synthetic symbols and adding them to the name indexes. The code was also adding the object file basename to the end of the symbol name which doesn't allow symbols from different shared libraries to share the names in the constant string pool.

Prior to this fix this was creating 180MB of "___lldb_unnamed_symbol" symbol names and was taking a long time to generate each name, add them to the string pool and then add each of these names to the name index.

This patch fixes the issue by:
- not adding a name to synthetic symbols at creation time, and allows name to be dynamically generated when accessed
- doesn't add synthetic symbol names to the name indexes, but catches this special case as name lookup time. Users won't typically set breakpoints or lookup these synthetic names, but support was added to do the lookup in case it does happen
- removes the object file baseanme from the generated names to allow the names to be shared in the constant string pool

Prior to this fix the startup times for a large application was:
12.5 seconds (cold file caches)
8.5 seconds (warm file caches)

After this fix:
9.7 seconds (cold file caches)
5.7 seconds (warm file caches)

The names of the symbols are auto generated by appending the symbol's UserID to the end of the "___lldb_unnamed_symbol" string and is only done when the name is requested from a synthetic symbol if it has no name.

Differential Revision: https://reviews.llvm.org/D105160

3 years ago[Test] delete LPM RUNs in inline_nossp.ll
Nick Desaulniers [Wed, 30 Jun 2021 00:09:39 +0000 (17:09 -0700)]
[Test] delete LPM RUNs in inline_nossp.ll

This test was modified in D104958. Invoking opt with -{passname} (vs
-passes={passname}) without -enable-new-pm={0|1} is now ambiguous and
dependent on how LLVM was configured.  Drop the LPM runs rather than
fix since there unlikely to be any users still on LPM that rely on the
behavior in this test.

See also:
https://lists.llvm.org/pipermail/llvm-dev/2021-June/151553.html

Reviewed By: MaskRay

Differential Revision: https://reviews.llvm.org/D105154

3 years agoConditionalize function only used in an assert to address -Wunused-function
David Blaikie [Tue, 29 Jun 2021 23:39:05 +0000 (16:39 -0700)]
Conditionalize function only used in an assert to address -Wunused-function

3 years ago[CodeGen] Add ParmVarDecls to FunctionDecls that are created to generate
Akira Hatanaka [Tue, 29 Jun 2021 23:27:24 +0000 (16:27 -0700)]
[CodeGen] Add ParmVarDecls to FunctionDecls that are created to generate
ObjC property getter/setter functions

This is needed to prevent clang from crashing when we make the changes
proposed in https://reviews.llvm.org/D98799.

Differential Revision: https://reviews.llvm.org/D104883

3 years agoRevert "Attempt to disable MLIR JIT tests on PowerPC to unbreak the bot"
Lei Huang [Tue, 29 Jun 2021 23:03:23 +0000 (18:03 -0500)]
Revert "Attempt to disable MLIR JIT tests on PowerPC to unbreak the bot"

This reverts commit 652f4b5140e231b679564a86019307291f7bf7cc.

Re-enable MLLIR JIT tests.
The MLIR Bot was updated to export LD_LIBRARY_PATH=/usr/lib64, which
seem to fix this issue.

3 years ago[Clang][NVPTX] Add NVPTX intrinsics and builtins for CUDA PTX 6.5 and 7.0 WMMA and...
Steffen Larsen [Mon, 28 Jun 2021 22:43:10 +0000 (15:43 -0700)]
[Clang][NVPTX] Add NVPTX intrinsics and builtins for CUDA PTX 6.5 and 7.0 WMMA and MMA instructions

Adds NVPTX builtins and intrinsics for the CUDA PTX `wmma.load`, `wmma.store`, `wmma.mma`, and `mma` instructions added in PTX 6.5 and 7.0.

PTX ISA description of

  - `wmma.load`: https://docs.nvidia.com/cuda/parallel-thread-execution/index.html#warp-level-matrix-instructions-wmma-ld
  - `wmma.store`: https://docs.nvidia.com/cuda/parallel-thread-execution/index.html#warp-level-matrix-instructions-wmma-st
  - `wmma.mma`: https://docs.nvidia.com/cuda/parallel-thread-execution/index.html#warp-level-matrix-instructions-wmma-mma
  - `mma`: https://docs.nvidia.com/cuda/parallel-thread-execution/index.html#warp-level-matrix-instructions-mma

Overview of `wmma.mma` and `mma` matrix shape/type combinations added with specific PTX versions: https://docs.nvidia.com/cuda/parallel-thread-execution/index.html#warp-level-matrix-shape

Authored-by: Steffen Larsen <steffen.larsen@codeplay.com>
Co-Authored-by: Stuart Adams <stuart.adams@codeplay.com>
Reviewed By: tra

Differential Revision: https://reviews.llvm.org/D104847

3 years ago[libomptarget] [amdgpu] Change default number of teams per computation unit
Dhruva Chakrabarti [Tue, 29 Jun 2021 22:07:57 +0000 (15:07 -0700)]
[libomptarget] [amdgpu] Change default number of teams per computation unit

This patch is related to https://reviews.llvm.org/D98832. Based on discussions there, I decided to separate out the teams default as this patch. This change is to increase the number of teams per computation unit so as to provide more wavefronts for hiding latency. This change improves performance for some programs, including 20-50% for some Stream benchmarks.

Reviewed By: JonChesterfield

Differential Revision: https://reviews.llvm.org/D99003

3 years agoImprove path remapping in cross-debugging scenarios
Adrian Prantl [Tue, 29 Jun 2021 22:24:36 +0000 (15:24 -0700)]
Improve path remapping in cross-debugging scenarios

This patch implements a slight improvement when debugging across
platforms and remapping source paths that are in a non-native
format. See the unit test for examples.

rdar://79205675

Differential Revision: https://reviews.llvm.org/D104407

3 years agoModernize Module::RemapFile to return an Optional (NFC)
Adrian Prantl [Tue, 29 Jun 2021 22:19:31 +0000 (15:19 -0700)]
Modernize Module::RemapFile to return an Optional (NFC)

This addresses feedback raised in https://reviews.llvm.org/D104404.

Differential Revision: https://reviews.llvm.org/D104724

3 years agoExpress PathMappingList::FindFile() in terms of PathMappingList::RemapPath()
Adrian Prantl [Tue, 29 Jun 2021 22:14:31 +0000 (15:14 -0700)]
Express PathMappingList::FindFile() in terms of PathMappingList::RemapPath()

NFC.

This patch replaces the function body FindFile() with a call to
RemapPath(), since the two functions implement the same functionality.

Differential Revision: https://reviews.llvm.org/D104406

3 years agoChange PathMappingList::FindFile to return an optional result (NFC)
Adrian Prantl [Tue, 29 Jun 2021 21:59:12 +0000 (14:59 -0700)]
Change PathMappingList::FindFile to return an optional result (NFC)

This is an NFC modernization refactoring that replaces the combination
of a bool return + reference argument, with an Optional return value.

Differential Revision: https://reviews.llvm.org/D104405

3 years agoThread safety analysis: Rename parameters of ThreadSafetyAnalyzer::intersectAndWarn...
Aaron Puchert [Tue, 29 Jun 2021 21:51:52 +0000 (23:51 +0200)]
Thread safety analysis: Rename parameters of ThreadSafetyAnalyzer::intersectAndWarn (NFC)

In D104261 we made the parameters' meaning slightly more specific, this
changes their names accordingly. In all uses we're building a new lock
set by intersecting existing locksets. The first (modifiable) argument
is the new lock set being built, the second (non-modifiable) argument is
the exit set of a preceding block.

Reviewed By: aaron.ballman, delesley

Differential Revision: https://reviews.llvm.org/D104649

3 years agoThread safety analysis: Always warn when dropping locks on back edges
Aaron Puchert [Tue, 29 Jun 2021 21:46:43 +0000 (23:46 +0200)]
Thread safety analysis: Always warn when dropping locks on back edges

We allow branches to join where one holds a managed lock but the other
doesn't, but we can't do so for back edges: because there we can't drop
them from the lockset, as we have already analyzed the loop with the
larger lockset. So we can't allow dropping managed locks on back edges.

We move the managed() check from handleRemovalFromIntersection up to
intersectAndWarn, where we additionally check if we're on a back edge if
we're removing from the first lock set (the entry set of the next block)
but not if we're removing from the second lock set (the exit set of the
previous block). Now that the order of arguments matters, I had to swap
them in one invocation, which also causes some minor differences in the
tests.

Reviewed By: delesley

Differential Revision: https://reviews.llvm.org/D104261

3 years ago[OpaquePtr][BitcodeWriter] Handle attributes with types
Arthur Eubanks [Tue, 29 Jun 2021 18:38:18 +0000 (11:38 -0700)]
[OpaquePtr][BitcodeWriter] Handle attributes with types

For example, byval.

Skip the type attribute auto-upgrade if we already have the type.

I've actually seen this error of the ValueEnumerator missing a type
attribute's type in a non-opaque pointer context.

Reviewed By: nikic

Differential Revision: https://reviews.llvm.org/D105138

3 years ago[Test] Regenerate test checks (NFC)
Nikita Popov [Tue, 29 Jun 2021 21:43:58 +0000 (23:43 +0200)]
[Test] Regenerate test checks (NFC)

Make these follow the update_test_checks.py format.

3 years agoCodeGen: Store LLT instead of uint64_t in MachineMemOperand
Matt Arsenault [Thu, 20 May 2021 02:06:14 +0000 (22:06 -0400)]
CodeGen: Store LLT instead of uint64_t in MachineMemOperand

GlobalISel is relying on regular MachineMemOperands to track all of
the memory properties of accesses. Just the raw byte size is
insufficent to disambiguate all situations. For example, if we need to
split an unaligned extending load, we need to know the number of bits
in the original source value and can't infer it from the result
type. This is also a problem for extending vector loads.

This does decrease the maximum representable size from the full
uint64_t bytes to a maximum of 16-bits. No in tree testcases hit this,
other than places using UINT64_MAX for unknown sizes. This may be an
issue for G_MEMCPY and co., although they can just use unknown size
for large static sizes. This also has potential for backend abuse by
relying on the type when it really shouldn't be relevant after
selection.

This does not include the necessary MIR printer/parser changes to
represent this.

3 years agoRevert "GlobalISel: Use MMO helper for getting the size in bits"
Matt Arsenault [Tue, 8 Jun 2021 22:23:34 +0000 (18:23 -0400)]
Revert "GlobalISel: Use MMO helper for getting the size in bits"

This reverts commit dc98adfb448bdb845605185bb173e99614a17790.

This should still be done, but this is currently causing some commit
ordering issues.

3 years ago[CodeGen] Stop creating fake FunctionDecls when generating IR for
Akira Hatanaka [Tue, 29 Jun 2021 21:22:26 +0000 (14:22 -0700)]
[CodeGen] Stop creating fake FunctionDecls when generating IR for
functions implicitly generated by the compiler

These fake functions would cause clang to crash if the changes proposed
in https://reviews.llvm.org/D98799 were made.

3 years agoOpaquePtr: Support i32** with --force-opaque-pointers
Duncan P. N. Exon Smith [Tue, 29 Jun 2021 19:49:57 +0000 (12:49 -0700)]
OpaquePtr: Support i32** with --force-opaque-pointers

4506f614cb6983a16d117cf77a968608e66d7a5c fixed parsing of textual IR to
reject `ptr*`, but broke the auto-conversion of `i32**` to `ptr` with
`--force-opaque-pointers`.

Get that working again by refactoring LLParser::parseType to only send
`ptr`-spelled pointers into the type suffix logic when it's the return
of a function type. This also rejects `ptr addrspace(3) addrspace(2)`,
which 1e6303e60ca5af4fbe7ca728572fd65666a98271 invadvertently started
accepting. Just the default top-level error message for the
double-addrspace since I had trouble thinking of something nice;
probably it's fine as is (it doesn't look valid the way that `ptr*`
does).

Differential Revision: https://reviews.llvm.org/D105146

3 years ago[llvm-objcopy][MachO] Code cleanup
Alexander Shaposhnikov [Tue, 29 Jun 2021 20:46:20 +0000 (13:46 -0700)]
[llvm-objcopy][MachO] Code cleanup

1. Remove unnecessary templates.
2. Fix potentially unaligned reads inside constructSection.

Test plan: make check-all

Differential revision: https://reviews.llvm.org/D105089

3 years ago[lldb] Fix debug_loc.s which was broken after https://reviews.llvm.org/D103502
Stella Stamenova [Tue, 29 Jun 2021 20:54:48 +0000 (13:54 -0700)]
[lldb] Fix debug_loc.s which was broken after https://reviews.llvm.org/D103502

An empty location is now printed as <empty>

3 years ago[libomptarget] [amdgpu] Fix default setting of max flat workgroup size
Dhruva Chakrabarti [Tue, 29 Jun 2021 00:52:01 +0000 (17:52 -0700)]
[libomptarget] [amdgpu] Fix default setting of max flat workgroup size

When max flat workgroup size is not specified, it is set to the default
workgroup size. This prevents kernel launch with a workgroup size larger
than the default. The fix is to ignore a size of 0 and treat it as
unspecified.

Reviewed By: JonChesterfield

Differential Revision: https://reviews.llvm.org/D105073

3 years ago[libc] Allow target architecture independent configs
Siva Chandra Reddy [Tue, 29 Jun 2021 20:27:28 +0000 (20:27 +0000)]
[libc] Allow target architecture independent configs

Previously, we required entrypoints.txt for every target architecture
supported by a target OS. With this change, we allow architecture
independent config for a target OS. That is, if an architecture specific
entrypoints.txt is missing, then a generic entrypoints.txt for that
target OS will be used.

Reviewed By: caitlyncano

Differential Revision: https://reviews.llvm.org/D105147

3 years ago[lldb] Fix globals-bss.cpp which was broken in https://reviews.llvm.org/D105055
Stella Stamenova [Tue, 29 Jun 2021 20:39:18 +0000 (13:39 -0700)]
[lldb] Fix globals-bss.cpp which was broken in https://reviews.llvm.org/D105055

-S replaced -s, so the test needs to be updated to use the new option

3 years ago[dfsan] Expose dfsan_get_track_origins to get origin tracking status
Jianzhou Zhao [Tue, 29 Jun 2021 06:17:00 +0000 (06:17 +0000)]
[dfsan] Expose dfsan_get_track_origins to get origin tracking status

This allows application code checks if origin tracking is on before
printing out traces.

-dfsan-track-origins can be 0,1,2.
The current code only distinguishes 1 and 2 in compile time, but not at runtime.
Made runtime distinguish 1 and 2 too.

Reviewed By: browneee

Differential Revision: https://reviews.llvm.org/D105128

3 years ago[mlir] Generare .cpp.inc files for dialects.
Stella Laurenzo [Mon, 28 Jun 2021 22:54:11 +0000 (22:54 +0000)]
[mlir] Generare .cpp.inc files for dialects.

* Previously, we were only generating .h.inc files. We foresee the need to also generate implementations and this is a step towards that.
* Discussed in https://llvm.discourse.group/t/generating-cpp-inc-files-for-dialects/3732/2
* Deviates from the discussion above by generating a default constructor in the .cpp.inc file (and adding a tablegen bit that disables this in case if this is user provided).
* Generating the destructor started as a way to flush out the missing includes (produces a link error), but it is a strict improvement on its own that is worth doing (i.e. by emitting key methods in the .cpp file, we root vtables in one translation unit, which is a non-controversial improvement).

Differential Revision: https://reviews.llvm.org/D105070

3 years agoRevert D104488 and friends since it broke the windows bot
Stella Stamenova [Tue, 29 Jun 2021 19:09:56 +0000 (12:09 -0700)]
Revert D104488 and friends since it broke the windows bot

Reverts commits:
"Fix failing tests after https://reviews.llvm.org/D104488."
"Fix buildbot failure after https://reviews.llvm.org/D104488."
"Create synthetic symbol names on demand to improve memory consumption and startup times."

This series of commits broke the windows lldb bot and then failed to fix all of the failing tests.

3 years ago[mlir:Async] Change async-parallel-for block size/count calculation
Eugene Zhulenev [Tue, 29 Jun 2021 19:56:15 +0000 (12:56 -0700)]
[mlir:Async] Change async-parallel-for block size/count calculation

Depends On D105037

Avoid creating too many tasks when the number of workers is large.

Reviewed By: herhut

Differential Revision: https://reviews.llvm.org/D105126

3 years ago[mlir:Async] Add an async reference counting pass based on the user defined policy
Eugene Zhulenev [Tue, 29 Jun 2021 19:12:15 +0000 (12:12 -0700)]
[mlir:Async] Add an async reference counting pass based on the user defined policy

Depends On D104999

Automatic reference counting based on the liveness analysis can add a lot of reference counting overhead at runtime. If the IR is known to be constrained to few particular "shapes", it's much more efficient to provide a custom reference counting policy that will specify where it is required to update the async value reference count.

Reviewed By: mehdi_amini

Differential Revision: https://reviews.llvm.org/D105037

3 years ago[mlir][Linalg] Add a ComprehensiveModuleBufferizePass and support for CallOp analysis...
Nicolas Vasilache [Tue, 29 Jun 2021 15:39:14 +0000 (15:39 +0000)]
[mlir][Linalg] Add a ComprehensiveModuleBufferizePass and support for CallOp analysis(9/n)

This revision adds the minimal plumbing to create a simple ComprehensiveModuleBufferizePass that can behave conservatively in the presence of CallOps.

A topological sort of caller/callee is performed and, if the call-graph is cycle-free, analysis can proceed.

Differential revision: https://reviews.llvm.org/D104859

3 years ago[Clang] Add option to handle behaviour of vector bool/vector pixel.
Stefan Pintilie [Tue, 29 Jun 2021 19:01:48 +0000 (14:01 -0500)]
[Clang] Add option to handle behaviour of vector bool/vector pixel.

Added the option `-altivec-src-compat=[mixed,gcc,xl]`. The default at this time is `mixed`.

The default behavior for clang is for all vector compares to return a scalar unless the vectors being
compared are vector bool or vector pixel. In that case the compare returns a
vector. With the gcc case all vector compares return vectors and in the xl case
all vector compares return scalars.

This patch does not change the default behavior of clang.

This option will be used in future patches to implement behaviour compatibility for the vector bool/pixel types.

Reviewed By: bmahjour

Differential Revision: https://reviews.llvm.org/D103615

3 years ago[NFC][compiler-rt][hwasan] Re-use ring buffer size calculation
Leonard Chan [Wed, 23 Jun 2021 23:12:52 +0000 (16:12 -0700)]
[NFC][compiler-rt][hwasan] Re-use ring buffer size calculation

Users can call HwasanThreadList::GetRingBufferSize rather than RingBufferSize
to prevent having to do the calculation in RingBufferSize. This will be useful
for Fuchsia where we plan to initialize the stack ring buffer separately from
the rest of thread initialization.

Differential Revision: https://reviews.llvm.org/D104823

3 years ago[llvm-readobj] Make -s and -t match llvm-readelf
Fangrui Song [Tue, 29 Jun 2021 18:56:26 +0000 (11:56 -0700)]
[llvm-readobj] Make -s and -t match llvm-readelf

llvm-readobj is an internal testing tool for binary formats. Its output and
command line options do not need to be stable. It isn't supposed to be part of a
build process.

llvm-readelf was created as a user-facing utility and its interface intends to
be compatible with GNU readelf (unless there are good reasons not to).

The two tools have mostly compatible options. -s and -t are noticeable
exceptions due to history. I think the cost of keeping the inconsistency
overweighs the little history-compatible benefit and hinders transition from
cl::opt to OptTable, so let's change it.

Reviewed By: jhenderson

Differential Revision: https://reviews.llvm.org/D105055

3 years ago[NFC][compiler-rt][hwasan] Move GetCurrentThread to hwasan.cpp
Leonard Chan [Wed, 23 Jun 2021 23:18:44 +0000 (16:18 -0700)]
[NFC][compiler-rt][hwasan] Move GetCurrentThread to hwasan.cpp

We can reuse the same implementation for getting the current thread on fuchsia.

Differential Revision: https://reviews.llvm.org/D104824

3 years ago[test] Change -t to --syms and -s to -S for llvm-readobj RUN lines
Fangrui Song [Tue, 29 Jun 2021 18:50:31 +0000 (11:50 -0700)]
[test] Change -t to --syms and -s to -S for llvm-readobj RUN lines

-s and -t will be changed to improve consistency with llvm-readelf.
The inconsistency issue regularly contributes to confusion using the two tools.

3 years ago[SanitizerCoverage] Fix global type check with opaque pointers
Nikita Popov [Tue, 29 Jun 2021 18:29:10 +0000 (20:29 +0200)]
[SanitizerCoverage] Fix global type check with opaque pointers

The code was previously relying on the fact that an incorrectly
typed global would result in the insertion of a BitCast constant
expression. With opaque pointers, this is no longer the case, so
we should check the type explicitly.

3 years ago[llvm-objcopy][MachO] Support ARM64_RELOC_ADDEND
Fangrui Song [Tue, 29 Jun 2021 18:23:30 +0000 (11:23 -0700)]
[llvm-objcopy][MachO] Support ARM64_RELOC_ADDEND

An ARM64_RELOC_ADDEND relocation reuses the symbol field for the addend value.
We should pass through such relocations.

Reviewed By: alexander-shaposhnikov

Differential Revision: https://reviews.llvm.org/D104967

3 years ago[NFC] clang-format on InlineCost.cpp and InlineAdvisor.h.
Jacob Hegna [Tue, 29 Jun 2021 18:14:24 +0000 (18:14 +0000)]
[NFC] clang-format on InlineCost.cpp and InlineAdvisor.h.

3 years ago[OpaquePtr] Support forward references in textual IR
Nikita Popov [Fri, 25 Jun 2021 20:14:37 +0000 (22:14 +0200)]
[OpaquePtr] Support forward references in textual IR

Currently, LLParser will create a Function/GlobalVariable forward
reference based on the desired pointer type and then modify it when
it is declared. With opaque pointers, we generally do not know the
correct type to use until we see the declaration.

Solve this by creating the forward reference with a dummy type, and
then performing a RAUW with the correct Function/GlobalVariable when
it is declared. The approach is adopted from
https://github.com/TNorthover/llvm-project/commit/b5b55963f62038319fa7a8b1b232226ba1d8ef3c.

This results in a change to the use list order, which is why we see
test changes on some module passes that are not stable under use list
reordering.

Differential Revision: https://reviews.llvm.org/D104950

3 years ago[LegalizeTypes][VE] Don't Expand BITREVERSE/BSWAP during type legalization promotion...
Craig Topper [Tue, 29 Jun 2021 17:38:47 +0000 (10:38 -0700)]
[LegalizeTypes][VE] Don't Expand BITREVERSE/BSWAP during type legalization promotion if they will be promoted for NVT in op legalization.

We were trying to expand these if they were going to be expanded
in op legalization so that we generated the minimum number of
operations. We failed to take into account that NVT could be
promoted to another legal type in op legalization.

Hoping this fixes the issue on the VE target reported as a follow
up to D96681. The check line changes were taken from before
1e46b6f4012399a2fef5fbbb4ed06fc919835414 so this patch does
appear to improve some cases that had previously regressed.

3 years ago[lldb] Check for the mangled symbol name for objc_copyRealizedClassList_nolock
Jonas Devlieghere [Tue, 29 Jun 2021 17:56:01 +0000 (10:56 -0700)]
[lldb] Check for the mangled symbol name for objc_copyRealizedClassList_nolock

When we check whether the Objective-C SPI is available, we need to check
for the mangled symbol name. Unlike `objc_copyRealizedClassList`, which
is C exported, the `nolock` variant is not.

Differential revision: https://reviews.llvm.org/D105136

3 years ago[libc++] NFC: Fix return-by-const-value and pass-by-const-value typos
Louis Dionne [Tue, 29 Jun 2021 17:52:26 +0000 (13:52 -0400)]
[libc++] NFC: Fix return-by-const-value and pass-by-const-value typos

While we can debate on the value of passing by const value, there is no
arguing that it's confusing to do so in some circumstances, such as when
marking a pointer parameter as being const (did you mean a pointer-to-const?).
This commit fixes a few issues along those lines.

3 years ago[Inline] prevent inlining on noprofile mismatch
Nick Desaulniers [Tue, 29 Jun 2021 17:31:58 +0000 (10:31 -0700)]
[Inline] prevent inlining on noprofile mismatch

Similar to
commit bc044a88ee3c ("[Inline] prevent inlining on stack protector mismatch")

The noprofile function attribute is meant to prevent compiler
instrumentation from being inserted into a function. Inlining may defeat
the developer's intent. If the caller and callee don't either BOTH have
the attribute or BOTH lack the attribute, suppress inline substitution.

This matches behavior being proposed in GCC:
https://gcc.gnu.org/pipermail/gcc-patches/2021-June/573511.html
https://gcc.gnu.org/bugzilla/show_bug.cgi?id=80223

Add LangRef entry for noprofile fn attr, similar to text added in D93422
and D104944.

Reviewed By: MaskRay, melver, phosek

Differential Revision: https://reviews.llvm.org/D104810

3 years ago[clang][PATCH][nfc] Refactor TargetInfo::adjust to pass DiagnosticsEngine to allow...
Melanie Blower [Tue, 29 Jun 2021 15:44:49 +0000 (11:44 -0400)]
[clang][PATCH][nfc] Refactor TargetInfo::adjust to pass DiagnosticsEngine to allow diagnostics on target-unsupported options

Reviewed By: aaron.ballman

Differential Revision: https://reviews.llvm.org/D104729

3 years ago[ObjC][ARC] Don't add operand bundle clang.arc.attachedcall to a call if
Akira Hatanaka [Wed, 3 Mar 2021 00:48:09 +0000 (16:48 -0800)]
[ObjC][ARC] Don't add operand bundle clang.arc.attachedcall to a call if
the call already has the operand bundle

This bug was causing the call to `replaceAllUsesWith` to crash because
the old call instruction and the new call instruction were the same.

rdar://74957948

Differential Revision: https://reviews.llvm.org/D97824

3 years ago[INSTCOMBINE] Transform reduction(shuffle V, poison, unique_mask) to reduction(V).
Alexey Bataev [Mon, 28 Jun 2021 19:21:19 +0000 (12:21 -0700)]
[INSTCOMBINE] Transform reduction(shuffle V, poison, unique_mask) to reduction(V).

After SLP + LTO we may have have reduction(shuffle V, poison,
mask). This can be simplified to just reduction(V) if the mask is only
for single vector and just all elements from this vector are permuted,
  without reusing, replacing with undefs and/or other values, etc.

Differential Revision: https://reviews.llvm.org/D105053

3 years ago[Flang][test] Fix Windows buildbot after D104930.
Michael Kruse [Tue, 29 Jun 2021 16:57:52 +0000 (16:57 +0000)]
[Flang][test] Fix Windows buildbot after D104930.

Add

    REQUIRES: shell

to the unpack.f90 test that executes a UNIX shell script.

3 years ago[lldb] Skip TestPairFromStdModule for now
Raphael Isemann [Tue, 29 Jun 2021 17:00:30 +0000 (19:00 +0200)]
[lldb] Skip TestPairFromStdModule for now

I didn't get around to fix this change and the original commit itself seems
fine, so this looks like an existing LLDB/Clang bug that was just uncovered
by this change. Skipping while I'm investigating.

3 years ago[RISCV] Protect the SHL/SRA/SRL handlers in LowerOperation against being called for...
Craig Topper [Tue, 29 Jun 2021 06:09:58 +0000 (23:09 -0700)]
[RISCV] Protect the SHL/SRA/SRL handlers in LowerOperation against being called for an illegal i32 shift amount.

It seems it is possible for DAG combine to create a shl with an
i64 result type and an i32 shift amount. This is ok before type
legalization since the type don't need to match in SelectionDAG.
This results in type legalization calling LowerOperation to
legalize just the amount. We weren't expecting this so we
asserted for not finding a fixed vector shift.

To fix this, I've added a check for the fixed vector case and
returned SDValue() to get the default type legalizer. I've
factored all shifts together and added a fixed vector specific
handler to avoid repeating similar code for each in
LowerOperation.

The particular case I found was exposed by D104581, but the bad
shift is created after that patch triggers.

3 years ago[libc++] Update ABI docs. NFCI.
Arthur O'Dwyer [Wed, 26 May 2021 12:59:16 +0000 (08:59 -0400)]
[libc++] Update ABI docs. NFCI.

Differential Revision: https://reviews.llvm.org/D103160

3 years ago[mlir:Async] Fix a bug in automatic refence counting around function calls
Eugene Zhulenev [Tue, 29 Jun 2021 16:30:54 +0000 (09:30 -0700)]
[mlir:Async] Fix a bug in automatic refence counting around function calls

Depends On D104998

Function calls "transfer ownership" to the callee and it puts additional constraints on the reference counting optimization pass

Reviewed By: mehdi_amini

Differential Revision: https://reviews.llvm.org/D104999

3 years ago[mlir:Async] Convert AsyncParallelFor pass to ModuleOp pass
Eugene Zhulenev [Sun, 27 Jun 2021 21:25:50 +0000 (14:25 -0700)]
[mlir:Async] Convert AsyncParallelFor pass to ModuleOp pass

Depends On D104891

Outlining scf.parallel body as a function requires async-parallel-for pass to be a ModuleOp pass

Reviewed By: bondhugula

Differential Revision: https://reviews.llvm.org/D104998

3 years ago[mlir:Async] Remove async operations if it is statically known that the parallel...
Eugene Zhulenev [Mon, 28 Jun 2021 00:44:31 +0000 (17:44 -0700)]
[mlir:Async] Remove async operations if it is statically known that the parallel operation has a single compute block

Depends On D104850

Add a test that verifies that canonicalization removes all async overheads if it is statically known that the scf.parallel operation will be computed using a single block.

Reviewed By: herhut

Differential Revision: https://reviews.llvm.org/D104891

3 years ago[llvm-objdump] Add --no-print-imm-hex to the command guide
gbreynoo [Tue, 29 Jun 2021 16:18:32 +0000 (17:18 +0100)]
[llvm-objdump] Add --no-print-imm-hex to the command guide

The option --no-print-imm-hex was not included in the command guide for
llvm-objdump but appears in the help text. This commit adds it to the
command guide.

Differential Revision: https://reviews.llvm.org/D104717

3 years ago[llvm-objdump] Add testing for --print-imm-hex, --headers, --section-headers and...
gbreynoo [Tue, 29 Jun 2021 16:03:21 +0000 (17:03 +0100)]
[llvm-objdump] Add testing for --print-imm-hex, --headers, --section-headers and --private-headers

llvm-objdump had some missing coverage that is fixed by this change:
- A test specifically for --print-imm-hex, and coverage of --no-print-imm-hex
- section-headers.test checks the aliases --headers or --section-headers
- A test for the use of --private-headers for ELF that checks the output
- A test for ELF program headers

Differential Revision: https://reviews.llvm.org/D103974

3 years ago[AMDGPU] Fix 224-bit spills
Piotr Sobczak [Tue, 29 Jun 2021 10:35:34 +0000 (12:35 +0200)]
[AMDGPU] Fix 224-bit spills

Related to D104622.

Differential Revision: https://reviews.llvm.org/D105109

3 years ago[ARM] Extra test for gep immediate costs. NFC
David Green [Tue, 29 Jun 2021 15:51:47 +0000 (16:51 +0100)]
[ARM] Extra test for gep immediate costs. NFC

3 years ago[gn build] Port d03aa7d6b66f
LLVM GN Syncbot [Tue, 29 Jun 2021 15:41:00 +0000 (15:41 +0000)]
[gn build] Port d03aa7d6b66f

3 years ago[libc++] NFCI: Remove __functional/search.h
Louis Dionne [Tue, 29 Jun 2021 15:33:16 +0000 (11:33 -0400)]
[libc++] NFCI: Remove __functional/search.h

The __search helper function was once split into __functional for circular
dependency reasons, however this is not an issue anymore now that we have
finer grained headers.

3 years ago[perf] Fix a data race in the PerfJITEventListener
Eugene Zhulenev [Sat, 26 Jun 2021 14:34:43 +0000 (07:34 -0700)]
[perf] Fix a data race in the PerfJITEventListener

Concurrent JIT compilation + PerfJITEventListener triggers tsan error

Reviewed By: cota

Differential Revision: https://reviews.llvm.org/D104977

3 years ago[SCCP] Extend tests added 1092357ccdc9 in with UREM/SREM by 0.
Florian Hahn [Tue, 29 Jun 2021 15:04:35 +0000 (16:04 +0100)]
[SCCP] Extend tests added 1092357ccdc9 in with UREM/SREM by 0.

Add additional coverage for computing UREM/SREM C, 0.

3 years ago[LV] Fix bug when unrolling (only) a loop with non-latch exit
Philip Reames [Tue, 29 Jun 2021 14:54:53 +0000 (07:54 -0700)]
[LV] Fix bug when unrolling (only) a loop with non-latch exit

If we unroll a loop in the vectorizer (without vectorizing), and the cost model requires a epilogue be generated for correctness, the code generation must actually do so.

The included test case on an unmodified opt will access memory one past the expected bound.  As a result, this patch is fixing a latent miscompile.

Differential Revision: https://reviews.llvm.org/D103700

3 years agoPrint default template argument if manually specified in typedef declaration.
Pratyush Das [Tue, 29 Jun 2021 13:50:04 +0000 (13:50 +0000)]
Print default template argument if manually specified in typedef declaration.

If a default template type argument is manually specified to be of the default
type, then it is committed when printing the template.

Differential revision: https://reviews.llvm.org/D103040

3 years ago[libc++] Serialize Lit parameters to make them available to from-scratch configs
Louis Dionne [Tue, 1 Jun 2021 21:16:11 +0000 (17:16 -0400)]
[libc++] Serialize Lit parameters to make them available to from-scratch configs

Before this patch, Lit parameters that were set as a result of CMake
options were not made available to from-scratch configs. This patch
serializes those parameters into the generated lit config file so that
they are available to all configs.

Differential Revision: https://reviews.llvm.org/D105047

3 years ago[libc++] NFCI: Remove code duplication and obsolete declarations in wrap_iter
Louis Dionne [Tue, 22 Jun 2021 17:43:48 +0000 (13:43 -0400)]
[libc++] NFCI: Remove code duplication and obsolete declarations in wrap_iter

Differential Revision: https://reviews.llvm.org/D105040

3 years agoCatch an extremely obvious memory leak, thanks asan
Jeremy Morse [Tue, 29 Jun 2021 14:40:43 +0000 (15:40 +0100)]
Catch an extremely obvious memory leak, thanks asan

https://lab.llvm.org/buildbot/#/builders/5/builds/9208

(dbg-phis-merging-in-ldv.mir and dbg-phis-with-loops.mir in the asan
 check stage)

3 years ago[mlir] silence -Wunused-variable in Linalg comprehensive bufferize
Alex Zinenko [Tue, 29 Jun 2021 14:44:16 +0000 (16:44 +0200)]
[mlir] silence -Wunused-variable in Linalg comprehensive bufferize

3 years agoRevert "[OpenMP] Add Two-level Distributed Barrier"
Johannes Doerfert [Tue, 29 Jun 2021 14:34:53 +0000 (09:34 -0500)]
Revert "[OpenMP] Add Two-level Distributed Barrier"

This reverts commit 25073a4ecfc9b2e3cb76776185e63bfdb094cd98.

This breaks non-x86 OpenMP builds for a while now. Until a solution is
ready to be upstreamed we revert the feature and unblock those builds.
See:
  https://reviews.llvm.org/rG25073a4ecfc9b2e3cb76776185e63bfdb094cd98#1005821
and
  https://reviews.llvm.org/rG25073a4ecfc9b2e3cb76776185e63bfdb094cd98#1005821

The currently proposed fix (D104788) seems not to be ready yet:
  https://reviews.llvm.org/D104788#2841928

3 years agoRevert "[omp] Fix build without ITT after D103121 changes"
Johannes Doerfert [Tue, 29 Jun 2021 14:33:31 +0000 (09:33 -0500)]
Revert "[omp] Fix build without ITT after D103121 changes"

This reverts commit eab1fd389b61d236bf8df4d09f62dd18253a10bc.

This commit fixed a problem with 25073a4ecfc9 (D103121) which is the one
we actually need to revert to unblock non-X86 builds of OpenMP. Can be
reapplied, or merged into, D103121 as it goes in again.

3 years ago[Attributor][NFCI] Make the state of AAValueSimplify explicit
Johannes Doerfert [Sat, 26 Jun 2021 18:20:28 +0000 (13:20 -0500)]
[Attributor][NFCI] Make the state of AAValueSimplify explicit

As we have done with other states we want the AAValueSimplify state to
be explicit to use it more easily in our helpers.

3 years ago[Attributor][NFCI] Remove unneeded namespace
Johannes Doerfert [Sat, 26 Jun 2021 18:10:13 +0000 (13:10 -0500)]
[Attributor][NFCI] Remove unneeded namespace

3 years ago[Attributor] Teach AAPotentialValues about constant select conditions
Johannes Doerfert [Thu, 10 Jun 2021 22:13:22 +0000 (17:13 -0500)]
[Attributor] Teach AAPotentialValues about constant select conditions

There was a TODO but now we actually check if the select condition is
assumed constant and only look at the relevant operand.

3 years ago[Attributor][NFC] Clang format
Johannes Doerfert [Sat, 26 Jun 2021 00:19:19 +0000 (19:19 -0500)]
[Attributor][NFC] Clang format

3 years ago[InstCombine] Gracefully handle an alloca outside the alloca-AS
Johannes Doerfert [Thu, 24 Jun 2021 17:04:46 +0000 (12:04 -0500)]
[InstCombine] Gracefully handle an alloca outside the alloca-AS

While we might eventually want to disallow allocas that do not have the
alloca-AS set, it seems undesirable to crash on them. Add a cast when
required so that we can support such allocas (at least here).

Differential Revision: https://reviews.llvm.org/D104866

3 years ago[analyzer] Make CheckerManager::hasPathSensitiveCheckers() complete again
Balazs Benics [Tue, 29 Jun 2021 14:35:07 +0000 (16:35 +0200)]
[analyzer] Make CheckerManager::hasPathSensitiveCheckers() complete again

It turns out that the CheckerManager::hasPathSensitiveCheckers() missed
checking for the BeginFunctionCheckers.
It seems like other callbacks are also missing:
 - ObjCMessageNilCheckers
 - BeginFunctionCheckers
 - NewAllocatorCheckers
 - PointerEscapeCheckers
 - EndOfTranslationUnitCheckers

In this patch, I wanted to use a fold-expression, but until C++17
arrives we are left with the old-school method.

When I tried to write a unittest I observed an interesting behavior. I
subscribed only to the BeginFunction event, it was not fired.
However, when I also defined the PreCall with an empty handler, suddenly
both fired.
I could add this test demonstrating the issue, but I don't think it
would serve much value in a long run. I don't expect regressions for
this.

However, I think it would be great to enforce the completeness of this
list in a runtime check.
I could not come up with a solution for this though.

PS: Thank you @Szelethus for helping me debugging this.

Differential Revision: https://reviews.llvm.org/D105101

Reviewed by: vsavchenko

3 years agoRevert "[NFC] Remove shadowed variable in InnerLoopVectorizer::createInductionVariable"
David Sherwood [Tue, 29 Jun 2021 14:20:11 +0000 (15:20 +0100)]
Revert "[NFC] Remove shadowed variable in InnerLoopVectorizer::createInductionVariable"

This reverts commit 9dde51416209a5552156384b9c2b08b676818d70.

3 years ago[SVE] Added CodeGen support for inserting an element into a predicate vector
Dylan Fleming [Tue, 29 Jun 2021 13:00:49 +0000 (14:00 +0100)]
[SVE] Added CodeGen support for inserting an element into a predicate vector

Reviewed By: sdesmalen

Differential Revision: https://reviews.llvm.org/D104722

3 years ago[DebugInstrRef][3/3] Follow DBG_PHI instructions through LiveDebugValues
Jeremy Morse [Tue, 29 Jun 2021 12:48:49 +0000 (13:48 +0100)]
[DebugInstrRef][3/3] Follow DBG_PHI instructions through LiveDebugValues

This patch reads machine value numbers from DBG_PHI instructions (marking
where SSA PHIs used to be), and matches them up with DBG_INSTR_REF
instructions that refer to them. Essentially they are two separate parts of
a DBG_VALUE: the place to read the value (register and program position),
and where the variable is assigned that value.

Sometimes these DBG_PHIs can be duplicated, usually by tail duplication.
This corresponds to the SSA structure of the program being destroyed, and
the original PHI being split. When this happens: run LLVMs standard
SSAUpdater utility, to work out what values should appear in which blocks.
The majority of this patch is boilerplate to make use of SSAUpdater.

If there are any additional PHIs on the path between multiple DBG_PHIs and
their using DBG_INSTR_REF, their existance is validated, just in case a
value gets clobbered along the way (see dbg-phis-with-loops.mir for
several examples).

Differential Revision: https://reviews.llvm.org/D86814

3 years ago[AVR] Fix a bug in prologue of ISR
Ben Shi [Tue, 29 Jun 2021 13:44:50 +0000 (21:44 +0800)]
[AVR] Fix a bug in prologue of ISR

The r1 register should be cleared in prologue of ISR as it is used
as constant zero.

Reviewed By: dylanmckay

Differential Revision: https://reviews.llvm.org/D99467

3 years ago[X86] Add cmov i33 sgt test case
Simon Pilgrim [Tue, 29 Jun 2021 13:36:20 +0000 (14:36 +0100)]
[X86] Add cmov i33 sgt test case

Suggested on D101074 - add a 'icmp sgt i64 %0, -2147483649' comparison that can fold to 'icmp sge i64 %0, -2147483648' on D101074 allowing i32 immediate folding

3 years ago[NFC] Remove shadowed variable in InnerLoopVectorizer::createInductionVariable
David Sherwood [Tue, 29 Jun 2021 13:28:49 +0000 (14:28 +0100)]
[NFC] Remove shadowed variable in InnerLoopVectorizer::createInductionVariable

Avoid creating a IRBuilder stack variable with the same name as the
class member.

3 years ago[mlir][Linalg] NFC - Drop AliasInfo::existsNonDominatingRead
Nicolas Vasilache [Thu, 24 Jun 2021 13:58:57 +0000 (13:58 +0000)]
[mlir][Linalg] NFC - Drop AliasInfo::existsNonDominatingRead

The case where a non-dominating read can be found is captured by slightly generalizing `AliasInfo::wouldCreaateReadAfterWriteInterference`.

This simplification will make it easier to implement bufferization across function call.

APIs are also simplified were possible.

Differential revision: https://reviews.llvm.org/D104845

3 years ago[lld/mac] Make symbol table order deterministic
Nico Weber [Tue, 29 Jun 2021 13:21:33 +0000 (09:21 -0400)]
[lld/mac] Make symbol table order deterministic

SymtabSection::emitStabs() writes the symbol table in the order
of externalSymbols, which has the order of symtab->getSymbols(),
which is just the order symbols are added to the symbol table.

In practice, symbols in the symbol files of input .o files are
sorted, but since that's not guaranteed we sort them in
ObjFile::parseSymbols(). To make sure several symbols with the same
address keep the order they're in the input file, we have to use
stable_sort().

In practice, std::sort() on already-sorted inputs won't change the order
of just adjacent elements, and while in theory std::sort() could use a
random pivot, in practice the code should be deterministic as it was
previously too.

But now lld/test/MachO/stabs.s passes with LLVM_ENABLE_EXPENSIVE_CHECKS=ON
(the last test that was failing with that set).

Fixes a regression from D99972.

While here, remove an empty section in stabs.s and move
.subsections_via_symbols to the end where it usually is (this part no
behavior change).

Differential Revision: https://reviews.llvm.org/D105071

3 years agoARM: fix vacuously true assertion to actually check what it should. NFC.
Tim Northover [Tue, 29 Jun 2021 13:19:01 +0000 (14:19 +0100)]
ARM: fix vacuously true assertion to actually check what it should. NFC.

3 years ago[SCCP] Add tests with urem/srem with 2 constant operands.
Florian Hahn [Tue, 29 Jun 2021 13:11:46 +0000 (14:11 +0100)]
[SCCP] Add tests with urem/srem with 2 constant operands.

Reduced test case for PR49731.