platform/upstream/llvm.git
4 years agoAdd syntactic sugar for strided memref parsing.
Nicolas Vasilache [Thu, 3 Oct 2019 19:33:47 +0000 (12:33 -0700)]
Add syntactic sugar for strided memref parsing.
This CL implements the last remaining bit of the [strided memref proposal](https://groups.google.com/a/tensorflow.org/forum/#!topic/mlir/MaL8m2nXuio).

The syntax is a bit more explicit than what was originally proposed and resembles:
  `memref<?x?xf32, offset: 0 strides: [?, 1]>`

Nonnegative strides and offsets are currently supported. Future extensions will include negative strides.

This also gives a concrete example of syntactic sugar for the ([RFC] Proposed Changes to MemRef and Tensor MLIR Types)[https://groups.google.com/a/tensorflow.org/forum/#!topic/mlir/-wKHANzDNTg].

The underlying implementation still uses AffineMap layout.

PiperOrigin-RevId: 272717437

4 years agoMake Module::getName return Optional<StringRef>
Alex Zinenko [Thu, 3 Oct 2019 17:04:05 +0000 (10:04 -0700)]
Make Module::getName return Optional<StringRef>

Module names are optional so it makes more sense to take and return an optional
any time the name is involved. Also update the language reference to reflect
the module names.

PiperOrigin-RevId: 272684698

4 years agoGive modules a name
Alex Zinenko [Thu, 3 Oct 2019 15:56:12 +0000 (08:56 -0700)]
Give modules a name

Modules are now Ops and, as such, can be nested. They do not produce an SSA
value so there is no possibility to refer to them in the IR. Introduce support
for symbol names attached to the module Op so that it can be referred to using
SymbolRefAttrs. The name is optional, for example the implicit top-level module
does not have a name.

PiperOrigin-RevId: 272671600

4 years agoAdd parentheses around boolean operators in assert
Alex Zinenko [Thu, 3 Oct 2019 08:46:39 +0000 (01:46 -0700)]
Add parentheses around boolean operators in assert

This removes a warning and is generally a good practice.

PiperOrigin-RevId: 272613597

4 years agoNFC: rename Conversion/ControlFlowToCFG to Conversion/LoopToStandard
Alex Zinenko [Thu, 3 Oct 2019 08:34:16 +0000 (01:34 -0700)]
NFC: rename Conversion/ControlFlowToCFG to Conversion/LoopToStandard

This makes the name of the conversion pass more consistent with the naming
scheme, since it actually converts from the Loop dialect to the Standard
dialect rather than working with arbitrary control flow operations.

PiperOrigin-RevId: 272612112

4 years agoDisallow index types in memrefs.
Alex Zinenko [Thu, 3 Oct 2019 07:57:55 +0000 (00:57 -0700)]
Disallow index types in memrefs.

As specified in the MLIR language reference and rationale documents, `memref`
types should not be allowed to have `index` as element types. As observed in
https://groups.google.com/a/tensorflow.org/forum/#!msg/mlir/P49hVWqTMNc/nW89a4i_AgAJ
this restriction was lifted when canonicalization unit tests for affine
operations were introduced, without sufficient motivation to lift the
restriction itself.  The test in question can be trivially rewritten (return
the value from a function instead of storing it to prevent DCE from removing
the producer operation) and the restriction put back in place.

If `memref<...x index>` is relevant for some use cases, the relaxation of the
type system can be implemented separately with appropriate modifications to the
documentation.

PiperOrigin-RevId: 272607043

4 years agoExtract MemRefType::getStridesAndOffset as a free function and fix dynamic offset...
Nicolas Vasilache [Wed, 2 Oct 2019 20:24:27 +0000 (13:24 -0700)]
Extract MemRefType::getStridesAndOffset as a free function and fix dynamic offset determination.

This also adds coverage with a missing test, which uncovered a bug in the conditional for testing whether an offset is dynamic or not.

PiperOrigin-RevId: 272505798

4 years ago[spirv] Add support for spv.selection
Lei Zhang [Wed, 2 Oct 2019 18:00:50 +0000 (11:00 -0700)]
[spirv] Add support for spv.selection

Similar to spv.loop, spv.selection is another op for modelling
SPIR-V structured control flow. It covers both OpBranchConditional
and OpSwitch with OpSelectionMerge.

Instead of having a `spv.SelectionMerge` op to directly model
selection merge instruction for indicating the merge target,
we use regions to delimit the boundary of the selection: the
merge target is the next op following the `spv.selection` op.
This way it's easier to discover all blocks belonging to
the selection and it plays nicer with the MLIR system.

PiperOrigin-RevId: 272475006

4 years agoFix example in OpInterfaces documentation
Alex Zinenko [Wed, 2 Oct 2019 16:15:53 +0000 (09:15 -0700)]
Fix example in OpInterfaces documentation

The concept-based polymorphism structure was missing an inheritance link
between the concept and the model. The interface class did not re-export the
base class constructor, which made it unusable with llvm::isa calls. Fix these
and reformat the code around.

PiperOrigin-RevId: 272452062

4 years agoReplace spurious `long` stride type by int64_t - NFC
Nicolas Vasilache [Wed, 2 Oct 2019 13:36:52 +0000 (06:36 -0700)]
Replace spurious `long` stride type by int64_t - NFC

PiperOrigin-RevId: 272425434

4 years ago[ROCm] Adding pass to lower GPU Dialect to ROCDL Dialect.
Deven Desai [Wed, 2 Oct 2019 08:50:03 +0000 (01:50 -0700)]
[ROCm] Adding pass to lower GPU Dialect to ROCDL Dialect.

This is a follow-up to the PRtensorflow/mlir#146 which introduced the ROCDL Dialect. This PR introduces a pass to lower GPU Dialect to the ROCDL Dialect. As with the previous PR, this one builds on the work done by @whchung, and addresses most of the review comments in the original PR.

Closes tensorflow/mlir#154

COPYBARA_INTEGRATE_REVIEW=https://github.com/tensorflow/mlir/pull/154 from deven-amd:deven-lower-gpu-to-rocdl 809893e08236da5ab6a38e3459692fa04247773d
PiperOrigin-RevId: 272390729

4 years agoShow type even if elementsattr is elided in graph
Jacques Pienaar [Wed, 2 Oct 2019 08:45:35 +0000 (01:45 -0700)]
Show type even if elementsattr is elided in graph

The type is quite useful for debugging and shouldn't be too large.

PiperOrigin-RevId: 272390311

4 years ago[spirv] Change enum case uniquing in gen_spirv_dialect.py
Lei Zhang [Tue, 1 Oct 2019 21:07:42 +0000 (14:07 -0700)]
[spirv] Change enum case uniquing in gen_spirv_dialect.py

In SPIR-V we can have multiple symbols corresponding to the same
enum value. This is because when an extension is introduced into
the core spec, its suffix is typically removed, e.g., 'VulkanKHR'
memory model becomes 'Vulkan' memory model in SPIR-V 1.5.

Previously we just keep the first symbol for an enum value. That
symbol is not necessarily a better one. This CL changes to sort
symbols, grouped by enum values, alphabetically and then keep
the first one, which is typically shorter and without the extension
suffix. We also fix up certain ones like HlslSemanticGOOGLE.

PiperOrigin-RevId: 272290363

4 years agoAdd a pair of hooks to DominanceInfo.
Eric Schweitz [Tue, 1 Oct 2019 20:55:10 +0000 (13:55 -0700)]
Add a pair of hooks to DominanceInfo.

This exposes hooks for accessing internal dominance nodes, and updating the internal DFS numbers.

Closes tensorflow/mlir#151

COPYBARA_INTEGRATE_REVIEW=https://github.com/tensorflow/mlir/pull/151 from schweitzpgi:dominance_hooks 69d14214a423b816cbd59feffcacdd02f3b5f921
PiperOrigin-RevId: 272287352

4 years agoFix and simplify CallOp/CallIndirectOp to LLVM::CallOp conversion
Alex Zinenko [Tue, 1 Oct 2019 15:41:16 +0000 (08:41 -0700)]
Fix and simplify CallOp/CallIndirectOp to LLVM::CallOp conversion

A recent ABI compatibility change affected the conversion from standard
CallOp/CallIndirectOp to LLVM::CallOp by changing its signature. In order to
analyze the signature, the code was looking up the callee symbol in the module.
This is incorrect since, during the conversion, the module may contain both the
original and the converted function op that have the same symbol name. There is
no strict guarantee on which of the two symbols will be found by the lookup.
The conversion was not failing because the type legalizer converts the LLVM
types to themselves making the original and the converted function signatures
ultimately produce the same type.

Instead of looking up the function signature to get the list of result types,
use the types of the CallOp/CallIndirectOp results which must match those of
the function in valid IR. These types are guaranteed to be the original,
unconverted types when converting the operation. Furthermore, this avoids the
need to perform a lookup of a symbol name in the module which may be expensive.

Finally, propagate attributes as-is from the original op to the converted op
since they share the attribute name for the callee of direct calls and the rest
of attributes are not affected by the conversion. This removes the need for
additional contorsions between direct and indirect calls to extract the name of
the optional callee attribute only to insert it back. This also prevents the
conversion from unintentionally dropping the other attributes of the op.

PiperOrigin-RevId: 272218871

4 years agoUnify Linalg types by using strided memrefs
Nicolas Vasilache [Tue, 1 Oct 2019 12:22:54 +0000 (05:22 -0700)]
Unify Linalg types by using strided memrefs

This CL finishes the implementation of the Linalg + Affine type unification of the [strided memref RFC](https://groups.google.com/a/tensorflow.org/forum/#!topic/mlir/MaL8m2nXuio).
As a consequence, the !linalg.view type, linalg::DimOp, linalg::LoadOp and linalg::StoreOp can now disappear and Linalg can use standard types everywhere.

PiperOrigin-RevId: 272187165

4 years ago[spirv] NFC: rename SPV_ArithmeticOp to SPV_ArithmeticBinaryOp
Lei Zhang [Tue, 1 Oct 2019 10:27:44 +0000 (03:27 -0700)]
[spirv] NFC: rename SPV_ArithmeticOp to SPV_ArithmeticBinaryOp

Also rename SPV_UnaryArithmeticOp to SPV_ArithmeticUnaryOp to be
consistent.

PiperOrigin-RevId: 272173974

4 years agoChange all_reduce lowering to support 2D and 3D blocks.
Christian Sigg [Tue, 1 Oct 2019 09:50:47 +0000 (02:50 -0700)]
Change all_reduce lowering to support 2D and 3D blocks.

Perform second reduce only with first warp. This requires an additional __sync_threads(), but doesn't need special handling when the last warp is small. This simplifies support for block sizes that are not multiple of 32.

Supporting partial warp reduce will be done in a separate CL.

PiperOrigin-RevId: 272168917

4 years agoAdd verification error message for ops that require at least one operand or result.
Christian Sigg [Tue, 1 Oct 2019 07:56:38 +0000 (00:56 -0700)]
Add verification error message for ops that require at least one operand or result.

PiperOrigin-RevId: 272153634

4 years agoAdd integer shift ops to LLVM dialect.
Christian Sigg [Tue, 1 Oct 2019 05:55:53 +0000 (22:55 -0700)]
Add integer shift ops to LLVM dialect.

PiperOrigin-RevId: 272140049

4 years agoFold away reduction over 0 dimensions.
MLIR Team [Tue, 1 Oct 2019 01:43:58 +0000 (18:43 -0700)]
Fold away reduction over 0 dimensions.

PiperOrigin-RevId: 272113564

4 years agoPass the pointer of the parent pipeline collection pass to PassInstrumentation::run...
River Riddle [Tue, 1 Oct 2019 00:44:31 +0000 (17:44 -0700)]
Pass the pointer of the parent pipeline collection pass to PassInstrumentation::run*Pipeline.

For the cases where there are multiple levels of nested pass managers, the parent thread ID is not enough to distinguish the parent of a given pass pipeline. Passing in the parent pass gives an exact anchor point.

PiperOrigin-RevId: 272105461

4 years agoFormat markdown list.
MLIR Team [Mon, 30 Sep 2019 23:48:08 +0000 (16:48 -0700)]
Format markdown list.

PiperOrigin-RevId: 272095611

4 years ago[spirv] Add array length check.
Denis Khalikov [Mon, 30 Sep 2019 23:42:46 +0000 (16:42 -0700)]
[spirv] Add array length check.

According to the SPIR-V spec:
"Length is the number of elements in the array. It must be at least 1."

Closes tensorflow/mlir#160

COPYBARA_INTEGRATE_REVIEW=https://github.com/tensorflow/mlir/pull/160 from denis0x0D:sandbox/array_len 0840dc0986ad0088a3aa7d5d8d3e97d489377ed9
PiperOrigin-RevId: 272094669

4 years agoAdding signed integer ops for abs, sign, min, and max in the GLSL extension.
Ben Vanik [Mon, 30 Sep 2019 21:36:50 +0000 (14:36 -0700)]
Adding signed integer ops for abs, sign, min, and max in the GLSL extension.

PiperOrigin-RevId: 272067942

4 years agoAdd missing file from cmakelist
Jacques Pienaar [Mon, 30 Sep 2019 20:37:16 +0000 (13:37 -0700)]
Add missing file from cmakelist

PiperOrigin-RevId: 272054623

4 years agoEnable autogenerating OpInterface method declarations
Jacques Pienaar [Mon, 30 Sep 2019 19:42:31 +0000 (12:42 -0700)]
Enable autogenerating OpInterface method declarations

Add DeclareOpInterfaceFunctions to enable specifying whether OpInterfaceMethods
for an OpInterface should be generated automatically. This avoids needing to
declare the extra methods, while also allowing adding function declaration by way of trait/inheritance.

Most of this change is mechanical/extracting classes to be reusable.

PiperOrigin-RevId: 272042739

4 years agoNFC: Change `classof` on registered operations to use pointer comparison.
River Riddle [Mon, 30 Sep 2019 19:35:21 +0000 (12:35 -0700)]
NFC: Change `classof` on registered operations to use pointer comparison.

The current implementation always uses string comparison, but if the operation is registered the AbstractOperation instance can be used to provide faster pointer comparison.

PiperOrigin-RevId: 272041333

4 years agoAdding some missing SPIR-V core and GLSL extended ops.
Ben Vanik [Mon, 30 Sep 2019 19:28:21 +0000 (12:28 -0700)]
Adding some missing SPIR-V core and GLSL extended ops.

PiperOrigin-RevId: 272039887

4 years agoNormalize MemRefType lowering to LLVM as strided MemRef descriptor
Nicolas Vasilache [Mon, 30 Sep 2019 18:58:14 +0000 (11:58 -0700)]
Normalize MemRefType lowering to LLVM as strided MemRef descriptor

This CL finishes the implementation of the lowering part of the [strided memref RFC](https://groups.google.com/a/tensorflow.org/forum/#!topic/mlir/MaL8m2nXuio).

Strided memrefs correspond conceptually to the following templated C++ struct:
```
template <typename Elem, size_t Rank>
struct {
  Elem *ptr;
  int64_t offset;
  int64_t sizes[Rank];
  int64_t strides[Rank];
};
```
The linearization procedure for address calculation for strided memrefs is the same as for linalg views:
`base_offset + SUM_i index_i * stride_i`.

The following CL will unify Linalg and Standard by removing !linalg.view in favor of strided memrefs.

PiperOrigin-RevId: 272033399

4 years ago[DRR] Explain result type deduction in doc
Lei Zhang [Mon, 30 Sep 2019 18:48:30 +0000 (11:48 -0700)]
[DRR] Explain result type deduction in doc

PiperOrigin-RevId: 272031467

4 years agoAdd support for Logical Ops in SPIR-V dialect
Mahesh Ravishankar [Mon, 30 Sep 2019 17:40:07 +0000 (10:40 -0700)]
Add support for Logical Ops in SPIR-V dialect

Add operations corresponding to OpLogicalAnd, OpLogicalNot,
OpLogicalEqual, OpLogicalNotEqual and OpLogicalOr instructions in
SPIR-V dialect. This needs changes to class hierarchy in SPIR-V
TableGen files to split SPIRVLogicalOp into SPIRVLogicalUnaryOp and
SPIRVLogicalBinaryOp. All derived classes of SPIRVLogicalOp are
updated accordingly.

Update the spirv dialect generation script to
1) Allow specifying base class to use for instruction spec generation
and file name to generate the specification in separately.
2) Use the existing descriptions for operations.
3) Update define_inst.sh to also invoke define_opcode.sh to also
define the corresponding SPIR-V instruction opcode enum.

PiperOrigin-RevId: 272014876

4 years agoUse MaybeAlign when setting alignment
Jacques Pienaar [Mon, 30 Sep 2019 16:36:26 +0000 (09:36 -0700)]
Use MaybeAlign when setting alignment

PiperOrigin-RevId: 272000548

4 years agoFix MemRefType::getStrides corner case
Nicolas Vasilache [Mon, 30 Sep 2019 14:15:54 +0000 (07:15 -0700)]
Fix MemRefType::getStrides corner case

MemRefType::getStrides uses AffineExpr::walk which operates in post-order from the leaves. In order to compute strides properly, it needs to escape on terminal nodes and analyze binary ops only. This did not work for AffineExpr that consist of a single term (i.e. without a binary op).

This CL fixes the corner case and adds relevant tests.

PiperOrigin-RevId: 271975746

4 years agoSwitch comments from GPU dialect terms to CUDA terms (NFC).
Christian Sigg [Mon, 30 Sep 2019 10:19:09 +0000 (03:19 -0700)]
Switch comments from GPU dialect terms to CUDA terms (NFC).

local workgroup -> block, subgroup -> warp, invocation -> thread.

PiperOrigin-RevId: 271946342

4 years agoAdd InferTypeOpTrait & enable generating its member function definition
Jacques Pienaar [Mon, 30 Sep 2019 00:28:29 +0000 (17:28 -0700)]
Add InferTypeOpTrait & enable generating its member function definition

Use OpInterfaces to add an interface for ops defining a return type function.

This change does not use this trait in any meaningful way, I'll use it in a
follow up to generalize and unify some of the op type traits/constraints. Also,
currently the infer type function can only be manually specified in C++, that should rather be the fallback in future.

PiperOrigin-RevId: 271883746

4 years agoupdate Rationale.md - remove outdated info
Uday Bondhugula [Sun, 29 Sep 2019 22:53:24 +0000 (15:53 -0700)]
update Rationale.md - remove outdated info

- removing outdated/confusing info
- the affine dialect is missing documentation on
  affine.load/affine.store; the references herein have to be updated
  once that's updated.

Signed-off-by: Uday Bondhugula <uday@polymagelabs.com>
Closes tensorflow/mlir#159

COPYBARA_INTEGRATE_REVIEW=https://github.com/tensorflow/mlir/pull/159 from bondhugula:doc 86dd794f2d0d7fd097dde5764c62eb406ed4f910
PiperOrigin-RevId: 271876525

4 years agoFix a typo in Toy Chapter 2 tutorial documentation
Roberto Rosmaninho [Sun, 29 Sep 2019 22:53:21 +0000 (15:53 -0700)]
Fix a typo in Toy Chapter 2 tutorial documentation

Closes tensorflow/mlir#155

COPYBARA_INTEGRATE_REVIEW=https://github.com/tensorflow/mlir/pull/155 from Robertorosmaninho:patch-1 232ac4e1253948c7f3150515e93abe50fcec2f96
PiperOrigin-RevId: 271876515

4 years agoFix syntax of 'call' and 'splat' ops
Uday Bondhugula [Sun, 29 Sep 2019 22:52:52 +0000 (15:52 -0700)]
Fix syntax of 'call' and 'splat' ops

- fix missing return value syntax on call / splat ops
- reflow cond_br / store op syntax

Closes tensorflow/mlir#161

COPYBARA_INTEGRATE_REVIEW=https://github.com/tensorflow/mlir/pull/161 from bondhugula:patch-1 2beb5bdcb387a5e7c52438985f79e2987d3b3ebe
PiperOrigin-RevId: 271876453

4 years agoSwitch explicit create methods to match generated build's order
Jacques Pienaar [Sat, 28 Sep 2019 16:35:23 +0000 (09:35 -0700)]
Switch explicit create methods to match generated build's order

The generated build methods have result type before the arguments (operands and attributes, which are also now adjacent in the explicit create method). This also results in changing the create method's ordering to match most build method's ordering.

PiperOrigin-RevId: 271755054

4 years agoTablegen helpers for accessing properties of shaped types
Geoffrey Martin-Noble [Sat, 28 Sep 2019 00:34:56 +0000 (17:34 -0700)]
Tablegen helpers for accessing properties of shaped types

Tablegen's lack of functions continues to be annoying

PiperOrigin-RevId: 271680947

4 years agoAppend a newline when dumping a Value.
Yanan Cao [Fri, 27 Sep 2019 23:20:04 +0000 (16:20 -0700)]
Append a newline when dumping a Value.

This is more consistent with other dump methods. Otherwise successive Value dumps are concatenated in same line, hurting readability.

PiperOrigin-RevId: 271669846

4 years agoRemove spurious debug spew in tests
Nicolas Vasilache [Fri, 27 Sep 2019 19:31:12 +0000 (12:31 -0700)]
Remove spurious debug spew in tests

PiperOrigin-RevId: 271624731

4 years agoAdd TODO to revisit coupling of CallOp to MemRefType lowering
Nicolas Vasilache [Fri, 27 Sep 2019 19:02:09 +0000 (12:02 -0700)]
Add TODO to revisit coupling of CallOp to MemRefType lowering

PiperOrigin-RevId: 271619132

4 years agoNFC - clean up op accessor usage, std.load/store op verify, other stale info
Uday Bondhugula [Fri, 27 Sep 2019 18:57:52 +0000 (11:57 -0700)]
NFC - clean up op accessor usage, std.load/store op verify, other stale info

- also remove stale terminology/references in docs

Signed-off-by: Uday Bondhugula <uday@polymagelabs.com>
Closes tensorflow/mlir#148

COPYBARA_INTEGRATE_REVIEW=https://github.com/tensorflow/mlir/pull/148 from bondhugula:cleanup e846b641a3c2936e874138aff480a23cdbf66591
PiperOrigin-RevId: 271618279

4 years agoPromote MemRefDescriptor to a pointer to struct when passing function boundaries...
Nicolas Vasilache [Fri, 27 Sep 2019 16:55:38 +0000 (09:55 -0700)]
Promote MemRefDescriptor to a pointer to struct when passing function boundaries in LLVMLowering.

The strided MemRef RFC discusses a normalized descriptor and interaction with library calls (https://groups.google.com/a/tensorflow.org/forum/#!topic/mlir/MaL8m2nXuio).
Lowering of nested LLVM structs as value types does not play nicely with externally compiled C/C++ functions due to ABI issues.
Solving the ABI problem generally is a very complex problem and most likely involves taking
a dependence on clang that we do not want atm.

A simple workaround is to pass pointers to memref descriptors at function boundaries, which this CL implement.

PiperOrigin-RevId: 271591708

4 years agoFix JitRunner.cpp Error creation pattern and reactivate tests.
Nicolas Vasilache [Fri, 27 Sep 2019 16:44:54 +0000 (09:44 -0700)]
Fix JitRunner.cpp Error creation pattern and reactivate tests.

linalg_integration_test.mlir and simple.mlir were temporarily disabled due to an OSS-only failure.

The issue is that, once created, an llvm::Error must be explicitly checked before it can be discarded or overwritten.

This CL fixes the issue and reenable the test.

PiperOrigin-RevId: 271589651

4 years agoFix Documentation OpDefinitions.md
Denis Khalikov [Fri, 27 Sep 2019 14:46:40 +0000 (07:46 -0700)]
Fix Documentation OpDefinitions.md

Add missing semicolon for the builders example.

Closes tensorflow/mlir#150

COPYBARA_INTEGRATE_REVIEW=https://github.com/tensorflow/mlir/pull/150 from denis0x0D:sandbox/doc_fix 07e3680e678bf141a70af7747136e9fde7b4cc0a
PiperOrigin-RevId: 271568527

4 years agoFix missing links in the documentation
Kazuaki Ishizaki [Fri, 27 Sep 2019 14:44:52 +0000 (07:44 -0700)]
Fix missing links in the documentation

Closes tensorflow/mlir#149

COPYBARA_INTEGRATE_REVIEW=https://github.com/tensorflow/mlir/pull/149 from kiszk:missing_links_g3doc 5f98bc279649d54ea3dcf9fe0e17be6ad6d6cb8f
PiperOrigin-RevId: 271568274

4 years ago[ROCm] Adding ROCDL Dialect.
Deven Desai [Fri, 27 Sep 2019 06:49:51 +0000 (23:49 -0700)]
[ROCm] Adding ROCDL Dialect.

This commit introduces the ROCDL Dialect (i.e. the ROCDL ops + the code to lower those ROCDL ops to LLWM intrinsics/functions). Think of ROCDL Dialect as analogous to the NVVM Dialect, but for AMD GPUs. This patch contains just the essentials needed to get a simple example up and running. We expect to make further additions to the ROCDL Dialect.

This is the first of 3 commits, the follow-up will be:
 * add a pass that lowers GPU Dialect to ROCDL Dialect
 * add a "mlir-rocm-runner" utility

Closes tensorflow/mlir#146

COPYBARA_INTEGRATE_REVIEW=https://github.com/tensorflow/mlir/pull/146 from deven-amd:deven-rocdl-dialect e78e8005c75a78912631116c78dc844fcc4b0de9
PiperOrigin-RevId: 271511259

4 years agoDisable failing tests
Jacques Pienaar [Thu, 26 Sep 2019 23:41:57 +0000 (16:41 -0700)]
Disable failing tests

PiperOrigin-RevId: 271460509

4 years agoMake result ops generated output deterministic
Jacques Pienaar [Thu, 26 Sep 2019 21:00:22 +0000 (14:00 -0700)]
Make result ops generated output deterministic

Sort the result ops reported in lexographical order.

PiperOrigin-RevId: 271426258

4 years agoDecouple tiling from fusion in Linalg.
Nicolas Vasilache [Thu, 26 Sep 2019 15:43:58 +0000 (08:43 -0700)]
Decouple tiling from fusion in Linalg.

This CL modifies the linalg-fusion pass such that it does not tile anymore as part of the pass. Tiling is a separate concern that enables linalg fusion but should happen before.
This makes fusion more composable with other decisions.
In particular the fusion pass now becomes greedy and only applies the transformation on a best-effort basis.

This should also let fusion work in a multi-hop fashion with chains of producer/consumers.

Since the fusion pass does not perform tiling anymore, tests are rewritten to be in pretiled form and make the intent of the test clearer (albeit more verbose).

PiperOrigin-RevId: 271357741

4 years agoDrop support for memrefs from JitRunner
Alex Zinenko [Thu, 26 Sep 2019 12:41:26 +0000 (05:41 -0700)]
Drop support for memrefs from JitRunner

The support for functions taking and returning memrefs of floats was introduced
in the first version of the runner, created before MLIR had reliable lowering
of allocation/deallocation to library calls.  It forcibly runs MLIR
transformation convering affine, loop and standard dialects into the LLVM
dialect, unlike the other runner flows that accept the LLVM dialect directly.
Memref support leads to more complex layering and is generally fragile.  Drop
it in favor of functions returning a scalar, or library-based function calls to
print memrefs and other data structures.

PiperOrigin-RevId: 271330839

4 years agoAdd AllReduceOp to GPU dialect with lowering to NVVM.
Christian Sigg [Thu, 26 Sep 2019 07:17:13 +0000 (00:17 -0700)]
Add AllReduceOp to GPU dialect with lowering to NVVM.

The reduction operation is currently fixed to "add", and the scope is fixed to "workgroup".

The implementation is currently limited to sizes that are multiple 32 (warp size) and no larger than 1024.

PiperOrigin-RevId: 271290265

4 years agoRemove unused variables and methods to address compiler warnings
Lei Zhang [Thu, 26 Sep 2019 02:04:59 +0000 (19:04 -0700)]
Remove unused variables and methods to address compiler warnings

PiperOrigin-RevId: 271256784

4 years agoAdd spv.Bitcast operation to SPIR-V dialect
Mahesh Ravishankar [Thu, 26 Sep 2019 02:01:18 +0000 (19:01 -0700)]
Add spv.Bitcast operation to SPIR-V dialect

Support the OpBitcast instruction of SPIR-V using the spv.Bitcast
operation. The semantics implemented in the dialect differ from the
SPIR-V spec in that the dialect does not allow conversion to/from
pointer types from/to non-pointer types.

PiperOrigin-RevId: 271255957

4 years agoChange the return type of createPrintCFGGraphPass to match other passes.
Jing Pu [Thu, 26 Sep 2019 01:33:09 +0000 (18:33 -0700)]
Change the return type of createPrintCFGGraphPass to match other passes.

PiperOrigin-RevId: 271252404

4 years ago[spirv] Add SPV_UnaryOp and spv.FNegate
Lei Zhang [Wed, 25 Sep 2019 23:34:37 +0000 (16:34 -0700)]
[spirv] Add SPV_UnaryOp and spv.FNegate

This CL also moves common parsers and printers to the
same section in SPIRVOps.cpp.

PiperOrigin-RevId: 271233546

4 years agoMinor spelling tweaks
Kazuaki Ishizaki [Wed, 25 Sep 2019 18:57:13 +0000 (11:57 -0700)]
Minor spelling tweaks

Closes tensorflow/mlir#145

COPYBARA_INTEGRATE_REVIEW=https://github.com/tensorflow/mlir/pull/145 from kiszk:spelling_tweaks_g3doc ae9140aab5b797441e880d43e557903585815e40
PiperOrigin-RevId: 271173907

4 years agoEmit function name being tested in TestMemRefStrideCalculation
Jacques Pienaar [Wed, 25 Sep 2019 18:23:15 +0000 (11:23 -0700)]
Emit function name being tested in TestMemRefStrideCalculation

Bring back CHECK-LABEL post

PiperOrigin-RevId: 271166428

4 years agoAdd tablegen verification traits for comparing different properties
Geoffrey Martin-Noble [Wed, 25 Sep 2019 17:16:39 +0000 (10:16 -0700)]
Add tablegen verification traits for comparing different properties

This allows things like comparing the rank of one operand to the size of another that specifies indices into it.

PiperOrigin-RevId: 271150439

4 years agoFix memref-stride-calculation on Windows
Lei Zhang [Wed, 25 Sep 2019 15:41:11 +0000 (08:41 -0700)]
Fix memref-stride-calculation on Windows

Call llvm::outs().flush() to make sure we don't mix streams.
Remove CHECK-LABEL to avoid assuming the relative order
between the additional info and the output IR.

PiperOrigin-RevId: 271131100

4 years agoForward declare LogicalResult as a struct to be consistent
Lei Zhang [Wed, 25 Sep 2019 15:14:48 +0000 (08:14 -0700)]
Forward declare LogicalResult as a struct to be consistent

This addresses a MSVC linker error saying splitAndProcessBuffer
was unresolved.

PiperOrigin-RevId: 271126570

4 years agoMiscellaneous fixes to SPIR-V Deserializer (details below).
Mahesh Ravishankar [Wed, 25 Sep 2019 05:50:16 +0000 (22:50 -0700)]
Miscellaneous fixes to SPIR-V Deserializer (details below).

1) Process and ignore the following debug instructions: OpSource,
OpSourceContinued, OpSourceExtension, OpString, OpModuleProcessed.
2) While processing OpTypeInt instruction, ignore the signedness
specification. Currently MLIR doesnt make a distinction between signed
and unsigned integer types.
3) Process and ignore BufferBlock decoration (similar to Buffer
decoration). StructType needs to be enhanced to track this attribute
since its needed for proper validation checks.
4) Report better error for unhandled instruction during
deserialization.

PiperOrigin-RevId: 271057060

4 years agoNFC: Add 'const' dereference method to OperandTypeIterator.
River Riddle [Wed, 25 Sep 2019 04:54:25 +0000 (21:54 -0700)]
NFC: Add 'const' dereference method to OperandTypeIterator.

The deference provided by mapped_iterator is non-const.

PiperOrigin-RevId: 271051375

4 years agoAdd support for GLSL Binary ops, and use it to implement GLSL FMax.
Mahesh Ravishankar [Wed, 25 Sep 2019 02:41:31 +0000 (19:41 -0700)]
Add support for GLSL Binary ops, and use it to implement GLSL FMax.

A base class is added to implement all GLSL Binary operations and is
used to implement the FMax operation. The existing framework already
generates all the necessary (de)serialization code.

PiperOrigin-RevId: 271037166

4 years ago[spirv] Replace bitwiseCast with llvm::bit_cast
Lei Zhang [Wed, 25 Sep 2019 02:24:33 +0000 (19:24 -0700)]
[spirv] Replace bitwiseCast with llvm::bit_cast

PiperOrigin-RevId: 271035618

4 years agoNFC: Add a description to the ODS interface example.
River Riddle [Tue, 24 Sep 2019 20:51:56 +0000 (13:51 -0700)]
NFC: Add a description to the ODS interface example.
PiperOrigin-RevId: 270978748

4 years agoAllow attaching descriptions to OpInterfaces and InterfaceMethods.
River Riddle [Tue, 24 Sep 2019 19:45:11 +0000 (12:45 -0700)]
Allow attaching descriptions to OpInterfaces and InterfaceMethods.

This change adds support for documenting interfaces and their methods. A tablegen generator for the interface documentation is also added(gen-op-interface-doc).

Documentation is added to an OpInterface via the `description` field:
def MyOpInterface : OpInterface<"MyOpInterface"> {
  let description = [{
    My interface is very interesting.
  }];
}

Documentation is added to an InterfaceMethod via a new `description` field that comes right before the optional body:

InterfaceMethod<"void", "foo", (ins), [{
  This is the foo method.
}]>,

PiperOrigin-RevId: 270965485

4 years agoIntroduce splat op + provide its LLVM lowering
Uday Bondhugula [Tue, 24 Sep 2019 19:44:11 +0000 (12:44 -0700)]
Introduce splat op + provide its LLVM lowering

- introduce splat op in standard dialect (currently for int/float/index input
  type, output type can be vector or statically shaped tensor)
- implement LLVM lowering (when result type is 1-d vector)
- add constant folding hook for it
- while on Ops.cpp, fix some stale names

Signed-off-by: Uday Bondhugula <uday@polymagelabs.com>
Closes tensorflow/mlir#141

COPYBARA_INTEGRATE_REVIEW=https://github.com/tensorflow/mlir/pull/141 from bondhugula:splat 48976a6aa0a75be6d91187db6418de989e03eb51
PiperOrigin-RevId: 270965304

4 years agoNormalize lowering of MemRef types
Nicolas Vasilache [Tue, 24 Sep 2019 18:21:04 +0000 (11:21 -0700)]
Normalize lowering of MemRef types

The RFC for unifying Linalg and Affine compilation passes into an end-to-end flow with a predictable ABI and linkage to external function calls raised the question of why we have variable sized descriptors for memrefs depending on whether they have static or dynamic dimensions  (https://groups.google.com/a/tensorflow.org/forum/#!topic/mlir/MaL8m2nXuio).

This CL standardizes the ABI on the rank of the memrefs.
The LLVM struct for a memref becomes equivalent to:
```
template <typename Elem, size_t Rank>
struct {
  Elem *ptr;
  int64_t sizes[Rank];
};
```

PiperOrigin-RevId: 270947276

4 years agoClone called functions into nested GPU module.
Christian Sigg [Tue, 24 Sep 2019 13:29:25 +0000 (06:29 -0700)]
Clone called functions into nested GPU module.

PiperOrigin-RevId: 270891190

4 years agoAllow null Attribute for value when building GlobalOp.
Christian Sigg [Tue, 24 Sep 2019 08:19:21 +0000 (01:19 -0700)]
Allow null Attribute for value when building GlobalOp.

PiperOrigin-RevId: 270853596

4 years ago[spirv] NFC: clean up (de)serialization tests
Lei Zhang [Tue, 24 Sep 2019 02:56:49 +0000 (19:56 -0700)]
[spirv] NFC: clean up (de)serialization tests

This CL uses the newly added -split-input-file CLI option to
mlir-translate to combine certain (de)serialization tests.
It also renames certain test filenames.

PiperOrigin-RevId: 270816324

4 years agoMake spirv::RuntimeArrayType part of spirv::CompositeType.
Mahesh Ravishankar [Tue, 24 Sep 2019 01:50:17 +0000 (18:50 -0700)]
Make spirv::RuntimeArrayType part of spirv::CompositeType.

According to SPIR-V spec, spirv::CompositeType includes
spirv::RuntimeArrayType. This allows using objects of
spirv::RuntimeArrayType with spirv::AccessChainOp.
PiperOrigin-RevId: 270809492

4 years agoLet mlir-translate support -split-input-file
Lei Zhang [Tue, 24 Sep 2019 01:17:52 +0000 (18:17 -0700)]
Let mlir-translate support -split-input-file

Similar to mlir-opt, having a -split-input-file mode is quite useful
in mlir-translate. It allows to put logically related tests in the
same test file for better organization.

PiperOrigin-RevId: 270805467

4 years agoHandle OpMemberName instruction in SPIR-V deserializer.
Mahesh Ravishankar [Tue, 24 Sep 2019 00:10:49 +0000 (17:10 -0700)]
Handle OpMemberName instruction in SPIR-V deserializer.

Sdd support in deserializer for OpMemberName instruction. For now
the name is just processed and not associated with the
spirv::StructType being built. That needs an enhancement to
spirv::StructTypes itself.
Add tests to check for errors reported during deserialization with
some refactoring to common out some utility functions.
PiperOrigin-RevId: 270794524

4 years agoUse constant's location for reporting errors in parsing of hex constant
Jacques Pienaar [Mon, 23 Sep 2019 22:51:11 +0000 (15:51 -0700)]
Use constant's location for reporting errors in parsing of hex constant

Before this the line following the error would be reported in some cases.

PiperOrigin-RevId: 270778722

4 years agoSimplify the way spirv::StructTypes are parsed.
Mahesh Ravishankar [Mon, 23 Sep 2019 19:52:28 +0000 (12:52 -0700)]
Simplify the way spirv::StructTypes are parsed.

The existing logic to parse spirv::StructTypes is very brittle. This
change simplifies the parsing logic a lot. The simplification also
allows for memberdecorations to be separated by commas instead of
spaces (which was an artifact of the existing parsing logic). The
change also needs a modification to mlir::parseType to return the
number of chars parsed. Adding a new parseType method to do so.

Also allow specification of spirv::StructType with no members.

PiperOrigin-RevId: 270739672

4 years agoAdd convenience methods to set an OpBuilder insertion point after an Operation (NFC)
Mehdi Amini [Mon, 23 Sep 2019 18:54:24 +0000 (11:54 -0700)]
Add convenience methods to set an OpBuilder insertion point after an Operation (NFC)

PiperOrigin-RevId: 270727180

4 years agoAdd initial callgraph support.
River Riddle [Mon, 23 Sep 2019 18:43:43 +0000 (11:43 -0700)]
Add initial callgraph support.

Using the two call interfaces, CallOpInterface and CallableOpInterface, this change adds support for an initial multi-level CallGraph. This call graph builds a set of nodes for each callable region, and connects them via edges. An edge may be any of the following types:
* Abstract
  - An edge not produced by a call operation, used for connecting to internal nodes from external nodes.
* Call
  - A call edge is an edge defined via a call-like operation.
* Child
  - This is an artificial edge connecting nested callgraph nodes.

This callgraph will be used, and improved upon, to begin supporting more interesting interprocedural analyses and transformation. In a followup, this callgraph will be used to support more complex inlining support.

PiperOrigin-RevId: 270724968

4 years agoAdd interfaces for call-like/callable operations.
River Riddle [Mon, 23 Sep 2019 18:36:37 +0000 (11:36 -0700)]
Add interfaces for call-like/callable operations.

These two operation interfaces will be used in a followup to support building a callgraph:
* CallOpInterface
  - Operations providing this interface are call-like, and have a "call" target. A call target may be a symbol reference, via SymbolRefAttr, or a SSA value.

* CallableOpInterface
  - Operations providing this interfaces define destinations to call-like operations, e.g. FuncOp. These operations may define any number of callable regions.

PiperOrigin-RevId: 270723300

4 years agoRefactor DiagnosticEngine to support multiple registered diagnostic handlers.
River Riddle [Mon, 23 Sep 2019 18:24:28 +0000 (11:24 -0700)]
Refactor DiagnosticEngine to support multiple registered diagnostic handlers.

This fixes a problem with current save-restore pattern of diagnostics handlers, as there may be a thread race between when the previous handler is destroyed. For example, this occurs when using multiple ParallelDiagnosticHandlers asynchronously:

Handler A
Handler B | - LifeTime - |    Restore A here.
Handler C | --- LifeTime ---| Restore B after it has been destroyed.

The new design allows for multiple handlers to be registered in a stack like fashion. Handlers can return success() to signal that they have fully processed a diagnostic, or failure to propagate otherwise.

PiperOrigin-RevId: 270720625

4 years agoUpdate the Pass, Analysis, and PassManager sections of WritingAPass.md.
River Riddle [Mon, 23 Sep 2019 18:17:55 +0000 (11:17 -0700)]
Update the Pass, Analysis, and PassManager sections of WritingAPass.md.

These have become out-of-date with the pass manager generalization.

PiperOrigin-RevId: 270719105

4 years agoNFC: Fix warning for uninitialized field.
River Riddle [Mon, 23 Sep 2019 17:19:45 +0000 (10:19 -0700)]
NFC: Fix warning for uninitialized field.
PiperOrigin-RevId: 270704572

4 years agoAdd variants of interleave that take separator
Jacques Pienaar [Mon, 23 Sep 2019 16:49:43 +0000 (09:49 -0700)]
Add variants of interleave that take separator

Make the common case of string separator easier to specify.

PiperOrigin-RevId: 270697581

4 years agoOutline GPU kernel function into a nested module.
Christian Sigg [Mon, 23 Sep 2019 10:16:23 +0000 (03:16 -0700)]
Outline GPU kernel function into a nested module.

Roll forward of commit 5684a12.

When outlining GPU kernels, put the kernel function inside a nested module. Then use a nested pipeline to generate the cubins, independently per kernel. In a final pass, move the cubins back to the parent module.

PiperOrigin-RevId: 270639748

4 years agoFix a number of Clang-Tidy warnings.
Christian Sigg [Mon, 23 Sep 2019 09:33:51 +0000 (02:33 -0700)]
Fix a number of Clang-Tidy warnings.

PiperOrigin-RevId: 270632324

4 years ago[NFC] Replace std::clamp with inline implementation.
Jing Pu [Mon, 23 Sep 2019 06:00:29 +0000 (23:00 -0700)]
[NFC] Replace std::clamp with inline implementation.

std::clamp is not in C++14, thus replace it with std::min and std::max.
PiperOrigin-RevId: 270604708

4 years agoSpecalize f32->i8/u8 Quanitization with C++ native arithmetic to optimize performance.
Jing Pu [Mon, 23 Sep 2019 05:07:08 +0000 (22:07 -0700)]
Specalize f32->i8/u8 Quanitization with C++ native arithmetic to optimize performance.

The CL adds a rounding mode flag to the class and changes the default to rmNearestTiesToAway from rmNearestTiesToEven because 1) Tensorflow QuantizeV2 ops uses rmNearestTiesToAway; 2) the specialization only implements rmNearestTiesToAway.

PiperOrigin-RevId: 270600739

4 years agoUpdate TruncateIOp builder to pass OperationState by reference.
MLIR Team [Sun, 22 Sep 2019 20:14:56 +0000 (13:14 -0700)]
Update TruncateIOp builder to pass OperationState by reference.

PiperOrigin-RevId: 270560295

4 years agoupdate layout map examples in doc, drop stale ones
Uday Bondhugula [Sun, 22 Sep 2019 17:14:11 +0000 (10:14 -0700)]
update layout map examples in doc, drop stale ones

- add more examples for affine layout maps showing various use
  cases

- affine map range sizes were removed from code, but examples in
  LangRef weren't updated

Signed-off-by: Uday Bondhugula <uday@polymagelabs.com>
Closes tensorflow/mlir#142

COPYBARA_INTEGRATE_REVIEW=https://github.com/tensorflow/mlir/pull/142 from bondhugula:doc 3291a8784bc69883f7a7cead21445fc8118aaad2
PiperOrigin-RevId: 270548991

4 years agoFix undefined reference to mlir::getElementTypeOrSelf(mlir::Type)
Denis Khalikov [Sun, 22 Sep 2019 16:08:06 +0000 (09:08 -0700)]
Fix undefined reference to mlir::getElementTypeOrSelf(mlir::Type)

Fix undefined reference:
mlir/lib/Dialect/StandardOps/Ops.cpp:2029:
undefined reference to `mlir::getElementTypeOrSelf(mlir::Type)'

Closes tensorflow/mlir#144

COPYBARA_INTEGRATE_REVIEW=https://github.com/tensorflow/mlir/pull/144 from denis0x0D:sandbox/fix_undef 494d4f7fa2e98ba21954d2b2f7ec1776b9397e08
PiperOrigin-RevId: 270545190

4 years agoAdd integer sign- and zero-extension and truncation to standard.
Manuel Freiberger [Sat, 21 Sep 2019 23:14:07 +0000 (16:14 -0700)]
Add integer sign- and zero-extension and truncation to standard.

This adds sign- and zero-extension and truncation of integer types to the
standard dialects. This allows to perform integer type conversions without
having to go to the LLVM dialect and introduce custom type casts (between
standard and LLVM integer types).

Closes tensorflow/mlir#134

COPYBARA_INTEGRATE_REVIEW=https://github.com/tensorflow/mlir/pull/134 from ombre5733:sext-zext-trunc-in-std c7657bc84c0ca66b304e53ec03797e09152e4d31
PiperOrigin-RevId: 270479722

4 years agominor spelling tweaks
brett koonce [Sat, 21 Sep 2019 18:38:41 +0000 (11:38 -0700)]
minor spelling tweaks

Closes tensorflow/mlir#143

COPYBARA_INTEGRATE_REVIEW=https://github.com/tensorflow/mlir/pull/143 from brettkoonce:minor_sp_demo 76bdf7c121a824417969627fc15e50259356a2fa
PiperOrigin-RevId: 270462293

4 years ago[spirv] Add OpControlBarrier and OpMemoryBarrier.
Denis Khalikov [Sat, 21 Sep 2019 17:18:00 +0000 (10:18 -0700)]
[spirv] Add OpControlBarrier and OpMemoryBarrier.

Add OpControlBarrier and OpMemoryBarrier (de)serialization.

Closes tensorflow/mlir#130

COPYBARA_INTEGRATE_REVIEW=https://github.com/tensorflow/mlir/pull/130 from denis0x0D:sandbox/memory_barrier 2e3fff16bca44904dc1039592cb9a65d526faea8
PiperOrigin-RevId: 270457478

4 years agoUpgrade/fix/simplify store to load forwarding
Uday Bondhugula [Sat, 21 Sep 2019 17:08:32 +0000 (10:08 -0700)]
Upgrade/fix/simplify store to load forwarding

- fix store to load forwarding for a certain set of cases (where
  forwarding shouldn't have happened); use AffineValueMap difference
  based MemRefAccess equality checking; utility logic is also greatly
  simplified

- add missing equality/inequality operators for AffineExpr ==/!= ints

- add == != operators on MemRefAccess

Closes tensorflow/mlir#136

COPYBARA_INTEGRATE_REVIEW=https://github.com/tensorflow/mlir/pull/136 from bondhugula:store-load-forwarding d79fd1add8bcfbd9fa71d841a6a9905340dcd792
PiperOrigin-RevId: 270457011

4 years agoAdd a note about the use of recursion in the developer guide
Mehdi Amini [Sat, 21 Sep 2019 16:44:58 +0000 (09:44 -0700)]
Add a note about the use of recursion in the developer guide

PiperOrigin-RevId: 270455509

4 years ago[ODS] Add support for FloatElementsAttr
Lei Zhang [Sat, 21 Sep 2019 16:44:38 +0000 (09:44 -0700)]
[ODS] Add support for FloatElementsAttr

This CL adds a new FloatElementsAttr definition to ODS for float
elements attributes of a certain type.

Tests are added to show both verification and how to use it in patterns.

PiperOrigin-RevId: 270455487