platform/upstream/coreclr.git
6 years agoNew jit intrinsic support (#13815)
Andy Ayers [Thu, 7 Sep 2017 21:28:07 +0000 (14:28 -0700)]
New jit intrinsic support (#13815)

Support for new-style intrinsics where corelib methods can have both IL
implementations and optional jit-supplied implementations.

Mark such methods with the [Intrinsic] attribute, then recognize the
intrinsic methods by name in the jit.

Jit currently has a placeholder for the Enum.HasFlag method.

6 years agoMerge pull request #13821 from pgavlin/DevDiv487701_487702
Pat Gavlin [Thu, 7 Sep 2017 19:30:51 +0000 (12:30 -0700)]
Merge pull request #13821 from pgavlin/DevDiv487701_487702

Fix VSO 487701 and 487702.

6 years agoSpelling and grammar corrections - A through L (#13683)
Brian Chavez [Thu, 7 Sep 2017 18:36:37 +0000 (11:36 -0700)]
Spelling and grammar corrections - A through L (#13683)

6 years agoMerge pull request #13817 from pgavlin/DevDiv487703
Pat Gavlin [Thu, 7 Sep 2017 18:33:59 +0000 (11:33 -0700)]
Merge pull request #13817 from pgavlin/DevDiv487703

Do not remove NOPs used by calls.

6 years agoUpdate CoreClr, CoreFx to preview2-25707-02, preview2-25707-02, respectively (#13808)
dotnet-maestro-bot [Thu, 7 Sep 2017 18:19:20 +0000 (11:19 -0700)]
Update CoreClr, CoreFx to preview2-25707-02, preview2-25707-02, respectively (#13808)

6 years agoFix for #13830 issue (#13831)
sergey ignatov [Thu, 7 Sep 2017 18:14:29 +0000 (21:14 +0300)]
Fix for #13830 issue (#13831)

6 years agoFix incorrect treatment of pointer as fixed (#13816)
Victor "Nate" Graf [Thu, 7 Sep 2017 15:55:21 +0000 (08:55 -0700)]
Fix incorrect treatment of pointer as fixed (#13816)

6 years agoMerge pull request #13797 from jashook/arm64_green_ci
Jarret Shook [Thu, 7 Sep 2017 02:47:52 +0000 (19:47 -0700)]
Merge pull request #13797 from jashook/arm64_green_ci

Disable tests based on 13796

6 years agoSegregate merged returns by constant value (#13792)
Joseph Tremoulet [Thu, 7 Sep 2017 01:14:19 +0000 (21:14 -0400)]
Segregate merged returns by constant value (#13792)

The JIT enforces a limit on the number of epilogs emitted in any given
method.  Change the logic so that when this merging kicks in, returns of
constant values are given merged return blocks distinct from each other
and from the general return block, as long as we can do so without going
over the limit.  This particularly helps avoid redundancy (while still
keeping method size down) in methods with a large number of constant
returns but only a few distinct constants, which is true of many
predicate methods with bool return type.

This is the compiler portion of #13466 and dotnet/corefx#23395.

6 years agoVendor the volatile.h header into src/gc/env for the standalone GC build (#13656)
Sean Gillespie [Wed, 6 Sep 2017 23:12:25 +0000 (16:12 -0700)]
Vendor the volatile.h header into src/gc/env for the standalone GC build (#13656)

* Vendor the volatile.h header into src/gc/env for the standalone GC build

* Repair the GC sample

* Remove some unneeded defines (fixes the sample build)

6 years agoFix VSO 487701 and 487702.
Pat Gavlin [Wed, 6 Sep 2017 22:51:22 +0000 (15:51 -0700)]
Fix VSO 487701 and 487702.

Both of these issues stem from attempting to unassign a copied interval
from the copied-to register and then reassigning the interval to the
same. This corrupts some of the bookkeeping necessary to track whether
or not the interval in the register needs to be spilled, and the RA ends
up attempting to spill the interval being allocated even though it is
not assigned a register.

6 years agoAdd tests for VSO 487701 and 487702.
Pat Gavlin [Wed, 6 Sep 2017 22:49:27 +0000 (15:49 -0700)]
Add tests for VSO 487701 and 487702.

6 years agoAdd a regression test.
Pat Gavlin [Wed, 6 Sep 2017 21:34:48 +0000 (14:34 -0700)]
Add a regression test.

6 years agoDo not remove NOPs used by calls.
Pat Gavlin [Wed, 6 Sep 2017 19:48:51 +0000 (12:48 -0700)]
Do not remove NOPs used by calls.

Instead of removing dead stores that are marked as late args, we replace
them with NOPs. This obviates the need to update the call's argument
table, but requires that the NOP itself not be DCE'd. This change marks
these NOPs with the `ORDER_SIDEEFF` flag s.t. DCE will not remove them.

Fixes VSO 487703.

6 years agoFix DevDiv_278523 test for r2r x86. (#13709)
Sergey Andreenko [Wed, 6 Sep 2017 19:38:58 +0000 (12:38 -0700)]
Fix DevDiv_278523 test for r2r x86. (#13709)

* separate sources into 2 files: for 32 and for 64.

6 years agoRestore Array.Empty
danmosemsft [Sat, 2 Sep 2017 00:55:10 +0000 (17:55 -0700)]
Restore Array.Empty

Signed-off-by: dotnet-bot <dotnet-bot@microsoft.com>
6 years agoMerge pull request #13811 from jashook/fix_xarch_warning
Jarret Shook [Wed, 6 Sep 2017 18:16:57 +0000 (11:16 -0700)]
Merge pull request #13811 from jashook/fix_xarch_warning

Fix potentially uninitialized local variable 'regCount'

6 years agoJit doesn't reload shift index if it was spilled to rcx. (#13757)
Sergey Andreenko [Wed, 6 Sep 2017 18:00:18 +0000 (11:00 -0700)]
Jit doesn't reload shift index if it was spilled to rcx. (#13757)

Repro test. Fix and additional assert.

6 years agoMerge pull request #13659 from mikedn/cast-actual-type
Pat Gavlin [Wed, 6 Sep 2017 17:28:50 +0000 (10:28 -0700)]
Merge pull request #13659 from mikedn/cast-actual-type

Fix getCastDescription to use the actual source type

6 years agoMerge pull request #13800 from adiaaida/addnopgoPerf
Michelle McDaniel [Wed, 6 Sep 2017 16:36:58 +0000 (09:36 -0700)]
Merge pull request #13800 from adiaaida/addnopgoPerf

Add nopgo option for throughput runs

6 years agoFix potentially uninitialized local variable 'regCount'
jashook [Wed, 6 Sep 2017 16:26:22 +0000 (09:26 -0700)]
Fix potentially uninitialized local variable 'regCount'

6 years agoAdd Memory-based Stream overloads to coreclr (#13769)
Stephen Toub [Wed, 6 Sep 2017 15:48:01 +0000 (11:48 -0400)]
Add Memory-based Stream overloads to coreclr (#13769)

Includes adding the virtuals to Stream and then overriding on the various streams implemented in coreclr.

6 years agoRemoved renamed method. (#13803)
Adrian Godong [Wed, 6 Sep 2017 14:14:19 +0000 (07:14 -0700)]
Removed renamed method. (#13803)

6 years agoSupport for not wrapping exceptions with TargetInvocationException. (#13767)
Austin Wise [Wed, 6 Sep 2017 12:19:48 +0000 (05:19 -0700)]
Support for not wrapping exceptions with TargetInvocationException. (#13767)

* Support for not wrapping exceptions with TargetInvocationException.

For dotnet/corefx#22866.

* Respond to PR feedback.

Mainly by making "WrapExceptions" consistently positive in FCalls.

* Remove BindingFlags.DoNotWrapExceptions tests in deference to CoreFX tests.

6 years agoUpdate CoreClr, CoreFx to preview2-25706-01, preview2-25706-01, respectively (#13734)
dotnet-maestro-bot [Wed, 6 Sep 2017 04:53:24 +0000 (21:53 -0700)]
Update CoreClr, CoreFx to preview2-25706-01, preview2-25706-01, respectively (#13734)

6 years agoAdd nopgo option for throughput runs
Michelle McDaniel [Tue, 5 Sep 2017 22:34:10 +0000 (15:34 -0700)]
Add nopgo option for throughput runs

6 years agoFix for CoreRT issue https://github.com/dotnet/corert/issues/3672 (ar… (#13777)
sergey ignatov [Wed, 6 Sep 2017 01:37:55 +0000 (04:37 +0300)]
Fix for CoreRT issue https://github.com/dotnet/corert/issues/3672 (ar… (#13777)

* Fix for CoreRT issue https://github.com/dotnet/corert/issues/3672 (armel tizen)

* Added assertion for accessType

6 years agoimplementing profiler ELT callbacks for AMD64 Linux (#12603)
sergey ignatov [Wed, 6 Sep 2017 01:06:50 +0000 (04:06 +0300)]
implementing profiler ELT callbacks for AMD64 Linux (#12603)

* implement profiler ELT callbacks for AMD64 Linux

* Some formatting fixes

* Fixed profiler

* Added aligning frame option

* Added aligning stack for quad values stores

6 years agoMoving the Windows Performance runs from Server 2012 to Server 2016. (#13725)
José Rivero [Wed, 6 Sep 2017 00:38:54 +0000 (17:38 -0700)]
Moving the Windows Performance runs from Server 2012 to Server 2016. (#13725)

6 years agoAdd support for building under glibc 2.26 (#13785)
Omair Majid [Tue, 5 Sep 2017 23:22:55 +0000 (19:22 -0400)]
Add support for building under glibc 2.26 (#13785)

glibc 2.26 renames a number of identifiers so they are reserved under
POSIX. Specifically, `padding` becomes `__glibc_reserved1`. Add a
configure test for it and use the appropriate field name.

See https://sourceware.org/bugzilla/show_bug.cgi?id=21457 for more
information.

Resolves #13009

6 years agoDisable tests based on 13796
jashook [Tue, 5 Sep 2017 22:27:24 +0000 (15:27 -0700)]
Disable tests based on 13796

6 years agoMerge pull request #13791 from jashook/revert_13687
Jarret Shook [Tue, 5 Sep 2017 22:20:39 +0000 (15:20 -0700)]
Merge pull request #13791 from jashook/revert_13687

revert_13687

6 years agoFix SemaphoreSlim throughput (#13766)
Koundinya Veluri [Tue, 5 Sep 2017 21:52:23 +0000 (14:52 -0700)]
Fix SemaphoreSlim throughput (#13766)

In https://github.com/dotnet/coreclr/pull/13670, by mistake I made the spin loop infinite, that is now fixed.

As a result the numbers I had provided in that PR for SemaphoreSlim were skewed, and fixing it caused the throughput to get even lower. To compensate, I have found and fixed one culprit for the low throughput problem:
- Every release wakes up a waiter. Effectively, when there is a thread acquiring and releasing the semaphore, waiters don't get to remain in a wait state.
- Added a field to keep track of how many waiters were pulsed to wake but have not yet woken, and took that into account in Release() to not wake up more waiters than necessary.
- Retuned and increased the number of spin iterations. The total spin delay is still less than before the above PR.

6 years agorevert_13687
jashoo [Tue, 5 Sep 2017 18:42:15 +0000 (11:42 -0700)]
revert_13687

6 years agoAdd Intel hardware intrinsic API (#13576)
Fei Peng [Tue, 5 Sep 2017 18:34:56 +0000 (11:34 -0700)]
Add Intel hardware intrinsic API (#13576)

6 years agoFix access order for double pointer (#13759)
Victor "Nate" Graf [Tue, 5 Sep 2017 16:36:53 +0000 (09:36 -0700)]
Fix access order for double pointer (#13759)

* Fix access order for double pointer

* Reinforce test to catch more errors

6 years agoMerge pull request #13747 from jashook/lst_file_updates
Jarret Shook [Tue, 5 Sep 2017 16:36:35 +0000 (09:36 -0700)]
Merge pull request #13747 from jashook/lst_file_updates

Lst File updates.

6 years agoJIT: allow inlines of methods with calli (#13756)
Andy Ayers [Tue, 5 Sep 2017 14:23:55 +0000 (07:23 -0700)]
JIT: allow inlines of methods with calli (#13756)

Provided call sig has default callling convention. Added test case.
Continuation of #12714.

6 years agoMerge pull request #13763 from shimingsg/v-shige/addtestdependencyxmlfiles
Shiming Ge [Tue, 5 Sep 2017 07:01:41 +0000 (15:01 +0800)]
Merge pull request #13763 from shimingsg/v-shige/addtestdependencyxmlfiles

add test dependency xml files

6 years agoPrint zapper stats on verbose mode (#13774)
Hanjoung Lee [Tue, 5 Sep 2017 05:26:33 +0000 (14:26 +0900)]
Print zapper stats on verbose mode (#13774)

6 years agoFix uninitialized fields of ZapperStats (#13773)
Hanjoung Lee [Mon, 4 Sep 2017 23:33:13 +0000 (08:33 +0900)]
Fix uninitialized fields of ZapperStats (#13773)

6 years agoupdate correct file path if the working folder is not test case folder
shimingsg [Sat, 2 Sep 2017 10:01:37 +0000 (18:01 +0800)]
update correct file path if the working folder is not test case folder

6 years agoChange identifier for EventProviders from GUID to string name (#13370)
Victor "Nate" Graf [Fri, 1 Sep 2017 23:19:07 +0000 (16:19 -0700)]
Change identifier for EventProviders from GUID to string name (#13370)

* [WIP] Changed event provider to user String identifiers

* [WIP] Remove GUID from generated code

* [WIP] Many small fixes

* [WIP] Fix error in constructing GUID

* Pass EventSource to abstract away GUID/Name references

* Fix various small errors

* Delay construction of SString objects

* Change GUIDs to names

* Change hardcoded GUID strings to names

* Revert testing changes

* Remove extra line

* Use the EventSource name

* Use provider full names

* Use full-names for Rundown

* Bump version number for eventpipe file

* Address review comments

6 years agoMerge pull request #13755 from BruceForstall/AddLsraAssert
Bruce Forstall [Fri, 1 Sep 2017 23:03:18 +0000 (16:03 -0700)]
Merge pull request #13755 from BruceForstall/AddLsraAssert

Add an assert to getRegisterRecord() that regNum is legal

6 years agoneed casting for size calculation (#13754)
Maoni Stephens [Fri, 1 Sep 2017 22:21:47 +0000 (15:21 -0700)]
need casting for size calculation (#13754)

6 years agoAdd an assert to getRegisterRecord() that regNum is legal
Bruce Forstall [Fri, 1 Sep 2017 20:59:23 +0000 (13:59 -0700)]
Add an assert to getRegisterRecord() that regNum is legal

6 years agoAdd normalized equivalent of YieldProcessor, retune some spin loops (#13670)
Koundinya Veluri [Fri, 1 Sep 2017 20:09:40 +0000 (13:09 -0700)]
Add normalized equivalent of YieldProcessor, retune some spin loops (#13670)

* Add normalized equivalent of YieldProcessor, retune some spin loops

Part of fix for https://github.com/dotnet/coreclr/issues/13388

Normalized equivalent of YieldProcessor
- The delay incurred by YieldProcessor is measured once lazily at run-time
- Added YieldProcessorNormalized that yields for a specific duration (the duration is approximately equal to what was measured for one YieldProcessor on a Skylake processor, about 125 cycles). The measurement calculates how many YieldProcessor calls are necessary to get a delay close to the desired duration.
- Changed Thread.SpinWait to use YieldProcessorNormalized

Thread.SpinWait divide count by 7 experiment
- At this point I experimented with changing Thread.SpinWait to divide the requested number of iterations by 7, to see how it fares on perf. On my Sandy Bridge processor, 7 * YieldProcessor == YieldProcessorNormalized. See numbers in PR below.
- Not too many regressions, and the overall perf is somewhat as expected - not much change on Sandy Bridge processor, significant improvement on Skylake processor.
  - I'm discounting the SemaphoreSlim throughput score because it seems to be heavily dependent on Monitor. It would be more interesting to revisit SemaphoreSlim after retuning Monitor's spin heuristics.
  - ReaderWriterLockSlim seems to perform worse on Skylake, the current spin heuristics are not translating well

Spin tuning
- At this point, I abandoned the experiment above and tried to retune spins that use Thread.SpinWait
- General observations
  - YieldProcessor stage
    - At this stage in many places we're currently doing very long spins on YieldProcessor per iteration of the spin loop. In the last YieldProcessor iteration, it amounts to about 70 K cycles on Sandy Bridge and 512 K cycles on Skylake.
    - Long spins on YieldProcessor don't let other work run efficiently. Especially when many scheduled threads all issue a long YieldProcessor, a significant portion of the processor can go unused for a long time.
    - Long spins on YieldProcessor is in some cases helping to reduce contention in high-contention cases, effectively taking away some threads into a long delay. Sleep(1) works much better but has a much higher delay so it's not always appropriate. In other cases, I found that it's better to do more iterations with a shorter YieldProcessor. It would be even better to reduce the contention in the app or to have a proper wait in the sync object, where appropriate.
    - Updated the YieldProcessor measurement above to calculate the number of YieldProcessorNormalized calls that amount to about 900 cycles (this was tuned based on perf), and modified SpinWait's YieldProcessor stage to cap the number of iterations passed to Thread.SpinWait. Effectively, the first few iterations have a longer delay than before on Sandy Bridge and a shorter delay than before on Skylake, and the later iterations have a much shorter delay than before on both.
  - Yield/Sleep(0) stage
    - Observed a couple of issues:
      - When there are no threads to switch to, Yield and Sleep(0) become no-op and it turns the spin loop into a busy-spin that may quickly reach the max spin count and cause the thread to enter a wait state, or may just busy-spin for longer than desired before a Sleep(1). Completing the spin loop too early can cause excessive context switcing if a wait follows, and entering the Sleep(1) stage too early can cause excessive delays.
      - If there are multiple threads doing Yield and Sleep(0) (typically from the same spin loop due to contention), they may switch between one another, delaying work that can make progress.
    - I found that it works well to interleave a Yield/Sleep(0) with YieldProcessor, it enforces a minimum delay for this stage. Modified SpinWait to do this until it reaches the Sleep(1) threshold.
  - Sleep(1) stage
    - I didn't see any benefit in the tests to interleave Sleep(1) calls with some Yield/Sleep(0) calls, perf seemed to be a bit worse actually. If the Sleep(1) stage is reached, there is probably a lot of contention and the Sleep(1) stage helps to remove some threads from the equation for a while. Adding some Yield/Sleep(0) in-between seems to add back some of that contention.
      - Modified SpinWait to use a Sleep(1) threshold, after which point it only does Sleep(1) on each spin iteration
    - For the Sleep(1) threshold, I couldn't find one constant that works well in all cases
      - For spin loops that are followed by a proper wait (such as a wait on an event that is signaled when the resource becomes available), they benefit from not doing Sleep(1) at all, and spinning in other stages for longer
      - For infinite spin loops, they usually seemed to benefit from a lower Sleep(1) threshold to reduce contention, but the threshold also depends on other factors like how much work is done in each spin iteration, how efficient waiting is, and whether waiting has any negative side-effects.
      - Added an internal overload of SpinWait.SpinOnce to take the Sleep(1) threshold as a parameter
- SpinWait - Tweaked the spin strategy as mentioned above
- ManualResetEventSlim - Changed to use SpinWait, retuned the default number of iterations (total delay is still significantly less than before). Retained the previous behavior of having Sleep(1) if a higher spin count is requested.
- Task - It was using the same heuristics as ManualResetEventSlim, copied the changes here as well
- SemaphoreSlim - Changed to use SpinWait, retuned similarly to ManualResetEventSlim but with double the number of iterations because the wait path is a lot more expensive
- SpinLock - SpinLock was using very long YieldProcessor spins. Changed to use SpinWait, removed process count multiplier, simplified.
- ReaderWriterLockSlim - This one is complicated as there are many issues. The current spin heuristics performed better even after normalizing Thread.SpinWait but without changing the SpinWait iterations (the delay is longer than before), so I left this one as is.
- The perf (see numbers in PR below) seems to be much better than both the baseline and the Thread.SpinWait divide by 7 experiment
  - On Sandy Bridge, I didn't see many significant regressions. ReaderWriterLockSlim is a bit worse in some cases and a bit better in other similar cases, but at least the really low scores in the baseline got much better and not the other way around.
  - On Skylake, some significant regressions are in SemaphoreSlim throughput (which I'm discounting as I mentioned above in the experiment) and CountdownEvent add/signal throughput. The latter can probably be improved later.

6 years agoJIT: fix some instruction size estimates (#13432)
Andy Ayers [Fri, 1 Sep 2017 18:20:39 +0000 (11:20 -0700)]
JIT: fix some instruction size estimates (#13432)

The jit might double-count the REX prefix for certain reg-reg moves, and
could overestimate the size of a code-referent LEA.

While the downstream emitter code can tolerate overestimates, it is better
not to have them.

Closes #13398

Also fixes overestimates for the following:

* `call reg`
* `call [reg]`
* `call [reg + disp-byte]`
* `cmp al,byte`

6 years agoClear the init-locals bit for CoreLib to workaround #1279 (#13728)
Jan Kotas [Fri, 1 Sep 2017 17:57:33 +0000 (10:57 -0700)]
Clear the init-locals bit for CoreLib to workaround #1279 (#13728)

* Clear the init-locals bit for CoreLib to workaround #1279

* Yet another place that depends on zero init locals

6 years agoUpdate Type.GetMethods() to be generics friendly (#13745)
Atsushi Kanamori [Fri, 1 Sep 2017 17:04:47 +0000 (10:04 -0700)]
Update Type.GetMethods() to be generics friendly (#13745)

Update Type.GetMethods() to be generics friendly

6 years agoShare four exception types (#13492)
Dan Moseley [Fri, 1 Sep 2017 17:03:50 +0000 (10:03 -0700)]
Share four exception types (#13492)

* AE

* Move RuntimeWrappedException to shared

* Move AccessViolationException to shared

* Move IOException to shared

* nit

* assert to catch when message ought to include path

* AE feedback

* RWE feedback

* Remove most of __Error in favor of duplicate shared code in Win32Marshal

* Remove duplicated MakeHRFromErrorCode

* Extra using

* Revert RWE field rename

* Rename to wrappedException

* Make DNFE public for corefx

* Add no path case to match corefx

* Share DNFE

* Add underscore

* EOL

* Temporarily make DrNFE internal again

* Make RWE public

* Fixup __HResults

* Remove dead entries from Win32Native

* Redirect Kernel32 to PAL on Unix

* Remove dead targets file

* Unify on Interop.Libraries

* Refactor to expression-bodied property

6 years agoLst File updates.
jashook [Fri, 1 Sep 2017 16:42:02 +0000 (09:42 -0700)]
Lst File updates.

This change includes:

1) lst_creator updates to allow adding priority tags automatically
2) arm32 lstFile updates: 29 new tests, 50 removed
3) arm64 lstFile updates: 80 new tests, 55 removed

6 years agoMerge pull request #13743 from alpencolt/ryu-arm-13056-tests
Bruce Forstall [Fri, 1 Sep 2017 15:44:09 +0000 (08:44 -0700)]
Merge pull request #13743 from alpencolt/ryu-arm-13056-tests

[RyuJIT/ARM32] Add regression tests

6 years ago[ARM64/Windows] Add JIT_Stelem_Ref helper (#13687)
Pankaj Gode [Fri, 1 Sep 2017 15:42:26 +0000 (21:12 +0530)]
[ARM64/Windows] Add JIT_Stelem_Ref helper (#13687)

* [ARM64/Windows] Add JIT_Stelem_Ref helper

* [ARM64/Windows] Modified JIT_Stelem_Ref helper to save and restore x0-x2 instead of x0-x8

* [ARM64/Windows] using EPILOG_BRANCH for correct unwind info

6 years agoInitialize m_failedILStubs of ZapperStats (#13742)
Hanjoung Lee [Fri, 1 Sep 2017 15:41:01 +0000 (00:41 +0900)]
Initialize m_failedILStubs of ZapperStats (#13742)

6 years agoAvoid StringBuilder allocation in ResourceManager (#13732)
Justin Van Patten [Fri, 1 Sep 2017 14:12:30 +0000 (07:12 -0700)]
Avoid StringBuilder allocation in ResourceManager (#13732)

6 years agoMerge pull request dotnet/corert#4370 from dotnet/nmirror
Michal Strehovský [Thu, 31 Aug 2017 01:05:28 +0000 (18:05 -0700)]
Merge pull request dotnet/corert#4370 from dotnet/nmirror

Merge nmirror to master

Signed-off-by: dotnet-bot <dotnet-bot@microsoft.com>
6 years ago[RyuJIT/ARM32] Add regression tests
Alexander Soldatov [Fri, 1 Sep 2017 10:46:26 +0000 (13:46 +0300)]
[RyuJIT/ARM32] Add regression tests

Tests for #13056

6 years agoEnable checking of GTF_EXCEPT and GTF_ASG flags. (#13668)
Eugene Rozenfeld [Fri, 1 Sep 2017 04:29:51 +0000 (21:29 -0700)]
Enable checking of GTF_EXCEPT and GTF_ASG flags. (#13668)

* Enable checking of GTF_EXCEPT and GTF_ASG flags.

fgDebugCheckFlags is modified to check that GTF_EXCEPT and GTF_ASG are set precisely when needed.
It's also modified to handle several special operators correctly.

fgAddrCouldBeNull is updated to check for handles, implicit byref locals, and stack byrefs.

OperMayThrow is modified to handle several operators correctly.

GTF_IND_NONFAULTING is reused on operations for which OperIsIndir() is true and on GT_ARR_LENGTH.

Various places in morph are updated to set side effect flags correctly.

gtUpdateSideEffects is re-written so that it's precise for GTF_ASG and GTF_EXCEPT
and conservatively correct for the other side effects. It's now called from more places
to keep the flags up-to-date after transformations.

NoThrow in HelperCallProperties is updated and GTF_EXCEPT flag is set on helper calls according to
that property.

optRemoveRangeCheck is cleaned up and simplified.

6 years agospmi: fix prevEnviroment delete statement. (#13729)
Sergey Andreenko [Fri, 1 Sep 2017 01:31:12 +0000 (18:31 -0700)]
spmi: fix prevEnviroment delete statement. (#13729)

6 years agoMerge pull request #13215 from CarolEidt/CrossHFA
Carol Eidt [Fri, 1 Sep 2017 00:28:04 +0000 (17:28 -0700)]
Merge pull request #13215 from CarolEidt/CrossHFA

Support checking for HFA types in altjit

6 years agoUpdate CoreClr, CoreFx to preview2-25631-03, preview2-25631-02, respectively (#13678)
dotnet-maestro-bot [Thu, 31 Aug 2017 21:03:20 +0000 (14:03 -0700)]
Update CoreClr, CoreFx to preview2-25631-03, preview2-25631-02, respectively (#13678)

6 years agoMerge pull request #13669 from BruceForstall/ArmTailcallViaHelper
Bruce Forstall [Thu, 31 Aug 2017 20:44:48 +0000 (13:44 -0700)]
Merge pull request #13669 from BruceForstall/ArmTailcallViaHelper

[RyuJIT/arm32] Add support for tailcall via helper

6 years agoMerge pull request #13724 from alpencolt/ryu-arm-13056
Carol Eidt [Thu, 31 Aug 2017 20:37:49 +0000 (13:37 -0700)]
Merge pull request #13724 from alpencolt/ryu-arm-13056

[RyuJIT/ARM32] Correct handling of double registers in registerIsAvai…

6 years agoAdding {ReadOnly}Memory, OwnedMemory, MemoryHandle, and IRetainable (#13583)
Ahson Ahmed Khan [Thu, 31 Aug 2017 18:34:20 +0000 (11:34 -0700)]
Adding {ReadOnly}Memory, OwnedMemory, MemoryHandle, and IRetainable (#13583)

* Adding {ReadOnly}Memory<T>, OwnedMemory<T>, MemoryHandle, and IRetainable.

* Adding types {ReadOnly}Memory<T>, OwnedMemory<T>, MemoryHandle, and IRetainable.

* Adding Unsafe.As and Unsafe.Add + other fixes of build errors

* Addressing PR feedback.

* Add a check for length > 0 before indexing the array.

* Removing use of Unsafe.As and changing signature to RefTFrom_RetRefTTo.

* Fixing metasig definition.

* Removing unnecessary call to Unsafe.Add.

6 years ago[RyuJIT/ARM32] Correct handling of double registers in registerIsAvailable()
Alexander Soldatov [Thu, 31 Aug 2017 18:14:07 +0000 (21:14 +0300)]
[RyuJIT/ARM32] Correct handling of double registers in registerIsAvailable()

6 years agoBug fix on measurement.py loop (#13711)
José Rivero [Thu, 31 Aug 2017 17:00:54 +0000 (10:00 -0700)]
Bug fix on measurement.py loop (#13711)

The loop was iterating through fixed file name and a pattern. The fixed file name did not exist, and the whole function failed.
With this change, we loop through the files if they exist.

6 years agoMerge pull request #13685 from kbaladurin/ryujit-fix-opcodeoffs
Bruce Forstall [Thu, 31 Aug 2017 16:34:45 +0000 (09:34 -0700)]
Merge pull request #13685 from kbaladurin/ryujit-fix-opcodeoffs

JIT: Fix calculation of opcodeOffsets in Compiler::impImportBlockCode

6 years agoMerge pull request #13719 from wateret/fix-multiregop
Bruce Forstall [Thu, 31 Aug 2017 16:32:51 +0000 (09:32 -0700)]
Merge pull request #13719 from wateret/fix-multiregop

[RyuJIT/armel] Fix MultiRegOp definition

6 years agoCleanup CoreLib defines (#13713)
Jan Kotas [Thu, 31 Aug 2017 14:36:39 +0000 (07:36 -0700)]
Cleanup CoreLib defines (#13713)

6 years agoUpdate optdata to version 20170830-0123 (#13717)
Daniel Podder [Thu, 31 Aug 2017 14:20:03 +0000 (09:20 -0500)]
Update optdata to version 20170830-0123 (#13717)

6 years agoMerge pull request #13394 from shimingsg/v-shige/add-perftc-0816
Shiming Ge [Thu, 31 Aug 2017 10:23:17 +0000 (18:23 +0800)]
Merge pull request #13394 from shimingsg/v-shige/add-perftc-0816

Add perf test (making cards) to coreclr

6 years ago[RyuJIT/armel] Fix MultiRegOp definition
Hanjoung Lee [Thu, 31 Aug 2017 08:04:38 +0000 (17:04 +0900)]
[RyuJIT/armel] Fix MultiRegOp definition

GT_COPY should not be MultiRegOp since it is CopyOrReload.

6 years agoadd test dependency files
Shiming Ge [Thu, 31 Aug 2017 06:03:06 +0000 (14:03 +0800)]
add test dependency files

6 years agoMerge pull request #13690 from CarolEidt/NullcheckNotContained
Carol Eidt [Thu, 31 Aug 2017 04:34:52 +0000 (21:34 -0700)]
Merge pull request #13690 from CarolEidt/NullcheckNotContained

Assert that Nullcheck child is not contained

6 years agoSpelling and grammar corrections - M through Z (#13698)
Brian Chavez [Thu, 31 Aug 2017 04:00:22 +0000 (21:00 -0700)]
Spelling and grammar corrections - M through Z (#13698)

6 years agoMerge pull request #13701 from pgavlin/IndexAddr2
Pat Gavlin [Thu, 31 Aug 2017 03:56:13 +0000 (20:56 -0700)]
Merge pull request #13701 from pgavlin/IndexAddr2

Restore `GT_INDEX_ADDR` after #13682.

6 years agoRandom span-based API (#13708)
Maggie Tsang [Thu, 31 Aug 2017 03:08:40 +0000 (20:08 -0700)]
Random span-based API (#13708)

* Span NextBytes

* int fixes

* undo ints

6 years agoPR feedback.
Pat Gavlin [Thu, 31 Aug 2017 01:36:32 +0000 (18:36 -0700)]
PR feedback.

6 years agoMerge pull request #13704 from pgavlin/PerfTestsPri0
Pat Gavlin [Thu, 31 Aug 2017 01:27:15 +0000 (18:27 -0700)]
Merge pull request #13704 from pgavlin/PerfTestsPri0

Move performance tests back into Priority 0.

6 years agoJIT: don't reuse box temps when optimizing (#13703)
Andy Ayers [Thu, 31 Aug 2017 00:36:07 +0000 (17:36 -0700)]
JIT: don't reuse box temps when optimizing (#13703)

The importer reuses temps for different box operations that do not overlap.
This keeps the number of temps to a minimum and reduces prolog zeroing if the
temps end up untracked. But reuse prevents the importer from accurately typing
the temp.

So now, when optimizing, allocate a new temp for each box operation, and type
the temp with the type of the box.

This, along with a small update in `gtGetClassHandle` to obtain the box type,
enables some devirtualization of interface calls on boxes and will facilitate
future changes to optimize away boxes entirely (eg #5626).

6 years agoPreemptively adding a resource string. (#13705)
Atsushi Kanamori [Wed, 30 Aug 2017 23:33:28 +0000 (16:33 -0700)]
Preemptively adding a resource string. (#13705)

Adding this now to save time later as
the CoreCLR/CoreRT bot will soon be
porting over a big feature change
and the only thing blocking the bot
from a green CI is this one new error string.

6 years agoFix a typo
Carol Eidt [Wed, 30 Aug 2017 21:34:12 +0000 (14:34 -0700)]
Fix a typo

6 years agoError out if specified testBinLoc path does not exist. (#13700)
José Rivero [Wed, 30 Aug 2017 20:51:23 +0000 (13:51 -0700)]
Error out if specified testBinLoc path does not exist. (#13700)

6 years agoMove performance tests back into Priority 0.
Pat Gavlin [Wed, 30 Aug 2017 20:25:23 +0000 (13:25 -0700)]
Move performance tests back into Priority 0.

Just what it says on the tin. Should fix #13697.

6 years agoMerge pull request #13684 from hseok-oh/ci/set_xml_file
Jarret Shook [Wed, 30 Aug 2017 19:55:38 +0000 (12:55 -0700)]
Merge pull request #13684 from hseok-oh/ci/set_xml_file

Use --xunitOutputPath option in runtest.sh

6 years agoFix `INDEX_ADDR` codegen on ARM for large element sizes.
Pat Gavlin [Mon, 28 Aug 2017 22:45:15 +0000 (15:45 -0700)]
Fix `INDEX_ADDR` codegen on ARM for large element sizes.

We were attempting to generate `base + index * size` using `MADD`, but
had the registers in the wrong order and were generating
`base * index + size`. This change fixes the register order s.t. the
expected instruction is generated.

Fixes #13593.

6 years agoFix `gtCloneExpr` for `GT_IND(GT_INDEX_ADDR)`.
Pat Gavlin [Wed, 30 Aug 2017 19:44:27 +0000 (12:44 -0700)]
Fix `gtCloneExpr` for `GT_IND(GT_INDEX_ADDR)`.

This function does not need to update the array info map when cloning
a `GT_IND` if the address is a `GT_INDEX_ADDR`.

6 years agoFix the GC info for `INDEX_ADDR` codegen.
Pat Gavlin [Wed, 30 Aug 2017 19:25:30 +0000 (12:25 -0700)]
Fix the GC info for `INDEX_ADDR` codegen.

`genConsumeReg` marks the consumed register as not a GC pointer, as it
assumes that the input register  dies at the first instruction
generated by the node. This is not the case for `INDEX_ADDR`, however,
as the base register is multiply-used. As such, we need to mark the base
regsiter as containing a GC pointer until we are finished generating the
code for this node.

Fixes

6 years agoRevert commit bec6ac10f3968a8f699aad6233657ac59df37a73.
Pat Gavlin [Wed, 30 Aug 2017 19:41:25 +0000 (12:41 -0700)]
Revert commit bec6ac10f3968a8f699aad6233657ac59df37a73.

This restores the `GT_INDEX_ADDR` changes.

6 years agoRemove EOL openSuSE 42.1 (#13693)
Matt Mitchell [Wed, 30 Aug 2017 18:48:52 +0000 (11:48 -0700)]
Remove EOL openSuSE 42.1 (#13693)

6 years agoChange FinalizerThreadCreate location to after profiler is initialized (#13663)
Sung Yoon Whang [Wed, 30 Aug 2017 17:45:52 +0000 (10:45 -0700)]
Change FinalizerThreadCreate location to after profiler is initialized (#13663)

* Change FinalizerThreadCreate location to after profiler is initialized to ensure finalizer creation notification to profilerAPI

* Fixes issue #13499

6 years agoSupport checking for HFA types in altjit
Carol Eidt [Wed, 2 Aug 2017 22:10:50 +0000 (15:10 -0700)]
Support checking for HFA types in altjit

When using an HFA altjit with a non-HFA coreclr, `FEATURE_HFA` will not
be defined in the runtime. In this case, instead of caching the information
on the `MethodTable`, it will be recomputed for every call to query for
an HFA type or to get the base element type.

In order to do this, the functionality must be available on a built class,
so implement these methods on `EEClass` instead of `MethodTableBuilder`
(which was already using `GetHalfBakedClass()` to access some of the
`EEClass` functionality).

Fix #13092

6 years agoRevert #13647 and #13638 (#13666)
Daniel Podder [Wed, 30 Aug 2017 16:56:09 +0000 (11:56 -0500)]
Revert #13647 and #13638 (#13666)

#13638 and #13647 attempted to replace the generic 'dotnet-bot' e-mail
address with PR authors' e-mail addresses when uploading perf data to
BenchView. Unfortunately, these changes are still broken for some users
(specifically, if a user's e-mail address is not published/visible on
their GitHub profile).

There is no clean way to implement the proper fix, and the right fix
will change once pipeline support is available. Rather than putting in
something hacky now, I'm reverting these changes to unblock PRs. We
should revisit these changes after pipeline jobs are available.

6 years agoAssert that Nullcheck child is not contained
Carol Eidt [Wed, 30 Aug 2017 16:03:18 +0000 (09:03 -0700)]
Assert that Nullcheck child is not contained

TreeNodeInfoInit doesn't call `TreeNodeInfoInitIndir on `GT_NULLCHECK`, though it does an indirection, because we never create an LEA for these. Assert that the child is not contained.

6 years agoJIT: allow nulls in gtCanOptimizeTypeEquality (#13680)
Andy Ayers [Wed, 30 Aug 2017 16:01:51 +0000 (09:01 -0700)]
JIT: allow nulls in gtCanOptimizeTypeEquality (#13680)

This is a follow-on to #13657. I looked at the remaining calls to
`Type::op_Equality` in the jit-diffs output and saw many of the calls had a
null pointer argument. This pattern comes about from explicit null checks in
the sources, often as part of argument validation.

Such calls can also be optimized into simple pointer equality checks, so
add another clause to `gtCanOptimizeTypeEquality` to look for nulls.

6 years agoFormatting
Bruce Forstall [Wed, 30 Aug 2017 16:01:26 +0000 (09:01 -0700)]
Formatting

6 years agoMerge pull request #13677 from hseok-oh/ryujit/fix_13675
Carol Eidt [Wed, 30 Aug 2017 15:09:44 +0000 (08:09 -0700)]
Merge pull request #13677 from hseok-oh/ryujit/fix_13675

[RyuJIT/ARMARCH] TreeNodeInfoInit for GT_NULLCHECK

6 years agoJIT: Fix calculation of opcodeOffsets in Compiler::impImportBlockCode
Konstantin Baladurin [Thu, 6 Jul 2017 11:21:42 +0000 (14:21 +0300)]
JIT: Fix calculation of opcodeOffsets in Compiler::impImportBlockCode

6 years agoRevert "Merge pull request #13245 from pgavlin/NoExpandIndex" (#13682)
Jan Kotas [Wed, 30 Aug 2017 13:35:44 +0000 (06:35 -0700)]
Revert "Merge pull request #13245 from pgavlin/NoExpandIndex" (#13682)

This reverts commit a7ffdeca6fed927dbd457293d97b07237db95e82, reversing
changes made to f5f622db2a00d7687f256c0d1cdda5e6f6da7ad4.