review.tizen.org Git - platform/upstream/dotnet/runtime.git/commit

projects / platform / upstream / dotnet / runtime.git / commit

author	Peter Sollich <petersol@microsoft.com>
	Thu, 13 Aug 2020 10:09:49 +0000 (12:09 +0200)
committer	GitHub <noreply@github.com>
	Thu, 13 Aug 2020 10:09:49 +0000 (12:09 +0200)
commit	2fd135f1b14bfc7ee0d715c37809f1fbdc41739f
tree	4faef5023c49dc99591334e827e92cbc7d18e470	tree \| snapshot
parent	3c29684ba59cb7999aab0223648e66eb3a3e079a	commit \| diff

Optimize vectorized sorting - reduce code size, improve speed for large heaps (#40613)

* Improved vectorized sort - smaller bitonic sorters, dynamic packing/unpacking.

There are two optimizations in this PR:

- reduction of code size in the bitonic sorters: by limiting the amount of inlining in this code, we can reduce overall code size in coreclr.dll by about 180 kB.

- dynamic packing: during sorting, we can switch to 32-bit sorting as soon as the address range in a partition is less 32 GB. This will only have an impact on large heaps or machines with many processors, because we already have a similar, but static optimization where we use 32-bit sorting if the overall address range in the ephemeral region is less than 32 GB. So this additional optimization will give improvements if the overall address range is greater than 32 GB initially, but becomes less during the sort. In this case, we get about a 1.6x improvement in sorting speed.

30 files changed:

src/coreclr/src/gc/CMakeLists.txt		diff \| blob \| history
src/coreclr/src/gc/gc.cpp		diff \| blob \| history
src/coreclr/src/gc/sample/CMakeLists.txt		diff \| blob \| history
src/coreclr/src/gc/vxsort/alignment.h		diff \| blob \| history
src/coreclr/src/gc/vxsort/defs.h		diff \| blob \| history
src/coreclr/src/gc/vxsort/do_vxsort.h		diff \| blob \| history
src/coreclr/src/gc/vxsort/do_vxsort_avx2.cpp		diff \| blob \| history
src/coreclr/src/gc/vxsort/do_vxsort_avx512.cpp		diff \| blob \| history
src/coreclr/src/gc/vxsort/isa_detection.cpp		diff \| blob \| history
src/coreclr/src/gc/vxsort/machine_traits.avx2.cpp		diff \| blob \| history
src/coreclr/src/gc/vxsort/machine_traits.avx2.h		diff \| blob \| history
src/coreclr/src/gc/vxsort/machine_traits.avx512.h		diff \| blob \| history
src/coreclr/src/gc/vxsort/machine_traits.h		diff \| blob \| history
src/coreclr/src/gc/vxsort/packer.h		diff \| blob \| history
src/coreclr/src/gc/vxsort/smallsort/avx2_load_mask_tables.cpp	[new file with mode: 0644]	blob
src/coreclr/src/gc/vxsort/smallsort/bitonic_sort.AVX2.int32_t.generated.cpp		diff \| blob \| history
src/coreclr/src/gc/vxsort/smallsort/bitonic_sort.AVX2.int32_t.generated.h		diff \| blob \| history
src/coreclr/src/gc/vxsort/smallsort/bitonic_sort.AVX2.int64_t.generated.cpp		diff \| blob \| history
src/coreclr/src/gc/vxsort/smallsort/bitonic_sort.AVX2.int64_t.generated.h		diff \| blob \| history
src/coreclr/src/gc/vxsort/smallsort/bitonic_sort.AVX512.int32_t.generated.cpp		diff \| blob \| history
src/coreclr/src/gc/vxsort/smallsort/bitonic_sort.AVX512.int32_t.generated.h		diff \| blob \| history
src/coreclr/src/gc/vxsort/smallsort/bitonic_sort.AVX512.int64_t.generated.cpp		diff \| blob \| history
src/coreclr/src/gc/vxsort/smallsort/bitonic_sort.AVX512.int64_t.generated.h		diff \| blob \| history
src/coreclr/src/gc/vxsort/smallsort/bitonic_sort.h		diff \| blob \| history
src/coreclr/src/gc/vxsort/smallsort/codegen/avx2.py		diff \| blob \| history
src/coreclr/src/gc/vxsort/smallsort/codegen/avx512.py		diff \| blob \| history
src/coreclr/src/gc/vxsort/smallsort/codegen/bitonic_gen.py		diff \| blob \| history
src/coreclr/src/gc/vxsort/vxsort.h		diff \| blob \| history
src/coreclr/src/gc/vxsort/vxsort_targets_enable_avx512.h		diff \| blob \| history
src/coreclr/src/vm/CMakeLists.txt		diff \| blob \| history

Domain: Dotnet / Core;

RSS Atom