[clang][Lexer] Speed up HeaderSearch when there are many HeaderMaps
authorTroy Johnson <troyj@meta.com>
Tue, 18 Oct 2022 15:03:10 +0000 (08:03 -0700)
committerTroy Johnson <troyj@meta.com>
Tue, 18 Oct 2022 15:21:14 +0000 (08:21 -0700)
commit10c0eca25523e3bf1872522bde4693aaa55513e0
tree2e9056aad9406fe33448befab80a337007f6fd78
parenta8e9742bd44daa4632b07ccc37a6da8236781fa6
[clang][Lexer] Speed up HeaderSearch when there are many HeaderMaps

HeaderSearch already uses a caching system to avoid duplicate searches,
but the initial cold miss can take a long time if a build system has
supplied thousands of HeaderMaps. For this case, the SearchDirs vector
begins with those HeaderMaps, so a cache miss requires testing if the
sought filename is present in each of those maps. Instead, we can
consolidate the keys of those HeaderMaps into one StringMap and then
each cache miss can skip directly to the correct HeaderMap or continue
its search beyond the initial sequence of HeaderMaps. In testing on TUs
with ~15000 SearchDirs where the initial 99% are HeaderMaps, time spent
in Clang was reduced by 15%. This patch is expected to be neutral for
SearchDir vectors that do not begin with HeaderMaps.

Differential Revision: https://reviews.llvm.org/D135801
clang/include/clang/Lex/HeaderMap.h
clang/include/clang/Lex/HeaderSearch.h
clang/lib/Lex/HeaderSearch.cpp