radv/ci: allow polaris10 to retry more times
authorMartin Roukala (né Peres) <martin.roukala@mupuf.org>
Tue, 31 May 2022 06:19:56 +0000 (09:19 +0300)
committerMarge Bot <emma+marge@anholt.net>
Wed, 1 Jun 2022 13:03:02 +0000 (13:03 +0000)
The Polaris10 in CI has been getting insta-hangs when starting dEQP.
Let's give it 5 attempts to get its act together, as it won't affect
the run time dramatically (max 5 minutes), but will provide more
reliable results for developers.

Tracking of hangs (and many other issues) is done through scrapping the
execution logs, processing them to find these issues, then pushing the
data to influxdb. This allows us to plot the failure rate over time,
and see if the situation is getting better or worse.

Signed-off-by: Martin Roukala (né Peres) <martin.roukala@mupuf.org>
Acked-by: Timur Kristóf <timur.kristof@gmail.com>
Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/16793>

src/amd/ci/gitlab-ci.yml

index b06e1b8..f84a778 100644 (file)
@@ -103,6 +103,7 @@ deqp-polaris10-valve:
   variables:
     GPU_VERSION: radv-polaris10-aco
     FDO_CI_CONCURRENT: 16
+    B2C_TIMEOUT_BOOT_RETRIES: 4
     # (2022-01) tsc=unstable was added in response to this message in kmsg,
     #    TSC found unstable after boot, most likely due to broken BIOS. Use 'tsc=unstable'.
     B2C_KERNEL_CMDLINE_EXTRAS: 'b2c.swap=16g tsc=unstable'