Revert "ci: Switch over to an autoscaling GKE cluster for builds."
authorEric Anholt <eric@anholt.net>
Wed, 6 Nov 2019 19:14:14 +0000 (11:14 -0800)
committerEric Anholt <eric@anholt.net>
Wed, 6 Nov 2019 19:38:07 +0000 (11:38 -0800)
commitcb655d255466cb2f326ebb8546f37434b5bdb16d
tree680518939bf0ab4d7837700afab6ceb7b6274a04
parent94e6d17043e2dab2fb0375cf09c26cf5f35b2d73
Revert "ci: Switch over to an autoscaling GKE cluster for builds."

This reverts commit c9df92bf795af878c38538c85f781291c78ec513.

It turns out that gitlab-runner uses kubernetes all wrong, spawning Pods
and sshing into them to run the script instead of Jobs containing the
script to run.  This means that when anything goes wrong with the pod
(autoscale, preemption, VM maintenance, cluster reconfiguration), the job
fails and only sometimes gets handled as a runner system failure.  Even
worse, due to bugs in either the runner or k8s itself, some classes of
timeout-related failure end up not being reported as failures, and the job
will incorrectly report success!

Disable using the "autoscale" cluster until we can do something else
(docker-machine instead of k8s, or the custom third-party k8s-native
runner).

Reviewed-by: Michel Dänzer <mdaenzer@redhat.com>
Acked-by: Daniel Stone <daniels@collabora.com>
.gitlab-ci.yml
.gitlab-ci/lava-gitlab-ci.yml
.gitlab-ci/meson-build.sh
.gitlab-ci/run-shader-db.sh