GCP上にPyTorchが入ったGPUインスタンスを立ち上げる

タイトルの通り、GCP上にPyTorchが入ったGPUインスタンスを立ち上げたので手順を残しておきます。

GCPはいきなりGPUインスタンスの作成はできず、GoogleさんにGPUの上限を増やす必要があります。

メニュー「IAMと管理」＞「割り当て」を辿り、以下の2つの上限を増やす申請をします。

ネット上には申請が通らない方も多いようですが、1回目で申請が通らなかったとしても2回目で通ったケースもありますし、申請するGPUの上限を少なくすると通ったケースもあるようです。

早ければ1時間ほどで上限が増えます。

インスタンス作成にはTerraformを使います。そしてこちらのリポジトリを使います。

まずはCloud Shellを起動します。

Cloud ShellにはTerraformが既にインストールされており、助かります。

Cloud Shellが起動したら、以下のコマンドを実行します。

$ git clone https://github.com/bassbone/gcp-instance-gpu.git
$ cd gcp-instance-gpu

variables.tfで以下の項目が調整できるので、必要に応じて修正してください。

variables.tfの調整が終わったら、さらに以下のコマンドを実行します。

$ terraform init
$ terraform plan
$ terraform apply

最後のapplyコマンドが終わっても、諸々の処理があるため数分程度待つ必要があります。

数分待って、sshログインできればインスタンス作成完了です。

GCP提供のGPU対応イメージにはJupyterLabというツールがインストールされています。

接続方法については、こちらの公式マニュアルに記載されているが、gcloudコマンドが使える環境で、以下コマンドを実行します。

$ gcloud compute ssh --project [プロジェクトID] --zone [ゾーン] [インスタンス名] -- -L 8080:localhost:8080

その後、http://localhost:8080に接続すると、JupyterLabにアクセスできます。

GCP提供のイメージを使っているので自分好みの環境ではないが、とにかくGCPでGPUインスタンスを立ち上げたい場合には使える手順ではないかと思います！

1点だけ注意点としては、GPUインスタンスは割高なので使うタイミングだけ起動させることをお奨めします。