2025年10月にGKEのReleaseNoteに流れてきた情報から、新機能と変更内容、stableチャンネルに影響のありそうな不具合情報のみをまとめて紹介します。
10月は利便性が改善されるリリースが多数ありました。中でもノードがドレインされるまでの時間が伸びたことや、クラスター作成時にしか設定できなかったネットワーク関連の設定が変更できるようになったことはとても嬉しいですね。また、いくつか不具合も告知されているため確認が必要です。
新機能
10/28
Autoscaled blue-green upgradesがプレビューとして利用可能になりました
Autoscaled blue-green upgradesは障害許容度の低いワークロードが強制終了されるまでの稼働時間を最大化しつつ、コストを最小化する新しいノードアップグレード戦略です。
この戦略は標準的なblue-green upgradesから派生しています。ただしAutoscaled blue-green upgradesではGKEはノードが隔離されてから最大7日間、強制終了が安全でないとマークされたワークロードを実行するノードのドレインを実行しません。
詳細やベストプラクティスは以下のドキュメントを参照してください。
NVIDIA RTX PRO 6000 GPUを搭載したG4 VMがバージョン1.34.1-gke.1829001以降のGKE Autopilotで利用可能になりました
10/21
NVIDIA RTX PRO 6000 Blackwell Server Edition GPUとAMD EPYC Turin CPUプラットフォームを搭載したG4 VMがGAになりました
10/9
クラスタの作成または更新時、LoadBalancerサービスの更新時にネットワーク ティアをStandard TierまたはPremium Tierのいずれかから選択できるようになりました
GKE 1.33.4-gke.1055000以降で利用可能です。
automatic IP address management (auto IPAM)を有効にできるようになりました
GKE 1.33以降で利用可能です。
auto IPAM はクラスタのスケールアップ/ダウン時にノードおよびポッド用の追加 IP アドレス範囲を動的に追加または削除します。この機能により、大規模で無駄になり得る事前IP予約やクラスタスケーリング時の手動介入が不要になります。
VPCネイティブクラスタに追加のサブネットを割り当てることができるようになりました
GKE 1.30.3-gke.1211000以降で利用可能です。
クラスタに割り当てられた追加のサブネットにより、ノードとポッドの両方のIPv4アドレスが追加のサブネット範囲から取得された新しいノードプールが作成できます。この機能強化により、単一サブネットの制限が解消され、スケーラビリティが向上し、GKEクラスタの柔軟性が向上します。
GKEクラスタにデプロイされたAIモデルについてGoogle Cloudコンソールでデプロイに関する詳細を確認できるようになりました
ページにはデプロイの詳細、ログ、および可観測性ダッシュボードが含まれています。
10/7
gke-l7-regional-external-managed-mc GatewayClassが使用する一時的なIPアドレスのネットワーク階層(StandardまたはPremium)を指定できるようになりました
GKE 1.33.2-gke.1240000以降が対象です。
10/1
GKE cluster autoscalerでノードのドレイン時間が大幅に延長されました
GKE 1.32.7-gke.1079000以降ではノードのグレースフルドレインタイムアウトが10分から1時間に延長されています。
Vertical Pod Autoscaler(VPA)のInPlaceOrRecreateモードがプレビューとして利用可能になりました
このモードではインプレースポッドリサイズ(IPPR/IPPU)を採用しており、ポッドの再作成を必要とせずにVPAがワークロードリソースを自動調整します。このシームレスな適正化機能により、特にアイドル期間中のリソース割り当てを最適化し、サービス継続性の向上とコスト削減を実現します。
VPAはAutopilotクラスタではデフォルトで有効化されています。StandardクラスタではまずVPAを有効化する必要があります。
不具合、修正
10/17
a3-highgpu-8gマシンタイプでノードプールを作成またはアップグレードする際、GKE 1.34.1-gke.1431000以降を使用しないでください
これらのバージョンのGKEノードにはCOS Milestone 125が含まれており、更新されたLinuxカーネルバージョンがGPUDirect-TCPXと互換性がありません。
10/14
GKE 1.32.4-gke.1029000以降でネットワークファイルシステム (NFS) ボリュームに対するMountVolume呼び出しが以下のエラーで失敗する可能性があります
mount.nfs:rpc.statd is not running but is required for remote locking
これはNFSボリュームをマウントするPodがNFSサーバーPodと同じノード上で実行され、クライアントPodがボリュームのマウントを試みる前にNFSサーバーPodが起動した場合に発生する可能性があります。このシナリオではrpcbindサービスに対する競合が発生し、クライアントPodのノード上でサービスが正常に起動できなくなり、マウントの失敗につながります。
回避策として、NFSボリュームをマウントする全ノードにこのDaemonSetをデプロイしてください。DaemonSetは必要なサービスが正しく起動することを保証します。
先月までの新機能と不具合情報
先月までの内容は以下のリンク先で確認できます。