【元記事をASCII.jpで読む】

 クラウド運用に携わる技術者のためのイベントCloud Operator Days Tokyo(CODT) 2025が、2025年7月15日からハイブリッド形式で開催される。

 IT運用担当者に光を当てる本イベントも、今回で6回目を迎えた。今年のテーマは「創る運用、遺す運用」だ。クラウドネイティブやAIといった最新技術による「攻めの運用(=創る)」が進化する中で、安定性や安全性が求められる運用という特性上、変えてはいけない「守る運用(=遺す)」にも注目すべき、という意味が込められている。

 先行開催されたイベントでは、昨年のCODT 2024で表彰された3名が登壇。受賞後の反響や進捗を披露すると共に、「生成AI時代に運用者の価値をどう高めていくか?」がディスカッションされた。

50以上のセッションを展開し、アワード表彰も

 CODT 2025の実行委員長を務める長谷川章博氏(AXLBIT)は、「運用を担当するエンジニアは、日の目を浴びる機会が少ない一方で、システムが落ちると責められ、正常に維持してもほめてもらえない」と語る。こうした運用担当者の底力を高め、価値を上げることが、本イベントの趣旨となっている。

 CODT 2025は、7月15日から始まるオンラインイベント(オンデマンド配信)と、9月5日にオフラインで開催されるクロージングイベントの2部構成となっている。「技術者の地位向上」「知的好奇心を高める」「若手エンジニアの育成」を3本柱としており、運用者たちが現場で取り組んだ挑戦や得られたノウハウを共有し合う。単に技術セッションを展開するだけではなく、優秀な運用者を選考・審査して「輝け! クラウドオペレーターアワード」として表彰する。

 アワードは今回も「2段階公開方式」を採用している。まず、オンデマンド配信される50以上のセッションから、視聴数や運営委員会の評価で約半数に絞り込まれ、それがクロージングイベントで披露される。そこから6つの賞が選ばれる仕組みだ。

 セッションのテーマは、「運用苦労話」「運用自動化」「監視・ログ・オブザーバビリティ」「OpenStack」「チーム作り/人材育成」「パブリッククラウド運用」「AIOps」「クラウドセキュリティ」の8つ。特に、今年はOpenStackが15周年を迎え、このイベント自体もOpenStackのユーザーコミュニティを母体としてスタートした経緯もあるため、OpenStackのセッションには注目だ。

昨年のアワード受賞者に聞く、その後の反響や進捗は?

 ここからは、CODT 2024で「輝け! クラウドオペレーターアワード」を受賞した3名から、受賞セッションのおさらいとその後の反響や進捗が語られた。

 まず、登壇したのは、満場一致で「最優秀オペレーター賞」に選出された、日鉄ソリューションズの田村大樹氏だ。顧客である金融機関のシステムにおける、「OSのスケジューラーで発生するレイテンシ(遅延)を観測する」セッションで受賞している。

 田村氏は、「ミリ秒単位の厳しいレイテンシ目標がある中で、アプリケーションでは限界があり、Linuxカーネルの中(ソースコード)を見る必要があった。ツールを動かせば終わり、という穏やかな話ではなかった」と振り返る。観測のために、Linuxカーネル内で動的かつ軽量にプログラムを動かせる「eBPF」をベースとした計測ツールを改良したという。

 試行錯誤の上、負荷試験でもアプリに影響がないことを確認して、本番環境で計測ツールを実行。「カーネルに手を加えるということでかなり緊張したが、意外とあっけなく終わった。一方、一部は仮説通りであったが、きれいな相関関係が見えるほどでもなく、得られたデータの分析方法を確立していくのが今後の課題」(田村氏)

 受賞後の反響としては、社内での田村氏のプレゼンスが向上したこと、同じタイミングでリリースした新サービスの露出にも寄与したことが挙げられた。

 審査員特別賞(挑戦編)を受賞したのは、ダイキン工業の角田潤也氏による、「AWS上のシステムが社内ルールに準拠しているかを自動チェックする仕組みを作り上げた」セッションだ。

 取り組みのきっかけは、クラウド活用の急増によって、既存のセキュリティ基準との間にギャップが生じ、抽象度が高すぎて若手の担当者が理解しづらくなっていたことだという。角田氏所属のR&D部門と本社の有識者によって、より詳細で“腹落ち”ができ、AWSネイティブな新基準を作成した。

 新基準の作成により、チェックリストの質は上がったが、手動チェックに時間を要するため、「リリース前にしかレビューされない」という新たな課題も生まれた。そこで、「CloudFormation Guard」のポリシーをカスタマイズし、インフラ周りの設定が社内基準を満たしているか自動チェックする仕組みを作り上げたという。

 受賞後には、開発者が自動チェックを利用するためのダッシュボードを作成。さらに、ハンズオンや社内コミュニティなどで、粘り強く利用を促しているという。実際に、IPアドレス制限ミスによるインシデントを防ぐという成果も得られている。角田氏は、「CODTで受賞したことで、社内の注目度も高まった」と語った。

 審査員特別賞(変革編)を受賞したのは、ジェーシービー(JCB)の平松淳也氏による、「2桁を超えるクレジット関連サービスが稼働する、GKEのアップグレードプロセス最適化」についてのセッションだ。

 同社がGoogle Cloud上に展開するGKEベースのプラットフォームでは、事業規模の拡大に伴い、アップグレード時の調整や作業量の負担が課題になっていた。それに対して、「GKEのリリースサイクルにあわせたこまめなアップグレード」「Cloud Workflowsなどを活用した実作業の自動化」「責任範囲の明確化によるチーム間の調整コストの削減」といった対応策で最適化を図った。

 受賞後も継続して運用中であり、GKEの利用規模はさらに拡大したものの、基本工数を大幅削減した状態を維持している。生成AIエージェントで、アップデート前後の本質的変更を抽出・要約する機能も開発した。平松氏は、「この機能を含めて、JCBではCODT 2025で2つのセッションを披露する。ぜひ聴講してほしい」と呼びかけた。

遺したいのは、運用を継続する上で重要な“ドキュメント

 受賞者によるプレゼンの後には、パネルディスカッションも行われた。ひとつ目の話題は、今年のCODTのテーマでもある「運用の現場で“創った”もの」だ。

 日鉄ソリューションの田村氏は、Service Meshを用いずにカナリアリリース(段階的にユーザーに展開するリリース手法)を実装した話に触れ、「リリースのハードルが低くなった」と説明した。

 JCBの平松氏は、セッションで紹介したGKEベースのプラットフォームが、「既存の枠にとらわれず、クラウドベースで構築したプロジェクトであり、すべてをゼロから構築した」と、大きな挑戦になったことを振り返った。

 ダイキン工業の角田氏も、セッションで披露した自動チェックの仕組みについて、「製造業の工場ではフェイルセーフがうたわれる一方で、ITにおいては進んでいなかった」と説明。システム管理側でフロントエンドのアプリを作る機会がなかった中で、ダッシュボードまで開発したのは、いろいろな学びが得られたと述べた。

 2つ目は、同じく今年のテーマから「どんな運用を“遺そう”としているか?」だ。

 角田氏は、今はR&D部門で活用している自動チェックのダッシュボードを、他部門にも広げるためには、作った意図などが伝わるドキュメントを残す必要があると回答。平松氏も同意し、「せっかく作った運用を続けていくためには、ドキュメントが必要。どういった事情で作られたかを記録しなければならない」とコメントした。

 田村氏が重要だとしたのは、SREの考え方だ。「特にポイントとなるのは『標準化』と『自動化』。標準化は、人の入れ替わりや育成の視点で同時に推進していくべきであり、自動化では、保守のしやすいコードを残していくことが大切になる」と語った。

生成AI時代に、運用者の価値を高める鍵は「人の意思」

 最後のテーマは、イベント自体の目的でもある「運用者の価値をどう高めていくか?」だ。

 田村氏は、「運用には“定型的な作業なので、AIに取って代わられそう”というイメージがあるが、結局、最終的な説明責任や判断は人が負う」と述べる。「AIができることが増えても、継続的に学ぶ“知的好奇心”を失わないことが求められる」と強調した。

 平松氏は、「オンプレミスからクラウド、そして生成AIと、IT技術の進化が早い中で、運用者にしても開発者にしても、それぞれの時代に適応できる人が活躍できる」と語った。

 角田氏は、「AIには“運用の価値”を広げることはできない」としたうえで、「生成AIは、上層部や新人などに、相手に刺さるように説明するのは難しい。そのコミュニケーションが運用者の価値を高める」とコメントした。

 最後に実行委員長である長谷川氏は、「3人に共通するのは、“人間の意思”が大切だということ。『こうしていきたい』という気持ちが何よりも重要になる。このイベントを通じて、そういう想いを持った人の輪を広げていきたい」と締めくくった。

今年も「Cloud Operator Days Tokyo」開催 IT運用者が生成AI時代を生き残るには?