インフラの品質が悪ければ「砂上の楼閣」になる
システムの安定運用が求められる運用チームは、時に失敗を恐れて旧来の運用を踏襲しがちだ。その中でも今回参加した各社は、自社のサービス提供価値を高めるために試行錯誤しながら運用品質の向上や効率化に取り組んでいる。
桔梗原 システム運用について、みなさんの組織はどのような課題を感じ、どんな対策をされていますか。また運用の価値を経営に認めてもらうため、何をされていますか。
大川 豊田通商のIT企業である豊通シスコムは、豊田通商グループを中心にシステムの構築・運用を提供しています。豊田通商は昨年度にオンプレミスのシステムを100%クラウド化しました。それに伴い従来型の運用を担うチーム・ベンダーとクラウド型の運用チームの両立が難しくなりました。社内メンバーのスキルチェンジは時間がかかるため、新たに外から人を入れることが多いのが実態です。今後の組織をどうモダン化するかが課題と考えています。
武田 第一三共では「革新的な医薬品の創出」「高品質な医薬品の安定供給」「高品質な医療情報の提供」などに取り組んでいます。その中で、どんなに優れたアプリケーションも、それを支えるインフラの品質が悪ければ「砂上の楼閣」になると伝えながら、理解を得るようにしています。
運用に関しては、長らく日立にアウトソースをしてきた歴史があります。しかしながら、我々のニーズの変化がなかなか伝わらないと感じています。このため、パートナーと協業しながらも、運用品質の向上や効率化に取り組むために、社内のメンバーがどこまで運用に踏み込み、何を押さえるべきなのか、再考する必要があると感じています。
野末 静銀ITソリューションは、しずおかフィナンシャルグループ(SFG)傘下の静岡銀行のIT子会社として、主にSFGのシステム開発および運用・保守・管理を行うとともに、一般企業向けサービスとしてIT化支援にも取り組んでいます。
私自身は2024年7月から運用部門を見るようになりました。新サービスの提供とシステム運用・保守をしていくにあたり開発と運用は両輪との認識であり24時間365日システムを安定稼働させていくために運用担当も極めて重要な責務を担っています。このため、運用担当者自らが運用作業の品質の高度化に向けて果敢に取り組める環境を整備し、『強い運用』へ変革できるように舵を取りたいと思っています。
近藤 オリックス・システムは、オリックスグループに対し情報システムサービスを提供しています。私は2年ほど前から運用部門を担当していますが、運用業務については、人力・手作業に依存しているところも多く感じています。例えばシステムの稼働状況を確認する死活監視業務や定例業務の自動化など、生産性や労働環境・品質の向上に向けた取り組みを推進していく必要性を感じています。
小糸 私はエヌ・ティ・ティエムイーのサーバーインフラ、テナントの運用企画などを行っています。当社はネットワーク保守の経験は多くあるのですが、サーバーやアプリケーションは技術が多岐に渡るため、社員の技術育成のために必要な技術要素の体系化や優先順位をつけることが課題と考えています。今までと同じことをやっていても経営には運用の価値が伝わらないので、ビジネス価値を高めるためのDXやAIに取り組むことに加え、その成果を社外へ発信し認知してもらうことで会社の評価を上げることが必要ではないかと感じています。従来通りの地道な取り組みは必要ですが、運用の価値を上げるために新しいことにも挑戦していきます。
山本 中央コンピュータシステムは、JA共済連グループのIT企業で、システム運用については当社が担っています。運用改善の課題認識はあるものの、運用部門単独での企画化に難しさを感じていました。特に投資効果を追求しすぎると、貴重な運用部門の人員を手放すことにもつながるため、どのように効果を訴求するかがポイントでした。そこで、複数システムを対象とした大規模プロジェクトの中で、システム運用の標準化・効率化に取り組み、運用改善につなげたいと考えています。
人材不足も課題です。今はIT人材は引く手あまたで入れ替わりも多く、少数精鋭でやっていかないといけない。この傾向は今後変わることがないと感じています。待遇だけでなく、どう魅力ある仕事にしていくかを考えています。
HARCが導く運用の未来、トヨタ自動車と第一フロンティア生命保険の挑戦
各社さまざまな現状、課題認識が見えてきた。そんな中、第一フロンティア生命保険の金森氏とトヨタ自動車の藤原氏は、自身が担当するプロジェクトの中で日立製作所のHitachi Application Reliability Centers(HARC)とともにSREに取り組み始めているという。効果は表れているのだろうか。
藤原 トヨタ自動車で、車両データを集めてクラウドに蓄積する基盤の開発・運用を担当しています。データ量が膨大なので、運用の責務として安定稼働に加え、コスト削減という命題もあります。同時に品質の担保にも継続的に取り組んでいます。
これまでもDevOpsに取り組んできましたが、自分たちだけでは見えない課題を洗い出すため、日立のHARCを採用しました。2025年1月からDevOpsチームの中に日立のSREチームに入ってもらい、SREの導入を進めています。これまで品質向上に充てていた予算の一部をSREに振り分けることで、トータル予算に変更はない形で実現しています。
金森 第一フロンティア生命保険はクラウドリフトを済ませ、現在クラウドシフト・クラウドネイティブに取り組んでいます。運用はサービスが動いて当たり前で、止まると減点されるので後ろ向きになりがちです。
そこでレベルアップするために、2024年7月から日立のHARC支援のもと、SREに取り組み始めました。運用チームを中心に、HARCの体系立った評価観点を現状の課題と照らし合わせ優先施策に取り組むことで、明るい将来への期待感を醸成しモチベーションを上げようとしています。
藤原 これまで自分たちなりにDevOpsチームで品質向上やコスト削減の改善活動を行ってきましたが、アセスメントされてみると気づいてなかった部分や足りない部分も見えてきました。メンバーからは「HARCチームはよく考えて動いてくれて、いい立ち上がりができている」という声が上がっています。改善活動をリードするメンバーがチーム内にいてくれることで、積極的に取り組みを進めているのではないかと感じています。
「サーバーは落ちてもいい」というマインドチェンジ
SREへの取り組みを通じて、運用チームのマインドに少しずつ、変化も見られたという。前向きな意見が出るようになり、組織が活性化。運用の存在感を会社全体で高める活動と両面で取り組むことがポイントになる。
金森 HARCチームがリードしてくれるというのは、まさに同感です。オンプレミスの運用ではサーバーに問題が起きないようディスク容量やプロセスなど、従来よくある各リソースの監視をしておりましたが、HARCチームと一緒に活動する中で、万一サーバーが落ちたとしてもサービス提供ができていれば良いという考え方に触れ、マインドチェンジが進みつつあります。
野末 従前のやり方を変えるにあたっては、運用担当者自身が新しいことにチャレンジしていくという強い意志と併せ、適切な舵取りがあることでメンバーも意識高く取り組むことができると考えます。伴走型で運用改善を進めるHARCの支援を受けてみたいですね。HARCを採用されている会社のメンバーはどのように変わられましたか。
金森 常に緊張と隣り合わせにいる運用チームが、「サーバーが落ちてもいい」発想に触れることで、前向きな意見が出るようになってきました。また、これまでと同様にオペレーターを必要とする業務は残るため、全員が変わる必要はないと思いますが、新しい取り組みでは運用の立ち位置を変えられないかを検討しています。どのようなシステムを構築すれば品質の高い運用ができるのかイメージを持ちながら、開発を進めるという考え方です。ここでは運用側のデザインがまず先に必要になることから、運用側に技術力があるメンバーが必要になります。このような考え方を通して、運用メンバーのやりがいの創出や存在感を高める活動にも取り組んでいます。
大川 運用の存在感を高めるという意味では、開発者に寄り添ってエンゲージメントを高めるためのツールとして、トヨタ自動車のクラウドプラットフォーム「TORO(TOyota Reliable Observatory/Orchestration)」を、豊田通商に横展開する取り組みを「LUNA」と名付け展開を行っています。LUNAは一定のセキュリティを担保し、できるだけ広いガードレールで守りながらも、開発者が素早く使いたいツールを利用できる環境を提供します。
武田 当社ではクラウドの活用を進めたい一方、制約が多く使いづらいという課題があるため、とても参考になります。
運用チームの未来を支える人材育成アプローチ
運用チームの強化においては、人材育成が重要になる。ローテーションで開発・運用の両方を経験させるなど、人事異動にも工夫の余地は大きい。研修や勉強会の実施、課題を与えるなど、さまざまな方法で人材育成を進める。
桔梗原 人材育成の課題はいかがでしょう。どんなことに取り組まれていますか。
山本 成長の機会を得られるような、教育システムの充実に取り組んでいます。最近は一定レベル以上のスキルを持つ人に、得意分野について若手に対して研修を行ってもらう仕組みを作りました。グループ内で勉強会も開催しています。
近藤 従来は一度配属されると異動が少なく、スキルや経験が偏りがちでした。例えばアプリチームは新しいプロジェクトに取り組むことが多く、多様な経験を得る機会も多い傾向にありますが、安定運用を求められる運用チームは、定型業務の遂行や、担当するサーバー環境などの技術知識を深めることが求められるため、多様な経験を得ることは、アプリチームと比較すると、どうしても少なくなります。そこで新卒は開発で2年、運用で2年経験を積むというローテーション制度を社内に設けました。両部門を経験することでお互いの事情や考え方の違いが分かり、経験を得る場面も広がることから、徐々に効果を感じています。例えば運用チームに異動してきたアプリチーム経験者から業務の改善提案などが出るようになりました。今後もこの取り組みを継続・改善しつつ、DevOpsなど組織や仕事の進め方を見直していきたいと考えています。
小糸 当社内ではサーバーの運用は社員教育に時間がかかることから少数精鋭となっております。目の前の保守に手一杯になるケースもあり、運用担当者は手順書をなぞるだけになりがちです。そのため、「手動作業を自動化する」といった課題を与えており、作業だけでなく技術面の広がりや業務を変えていくという姿勢を学ばせるようにしています。
武田 当社のIT人材は上流工程のメンバーが多く、現在のアーキテクチャー・仕様や運用への理解が十分ではありませんでした。それではどんなに良い提案をしても、個別最適に陥る可能性があります。そこで、現状に対する理解の深化に取り組んでいます。
運用におけるAI活用の可能性
AI・生成AIを運用へいかに活用できるか、一部では検討を始めている。ただ現状、大きな変革を起こすには至っていない。得意不得意を理解しながら、うまく付き合っていく必要がありそうだ。
桔梗原 最後に、今注目を集めているAI・生成AIについて、どのように運用に生かしたいとお考えですか。
大川 RAG(検索拡張生成)の活用や、監視の通知を人が分かるように翻訳するといったことも試しましたが、まだ画期的な取り組みができているとは言い難い。今は少し様子を見ている状態です。
小糸 当社も取り組んでいますが、RAGに入れるためのドキュメントの整形、過去事例をAIが読めるように書くといった学習のための準備が大変です。
野末 AIを活用してシステムが日々発報するメッセージの自動選別や一定の自動オペレーションなどができたら、夜間の電話連絡の削減により運用担当だけでなく開発担当もメリットを享受できると思います。また、静岡銀行でも生成AIの活用に取り組んでおり、その1つとして勘定系システムの追加開発に生成AIを活用する技術検証を行っています。
佐藤 私は「優秀なド新人」と思って、AIと付き合っています。言った通りにやってくれますが、作業指示を間違えるとポンコツな答えしか出てきません。特に監視のAI活用は難しく、トライはしていますが、実用化には至っていません。