メインコンテンツまでスキップ

エージェンティック・オペレーティングモデルへの12ヶ月ロードマップ

図:エージェンティック・オペレーティングモデルへの12ヶ月ロードマップ

90日間のパイロットを完了したばかりの状況を想像してみてください。1つのエージェントが稼働し、結果は有望で、チームからは「いつスケールさせるのか?」という質問が上がり始めます。この質問は自然なものですが、しばしば落とし穴があります。多くの企業は、見栄えの良い1つのエージェントを構築できます。しかし、その成功を組織全体で信頼できるケイパビリティに変えられる企業は、はるかに少数です。

この時点では、問題はもはや、どのユースケースをデモできるか、どのモデルが最も魅力的か、ということではありません。問題は、より根本的な問いへと移行します。すなわち、企業はどのようにして、単一のパイロットから、公式で、測定可能で、様々な機能に拡張可能であり、かつ制御を失わない、新しい働き方へと移行するのか、ということです。

この問いに答えようとするのが、この12ヶ月ロードマップです。これは単にエージェントの数を増やす計画ではなく、4つの要素を並行して構築するための地図です。すなわち、信頼に足る価値の証明、再利用可能なプラットフォームとパターン、ガバナンスと運用の規律、そして労働力とサービスモデルの変革です。

なぜこれら4つを同時に進める必要があるのでしょうか。なぜなら、エージェンティックな変革はテクノロジープロジェクトではないからです。それは、企業が日々の業務を遂行する方法そのものを変えるものです。最大の価値は、AIを既存のプロセスに貼り付けることから生まれるのではなく、人間とエージェントがどのように協働するか、プラットフォームがそれをどのように支援するか、そしてリスクがどのように管理されるかを、再設計することから生まれます。したがって、このロードマップは、単なる実験のスケジュールではなく、新しいオペレーティングモデルへの道筋として読まれるべきです。

ここでは、これを4つの四半期に分けて説明します。すべての企業が同じリズムで動くわけではありませんが、この順序は健全な論理を維持するのに役立ちます。すなわち、価値を証明し、基盤を構築し、他の領域へ拡大し、そしてそれを企業のメカニズムの一部とする、という論理です。

第1四半期:単一領域での価値証明

第1四半期は、多くのユースケースを追い求める時期ではありません。焦点はむしろ狭く、すなわち、エージェントが単一の領域で実際の成果を改善できることを証明し、同時に、安全に学習するために十分な最小限のガバナンスを構築することです。

初期の領域は、規律を持って選択する必要があります。最も適しているのは通常、量が多く、例外も多く、プロセスオーナーが明確で、リスクを限定できる業務です。例えば、経理業務のクローズ支援、購買受付、カスタマーオペレーションのトリアージ、ITインシデントのトリアージ、あるいは限定された範囲でのサプライチェーン例外調整などです。

第1四半期の目標は、AIをローンチすることではありません。目標は、エージェントが測定可能な何かを改善できるという証拠を生み出すことです。

第1四半期末までに整えるべきこと

以下の5つは完了しているべきです。

第一に、実際のワークフローで使用されるパイロットエージェント。汎用的なチャットボットではなく、明確なスコープ、限定されたツールアクセス、そして明示的な人間によるレビューを持つエージェントです。例えば、証拠を収集し、決算プロセスのためのドラフトコメントを作成するエージェント、購買依頼を分類し適切なルートに振り分けるエージェント、あるいはITインシデントのログと推奨事項を収集するエージェントなどです。

第二に、パイロット開始前のベースラインメトリクス。企業は、サイクルタイム、修正率、バックログ、エスカレーション、その他関連するメトリクスに関するデータを持っている必要があります。ベースラインデータがなければ、パイロットの結果は単なる意見に過ぎなくなります。

第三に、エージェントカードのテンプレート。各エージェントは、運用オブジェクトとして扱われる必要があります。エージェントカードには、少なくとも、ビジネス上の目的、ユースケースの範囲、データソース、呼び出し可能なツール、ビジネスオーナー、テクニカルオーナー、リスクレベル、成功基準を記載します。これは管理的に見えますが、エージェントの数が増え始めると非常に重要になります。初期段階でテンプレートがなければ、各チームが異なる方法でエージェントを定義することになります。

第四に、初期のツールレジストリ。第1四半期に大規模なプラットフォームは必要ありませんが、企業は、エージェントが使用を許可されるツールとAPIを、明確なアクセス権と使用制限とともに記録し始める必要があります。これにより、エージェントがERP、CRM、ナレッジベースなどのシステムへの場当たり的な接続を通じて、制御不能に発展するのを防ぎます。

第五に、最低限のリスクレビュープロセス。大規模な委員会はまだ必要ありませんが、ビジネス、テクノロジー、セキュリティ、リスク管理が関与するシンプルなレビュープロセスが必要です。このプロセスでは、機密データ、自律性のレベル、承認のしきい値、監査証跡、そしてエージェントが失敗した場合のバックアップ計画を評価します。

成功の測定方法

これは最も頻繁に破られる規律です。第1四半期の成功は、プロンプトがどれだけ成功したか、どれだけ多くのステークホルダーが感銘を受けたか、あるいはどれだけ多くのユースケースが待機リストに追加されたかで測定されるものではありません。成功は、次のような質問で測定されます。選択したケースでサイクルタイムは改善されたか?エージェントの出力は、手作業の負荷を軽減するのに十分有用か?修正率は許容範囲内か?ユーザーは実際にそれを使用しているか?最低限の管理は機能しているか?

これらの答えが明確でなければ、企業は次のフェーズに進む準備ができていません。

受け入れるべきトレードオフ

第1四半期は、保守的であることを要求します。多くの組織は、エージェントにすぐに実行権限を与えたいと考えますが、それは通常、時期尚早です。ほとんどの企業にとって、第1四半期は、監視、ドラフト作成、または推奨のレベルで止めておくのが最善です。このパターンは、財務、購買、IT運用などの領域に適しており、完全な自動化よりも限定された自律性の方が健全です。基本プロセスがまだ混乱している、データが不安定である、またはポリシーが文書化されていない場合、第1四半期は、拡大する前にまず基盤を改善するという正しい決断で終わるかもしれません。

第2四半期:再利用可能なプラットフォームとパターンの構築

第1四半期が単一のユースケースに価値があることを証明したのであれば、第2四半期は、最も一般的な落とし穴を回避する時です。すなわち、2つ目、3つ目、4つ目のエージェントを、それぞれまったく異なる方法で構築してしまうことです。ここで、企業はパイロットから共通プラットフォームへと移行し始めます。

スケールの価値は、AI戦略、プラットフォーム、ビジネスが整合し始めたときに現れます。それがなければ、組織は、コストがかかり監査が困難なパイロットを単に蓄積しているだけになります。

構築すべきプラットフォームケイパビリティ

第2四半期にすべてが完璧である必要はありませんが、いくつかの共通ケイパビリティは具体化し始めている必要があります。

第一に、アイデンティティとアクセス制御。エージェントは、汎用的なクレデンシャルや人間から借りたアクセスを使用すべきではありません。企業は、エージェントのアイデンティティ、ロールベースのアクセス、およびポリシーに従ったツール呼び出しの制限を適用し始める必要があります。

第二に、オブザーバビリティ。エージェントが実行されるたびに、コンテキスト入力、呼び出されたツール、提供された結果、発生したエラー、そして人間がいつ介入したかが可視化される必要があります。オブザーバビリティがなければ、スケールは学習ではなく混乱を生み出します。

第三に、評価フレームワーク。優れたパイロットは、一度テストすれば十分というものではありません。第2四半期には、より体系的な評価、すなわち、過去のテストケース、境界シナリオ、ポリシー準拠チェック、出力品質の測定を構築し始める必要があります。

第四に、ポリシーと承認のレイヤー。企業は、ポリシーロジックをエージェントのプロンプトやコードから分離し始める必要があります。例えば、特定のしきい値を超える取引は承認必須、特定のデータにはアクセス不可、特定のアクションは低リスクレベルでのみ実行可能、などです。

第五に、デプロイメントパス。エージェントにもライフサイクル規律が必要です。プロンプト、ツールスキーマ、ポリシー、モデルへの変更は、適切なテストと承認なしに本番環境に直接投入されるべきではありません。

パイロットの構成要素を再利用可能なパターンへ

第2四半期は、初期の標準化フェーズです。チームは、パイロットのどの部分が再利用可能か、何をテンプレート化すべきか、何を禁止すべきかを問い始める必要があります。再利用可能なパターンの例としては、エージェントカードテンプレート、人間による承認ワークフローパターン、証拠パッケージの構造、ERPやCRMシステム向けのツールラッパーの設計、分類やドラフト作成のための評価、標準的なオブザーバビリティダッシュボードなどがあります。

これは、シェアードサービスチーム、グローバルサービスセンター、または企業プラットフォームチームにとって特に重要です。再利用可能なパターンがなければ、各領域が独自のミニプラットフォームを構築することになります。

正式なガバナンス委員会の設立

第2四半期には、ガバナンスはもはや非公式であってはなりません。企業は、以下の3つを管理するガバナンス委員会または同等のフォーラムを設立する必要があります。すなわち、ポートフォリオの優先順位付け(どのユースケースを進め、どのユースケースを延期し、どのユースケースを中止するか)、リスクレベルの設定(すべてのエージェントが同じように扱われるわけではないため)、そしてアイデンティティ、ログ記録、評価、承認、リリースに関する最低基準です。

この委員会は、理想的には、最高情報責任者、ビジネスオーナー、リスク/コンプライアンス/セキュリティ、アーキテクチャ、そして必要に応じて財務または内部監査を含む、クロスファンクショナルであるべきです。

第2四半期がまだ適切でない場合

第1四半期に十分な証拠が得られていない場合、第2四半期に大規模なプラットフォームプログラムを無理に推進すべきではありません。証明されたユースケースなしにプラットフォームを構築しても、採用を伴わない固定費を生み出すだけです。

第3四半期:複数領域への拡大とエージェントファクトリーの稼働開始

基本プラットフォームと再利用可能なパターンが形成され始めた後、第3四半期は、エージェンティックな作業をさらに2~3の領域に拡大する時期です。ただし、強調しておきますが、拡大とは、アイデアの蛇口を可能な限り開放することを意味しません。拡大とは、明確なビジネススポンサーと十分な運用準備が整った領域に対して、選択的に追加することを意味します。

妥当な組み合わせの例としては、経理業務のクローズから買掛金の例外処理へ、購買受付からベンダー問い合わせ業務へ、ITインシデントトリアージから変更準備へ、カスタマーオペレーションからクレームやサービスリクエストへ、サプライチェーン例外監視から調整ワークフローへ、などがあります。

ビジネススポンサーは現実的であるべき

追加される各領域には、目標とする成果、プロセス変更、トレードオフの決定、チームの採用について責任を持つ意思のあるスポンサーが必要です。積極的なビジネススポンサーがいなければ、拡大は再びテクノロジープロジェクトに逆戻りします。

エージェントファクトリーの稼働開始

第3四半期には、企業はエージェントファクトリーを稼働させ始めるべきです。文字通りの工場ではなく、エージェント構築をより工業的で管理されたものにするためのデリバリーモデルです。

その主要な構成要素は以下の通りです。プレイブック:ユースケースの選択、エージェントの設計、自律性レベルの決定、評価の準備、限定ローンチの実施に関する標準ガイド。また、リファレンスアーキテクチャ:エージェントがモデル、コンテキストレイヤー、ツールレイヤー、ポリシーエンジン、オブザーバビリティ、企業システムにどのように接続するかを説明するもの。さらに、出力品質、ツール障害、ポリシー準拠、セキュリティチェック、変更時の回帰テストのための再利用可能なテストスイート。そして、ビジネスオーナー、スーパーバイザー、エンジニア、リスクレビューア、運用リーダーが人間とエージェントのチームモデルで作業できるようにするためのトレーニングプログラム。

エージェントファクトリーは、制御不能なエージェントの拡散を防ぐために重要です。これがなければ、企業は多くのエージェントを持つことになりますが、標準、再利用、そして管理はほとんどありません。

人事と運用部門が役割、KPI、人員計画の変更を開始

第3四半期は、労働力の変更をこれ以上先延ばしにできなくなる時点でもあります。複数の領域が稼働し始めると、人事と運用部門は、職務記述書、スキル要件、スーパーバイザーのKPI、キャパシティモデル、人員計画を更新し始める必要があります。

変更の例としては、財務アナリストは、主に手作業の処理量ではなく、レビューの質、例外の解決、根本原因の改善によって評価されるようになります。サービスデスクのリーダーは、人間のエージェントあたりのチケット数ではなく、人間とエージェントのチームによる解決の質によって評価されるようになります。サプライチェーンプランナーは、ダッシュボードの監視だけでなく、例外の解決と意思決定の質に関するKPIを保持するようになります。

また、エージェントプロダクトオーナー、ワークフローデザイナー、エージェントオペレーションリーダー、評価/テストリーダー、ポリシーマネージャーなどの新しい役割を明確にする良い機会でもあります。

第3四半期のトレードオフ

第3四半期は、しばしば最も危険なフェーズです。初期の価値がすでに見えているため、組織はあまりにも多くの領域を同時に加速させたくなります。リスクは、プラットフォームが未成熟、ガバナンス委員会が手一杯、トレーニングが遅れ、チームが量を追うためにエージェントの品質が低下することです。したがって、混乱を伴う10の領域に拡大するよりも、規律を持って2~3の領域に拡大する方がはるかに優れています。

第4四半期:公式なオペレーティングモデルへの統合

第1四半期が証明、第2四半期が標準化、第3四半期が管理された拡大であるならば、第4四半期は、真剣な企業と単なるイノベーションショーケースを区別するフェーズです。第4四半期には、エージェンティックAIは、実験のリストだけでなく、企業の管理メカニズムに組み込まれ始める必要があります。

計画と予算編成への統合

企業は、エージェンティックなイニシアチブを、年間計画、プラットフォーム投資配分、機能別ビジネスケース、生産性またはサービス成果目標に組み込み始める必要があります。これは、エージェントが依然として実験のように資金提供されている限り、常に削減または周辺化のリスクにさらされるため、重要です。

リスク管理への統合

リスク管理は、場当たり的なレビューから、より正式なモデルへと移行する必要があります。すなわち、エージェントのリスク分類、管理テスト、エージェント障害に対するインシデント対応、ポリシー逸脱の定期的なレビュー、内部監査の関与などです。

ベンダー管理への統合

多くの企業は、ベンダープラットフォーム、モデルプロバイダー、システムインテグレーター、マネージドサービスプロバイダーの組み合わせを利用することになります。第4四半期は、誰が何に責任を持つのか、ベンダーが満たすべき基準、データとモデルリスクの管理方法、契約における成果の測定方法を整理する時期です。これは、エージェンティックサービスモデルに移行し始めるシェアードサービスやグローバルサービスセンターにとって特に重要です。最終的に、エージェンティックサービスとは、ツールを購入することではなく、成果を購入し管理することです。

業績評価への統合

オペレーティングモデルが変われば、業績評価システムも変わらなければなりません。企業は、人間とエージェントの協働の質、監督能力、ワークフロー再設計への貢献、エージェントのパフォーマンス継続的改善を評価し始める必要があります。KPIが古い活動ベースのままであれば、組織は静かに変革に抵抗することになります。

イノベーションラボから公式なオペレーティングモデルへ

第4四半期の成功を示す最も明確な兆候はこれです。エージェントはもはやイノベーションチームの実験とは見なされず、企業が業務を遂行する方法の一部として見なされるようになります。つまり、明確なオーナーが存在し、予算があり、標準があり、定期的なレビューがあり、成果に関するメトリクスがあり、説明責任があるということです。

翌年の焦点

12ヶ月後、企業はもはやユースケースという言葉だけで考えるべきではありません。翌年の焦点は、戦略的な賭けへと移行し始めるべきです。例えば、バリューストリーム全体の抜本的な再設計、エージェンティックシェアードサービスの構築、グローバルサービスセンターのAIベースのデリバリーハブへの変革、あるいは企業プラットフォームのより適応性の高いオーケストレーションレイヤーへの転換などです。ここで、エージェンティックな変革は、真に企業のオペレーティングモデルのアジェンダとなります。

今すぐ決定すべきこと

いくつかの決定は直ちに行う必要があります。第一に、第1四半期のために、価値を証明するのに十分重要でありながら、制限するのに十分安全な単一の領域を選択すること。デモが簡単なだけの領域や、逆に初期の実験には重要すぎる領域から始めてはいけません。

第二に、企業がいつ共通プラットフォームに投資するかを決定すること。プラットフォーム構築が早すぎるとコストがかかります。遅すぎると、制御不能なエージェントの拡散を招きます。第1四半期の証拠を、第2四半期の決定の基礎として使用してください。

第三に、複数領域に拡大する前に、ガバナンス委員会を設立すること。複数の領域が稼働し始めると、ポートフォリオ、リスクレベル、標準を非公式に管理することはできなくなります。

第四に、自社のエージェントファクトリーモデルを決定すること。プラットフォームチーム、デジタルファクトリー、グローバルサービスセンター、あるいは中央標準によるハイブリッドモデルのいずれに集中させるかを決定します。

第五に、人事、財務、運用部門をエージェンティックなロードマップと連携させ始めること。役割、KPI、予算編成、ベンダーモデルが変わらなければ、エージェントはサイドプロジェクトのままです。

注意すべき危険信号

いくつかのシグナルは、企業が拡大する準備ができていないことを示しています。成功が成果ではなく、デモの数やエージェントの数で測定されている場合。各領域が異なるツール、標準、アクセスでエージェントを構築している場合。ビジネスオーナー、エージェントオーナー、リスクオーナーの明確な分離がない場合。エージェントがコアシステムに触れ始めた後になって初めてガバナンスが議論される場合。人間のワークフローがすでに変化しているにもかかわらず、人事部門が関与していない場合。プラットフォームチームに拡大が求められているが、オブザーバビリティ、評価、デプロイメントの規律がまだない場合。ビジネススポンサーが受動的で、これを単なるテクノロジーのアジェンダと見なしている場合。価値を示さないユースケースを中止するという断固たる決定がない場合。

熟考すべき問い

もし今から12ヶ月後に、あなたの会社に20のアクティブなエージェントがあったとして、それはあなたのオペレーティングモデルが変わったことを意味しますか?それとも、あなたは単に20の新しい実験を持っているだけで、それぞれが小さなチームの懸命な努力に依存しており、それらを支える準備ができたプラットフォーム、ガバナンス、労働力モデルがない状態でしょうか?

これこそが、浅いエージェンティックな採用と、真に企業として準備が整ったエージェンティック・オペレーティングモデルを区別する問いです。