AIエージェントとは、人間の指示を受けて自律的にタスクを計画・実行・修正できるAIシステムです。2025年以降、MCP(Model Context Protocol)やA2A(Agent-to-Agent Protocol)といった標準プロトコルの登場により、AIエージェントの開発は「LLMにプロンプトを書く」段階から「外部ツールと連携し、複数エージェントが協調する実用システムを構築する」段階へと進化しました。本記事では、AIエージェント開発の全体像を体系的に解説し、主要フレームワークの比較からMCP・A2Aを活用した実装手順までを網羅します。
「自社の業務を自動化するAIエージェントを作りたいが、どこから手をつければよいのかわからない」――そんな声を多くの企業担当者から耳にします。ChatGPTやClaudeといったLLM(大規模言語モデル)の登場で「AIとの対話」は身近になりましたが、業務システムと連携して自律的に動くAIエージェントの開発となると、まだ情報が断片的で体系化されていないのが現状です。
本記事では、AIエージェントの基本構造から、開発フレームワークの選定、MCP・A2Aプロトコルの実装、そして実運用に至るまでのロードマップを解説します。
AIエージェントの基本概念については「AIエージェントとは?ビジネス活用の全体像を解説」で詳しく紹介しています。
AIエージェントを開発するには、まずその構成要素を理解する必要があります。AIエージェントは以下の4つの要素で構成されます。
| 構成要素 | 役割 | 具体例 |
|---|---|---|
| LLM(推論エンジン) | 自然言語の理解・推論・計画立案 | Claude、GPT-4o、Gemini |
| ツール接続(Tool Use) | 外部システムの操作・データ取得 | MCP経由のCRM操作、API呼び出し |
| メモリ(記憶) | 過去の対話・実行結果の保持 | 短期メモリ(コンテキスト)、長期メモリ(DB) |
| オーケストレーション | タスクの計画・実行・エラー処理 | ReActパターン、Plan-and-Execute |
AIエージェントの中核はLLMです。LLMがユーザーの指示を理解し、タスクを分解し、どのツールをどの順序で使うかを判断します。エージェント開発においてLLMの選定は重要で、以下の観点で評価します。
LLMだけでは「考える」ことしかできません。実際に業務を遂行するには、CRM・会計ソフト・メール・ファイルシステムなどの外部ツールと接続する必要があります。ここで重要な役割を果たすのがMCP(Model Context Protocol)です。
エージェントが長期的なタスクを遂行するには、過去の実行結果や対話履歴を保持するメモリが必要です。また、複数のステップを適切な順序で実行し、エラー発生時にリトライや代替手段を選択するオーケストレーション機能も欠かせません。
MCPはAnthropicが2024年11月に公開した、AIモデルと外部データソース・ツールを接続するためのオープンプロトコルです。MCPの詳細については「MCP(Model Context Protocol)とは?AIと外部ツールをつなぐ標準規格を解説」で体系的に解説しています。
従来、AIエージェントに外部ツールを接続するには、ツールごとに個別のAPI連携コードを書く必要がありました。CRMならCRM用、会計ソフトなら会計ソフト用、ファイル操作ならファイル操作用――と、ツールが増えるたびに開発コストが増大します。
MCPはこの問題を「USB-Cのように」標準化します。MCPに対応したツール(MCPサーバー)を用意すれば、どのLLMからでも統一的なインターフェースでアクセスできます。
MCPの基本構造は以下のとおりです。
| 構成要素 | 役割 | 具体例 |
|---|---|---|
| MCPホスト | エージェントが動作する環境 | Claude Desktop、Claude Code、自作アプリ |
| MCPクライアント | MCPサーバーとの通信を仲介 | ホスト内の通信モジュール |
| MCPサーバー | 外部ツールの機能を公開 | HubSpot MCPサーバー、Slack MCPサーバー |
自社ツール用のMCPサーバーを構築する基本的な流れは以下のとおりです。
たとえば、HubSpotの商談情報をMCP経由で取得し、会計ソフトの売上データと突合して経営ダッシュボードを自動更新する――といった業務を、1つのAIエージェントが自律的に遂行することが可能です。MCPにより、CRM・会計・プロジェクト管理ツールを統合したAIエージェントが実用段階に入っています。
MCP が「AIとツールの接続」を標準化するのに対し、A2A(Agent-to-Agent Protocol)は「AIとAIの接続」を標準化します。Googleが2025年4月に発表したA2Aにより、異なるベンダーのAIエージェント同士が安全にタスクを委任し合えるようになりました。
| 層 | 役割 | エージェント開発での活用 |
|---|---|---|
| Agent Card(名刺層) | エージェントの能力を宣言 | 他のエージェントが「何を依頼できるか」を自動判定 |
| Task管理層 | タスクの作成・進捗・完了を管理 | submitted → working → completed のライフサイクル |
| メッセージ層 | エージェント間のデータ交換 | テキスト・ファイル・構造化データの送受信 |
A2Aの実装では、まず各エージェントのAgent Cardを定義します。Agent CardはJSON形式で、エージェントの名前・説明・対応可能なタスク・認証方式を記載します。
マルチエージェントシステムの設計パターンには以下の3つがあります。
A2Aプロトコルを使った複数エージェントの協調動作も実用化が進んでいます。たとえば、コンテンツ制作プロセスで、リサーチエージェント・執筆エージェント・品質レビューエージェント・公開エージェントがそれぞれの役割を担い、一連の制作フローを自律的に回す構成が可能です。
AIエージェント開発のフレームワークは乱立状態にあります。ここでは実務で使われている主要フレームワークを比較し、目的に応じた選び方を解説します。
| フレームワーク | 開発元 | 特徴 | 適用場面 | 学習コスト |
|---|---|---|---|---|
| Claude Code | Anthropic | CLI型エージェント。ファイル操作・コード生成に特化。MCP標準対応 | 開発タスクの自動化、プロトタイプ開発 | 低 |
| LangChain / LangGraph | LangChain | グラフベースのワークフロー定義。状態管理が強力 | 複雑な条件分岐を含む業務フロー | 中〜高 |
| Crew AI | Crew AI | ロールベースのマルチエージェント。直感的なAPI | チーム型のタスク分担 | 低〜中 |
| AutoGen | Microsoft | 会話駆動型マルチエージェント。研究用途にも強い | R&D・分析・ディスカッション型タスク | 中 |
| Dify | Dify AI | ノーコード/ローコードでエージェント構築 | 非エンジニアによるエージェント開発 | 低 |
| Mastra | Mastra | TypeScript特化。MCP・A2Aネイティブ対応 | TypeScript環境でのプロダクション開発 | 中 |
Claude Codeの使い方と実践ガイドでも紹介しているとおり、Claude CodeはAnthropicが提供するCLI型のAIエージェントです。ターミナル上で動作し、コードの読み書き・ファイル操作・Git管理・テスト実行などを自律的に行います。
Claude Codeの最大の強みはMCPへのネイティブ対応です。設定ファイル(claude_desktop_config.json)にMCPサーバーを追加するだけで、CRM・会計ソフト・プロジェクト管理ツールなど、さまざまな外部システムと接続できます。
LangChainはPython/TypeScript対応のフレームワークで、LLMアプリケーション開発のデファクトスタンダードとして広く使われています。LangGraphはLangChainの拡張で、有向グラフ(DAG)によるワークフロー定義が可能です。
LangGraphの強みは、条件分岐・ループ・並列実行を含む複雑なワークフローを明示的に定義できる点です。ただし、学習コストが高く、シンプルなエージェントには過剰な場合があります。
Crew AIは「エージェントにロール(役割)を与え、チームとして協調させる」というコンセプトのフレームワークです。たとえば「リサーチャー」「ライター」「エディター」というロールを定義し、それぞれのエージェントが順番にタスクを遂行します。
直感的なAPIが特徴で、マルチエージェントの入門として適しています。一方、大規模なプロダクション環境では細かな制御が難しい場面もあります。
MicrosoftのAutoGenは、エージェント同士が「会話」によってタスクを進めるフレームワークです。研究用途で広く使われており、複数のLLMエージェントと人間がディスカッション形式でタスクを遂行するユースケースに強みがあります。
ここからは、実際にAIエージェントを開発する手順を解説します。
AIエージェント開発で最も重要なのは「何を自動化するか」の選定です。以下の条件に当てはまる業務から始めることを推奨します。
具体的には、日次レポートの自動生成、CRMデータの定期更新、メール文面のドラフト作成などが適しています。
対象業務が決まったら、LLMとフレームワークを選定します。選定の判断基準は以下のとおりです。
MCPサーバーの開発は、TypeScript SDKを使う場合、以下のような流れになります。
@modelcontextprotocol/sdk パッケージをインストールするすでに公開されているMCPサーバーも多数あります。GitHub・Slack・Google Drive・PostgreSQL・HubSpotなど、主要サービスのMCPサーバーはOSSとして利用可能です。自社ツール用にゼロから開発する前に、既存のMCPサーバーを活用できないか確認しましょう。
AIエージェントは一度作って終わりではありません。以下の観点で継続的に評価・改善します。
実際にAIエージェントを開発・運用していると、いくつかの典型的な失敗パターンに遭遇します。
AIエージェントに強力な権限を与えすぎると、意図しない操作(データの削除・大量メール送信など)が発生するリスクがあります。最小権限の原則を適用し、エージェントに与える権限は必要最小限にとどめましょう。
具体的には、読み取り専用の操作から始め、十分な検証を経てから書き込み権限を追加する段階的なアプローチが有効です。
エージェントのシステムプロンプトに、あらゆる業務ルールや条件分岐を詰め込むケースがあります。プロンプトが長くなりすぎるとLLMの判断精度が低下します。
対策として、業務ロジックはツール側(MCPサーバー)に実装し、プロンプトには「何をすべきか」の方針だけを記述するのが効果的です。
複数エージェントの協調は魅力的ですが、デバッグの難易度が跳ね上がります。まずは単一エージェントで業務を自動化し、ボトルネックが明確になってからマルチエージェント化を検討しましょう。
MCPを活用したAIエージェントの構成例を紹介します。Claude CodeをベースにMCPで以下のようなツールを接続することで、強力な業務自動化エージェントが構築できます。
これらのツールがMCPで統合されているため、「今月の売上を会計ソフトから取得し、CRMの商談データと突合して、経営ダッシュボードを更新する」といった複合的なタスクを、自然言語の指示だけでエージェントに実行させることが可能です。
さらにA2Aプロトコルを活用すれば、複数のAIエージェントが並列でタスクを遂行し、相互にレビューし合うマルチエージェント体制を構築することもできます。共有ファイルを介してエージェント間の作業状況を同期し、タスクの競合を回避しながら大量の作業を効率的に処理する構成が実用化されています。
目的によります。Difyのようなノーコードツールを使えば、プログラミング経験がなくてもシンプルなエージェントは構築できます。ただし、MCPサーバーの自社開発や複雑なマルチエージェントシステムの構築には、TypeScriptまたはPythonのスキルが必要です。まずはノーコードツールで概念を理解し、段階的にコーディングに移行するアプローチを推奨します。
MCPから始めてください。MCPは「AIと外部ツールの接続」という基本的な機能を提供するプロトコルで、単一エージェントの開発に不可欠です。A2Aは「エージェント同士の連携」であり、まず1つのエージェントがMCP経由でツールを使いこなせるようになってから、次のステップとしてA2Aによるマルチエージェント連携に進むのが効率的です。
LLMのAPI利用料が主なコストです。Claude APIの場合、Claude 3.5 Sonnetで入力$3/百万トークン・出力$15/百万トークンが目安です(2026年3月時点)。エージェントは1つのタスクで複数回LLMを呼び出すため、1タスクあたり数円〜数十円のコストが発生します。月間数千タスクを処理する場合でも、人件費と比較すれば大幅なコスト削減が見込めます。フレームワーク自体はOSSで無料のものがほとんどです。
はい、適切な対策が必要です。主なリスクは「プロンプトインジェクション(悪意ある入力によるエージェントの操作)」「過剰な権限付与」「外部ツールへの意図しないアクセス」の3点です。対策として、入力のバリデーション、最小権限の原則、操作ログの記録、重要操作前の人間承認フローの実装が推奨されます。MCPの認証機構やA2Aの認証・認可フレームワークを活用することで、プロトコルレベルでのセキュリティ確保も可能です。
RPAは画面操作を記録・再生する「ルールベース」の自動化です。定型作業には強いですが、例外処理や判断が必要な場面には対応できません。AIエージェントはLLMの推論能力を活かして「状況に応じた判断」が可能で、非定型な業務にも対応できます。ただし、RPAのほうがコストが低く導入が簡単なケースもあるため、業務の性質に応じて使い分けるのが最善です。完全な定型作業はRPA、判断を伴う業務はAIエージェントという棲み分けが実務的な最適解です。
AIエージェント開発は、MCP・A2Aプロトコルの登場により、急速に実用段階に入っています。しかし、最初から壮大なマルチエージェントシステムを構想するのではなく、まずは1つの業務タスクを1つのエージェントで自動化するところから始めましょう。
開発のロードマップは以下のとおりです。
株式会社StartLinkでは、CRM連携を中心としたAIエージェントの開発支援を行っています。「自社業務にAIエージェントを導入したいが、どこから始めればよいかわからない」という方は、ぜひお気軽にご相談ください。CRM特化のコンサルティング経験とAIエージェント開発の実践知をもとに、貴社に最適なエージェント設計をご提案します。