ブログ目次
AIエージェントとは、人間の指示を受けて自律的にタスクを計画・実行・修正できるAIシステムです。2025年以降、MCP(Model Context Protocol)やA2A(Agent-to-Agent Protocol)といった標準プロトコルの登場により、AIエージェントの開発は「LLMにプロンプトを書く」段階から「外部ツールと連携し、複数エージェントが協調する実用システムを構築する」段階へと進化しました。本記事では、AIエージェント開発の全体像を体系的に解説し、主要フレームワークの比較からMCP・A2Aを活用した実装手順までを網羅します。
「自社の業務を自動化するAIエージェントを作りたいが、どこから手をつければよいのかわからない」――そんな声を多くの企業担当者から耳にします。ChatGPTやClaudeといったLLM(大規模言語モデル)の登場で「AIとの対話」は身近になりましたが、業務システムと連携して自律的に動くAIエージェントの開発となると、まだ情報が断片的で体系化されていないのが現状です。
本記事では、AIエージェントの基本構造から、開発フレームワークの選定、MCP・A2Aプロトコルの実装、そして実運用に至るまでのロードマップを解説します。
AIエージェントの基本概念については「AIエージェントとは?ビジネス活用の全体像を解説」で詳しく紹介しています。
この記事でわかること
- AIエージェント開発は「LLM選定→ツール接続→ワークフロー設計→評価・改善」の4ステップで進める
- MCP(Model Context Protocol)でAIと外部ツールを標準化接続し、A2A(Agent-to-Agent Protocol)でエージェント同士を連携させる
- フレームワークは目的で選ぶ:軽量プロトタイプならClaude Code、複雑なワークフローならLangGraph、マルチエージェントならCrew AIやAutoGen
- MCPを活用して会計ソフト・CRM・プロジェクト管理ツールを統合するAIエージェントの構築が実用段階に入っている
- 「まずは1つの業務タスク × 1つのツール接続」から始めるのが成功の鍵
AIエージェントのアーキテクチャ:4つの構成要素
AIエージェントを開発するには、まずその構成要素を理解する必要があります。AIエージェントは以下の4つの要素で構成されます。
| 構成要素 | 役割 | 具体例 |
|---|---|---|
| LLM(推論エンジン) | 自然言語の理解・推論・計画立案 | Claude、GPT-4o、Gemini |
| ツール接続(Tool Use) | 外部システムの操作・データ取得 | MCP経由のCRM操作、API呼び出し |
| メモリ(記憶) | 過去の対話・実行結果の保持 | 短期メモリ(コンテキスト)、長期メモリ(DB) |
| オーケストレーション | タスクの計画・実行・エラー処理 | ReActパターン、Plan-and-Execute |
LLM:エージェントの「脳」
AIエージェントの中核はLLMです。LLMがユーザーの指示を理解し、タスクを分解し、どのツールをどの順序で使うかを判断します。エージェント開発においてLLMの選定は重要で、以下の観点で評価します。
- ツール呼び出し精度: 関数呼び出し(Function Calling)の正確さ。Claudeは複雑なツール連携での精度が高い
- コンテキストウィンドウ: 長い会話や大量のデータを扱えるか。Claude 3.5 Sonnetは200Kトークン対応
- 推論能力: 複雑なタスク分解や条件分岐を適切に判断できるか
- コスト: API呼び出し単価。エージェントは複数回のLLM呼び出しを行うためコスト設計が重要
ツール接続:エージェントの「手」
LLMだけでは「考える」ことしかできません。実際に業務を遂行するには、CRM・会計ソフト・メール・ファイルシステムなどの外部ツールと接続する必要があります。ここで重要な役割を果たすのがMCP(Model Context Protocol)です。
メモリとオーケストレーション
エージェントが長期的なタスクを遂行するには、過去の実行結果や対話履歴を保持するメモリが必要です。また、複数のステップを適切な順序で実行し、エラー発生時にリトライや代替手段を選択するオーケストレーション機能も欠かせません。
MCP(Model Context Protocol)によるツール接続の標準化
MCPはAnthropicが2024年11月に公開した、AIモデルと外部データソース・ツールを接続するためのオープンプロトコルです。MCPの詳細については「MCP(Model Context Protocol)とは?AIと外部ツールをつなぐ標準規格を解説」で体系的に解説しています。
MCPがエージェント開発を変える理由
従来、AIエージェントに外部ツールを接続するには、ツールごとに個別のAPI連携コードを書く必要がありました。CRMならCRM用、会計ソフトなら会計ソフト用、ファイル操作ならファイル操作用――と、ツールが増えるたびに開発コストが増大します。
MCPはこの問題を「USB-Cのように」標準化します。MCPに対応したツール(MCPサーバー)を用意すれば、どのLLMからでも統一的なインターフェースでアクセスできます。
MCPの基本構造は以下のとおりです。
| 構成要素 | 役割 | 具体例 |
|---|---|---|
| MCPホスト | エージェントが動作する環境 | Claude Desktop、Claude Code、自作アプリ |
| MCPクライアント | MCPサーバーとの通信を仲介 | ホスト内の通信モジュール |
| MCPサーバー | 外部ツールの機能を公開 | HubSpot MCPサーバー、Slack MCPサーバー |
MCPサーバーの開発手順
自社ツール用のMCPサーバーを構築する基本的な流れは以下のとおりです。
- ツールの機能定義: エージェントに公開したい操作を洗い出す(例:顧客情報の取得、請求書の作成)
- スキーマ設計: 各ツールの入力パラメータと出力形式をJSON Schemaで定義する
- MCPサーバー実装: TypeScript SDKまたはPython SDKを使い、MCP仕様に準拠したサーバーを実装する
- 認証設計: OAuth 2.0やAPIキーによる認証を組み込む
- テストとデバッグ: MCP Inspectorを使って動作確認する
たとえば、HubSpotの商談情報をMCP経由で取得し、会計ソフトの売上データと突合して経営ダッシュボードを自動更新する――といった業務を、1つのAIエージェントが自律的に遂行することが可能です。MCPにより、CRM・会計・プロジェクト管理ツールを統合したAIエージェントが実用段階に入っています。
A2Aプロトコルによるマルチエージェント連携
MCP が「AIとツールの接続」を標準化するのに対し、A2A(Agent-to-Agent Protocol)は「AIとAIの接続」を標準化します。Googleが2025年4月に発表したA2Aにより、異なるベンダーのAIエージェント同士が安全にタスクを委任し合えるようになりました。
A2Aの3層構造
| 層 | 役割 | エージェント開発での活用 |
|---|---|---|
| Agent Card(名刺層) | エージェントの能力を宣言 | 他のエージェントが「何を依頼できるか」を自動判定 |
| Task管理層 | タスクの作成・進捗・完了を管理 | submitted → working → completed のライフサイクル |
| メッセージ層 | エージェント間のデータ交換 | テキスト・ファイル・構造化データの送受信 |
A2Aを活用したマルチエージェント設計
A2Aの実装では、まず各エージェントのAgent Cardを定義します。Agent CardはJSON形式で、エージェントの名前・説明・対応可能なタスク・認証方式を記載します。
マルチエージェントシステムの設計パターンには以下の3つがあります。
- オーケストレーター型: 中央のエージェントが他のエージェントにタスクを振り分ける。管理しやすいが、中央エージェントがボトルネックになりやすい
- ピアツーピア型: エージェント同士が対等にタスクを委任し合う。柔軟だが、デバッグが難しい
- 階層型: エージェントがチームリーダーとメンバーの階層構造を持つ。大規模システムに向いている
A2Aプロトコルを使った複数エージェントの協調動作も実用化が進んでいます。たとえば、コンテンツ制作プロセスで、リサーチエージェント・執筆エージェント・品質レビューエージェント・公開エージェントがそれぞれの役割を担い、一連の制作フローを自律的に回す構成が可能です。
主要フレームワーク比較:目的別の選び方
AIエージェント開発のフレームワークは乱立状態にあります。ここでは実務で使われている主要フレームワークを比較し、目的に応じた選び方を解説します。
フレームワーク比較表
| フレームワーク | 開発元 | 特徴 | 適用場面 | 学習コスト |
|---|---|---|---|---|
| Claude Code | Anthropic | CLI型エージェント。ファイル操作・コード生成に特化。MCP標準対応 | 開発タスクの自動化、プロトタイプ開発 | 低 |
| LangChain / LangGraph | LangChain | グラフベースのワークフロー定義。状態管理が強力 | 複雑な条件分岐を含む業務フロー | 中〜高 |
| Crew AI | Crew AI | ロールベースのマルチエージェント。直感的なAPI | チーム型のタスク分担 | 低〜中 |
| AutoGen | Microsoft | 会話駆動型マルチエージェント。研究用途にも強い | R&D・分析・ディスカッション型タスク | 中 |
| Dify | Dify AI | ノーコード/ローコードでエージェント構築 | 非エンジニアによるエージェント開発 | 低 |
| Mastra | Mastra | TypeScript特化。MCP・A2Aネイティブ対応 | TypeScript環境でのプロダクション開発 | 中 |
Claude Code:開発者向けエージェントの最前線
Claude Codeの使い方と実践ガイドでも紹介しているとおり、Claude CodeはAnthropicが提供するCLI型のAIエージェントです。ターミナル上で動作し、コードの読み書き・ファイル操作・Git管理・テスト実行などを自律的に行います。
Claude Codeの最大の強みはMCPへのネイティブ対応です。設定ファイル(claude_desktop_config.json)にMCPサーバーを追加するだけで、CRM・会計ソフト・プロジェクト管理ツールなど、さまざまな外部システムと接続できます。
LangChain / LangGraph:複雑なワークフロー向け
LangChainはPython/TypeScript対応のフレームワークで、LLMアプリケーション開発のデファクトスタンダードとして広く使われています。LangGraphはLangChainの拡張で、有向グラフ(DAG)によるワークフロー定義が可能です。
LangGraphの強みは、条件分岐・ループ・並列実行を含む複雑なワークフローを明示的に定義できる点です。ただし、学習コストが高く、シンプルなエージェントには過剰な場合があります。
Crew AI:チーム型マルチエージェント
Crew AIは「エージェントにロール(役割)を与え、チームとして協調させる」というコンセプトのフレームワークです。たとえば「リサーチャー」「ライター」「エディター」というロールを定義し、それぞれのエージェントが順番にタスクを遂行します。
直感的なAPIが特徴で、マルチエージェントの入門として適しています。一方、大規模なプロダクション環境では細かな制御が難しい場面もあります。
AutoGen:会話駆動型マルチエージェント
MicrosoftのAutoGenは、エージェント同士が「会話」によってタスクを進めるフレームワークです。研究用途で広く使われており、複数のLLMエージェントと人間がディスカッション形式でタスクを遂行するユースケースに強みがあります。
AIエージェント開発の実践ステップ
ここからは、実際にAIエージェントを開発する手順を解説します。
ステップ1:対象業務の選定
AIエージェント開発で最も重要なのは「何を自動化するか」の選定です。以下の条件に当てはまる業務から始めることを推奨します。
- 反復性が高い: 毎日・毎週同じ手順で行う業務
- 判断基準が明確: 「この条件ならAの処理、そうでなければBの処理」とルール化できる
- ツールとの接続が可能: 対象システムにAPIが提供されている
- 失敗時のリスクが低い: 初期段階では、ミスがあっても取り返しがつく業務を選ぶ
具体的には、日次レポートの自動生成、CRMデータの定期更新、メール文面のドラフト作成などが適しています。
ステップ2:LLMとフレームワークの選定
対象業務が決まったら、LLMとフレームワークを選定します。選定の判断基準は以下のとおりです。
- 単一タスク × シンプルなツール接続: Claude Code + MCPが最速。設定ファイルを書くだけでプロトタイプが動く
- 複雑なワークフロー × 条件分岐: LangGraphで状態管理込みのグラフを設計する
- 複数エージェントの協調: Crew AIまたはAutoGenでチーム構成を定義する
- 非エンジニアが開発: Difyのノーコード環境を使う
ステップ3:ツール接続の実装(MCP)
MCPサーバーの開発は、TypeScript SDKを使う場合、以下のような流れになります。
@modelcontextprotocol/sdkパッケージをインストールする- MCPサーバーのクラスを定義し、ツール(関数)を登録する
- 各ツールの入力スキーマ(JSON Schema)と実行ロジックを実装する
- サーバーを起動し、MCPホスト(Claude DesktopやClaude Code)から接続する
すでに公開されているMCPサーバーも多数あります。GitHub・Slack・Google Drive・PostgreSQL・HubSpotなど、主要サービスのMCPサーバーはOSSとして利用可能です。自社ツール用にゼロから開発する前に、既存のMCPサーバーを活用できないか確認しましょう。
ステップ4:評価と改善
AIエージェントは一度作って終わりではありません。以下の観点で継続的に評価・改善します。
- タスク成功率: エージェントが指示どおりにタスクを完了した割合
- ツール選択精度: 適切なツールを適切なタイミングで呼び出せているか
- コスト効率: LLMのAPI呼び出し回数とトークン消費量
- 実行時間: タスク完了までの所要時間
- エラーハンドリング: 失敗時に適切にリトライ・エスカレーションできているか
エージェント開発のよくある失敗と対策
実際にAIエージェントを開発・運用していると、いくつかの典型的な失敗パターンに遭遇します。
失敗1:ツールの権限を広げすぎる
AIエージェントに強力な権限を与えすぎると、意図しない操作(データの削除・大量メール送信など)が発生するリスクがあります。最小権限の原則を適用し、エージェントに与える権限は必要最小限にとどめましょう。
具体的には、読み取り専用の操作から始め、十分な検証を経てから書き込み権限を追加する段階的なアプローチが有効です。
失敗2:プロンプトに業務ロジックを詰め込みすぎる
エージェントのシステムプロンプトに、あらゆる業務ルールや条件分岐を詰め込むケースがあります。プロンプトが長くなりすぎるとLLMの判断精度が低下します。
対策として、業務ロジックはツール側(MCPサーバー)に実装し、プロンプトには「何をすべきか」の方針だけを記述するのが効果的です。
失敗3:マルチエージェントを早期に導入する
複数エージェントの協調は魅力的ですが、デバッグの難易度が跳ね上がります。まずは単一エージェントで業務を自動化し、ボトルネックが明確になってからマルチエージェント化を検討しましょう。
AIエージェント開発の実践例
MCPを活用したAIエージェントの構成例を紹介します。Claude CodeをベースにMCPで以下のようなツールを接続することで、強力な業務自動化エージェントが構築できます。
- 会計ソフトMCP: 会計データの取得・仕訳の確認・経営数値の分析
- CRM(HubSpot等)MCP: 商談情報・顧客データ・パイプラインの操作
- プロジェクト管理MCP: ドキュメントの読み書き・タスク管理
- Google Calendar MCP: スケジュール管理・ミーティング調整
- Slack MCP: チーム通知・顧客コミュニケーション
これらのツールがMCPで統合されているため、「今月の売上を会計ソフトから取得し、CRMの商談データと突合して、経営ダッシュボードを更新する」といった複合的なタスクを、自然言語の指示だけでエージェントに実行させることが可能です。
さらにA2Aプロトコルを活用すれば、複数のAIエージェントが並列でタスクを遂行し、相互にレビューし合うマルチエージェント体制を構築することもできます。共有ファイルを介してエージェント間の作業状況を同期し、タスクの競合を回避しながら大量の作業を効率的に処理する構成が実用化されています。
FAQ(よくある質問)
Q1. AIエージェント開発にプログラミングスキルは必要ですか?
目的によります。Difyのようなノーコードツールを使えば、プログラミング経験がなくてもシンプルなエージェントは構築できます。ただし、MCPサーバーの自社開発や複雑なマルチエージェントシステムの構築には、TypeScriptまたはPythonのスキルが必要です。まずはノーコードツールで概念を理解し、段階的にコーディングに移行するアプローチを推奨します。
Q2. MCPとA2Aはどちらを先に学ぶべきですか?
MCPから始めてください。MCPは「AIと外部ツールの接続」という基本的な機能を提供するプロトコルで、単一エージェントの開発に不可欠です。A2Aは「エージェント同士の連携」であり、まず1つのエージェントがMCP経由でツールを使いこなせるようになってから、次のステップとしてA2Aによるマルチエージェント連携に進むのが効率的です。
Q3. エージェント開発のコストはどれくらいかかりますか?
LLMのAPI利用料が主なコストです。Claude APIの場合、Claude 3.5 Sonnetで入力$3/百万トークン・出力$15/百万トークンが目安です(2026年3月時点)。エージェントは1つのタスクで複数回LLMを呼び出すため、1タスクあたり数円〜数十円のコストが発生します。月間数千タスクを処理する場合でも、人件費と比較すれば大幅なコスト削減が見込めます。フレームワーク自体はOSSで無料のものがほとんどです。
Q4. セキュリティ面でのリスクはありますか?
はい、適切な対策が必要です。主なリスクは「プロンプトインジェクション(悪意ある入力によるエージェントの操作)」「過剰な権限付与」「外部ツールへの意図しないアクセス」の3点です。対策として、入力のバリデーション、最小権限の原則、操作ログの記録、重要操作前の人間承認フローの実装が推奨されます。MCPの認証機構やA2Aの認証・認可フレームワークを活用することで、プロトコルレベルでのセキュリティ確保も可能です。
Q5. 既存のRPA(ロボティック・プロセス・オートメーション)とAIエージェントの違いは何ですか?
RPAは画面操作を記録・再生する「ルールベース」の自動化です。定型作業には強いですが、例外処理や判断が必要な場面には対応できません。AIエージェントはLLMの推論能力を活かして「状況に応じた判断」が可能で、非定型な業務にも対応できます。ただし、RPAのほうがコストが低く導入が簡単なケースもあるため、業務の性質に応じて使い分けるのが最善です。完全な定型作業はRPA、判断を伴う業務はAIエージェントという棲み分けが実務的な最適解です。
まとめ:まず1つのタスクから始める
AIエージェント開発は、MCP・A2Aプロトコルの登場により、急速に実用段階に入っています。しかし、最初から壮大なマルチエージェントシステムを構想するのではなく、まずは1つの業務タスクを1つのエージェントで自動化するところから始めましょう。
開発のロードマップは以下のとおりです。
- フェーズ1: 単一タスク × 単一ツール(MCP接続で1つの業務を自動化)
- フェーズ2: 単一エージェント × 複数ツール(MCP経由で複数のツールを連携)
- フェーズ3: マルチエージェント(A2Aプロトコルで複数エージェントを協調)
株式会社StartLinkでは、CRM連携を中心としたAIエージェントの開発支援を行っています。「自社業務にAIエージェントを導入したいが、どこから始めればよいかわからない」という方は、ぜひお気軽にご相談ください。CRM特化のコンサルティング経験とAIエージェント開発の実践知をもとに、貴社に最適なエージェント設計をご提案します。
株式会社StartLinkは、事業推進に関わる「販売促進」「DXによる業務効率化(ERP/CRM/SFA/MAの導入)」などのご相談を受け付けております。 サービスのプランについてのご相談/お見積もり依頼や、ノウハウのお問い合わせについては、無料のお問い合わせページより、お気軽にご連絡くださいませ。
関連キーワード:
サービス資料を無料DL
著者情報
今枝 拓海 / Takumi Imaeda
株式会社StartLinkの代表取締役。
HubSpotのトップパートナーである株式会社H&Kにて、HubSpotのCRM戦略/設計/構築を軸として、 国内・外資系エンタープライズ企業へコンサルティング支援を実施。
パーソルホールティングス株式会社にて、大規模CRM/SFA戦略の策定・PERSOLグループ横断のグループAI戦略/企画/開発ディレクションの業務を遂行経験あり。
株式会社StartLinkでは、累計100社以上のHubSpotプロジェクト実績を元にHubSpot×AIを軸にした経営基盤DXのコンサルティング事業を展開。