ElevenLabsが提供するツール

ElevenLabs MCP Server

シェア
AIスキル拡張音声合成TTSナレーションボイスクローンConversational AI音楽生成
最終確認:
2026-05-25
ライセンス:
MIT
無料で使えるオープンソースです(商用利用も可)

ElevenLabs とは

ElevenLabs は、AI 音声生成のリーディング企業です。「不気味の谷」を超えたとされる自然な合成音声で知られ、Audible や Netflix 系の海外コンテンツでも採用が広がっています。日本語を含む多言語に対応し、TTS(音声合成)・ボイスクローン・文字起こし・効果音生成・音楽生成・会話エージェント(Conversational AI)など、音声まわりの機能を網羅的に提供しています。

ブログの音声化・YouTube 仮ナレーション・キャラクターボイス・サポート向け電話アウトバウンドなど、これまで外注やスタジオ収録が必要だった範囲をすべて API 経由で内製化できます。

ElevenLabs × AI でできること

この MCP サーバーを導入すると、AI に音声生成・編集の全機能を委ねられます

🔊 音声を生成

「このブログ記事を Rachel の声で読み上げて、MP3 で articles/ に保存して」
→ text_to_speech で MP3 出力

🎙️ ナレーションを試作

「研修動画台本をフォーマルな日本語ナレーションにして」
→ 日本語 TTS で仮ナレーション完成

👤 カスタムボイス

「自分の声を学習させたボイスで議事録要約を読み上げて」
→ voice_clone + text_to_speech のパイプライン

🎬 効果音・楽曲

「ホラー映画予告編用に雷雨と遠吠えの効果音を 30 秒生成して」
→ text_to_sound_effects / compose_music で生成

提供される主なツール

ElevenLabs MCP Server は 24 ツールを提供します(公式 server.py 逐語確認)。主要カテゴリ別:

機能カテゴリ主なツール
音声合成・編集text_to_speech / text_to_sound_effects / speech_to_speech / isolate_audio / play_audio
音声→テキストspeech_to_text(話者識別対応)
音声管理・ボイスクローンsearch_voices / search_voice_library / get_voice / list_models / voice_clone / text_to_voice / create_voice_from_preview
会話エージェント(Conversational AI)create_agent / add_knowledge_base_to_agent / list_agents / get_agent / list_conversations / get_conversation
音楽生成compose_music / create_composition_plan
電話通信(ConvAI 連携)make_outbound_call / list_phone_numbers
アカウント情報check_subscription(クレジット残量・プラン確認)

「音声を作る」だけでなく「音声で会話する」「電話を架ける」まで含む包括的な構成です。

ElevenLabs MCP Server について

ElevenLabs MCP Server は、ElevenLabs 社が公式に提供する MCP サーバーです。ElevenLabs API を経由して、AI エージェントから音声生成・編集・ボイスクローン・会話エージェント運用・楽曲生成・電話発信まで実行できます。

実装は Python で、uv(Astral 社の Python パッケージマネージャ)の uvx コマンドで起動します。Free プラン(月 10,000 クレジット)から始められるため、検証用途にも適しています。

スペック

  • 配布形態: PyPI パッケージ(elevenlabs-mcp)+ uvx ランナー(Python 3.11+)
  • 認証: API Key(ELEVENLABS_API_KEY 環境変数)
  • 提供元: ElevenLabs 社(公式)/ MIT
  • 対応範囲: TTS・STT・ボイスクローン・音声分離・効果音・楽曲・会話エージェント・電話発信(計 24 ツール)
  • オプション変数: ELEVENLABS_MCP_BASE_PATH(出力先・既定 ~/Desktop)/ ELEVENLABS_MCP_OUTPUT_MODE(files / resources / both)
  • 公式ドキュメント: github.com/elevenlabs/elevenlabs-mcp

導入手順

前提条件

ステップ

  1. uv をインストール(OS 別の手順は platformNotes を参照)
  2. ElevenLabs にサインアップし、ダッシュボードから API Key を発行
  3. ページ上部のタブから使用環境(Claude Desktop / Cursor / Cline)を選択し、JSON 設定をコピー
  4. <your-elevenlabs-api-key> を取得した API キーに置き換える
  5. クライアントを再起動

注意事項

  • ElevenLabs API の利用には認証キーが必須です。Free プランは月 10,000 クレジットまで、それ以上は有料プラン(Starter 以上)が必要です。
  • 生成された音声のデフォルト出力先は ~/Desktop ですが、ELEVENLABS_MCP_BASE_PATH 環境変数で変更可能です。
  • ボイスクローンは、本人の同意なく他者の声を学習させる利用は規約違反です。商用利用時は ElevenLabs 利用規約を必ず確認してください。
  • API キーは秘密情報です。ソースコードやチャット履歴に含めないよう注意してください。

設定方法

MCP は、お使いの対応アプリ(クライアント)に下記の設定を貼り付けて使います。 タブからアプリを選び、表示された設定をコピーしてください。

Claude Desktop: Anthropic 公式のデスクトップ版 Claude アプリ

{
  "mcpServers": {
    "elevenlabs": {
      "command": "uvx",
      "args": ["elevenlabs-mcp"],
      "env": {
        "ELEVENLABS_API_KEY": "<your-elevenlabs-api-key>"
      }
    }
  }
}

主なユースケース

  1. 「このブログ記事を Rachel の声で読み上げて MP3 に保存して」と頼むだけで音声記事を即生成できる
  2. 「社内研修動画用のナレーション台本をフォーマルな日本語で音声化して」と依頼して仮ナレーションを試作できる
  3. 「自分の声を学習させたカスタムボイスで議事録要約を読み上げて」とパーソナライズ音声化を AI に任せられる
  4. 「ホラー映画予告編用に雷雨と遠吠えの効果音を 30 秒生成して」と効果音生成も同じ MCP で完結する

プラットフォーム別の注意事項

  • uv(Python パッケージマネージャ)を `brew install uv` で先にインストールしてください。生成音声のデフォルト出力先は `~/Desktop` です。
  • WindowsClaude Desktop の「Developer Mode」を有効化する必要があります(公式 README 記載)。uv は `winget install --id=astral-sh.uv` でインストールできます。
  • uv を `curl -LsSf https://astral.sh/uv/install.sh | sh` でインストールしてください。