Mistral OCR MCP Server

AIスキル拡張#Mistral#OCR#クラウドOCR#文字認識#PDF抽出#Docker

最終確認:2026-05-25ライセンス:MIT無料で使えるオープンソースです（商用利用も可）リポジトリ

Mistral OCR とは

Mistral OCR は、Mistral AI 社が提供する高精度 OCR（光学文字認識）API です。最大 1000 ページの PDF と JPG / JPEG / PNG / GIF / WebP 画像（最大 50MB）から構造化テキストを抽出できます。

ローカル CPU での OCR（Tesseract 等）と比較して、Mistral API はクラウド側で処理されるためローカル環境への依存が少なく、特に多言語混在文書や複雑なレイアウトの精度に強みがあります。一方、API キー（有償）と通信コストが必要です。

これは公式提供ではなく、有志が作った非公式ツールです。

Mistral OCR × AI でできること

この MCP サーバーを導入すると、Mistral OCR を AI への一言で呼び出せます。

📄 ローカル PDF を OCR

「マウントしたフォルダの contract.pdf を OCR して、契約条項のテキストを抜き出して」
→ process_local_file で PDF → 構造化テキスト

🌐 URL から OCR

「https://example.com/scanned-invoice.pdf を OCR して請求金額を教えて」
→ process_url_file でリモート PDF を取得 → OCR

📚 大量ページ一括処理

「1000 ページの技術書 PDF を OCR してテキスト化して」
→ Mistral API 側で並列処理 → タイムスタンプ付き JSON 出力

🌏 多言語混在文書

「日英中混在の論文を OCR して、言語ごとに分けて出力」
→ Mistral OCR の多言語認識を活用

提供される主なツール

Mistral OCR MCP Server が提供するツール:

ツール名	役割
`process_local_file(filename)`	コンテナ内の `/data/ocr`（ホストのマウント元ディレクトリ）に置いたローカルファイルを OCR
`process_url_file(url, file_type)`	URL とファイル種別（`image`/`pdf`）を指定してリモートファイルを OCR

両ツールとも MCP 起動時に MISTRAL_API_KEY と OCR_DIR 環境変数の存在を検証し、未設定の場合は例外を投げて起動を中断します（fail-fast）。ただしコンテナ内の入出力パスは常に /data/ocr に固定されており、OCR_DIR に指定した値自体は使用されません。各ツールの結果はタイムスタンプ付き JSON で /data/ocr/output（＝ホストのマウント元ディレクトリの output/）配下に保存されます。

Mistral OCR MCP Server について

Mistral OCR MCP Server は、everaldo 氏（個人）が公開するコミュニティ実装の MCP サーバーです。Mistral AI 社の OCR API を AI クライアントから呼び出せるようにラップしています。OCR API 自体は Mistral 公式ですが、本 MCP サーバーは Mistral 社の公式提供ではない点に注意してください。

実装は Python 製で、Docker でローカルビルドして実行します（公開 Docker Hub イメージは無く、git clone 後に docker build が必要）。Smithery 経由のワンライナーインストールにも対応します。直接の PyPI 配布は現状なく、ローカルビルドする場合は git clone 後 uv pip install . で開発用インストールも可能です。

スペック

配布形態: Docker（ローカルビルド mcp-mistral-ocr）+ Smithery 経由のワンライナーインストール
認証: API Key（MISTRAL_API_KEY 環境変数）。加えて OCR_DIR 環境変数の設定が必須（存在チェックのみ・コンテナ内パスは /data/ocr 固定）
提供元: everaldo 氏（コミュニティ）/ MIT（OCR API 自体は Mistral 公式）
対応範囲: 画像（JPG/JPEG/PNG/GIF/WebP）と PDF（最大 1000 ページ / 50MB）の OCR
公式リポジトリ: github.com/everaldo/mcp-mistral-ocr

導入手順

前提条件

Docker（推奨）または Python 3.10+ + uv（ローカルビルド）
Mistral La Plateforme のアカウントと API キー
OCR 結果保存用ローカルディレクトリ

ステップ（Docker 経由・推奨）

Mistral のコンソールから API キーを発行
git clone https://github.com/everaldo/mcp-mistral-ocr 後、docker build -t mcp-mistral-ocr . でローカルビルド（公開 Docker Hub イメージは無いためビルドが必要）
ページ上部のタブから使用環境を選択し、JSON 設定をコピー
<your-mistral-api-key> を発行した API キーに置き換える
/path/to/your/files を OCR 対象ファイルを置くローカルディレクトリに置き換える（コンテナ内では常に /data/ocr にマウントされ、結果は同ディレクトリの output/ に出力されます）
クライアントを再起動

Smithery 経由（最短）

npx -y @smithery/cli install @everaldo/mcp/mistral-crosswalk --client claude

Claude Desktop 向けのみ。初回起動時に MISTRAL_API_KEY の入力を求められます。

注意事項

Mistral API キーは必須です。OCR 処理は Mistral 側で実行されるため通信が発生します（料金は Mistral の OCR 価格に依存・無料枠は限定的）。
最大ファイルサイズ 50MB、PDF は最大 1000 ページ（Mistral API 側の制限）。
機密文書（NDA / 個人情報含む契約書等）をクラウド OCR に送るかは社内のセキュリティポリシーを確認してください。
多言語サポートについては README に明示記載がないため、Mistral OCR API の公式ドキュメントを参照してください。
本 MCP は everaldo 氏（個人）のコミュニティ実装で、Mistral AI 公式提供ではありません（API は Mistral 公式）。サポート契約等はありません。
ローカル OCR との使い分け: 小規模・機密文書・オフライン環境では Tesseract ベースのローカル OCR（pdf-mcp 等）が適し、大量 / 複雑レイアウト / 多言語混在は本 MCP（クラウド・高精度）が適します。クラウドに送れない機密文書も pdf-mcp でローカル完結を推奨。

設定方法

MCP は、お使いの対応アプリ（クライアント）に下記の設定を貼り付けて使います。タブからアプリを選び、表示された設定をコピーしてください。

Claude Desktop / Claude Code: Claude Desktop（公式デスクトップアプリ）と Claude Code（公式CLI）は同じ JSON を使います。Desktop は設定ファイルに貼り付け、Claude Code は `.mcp.json` に記述するか `claude mcp add` で追加します。

{
  "mcpServers": {
    "mistral-ocr": {
      "command": "docker",
      "args": [
        "run", "-i", "--rm",
        "-e", "MISTRAL_API_KEY",
        "-e", "OCR_DIR=/data/ocr",
        "-v", "/path/to/your/files:/data/ocr",
        "mcp-mistral-ocr"
      ],
      "env": {
        "MISTRAL_API_KEY": "<your-mistral-api-key>"
      }
    }
  }
}

Cursor: AI 機能を内蔵したコードエディタ（`~/.cursor/mcp.json` に記述）

{
  "mcpServers": {
    "mistral-ocr": {
      "command": "docker",
      "args": [
        "run", "-i", "--rm",
        "-e", "MISTRAL_API_KEY",
        "-e", "OCR_DIR=/data/ocr",
        "-v", "/path/to/your/files:/data/ocr",
        "mcp-mistral-ocr"
      ],
      "env": {
        "MISTRAL_API_KEY": "<your-mistral-api-key>"
      }
    }
  }
}

Cline: VS Code に追加する AI アシスタント拡張（設定画面の MCP Servers から記述）

{
  "mcpServers": {
    "mistral-ocr": {
      "command": "docker",
      "args": [
        "run", "-i", "--rm",
        "-e", "MISTRAL_API_KEY",
        "-e", "OCR_DIR=/data/ocr",
        "-v", "/path/to/your/files:/data/ocr",
        "mcp-mistral-ocr"
      ],
      "env": {
        "MISTRAL_API_KEY": "<your-mistral-api-key>"
      }
    }
  }
}

Gemini CLI: Google の AI CLI。設定形式は Claude Desktop と同じで、`~/.gemini/settings.json` の `mcpServers` に記述するか `gemini mcp add` で追加します。

{
  "mcpServers": {
    "mistral-ocr": {
      "command": "docker",
      "args": [
        "run", "-i", "--rm",
        "-e", "MISTRAL_API_KEY",
        "-e", "OCR_DIR=/data/ocr",
        "-v", "/path/to/your/files:/data/ocr",
        "mcp-mistral-ocr"
      ],
      "env": {
        "MISTRAL_API_KEY": "<your-mistral-api-key>"
      }
    }
  }
}

OpenAI Codex: OpenAI の CLI/IDE。設定は TOML 形式で `~/.codex/config.toml` に記述します（下記は左の JSON から自動変換した参考値です）。

[mcp_servers.mistral-ocr]
command = "docker"
args = ["run", "-i", "--rm", "-e", "MISTRAL_API_KEY", "-e", "OCR_DIR=/data/ocr", "-v", "/path/to/your/files:/data/ocr", "mcp-mistral-ocr"]

[mcp_servers.mistral-ocr.env]
MISTRAL_API_KEY = "<your-mistral-api-key>"

VS Code: VS Code（GitHub Copilot のエージェント）。`mcp.json` の `servers` キーに記述します（下記は左の JSON から自動変換した参考値です）。

{
  "servers": {
    "mistral-ocr": {
      "type": "stdio",
      "command": "docker",
      "args": [
        "run",
        "-i",
        "--rm",
        "-e",
        "MISTRAL_API_KEY",
        "-e",
        "OCR_DIR=/data/ocr",
        "-v",
        "/path/to/your/files:/data/ocr",
        "mcp-mistral-ocr"
      ],
      "env": {
        "MISTRAL_API_KEY": "<your-mistral-api-key>"
      }
    }
  }
}

※ Gemini CLI は Claude Desktop と同じ mcpServers 形式のため同一の JSON を表示しています。Codex / VS Code タブの設定は、上記 JSON を各公式スキーマ（Codex＝~/.codex/config.toml の TOML 形式 / VS Code＝mcp.json の servers キー）へ自動変換した参考値です。貼り付け前にお使いのバージョンの公式ドキュメントもご確認ください。

主なユースケース

「契約書のスキャン PDF から条文をテキスト化して」と頼むと、`process_local_file` で OCR して条文を構造化してくれる
「URL の領収書画像から日付と金額を抽出して」と依頼すると、`process_url_file` でリモート OCR して必要情報を抜き出してくれる
「論文の図キャプションも含めて全文テキスト化して」と頼むと、Mistral の高精度 OCR でレイアウトを維持しながら抽出してくれる
1000 ページ規模の技術書 PDF を一括 OCR し、後段の検索エンジンに渡す前段処理として活用できる

プラットフォーム別の注意事項

WindowsDocker Desktop のインストールが必要です（Windows では WSL2 バックエンドが既定。Docker Desktop のセットアップ内で構成され、WSL2 を直接操作する必要はありません）。

セットアップ・利用上の注意

導入・前提Smithery 経由のワンライナーインストールも提供されています: `npx -y @smithery/cli install @everaldo/mcp/mistral-crosswalk --client claude`。Claude Desktop に直接インストールされます。ローカルビルドする場合は `git clone` 後 `uv pip install .` で開発用インストール可能（PyPI 直接配布は現状なし）。

Mistral OCR MCP Server

Mistral OCR とは

Mistral OCR × AI でできること

提供される主なツール

Mistral OCR MCP Server について

導入手順

前提条件

ステップ（Docker 経由・推奨）

Smithery 経由（最短）

注意事項

設定方法

主なユースケース

プラットフォーム別の注意事項

セットアップ・利用上の注意

このツールを使ったガイド

「このPDF、結局何が書いてある？」――長い書類はAIに要点を聞く時代になった

Context7 MCP Server

DeepL MCP Server

Docker MCP

Mistral OCR とは

Mistral OCR × AI でできること

提供される主なツール

Mistral OCR MCP Server について

導入手順

前提条件

ステップ（Docker 経由・推奨）

Smithery 経由（最短）

注意事項

設定方法

主なユースケース

プラットフォーム別の注意事項

セットアップ・利用上の注意

このツールを使ったガイド

「このPDF、結局何が書いてある？」――長い書類はAIに要点を聞く時代になった

関連するツール

Context7 MCP Server

DeepL MCP Server

Docker MCP