Mistral OCR MCP Server

シェア
AIスキル拡張MistralOCRクラウドOCR文字認識PDF抽出Docker
最終確認:
2026-05-25
ライセンス:
MIT
無料で使えるオープンソースです(商用利用も可)

Mistral OCR とは

Mistral OCR は、Mistral AI 社が提供する高精度 OCR(光学文字認識)API です。最大 1000 ページの PDF と JPG / JPEG / PNG / GIF / WebP 画像(最大 50MB)から構造化テキストを抽出できます。

ローカル CPU での OCR(Tesseract 等)と比較して、Mistral API はクラウド側で処理されるためローカル環境への依存が少なく、特に多言語混在文書や複雑なレイアウトの精度に強みがあります。一方、API キー(有償)と通信コストが必要です。

Mistral OCR × AI でできること

この MCP サーバーを導入すると、Mistral OCR を AI への一言で呼び出せます

📄 ローカル PDF を OCR

「マウントしたフォルダの contract.pdf を OCR して、契約条項のテキストを抜き出して」
→ process_local_file で PDF → 構造化テキスト

🌐 URL から OCR

「https://example.com/scanned-invoice.pdf を OCR して請求金額を教えて」
→ process_url_file でリモート PDF を取得 → OCR

📚 大量ページ一括処理

「1000 ページの技術書 PDF を OCR してテキスト化して」
→ Mistral API 側で並列処理 → タイムスタンプ付き JSON 出力

🌏 多言語混在文書

「日英中混在の論文を OCR して、言語ごとに分けて出力」
→ Mistral OCR の多言語認識を活用

提供される主なツール

Mistral OCR MCP Server が提供するツール(src/mcp_mistral_ocr/main.py@app.tool() デコレータから逐語抽出):

ツール名役割
process_local_file(filename)コンテナ内の /data/ocr(ホストのマウント元ディレクトリ)に置いたローカルファイルを OCR
process_url_file(url, file_type)URL とファイル種別(image/pdf)を指定してリモートファイルを OCR

両ツールとも MCP 起動時に MISTRAL_API_KEYOCR_DIR 環境変数の存在を検証し、未設定の場合は例外を投げて起動を中断します(fail-fast)。ただしコンテナ内の入出力パスは常に /data/ocr に固定されており、OCR_DIR に指定した値自体は使用されません。各ツールの結果はタイムスタンプ付き JSON で /data/ocr/output(=ホストのマウント元ディレクトリの output/)配下に保存されます。

Mistral OCR MCP Server について

Mistral OCR MCP Server は、everaldo 氏(個人)が公開するコミュニティ実装の MCP サーバーです。Mistral AI 社の OCR API を AI クライアントから呼び出せるようにラップしています。OCR API 自体は Mistral 公式ですが、本 MCP サーバーは Mistral 社の公式提供ではない点に注意してください。

実装は Python 製で、Docker でローカルビルドして実行します(公開 Docker Hub イメージは無く、git clone 後に docker build が必要)。Smithery 経由のワンライナーインストールにも対応します。直接の PyPI 配布は現状なく、ローカルビルドする場合は git cloneuv pip install . で開発用インストールも可能です。

スペック

  • 配布形態: Docker(ローカルビルド mcp-mistral-ocr)+ Smithery 経由のワンライナーインストール
  • 認証: API Key(MISTRAL_API_KEY 環境変数)。加えて OCR_DIR 環境変数の設定が必須(存在チェックのみ・コンテナ内パスは /data/ocr 固定)
  • 提供元: everaldo 氏(コミュニティ)/ MIT(OCR API 自体は Mistral 公式)
  • 対応範囲: 画像(JPG/JPEG/PNG/GIF/WebP)と PDF(最大 1000 ページ / 50MB)の OCR
  • 公式リポジトリ: github.com/everaldo/mcp-mistral-ocr

導入手順

前提条件

  • Docker(推奨)または Python 3.10+ + uv(ローカルビルド)
  • Mistral La Plateforme のアカウントと API キー
  • OCR 結果保存用ローカルディレクトリ

ステップ(Docker 経由・推奨)

  1. Mistral のコンソールから API キーを発行
  2. git clone https://github.com/everaldo/mcp-mistral-ocr 後、docker build -t mcp-mistral-ocr . でローカルビルド(公開 Docker Hub イメージは無いためビルドが必要)
  3. ページ上部のタブから使用環境(Claude Desktop / Cursor / Cline)を選択し、JSON 設定をコピー
  4. <your-mistral-api-key> を発行した API キーに置き換える
  5. /path/to/your/files を OCR 対象ファイルを置くローカルディレクトリに置き換える(コンテナ内では常に /data/ocr にマウントされ、結果は同ディレクトリの output/ に出力されます)
  6. クライアントを再起動

Smithery 経由(最短)

npx -y @smithery/cli install @everaldo/mcp/mistral-crosswalk --client claude

Claude Desktop 向けのみ。初回起動時に MISTRAL_API_KEY の入力を求められます。

注意事項

  • Mistral API キーは必須です。OCR 処理は Mistral 側で実行されるため通信が発生します(料金は Mistral の OCR 価格に依存・無料枠は限定的)。
  • 最大ファイルサイズ 50MB、PDF は最大 1000 ページ(Mistral API 側の制限)。
  • 機密文書(NDA / 個人情報含む契約書等)をクラウド OCR に送るかは社内のセキュリティポリシーを確認してください。
  • 多言語サポートについては README に明示記載がないため、Mistral OCR API の公式ドキュメント を参照してください。
  • 本 MCP は everaldo 氏(個人)のコミュニティ実装で、Mistral AI 公式提供ではありません(API は Mistral 公式)。サポート契約等はありません。
  • ローカル OCR との使い分け: 小規模・機密文書・オフライン環境では Tesseract ベースのローカル OCR(pdf-mcp 等)が適し、大量 / 複雑レイアウト / 多言語混在は本 MCP(クラウド・高精度)が適します。クラウドに送れない機密文書も pdf-mcp でローカル完結を推奨。

設定方法

MCP は、お使いの対応アプリ(クライアント)に下記の設定を貼り付けて使います。 タブからアプリを選び、表示された設定をコピーしてください。

Claude Desktop: Anthropic 公式のデスクトップ版 Claude アプリ

{
  "mcpServers": {
    "mistral-ocr": {
      "command": "docker",
      "args": [
        "run", "-i", "--rm",
        "-e", "MISTRAL_API_KEY",
        "-e", "OCR_DIR=/data/ocr",
        "-v", "/path/to/your/files:/data/ocr",
        "mcp-mistral-ocr"
      ],
      "env": {
        "MISTRAL_API_KEY": "<your-mistral-api-key>"
      }
    }
  }
}

主なユースケース

  1. 「契約書のスキャン PDF から条文をテキスト化して」と頼むと、`process_local_file` で OCR して条文を構造化してくれる
  2. 「URL の領収書画像から日付と金額を抽出して」と依頼すると、`process_url_file` でリモート OCR して必要情報を抜き出してくれる
  3. 「論文の図キャプションも含めて全文テキスト化して」と頼むと、Mistral の高精度 OCR でレイアウトを維持しながら抽出してくれる
  4. 1000 ページ規模の技術書 PDF を一括 OCR し、後段の検索エンジンに渡す前段処理として活用できる

プラットフォーム別の注意事項

  • WindowsDocker Desktop の有効化が必要です。WSL2 上での実行を推奨。
  • Smithery 経由のワンライナーインストールも提供されています: `npx -y @smithery/cli install @everaldo/mcp/mistral-crosswalk --client claude`。Claude Desktop に直接インストールされます。
  • ローカルビルドする場合は `git clone` 後 `uv pip install .` で開発用インストール可能(PyPI 直接配布は現状なし)。