Mistral OCR MCP Server
- 最終確認:
- 2026-05-25
- ライセンス:
- MIT
Mistral OCR とは
Mistral OCR は、Mistral AI 社が提供する高精度 OCR(光学文字認識)API です。最大 1000 ページの PDF と JPG / JPEG / PNG / GIF / WebP 画像(最大 50MB)から構造化テキストを抽出できます。
ローカル CPU での OCR(Tesseract 等)と比較して、Mistral API はクラウド側で処理されるためローカル環境への依存が少なく、特に多言語混在文書や複雑なレイアウトの精度に強みがあります。一方、API キー(有償)と通信コストが必要です。
Mistral OCR × AI でできること
この MCP サーバーを導入すると、Mistral OCR を AI への一言で呼び出せます。
📄 ローカル PDF を OCR
「マウントしたフォルダの contract.pdf を OCR して、契約条項のテキストを抜き出して」
→ process_local_file で PDF → 構造化テキスト
🌐 URL から OCR
「https://example.com/scanned-invoice.pdf を OCR して請求金額を教えて」
→ process_url_file でリモート PDF を取得 → OCR
📚 大量ページ一括処理
「1000 ページの技術書 PDF を OCR してテキスト化して」
→ Mistral API 側で並列処理 → タイムスタンプ付き JSON 出力
🌏 多言語混在文書
「日英中混在の論文を OCR して、言語ごとに分けて出力」
→ Mistral OCR の多言語認識を活用
提供される主なツール
Mistral OCR MCP Server が提供するツール(src/mcp_mistral_ocr/main.py の @app.tool() デコレータから逐語抽出):
| ツール名 | 役割 |
|---|---|
process_local_file(filename) | コンテナ内の /data/ocr(ホストのマウント元ディレクトリ)に置いたローカルファイルを OCR |
process_url_file(url, file_type) | URL とファイル種別(image/pdf)を指定してリモートファイルを OCR |
両ツールとも MCP 起動時に MISTRAL_API_KEY と OCR_DIR 環境変数の存在を検証し、未設定の場合は例外を投げて起動を中断します(fail-fast)。ただしコンテナ内の入出力パスは常に /data/ocr に固定されており、OCR_DIR に指定した値自体は使用されません。各ツールの結果はタイムスタンプ付き JSON で /data/ocr/output(=ホストのマウント元ディレクトリの output/)配下に保存されます。
Mistral OCR MCP Server について
Mistral OCR MCP Server は、everaldo 氏(個人)が公開するコミュニティ実装の MCP サーバーです。Mistral AI 社の OCR API を AI クライアントから呼び出せるようにラップしています。OCR API 自体は Mistral 公式ですが、本 MCP サーバーは Mistral 社の公式提供ではない点に注意してください。
実装は Python 製で、Docker でローカルビルドして実行します(公開 Docker Hub イメージは無く、git clone 後に docker build が必要)。Smithery 経由のワンライナーインストールにも対応します。直接の PyPI 配布は現状なく、ローカルビルドする場合は git clone 後 uv pip install . で開発用インストールも可能です。
スペック
- 配布形態: Docker(ローカルビルド
mcp-mistral-ocr)+ Smithery 経由のワンライナーインストール - 認証: API Key(
MISTRAL_API_KEY環境変数)。加えてOCR_DIR環境変数の設定が必須(存在チェックのみ・コンテナ内パスは/data/ocr固定) - 提供元: everaldo 氏(コミュニティ)/ MIT(OCR API 自体は Mistral 公式)
- 対応範囲: 画像(JPG/JPEG/PNG/GIF/WebP)と PDF(最大 1000 ページ / 50MB)の OCR
- 公式リポジトリ: github.com/everaldo/mcp-mistral-ocr
導入手順
前提条件
- Docker(推奨)または Python 3.10+ + uv(ローカルビルド)
- Mistral La Plateforme のアカウントと API キー
- OCR 結果保存用ローカルディレクトリ
ステップ(Docker 経由・推奨)
- Mistral のコンソールから API キーを発行
git clone https://github.com/everaldo/mcp-mistral-ocr後、docker build -t mcp-mistral-ocr .でローカルビルド(公開 Docker Hub イメージは無いためビルドが必要)- ページ上部のタブから使用環境(Claude Desktop / Cursor / Cline)を選択し、JSON 設定をコピー
<your-mistral-api-key>を発行した API キーに置き換える/path/to/your/filesを OCR 対象ファイルを置くローカルディレクトリに置き換える(コンテナ内では常に/data/ocrにマウントされ、結果は同ディレクトリのoutput/に出力されます)- クライアントを再起動
Smithery 経由(最短)
npx -y @smithery/cli install @everaldo/mcp/mistral-crosswalk --client claude
Claude Desktop 向けのみ。初回起動時に MISTRAL_API_KEY の入力を求められます。
注意事項
- Mistral API キーは必須です。OCR 処理は Mistral 側で実行されるため通信が発生します(料金は Mistral の OCR 価格に依存・無料枠は限定的)。
- 最大ファイルサイズ 50MB、PDF は最大 1000 ページ(Mistral API 側の制限)。
- 機密文書(NDA / 個人情報含む契約書等)をクラウド OCR に送るかは社内のセキュリティポリシーを確認してください。
- 多言語サポートについては README に明示記載がないため、Mistral OCR API の公式ドキュメント を参照してください。
- 本 MCP は everaldo 氏(個人)のコミュニティ実装で、Mistral AI 公式提供ではありません(API は Mistral 公式)。サポート契約等はありません。
- ローカル OCR との使い分け: 小規模・機密文書・オフライン環境では Tesseract ベースのローカル OCR(pdf-mcp 等)が適し、大量 / 複雑レイアウト / 多言語混在は本 MCP(クラウド・高精度)が適します。クラウドに送れない機密文書も pdf-mcp でローカル完結を推奨。
設定方法
MCP は、お使いの対応アプリ(クライアント)に下記の設定を貼り付けて使います。 タブからアプリを選び、表示された設定をコピーしてください。
Claude Desktop: Anthropic 公式のデスクトップ版 Claude アプリ
{
"mcpServers": {
"mistral-ocr": {
"command": "docker",
"args": [
"run", "-i", "--rm",
"-e", "MISTRAL_API_KEY",
"-e", "OCR_DIR=/data/ocr",
"-v", "/path/to/your/files:/data/ocr",
"mcp-mistral-ocr"
],
"env": {
"MISTRAL_API_KEY": "<your-mistral-api-key>"
}
}
}
}
Cursor: AI 機能を内蔵したコードエディタ
{
"mcpServers": {
"mistral-ocr": {
"command": "docker",
"args": [
"run", "-i", "--rm",
"-e", "MISTRAL_API_KEY",
"-e", "OCR_DIR=/data/ocr",
"-v", "/path/to/your/files:/data/ocr",
"mcp-mistral-ocr"
],
"env": {
"MISTRAL_API_KEY": "<your-mistral-api-key>"
}
}
}
}
Cline: VS Code に追加する AI アシスタント拡張
{
"mcpServers": {
"mistral-ocr": {
"command": "docker",
"args": [
"run", "-i", "--rm",
"-e", "MISTRAL_API_KEY",
"-e", "OCR_DIR=/data/ocr",
"-v", "/path/to/your/files:/data/ocr",
"mcp-mistral-ocr"
],
"env": {
"MISTRAL_API_KEY": "<your-mistral-api-key>"
}
}
}
}
主なユースケース
- 「契約書のスキャン PDF から条文をテキスト化して」と頼むと、`process_local_file` で OCR して条文を構造化してくれる
- 「URL の領収書画像から日付と金額を抽出して」と依頼すると、`process_url_file` でリモート OCR して必要情報を抜き出してくれる
- 「論文の図キャプションも含めて全文テキスト化して」と頼むと、Mistral の高精度 OCR でレイアウトを維持しながら抽出してくれる
- 1000 ページ規模の技術書 PDF を一括 OCR し、後段の検索エンジンに渡す前段処理として活用できる
プラットフォーム別の注意事項
- Windows:Docker Desktop の有効化が必要です。WSL2 上での実行を推奨。
- :Smithery 経由のワンライナーインストールも提供されています: `npx -y @smithery/cli install @everaldo/mcp/mistral-crosswalk --client claude`。Claude Desktop に直接インストールされます。
- :ローカルビルドする場合は `git clone` 後 `uv pip install .` で開発用インストール可能(PyPI 直接配布は現状なし)。