Claude Codeのビジョン機能を使えば、スクリーンショット・帳票・UIデザインなど多様な画像を業務で活用できます。
- 要点1: 画像は4つの方法(ドラッグ&ドロップ、コピペ、パス指定、URL)で添付でき、1ターンで最大20枚処理可能
- 要点2: OCR・エラー診断・UIレビューなど業務に直結する活用シーンが多数あり、帳票処理の工数を大幅削減した事例も報告されている
- 要点3: 単体での画像生成はできないが、MCP経由で外部ツールと連携することで対応可能
対象: Claude Codeを業務で活用したい経営者・DX推進担当者・非エンジニア
今日やること: エラー画面や帳票のスクリーンショットを1枚コピーして、Claude Codeに貼り付けて分析させてみる
この記事の目次
Claude Codeのビジョン機能を使えば、スクリーンショット・帳票・UIデザインなど多様な画像を業務で活用できます。
「Claude Codeで画像は使えるの?」「スクリーンショットを分析させるにはどうすればいいの?」——こうした疑問を持つ方は多くいます。
この記事では、Claude Codeへの画像の渡し方から、帳票OCR・エラー診断・UIレビューといった実務活用シーン、さらに画像生成への対応方法まで、実践的に解説します。
Claude Codeの画像機能(Vision)とは?
Claude Codeは、テキストだけでなく画像を読み取って理解する「ビジョン機能」を備えています。写真・スクリーンショット・図表・手書きメモなど、さまざまな画像を分析して回答・処理することが可能です。
できること・できないことを整理
まず、Claude Codeの画像機能で「何ができて、何ができないか」を整理しておきましょう。
できること:
| 機能 | 具体的な用途 |
|---|---|
| 画像認識・内容説明 | 写真の内容を説明・分類する |
| OCR(文字読み取り) | 帳票・レシート・名刺のテキストを抽出 |
| スクリーンショット分析 | エラー画面の診断、UIのフィードバック |
| 図表・グラフの読み取り | データの傾向分析、数値の抽出 |
| 複数画像の比較 | 変更前後の差分分析 |
| 手書きメモの解読 | 議事録・ノートの文字起こし |
できないこと:
- Claude Code単体での画像生成(ラスター画像の出力)— ただしMCP連携や外部ツールとの組み合わせで対応可能。詳しくは後述します
- リアルタイムのカメラ映像の取り込み(静止画のみ対応)
ポイント「Claude Codeで画像生成できますか?」という質問をよく受けますが、単体では直接的な画像ファイルの生成はできません。ただし、SVGやHTMLを使った図表生成、MCP経由での外部サービス連携など、実務では十分に対応できます。
対応している画像形式と仕様
Anthropic公式ドキュメントによると、Claude Codeが対応する画像の仕様は以下の通りです。
| 項目 | 仕様 |
|---|---|
| 対応形式 | JPEG / PNG / GIF / WebP |
| 最大サイズ | 8,000 × 8,000 ピクセル |
| 推奨サイズ | 長辺1,568ピクセル以内(パフォーマンス最適) |
| 1ターンの上限 | 最大20画像(claude.ai)/ 最大100画像(API経由) |
一般的なスクリーンショットや帳票写真であれば、ほぼそのまま使用できます。
Claude Codeに画像を渡す4つの方法
実際にClaude Codeへ画像を送信する方法は4つあります。目的に応じて使い分けましょう。
方法1:ドラッグ&ドロップ(最もシンプル)
ファイルエクスプローラー(またはFinder)から画像ファイルをClaude Codeのチャット欄にドラッグ&ドロップするだけです。
- 操作手順: Finderでファイルを選択 → Claude Codeのターミナルまたはチャット画面にドロップ
- こんな時に使う: ローカルに保存された画像ファイルをすぐに送りたいとき
方法2:クリップボードからの貼り付け(最も素早い)
スクリーンショットを撮った直後に貼り付ける方法です。
- Mac:
Cmd + Shift + 4でスクリーンショット → クリップボードに保存(Ctrlを同時押し)→ Claude CodeでCmd + V - Windows:
Win + Shift + Sでスクリーンショット →Ctrl + Vで貼り付け - こんな時に使う: エラー画面やUIのスクリーンショットをすぐに分析させたいとき
注意(WSL環境の方へ)WindowsのWSL(Windows Subsystem for Linux)環境では、クリップボードからの直接貼り付けに制限がある場合があります。一度ファイルに保存してからパス参照を使うか、専用のスクリプトを活用することをお勧めします。
方法3:ファイルパスで参照(プロジェクト内の画像)
Claude Codeが作業中のディレクトリ内に画像ファイルがある場合、ファイルパスを指定して読み込ませることができます。
# 例:プロジェクト内のスクリーンショットを分析させる
「screenshots/error-2026-03-16.png を分析して、エラーの原因と解決策を教えてください」
- こんな時に使う: 自動化スクリプトでキャプチャした画像を順次分析させたいとき
方法4:URLで指定(公開されている画像)
インターネット上で公開されている画像のURLを指定して分析させることもできます。
「https://example.com/product-image.jpg の商品画像から、説明文を日本語で作成してください」
- こんな時に使う: Webサイトの競合調査や商品情報の整理
業務で使えるスクリーンショット分析の活用法
画像の渡し方を理解したら、実務での活用シーンを見ていきましょう。スクリーンショット分析は、業務効率化において特に効果的です。
エラー画面の診断と解決策の取得
システムやアプリのエラーが発生した際、スクリーンショットをそのままClaude Codeに渡して原因と解決策を取得できます。
活用例のプロンプト:
(エラー画面のスクリーンショットを貼り付けて)
このエラー画面を見て、発生している問題の原因と、解決するための手順を教えてください。
社内システムの担当者に共有できる形でまとめてください。
以前はエンジニアに問い合わせて数時間待つことが多かったエラー診断が、数分で初期対応まで完了できるケースが増えています。
UIデザインのレビューとフィードバック
変更前・変更後のUIのスクリーンショットを2枚同時に送り、差分分析やフィードバックを受け取ることができます。
活用例のプロンプト:
(before.png と after.png を添付)
この2つの画面を比較して、
① 変更された箇所の一覧
② ユーザビリティの観点からの改善点
③ デザインの一貫性に関するコメント
をまとめてください。
デザインレビューの会議準備に要する時間を大幅に削減した事例が報告されています。
Webページの現状確認とコンテンツ分析
競合サイトや自社サイトのスクリーンショットを分析させることで、コンテンツ改善のインサイトを素早く取得できます。
活用例のプロンプト:
(競合サイトのスクリーンショットを添付)
このWebページのキャッチコピー・CTAボタンの配置・訴求ポイントを分析して、
自社サイトに取り入れるべきポイントを3つ提案してください。
帳票・文書画像のOCRと情報抽出
Claude Codeのビジョン機能は、OCR(文字認識)としても活用できます。紙の帳票や画像化された書類からテキストやデータを抽出する業務に特に効果的です。
レシート・請求書の自動データ化
経費精算や仕入れ管理において、紙のレシートや請求書を写真で撮影してClaude Codeに渡すだけで、構造化データに変換できます。
活用例のプロンプト:
(レシートの写真を添付)
このレシートの情報を以下の形式でJSON形式に変換してください:
- 店舗名
- 日付
- 購入品目(品名・単価・数量・小計)
- 合計金額
- 支払い方法
専用のOCRツール(年間数十万円のものもある)の代替として、Claude Codeを活用する企業が増えています。
名刺・手書きメモの読み取り
展示会でまとめて入手した名刺や、会議中の手書きメモをまとめて文字起こしする作業も自動化できます。
活用例のプロンプト:
(名刺の写真を添付)
この名刺の情報をCSV形式(氏名, 会社名, 部署, 役職, メールアドレス, 電話番号)で出力してください。
読み取れない部分は[不明]としてください。
PDF画像からの情報抽出
スキャンして画像化されたPDFや、テキストデータが埋め込まれていないPDFからの情報抽出にも対応しています。
契約書・仕様書・過去の議事録など、デジタル化されていない資料のデータベース化を効率的に進めることが可能です。
画像生成はどう対応する?MCPとの組み合わせ
「Claude Codeで画像を生成したい」というニーズも多くあります。単体では直接的な画像ファイル生成はできませんが、以下の方法で対応が可能です。
Claude Code単体で「画像生成」はできない理由
Claude Codeが基盤とするClaudeモデルは、テキスト・コード・分析に特化した設計になっています。ラスター画像(JPEG・PNG等の写真形式)の生成は現時点では対応していません。
ただし、これは業務上の大きな制約ではありません。実務で必要な「図・チャート・ダイアグラム」はコードベースで生成できるからです。
MCP連携による画像生成の方法
Claude CodeのMCP(Model Context Protocol)機能を使えば、外部の画像生成サービスとの連携が可能です。
| 連携方法 | 生成できる画像の種類 | 難易度 |
|---|---|---|
| DALL-E API(OpenAI) | 汎用的なイラスト・画像 | 中 |
| Stable Diffusion(ローカル) | 高品質な画像・写真 | 高 |
| Gemini(Google) | 汎用画像・デザイン向け | 中 |
MCP連携の設定についてはClaude Code MCP連携ガイドをご参照ください。
図・チャートはClaude CodeのSVG生成で対応
プレゼン資料や報告書に使う図解・フローチャート・組織図などは、Claude CodeにSVGコードやHTMLを生成させる方法が実用的です。
「以下の業務フローをSVGのフローチャートとして生成してください:
① 受注入力 → ② 在庫確認 → ③ 出荷指示 → ④ 請求処理」
また、2026年3月にAnthropicが発表した「インラインインタラクティブビジュアライゼーション」機能により、claude.aiのチャット内で動くグラフ・図解を自動生成できるようになりました。データビジュアライゼーションの用途であれば、外部ツール不要で対応可能です。
企業での活用事例5選
実際の業務でClaude Codeの画像機能がどのように活用されているか、業種別の事例を紹介します。
事例1:製造業 — 品質検査レポートの画像分析
製品の検査写真をClaude Codeに送り、不良品の判定基準に沿って分類・レポート化する用途で活用。- 効果: 検査担当者の報告書作成時間を1件あたり約20分 → 5分に短縮- プロンプト: 「この製品写真を見て、[社内基準書の内容]に基づき合否判定と理由をまとめてください」
事例2:小売業 — 商品画像の説明文自動生成
ECサイト用の商品画像から商品説明文を自動生成。1日100〜200品の登録作業の大幅な省力化を実現。- 効果: 商品説明文の作成工数を約60%削減- プロンプト: 「この商品画像をもとに、ECサイト用の日本語商品説明文(200文字)を作成してください」
事例3:経理部門 — 帳票OCRによる月次処理の自動化
紙の領収書・請求書の写真をまとめてClaude Codeに送り、Excelに転記するためのデータを一括抽出。- 効果: 月次の帳票処理時間を半日 → 1時間程度に短縮- 注意点: 金額の確認は人間が最終チェックを行う運用が推奨される
事例4:IT部門 — スクリーンショットテストの自動化
コード変更後のUIをClaude Codeに自動スクリーンショットで確認させ、デザイン崩れを検出するワークフローを構築。- 効果: テスト工数の削減と、見落としによるバグの早期発見- 技術: Playwright MCPとClaude Codeを組み合わせた「ラウンドトリップ・スクリーンショットテスト」
事例5:マーケティング — 競合サイトのUI分析とレポート作成
競合他社のWebサイト・広告画像を定期的にスクリーンショットして、Claude Codeに分析させ競合レポートを自動生成。- 効果: 週次の競合調査レポート作成時間を3時間 → 30分に短縮
よくある質問
Q. Claude Codeは画像生成できますか?
Claude Code単体ではJPEGやPNGなどのラスター画像の直接生成には対応していません。ただし、SVGやHTMLによる図表生成、MCP経由での外部画像生成APIとの連携により実務上の画像生成ニーズに対応できます。2026年3月にリリースされたインラインインタラクティブビジュアライゼーション機能を使えば、チャット内で動くグラフの生成も可能です。
Q. WindowsのWSL環境で画像を添付するにはどうすればいいですか?
WSL環境ではクリップボードからの直接貼り付けに制限がある場合があります。一度Windowsのファイルシステムに画像を保存し(/mnt/c/Users/...)、ファイルパスで参照する方法が安定しています。または、スクリーンショットを自動的にWSL内のフォルダに保存するスクリプトを活用する方法も有効です。
Q. 大量の画像を一括処理することはできますか?
Claude CodeのAPIを使えば、1リクエストで最大100画像まで処理できます。ただし、claude.aiのUI上では1ターン最大20枚が上限です。大量処理が必要な場合は、Claude Code APIとAPI連携ガイドを組み合わせたスクリプトを組むことをお勧めします。
Q. 画像認識の精度はどの程度ですか?
Claude 4モデルファミリーのビジョン機能は業界トップクラスの精度を持ち、特に文書OCRや図表読み取りにおいて高い認識率を発揮します。ただし、手書き文字の読み取りや、解像度が低い画像では精度が下がる場合があります。重要なデータは人間による確認を合わせて行うことを推奨します。
Q. スクリーンショット分析でセキュリティ上の問題はありますか?
Claude APIを使用する場合、入力データはAnthropicのプライバシーポリシーに従って処理されます。機密情報を含むスクリーンショット(個人情報・財務情報等)の取り扱いには注意が必要です。企業での利用においては、社内のAI利用ガイドラインに基づいた運用を設定してください。詳しくはClaude Codeセキュリティガイドをご参照ください。
まとめ
Claude Codeの画像機能(Vision)を活用することで、スクリーンショット分析・帳票OCR・UIレビュー・競合調査など、多様な業務を効率化できます。
この記事でお伝えした要点を振り返ります:
- 4つの画像の渡し方: ドラッグ&ドロップ、クリップボード貼り付け、パス参照、URL指定
- 主な活用シーン: エラー診断、UIレビュー、帳票OCR、商品説明文生成、競合分析
- 画像生成への対応: 単体では生成不可だが、MCP連携やSVG生成で実務上の代替が可能
- 2026年の最新機能: インタラクティブビジュアライゼーションによるチャット内グラフ生成に対応
まずはスクリーンショット1枚を貼り付けて分析させてみるところから始めてみてください。エラー画面の診断や帳票の文字起こしなど、すぐに効果を実感できる用途から試してみることをお勧めします。
Claude Codeのさらなる活用法についてはClaude Codeでできることもあわせてご参照ください。





