Claude Code × PDF|読み取り・要約・データ抽出を自動化する方法

Claude Code PDFのイメージ画像

Claude CodeはPDFの読み取り・要約・データ抽出をプログラミング不要で自動化でき、企業の文書処理工数を最大80%削減できます。

  • 要点1: テキストPDF・スキャンPDF(画像PDF)の両方に対応。日本語文書も高精度で処理
  • 要点2: 請求書・契約書・月次レポートなど業務文書を自然言語指示だけで構造化データに変換できる
  • 要点3: フォルダ内の複数PDFを一括処理するワークフローを構築すれば、月20時間の作業が5分に短縮

対象: PDF処理の自動化を検討している経営者・DX推進担当者・バックオフィス担当者

今日やること: 手元の請求書PDFをClaude Codeに渡し、「この請求書から金額・振込先・支払期日を抽出してください」と指示してみる

Claude CodeはPDFの読み取り・要約・データ抽出をプログラミング不要で自動化できます。自然言語で指示するだけで、テキスト抽出からCSV変換まで一気通貫で処理できるため、経理・法務・総務など多くの業務部門で活用が広がっています。

「毎月、取引先から届く請求書PDFを手動で台帳に転記している」「大量の契約書PDFから期限を確認するのに時間がかかる」——こうした課題を抱える企業は少なくありません。

この記事では、Claude CodeでPDFを処理する基本操作から、業務別の実践レシピ、複数ファイルの一括処理ワークフローまでを解説します。まずは手元の1枚のPDFから試せる内容になっています。

Claude CodeのPDF処理機能とは?基本を3分で理解する

Claude CodeはAnthropicが開発したAIコーディングエージェントです。コード作成だけでなく、ファイルの読み取り・分析・変換も得意としており、PDFはその代表的な処理対象の一つです。

重要なのは、Claude CodeがPDFを「画像として見る」のではなく、「内容を理解する」という点です。単純な文字起こしにとどまらず、文書の構造を把握した上で、必要な情報を抽出・整理・要約まで行えます。

テキストPDFと画像PDF(スキャン)の違い

Claude CodeはPDFの種類に応じて異なる処理を行います。

PDFの種類 特徴 Claude Codeの処理方法
テキストPDF Wordや一般的なソフトで作成されたPDF。テキスト情報がデータとして埋め込まれている テキスト層を直接読み取り。高速・高精度
画像PDF(スキャン) 紙文書をスキャンして作成したPDF。内容が画像として保存されている Vision機能(OCR)で画像を解析し文字を認識。日本語・英語ともに対応

どちらのタイプでも自然言語で同じように指示できます。Claude Codeが自動的に判断して最適な処理を選択します。

Claude CodeのVision機能でできること

Claude 3.5 Sonnetのマルチモーダル(Vision)機能により、画像として保存されたPDFでも高精度な処理が可能です。Anthropicの公式評価では、グラフ解析や複雑な表の読み取りにおいて従来モデルを上回る精度を記録しています。

日本語文書への対応も充実しており、縦書き文書・複雑な帳票レイアウト・手書き文字(限定的)まで認識できます。実務での導入企業からは「手作業と比較して工数を80%以上削減できた」という報告も出ています。

ポイントClaude CodeはPDFを渡す際に「何をしてほしいか」を自然言語で指示するだけです。Pythonのコードを書く必要はありません。「このPDFを要約して」「表をCSVに変換して」といった指示で処理が始まります。

Claude CodeでPDFを処理する4つの基本操作

Claude CodeでPDFを処理する際の基本的な操作パターンは4つです。いずれもClaude Codeが起動した状態で、ファイルを指定しながら自然言語で指示するだけで実行できます。

PDFをClaude Codeに渡す方法

Claude CodeでPDFを処理するには、以下のように指示します。

このPDFを処理してください: /path/to/document.pdf
(ここに処理内容の指示を続ける)

または、Claude Codeが動いているディレクトリと同じ場所にPDFを置いて、ファイル名だけで指定することもできます。

report.pdf を読み込んで、内容を要約してください。

実務では、処理対象のPDFを特定のフォルダ(例: ~/Documents/invoices/)に集約しておくと、後述の一括処理ワークフローと連携しやすくなります。

テキスト抽出・Markdown変換

PDFの内容をテキスト形式やMarkdown形式に変換することで、他のツールへの連携やドキュメント管理システムへの取り込みがしやすくなります。

指示例:

annual_report_2025.pdf のテキストをMarkdown形式に変換してください。
見出し構造を保持し、表は Markdown テーブル形式で出力してください。

この処理は、Qiitaでの実践報告によると「論文・技術レポートのPDFを1コマンドでMarkdown変換でき、GitHub上で閲覧できるようになった」という活用方法が紹介されています。

要約・サマリー生成

長文PDFを読む前に全体像を把握したい場合や、複数の関係者に配布する要約資料を作りたい場合に有効です。

指示例:

board_meeting_minutes_202603.pdf を読んで、
以下の3点を箇条書きでまとめてください:
1. 主要な決定事項
2. 次回アクションアイテム(担当者・期限付き)
3. 要フォローアップ事項

特定情報の抽出(構造化データ化)

PDFから特定の情報項目だけを抜き出してJSON・CSVなどの構造化データにすることで、データベースへの登録や集計・分析が容易になります。

指示例:

invoice_march2026.pdf から以下の情報を抽出して、
JSON形式で出力してください:
- 発行日
- 請求先会社名
- 請求金額(税抜・税込)
- 振込先銀行・口座番号
- 支払期限

これらの基本操作を組み合わせることで、次のセクションで紹介する業務別のユースケースに対応できます。

業務別・PDF自動化の実践レシピ5選

ここでは企業でよく使われる5つのPDF処理ユースケースを、Claude Codeへの指示プロンプト例とともに解説します。

請求書処理:金額・振込先・期日を自動抽出してCSV化

毎月届く請求書の内容を手動で台帳に転記する作業は、多くの経理担当者が課題に感じているものです。Claude Codeを使えば、この作業を数秒で完了できます。

指示例:

~/invoices/ フォルダ内のすべてのPDFを読み込み、
各請求書から以下の情報を抽出してCSVファイルを作成してください:
ファイル名, 発行日, 請求先, 請求元, 金額(税抜), 消費税, 合計, 振込期限, 振込先

出力ファイル: ~/invoices/invoice_list_202603.csv

ある中小製造業では、月次発注レポートPDFから品目・数量・単価をこの方法で自動抽出するようにした結果、月20時間かかっていた集計作業が5分に短縮されたという事例があります。

契約書管理:契約先・期間・金額・更新条項を一覧表に

法務担当者が抱える「どの契約書がいつ期限を迎えるか把握できていない」という問題も、Claude Codeで解決できます。

指示例:

~/contracts/ フォルダ内の契約書PDFをすべて読み込み、
以下の情報を抽出してMarkdownの表形式で出力してください:
- 契約先会社名
- 契約種別(業務委託・売買・NDA など)
- 契約期間(開始日・終了日)
- 契約金額(月額・年額)
- 自動更新条項の有無
- 解約通知期限
- 注目すべき特記事項(あれば)

自動更新条項がある契約を見落として更新されてしまうリスクを防げるほか、契約台帳の整備工数を大幅に削減できます。

月次レポート:グラフ・表の数値を読み取り比較分析

販売レポートや財務レポートに含まれるグラフ・表の数値を読み取り、前月比較や傾向分析を自動化できます。

指示例:

sales_report_202603.pdf と sales_report_202602.pdf を読み込み、
売上・利益率・主要KPIについて前月比較を行い、
増減の理由として考えられることもあわせて分析してください。

Claude 3.5 SonnetのVision機能は投資レポートのグラフ解析においても高い精度を持ち、「このグラフが示す傾向を教えてください」という自然言語の質問に対して具体的な回答を返せます。

議事録PDF:アクションアイテムを自動抽出

会議後に配布される議事録PDFからアクションアイテムだけを抜き出し、担当者・期限付きのタスクリストを自動生成できます。

指示例:

minutes_20260315.pdf を読んで、
アクションアイテムを担当者・期限・内容の形式で箇条書きにまとめてください。
担当者や期限が明示されていない場合は「未定」と記載してください。

技術文書・マニュアル:目次生成・セクション要約

長い技術仕様書やマニュアルPDFから、必要な箇所だけをすばやく把握したい場合に活用できます。

指示例:

system_manual_v3.pdf を読んで、
1. 文書全体の目次を生成してください
2. 第3章「セキュリティ設定」の内容を500文字以内で要約してください
3. 「パスワードポリシー」に関する記述をすべて抜き出してください

Claude Codeの活用、何から始めればいい?

無料でClaude Codeの活用について相談に乗ります。お気軽にお問い合わせください。

無料相談はこちら →

複数PDFを一括処理するワークフローの構築方法

単発の処理から一歩進んで、フォルダ内の複数PDFを自動的に処理するワークフローを構築しましょう。

フォルダ内の全PDFを一括処理する手順

Claude Codeは特定のフォルダ内にあるすべてのPDFを順番に処理する能力があります。

指示例:

~/Documents/monthly_invoices/202603/ フォルダ内の
すべてのPDFファイル(*.pdf)を読み込み、
各ファイルから請求元・金額・支払期日を抽出して
invoice_summary.csv として同フォルダに保存してください。
処理したファイル数と合計金額も最後に表示してください。

Claude Codeはこの指示を受けると、フォルダ内のPDFを自動的にリストアップし、1件ずつ処理して結果を集約します。処理が完了したら「12件のPDFを処理しました。合計金額: ¥3,456,789」のような報告を返します。

処理結果をCSV・スプレッドシートに出力する方法

抽出したデータを使いやすい形式で出力するには、出力形式を明示的に指定します。

出力形式 適した用途 指示の書き方
CSV ExcelやGoogleスプレッドシートへの連携 「CSVファイルとして保存してください」
JSON APIやシステム連携 「JSON形式で出力してください」
Markdown表 ドキュメントやSlack共有 「Markdownの表形式でまとめてください」
テキスト メール・報告書への貼り付け 「箇条書きでまとめてください」

定期実行ワークフローへの発展

Claude Codeの処理スクリプトをシェルスクリプトやPythonスクリプトとして保存しておくことで、毎月1日に自動実行するワークフローに発展させることもできます。

指示例:

以下の処理を毎月1日に自動実行するシェルスクリプトを作成してください:
1. ~/invoices/new/ フォルダ内のPDFを処理
2. 請求書情報をCSVに追記
3. 処理済みファイルを ~/invoices/processed/ に移動
4. 完了メールを info@example.com に送信

Claude Codeがスクリプトを作成した後、cronジョブとして登録するための手順まで案内してくれます。

Claude CodeのPDF処理でつまずきやすいポイントと対処法

実際にPDF処理を試みると、いくつかの問題に直面することがあります。よくある問題と対処法を事前に把握しておきましょう。

スキャンPDFの認識精度が低い場合

スキャンの品質が低い場合(解像度不足・傾き・汚れなど)、OCR精度が低下することがあります。

対処法:

  • スキャン品質を300dpi以上に設定して再スキャン
  • Claude Codeに「画像品質が低い可能性があります。読み取れた部分だけでも抽出してください」と伝える
  • 複数回処理して結果を照合する

PDFのサイズ・ページ数制限への対応

Claude APIには1回のリクエストで処理できるPDFのサイズ・ページ数に上限があります(Anthropic公式ドキュメントによると、PDFは最大100ページ、ファイルサイズは32MB以下が推奨)。

対処法:

  • 大きなPDFは「第1章から第3章だけを処理してください」のようにセクションを指定
  • Claude Codeに「このPDFを50ページずつに分割して処理してください」と依頼すると自動的に分割処理してくれる

表・図が正確に読み取れない場合

複雑なレイアウトの表や低解像度のグラフは、完全な精度での読み取りが難しい場合があります。

対処法:

  • 「表の内容を読み取り、読み取れなかった箇所は [不明] と記入してください」と指示する
  • 処理後に「抽出した数値に自信がないものはフラグを立ててください」と追加指示する
  • 重要なデータは必ず原本と照合する

よくある質問

Q. Claude CodeはPDFを直接読み込めますか?

はい、読み込めます。Claude Codeにファイルパスを指定して「このPDFを〜してください」と指示するだけです。PDFをClaude.ai(Web版)にアップロードする必要はなく、ローカルファイルを直接指定できます。

Q. スキャンしたPDF(画像PDF)も処理できますか?

処理できます。Claude 3.5 SonnetのVision(画像認識)機能を使ってOCRを行い、文字を認識します。テキストPDFと同じように自然言語で指示するだけで、Claude Codeが自動的に画像PDFと判断して適切な処理を行います。ただし、スキャン品質が低い場合は認識精度が下がるため、300dpi以上でのスキャンを推奨します。

Q. 複数のPDFをまとめて処理できますか?

できます。「このフォルダ内の全PDFを〜」という指示でフォルダ内のPDFを一括処理できます。請求書100枚をまとめてCSV化する、契約書フォルダを一括で台帳化するといった処理も自然言語の指示だけで実行可能です。

Q. 日本語PDFも精度よく読み取れますか?

精度よく読み取れます。Claude 3.5 SonnetはAnthropicの評価において日本語OCRで高い認識精度を示しており、縦書き文書・複雑な帳票レイアウトにも対応しています。日本語と英語が混在するPDFも正確に処理できます。

Q. 処理できるPDFのサイズ・ページ数に上限はありますか?

Anthropic公式ドキュメントによると、推奨上限は100ページ以下、32MB以下です。これを超える大きなPDFの場合、Claude Codeに「50ページずつに分けて処理してください」と指示することで対応できます。

まとめ

Claude CodeはPDFの読み取り・要約・データ抽出をプログラミング不要で自動化できるツールです。この記事の要点を振り返ります。

  • 基本操作は4つ: ファイル指定・テキスト抽出/Markdown変換・要約・情報抽出(構造化)
  • 業務別レシピ5選: 請求書処理・契約書管理・月次レポート分析・議事録処理・技術文書要約
  • 一括処理ワークフロー: フォルダ内の複数PDFを一括処理してCSVに出力。月20時間→5分の短縮も実現
  • つまずきポイントと対処法: スキャン品質・ページ数制限・複雑な表への対応策を把握しておく

まず試してほしいのは、手元の請求書PDF1枚をClaude Codeに渡して「この請求書から金額・振込先・支払期日を抽出してください」と指示してみることです。その結果を見れば、業務への応用イメージが具体的に掴めるはずです。

さらに詳しく学びたい方はClaude Code 始め方ガイドClaude Code × 非エンジニア入門も参考にしてください。

Claude Codeの活用、何から始めればいい?

無料でClaude Codeの活用について相談に乗ります。お気軽にお問い合わせください。

無料相談はこちら →




この記事の監修者

川島陸

株式会社Nexa 代表取締役

川島 陸

一橋大学経済学部卒業後、フォーティエンスコンサルティング株式会社(旧 株式会社クニエ)にて法人向けAI導入支援等を経験。独立後、AI系メディア運営やDify/n8nの導入支援を経て、株式会社Nexaを創業。法人向けAI研修・AI導入支援・AI関連メディア運営を手掛ける。

関連記事

AIの力で、ビジネスを次のステージへ

まずはお気軽にご相談ください。貴社に最適なAI活用プランをご提案します。