Gemini APIの画像生成をClaude Codeスキルとして組み込むことで、サムネイルや挿絵の生成を指示一発で自動化できます。
- 要点1: google-genaiライブラリを使えばPython数十行でGemini画像生成が動作する
- 要点2: macOS KeychainでAPIキーを管理することで.envファイル不要の安全な運用が可能
- 要点3: SKILL.mdにトリガーとワークフローを記述するだけでカスタムスキルとして再利用できる
対象: Claude Codeを使って画像生成を業務に組み込みたいDX推進担当者・エンジニア
今日やること: Google AI StudioでAPIキーを発行し、macOS Keychainに登録する
この記事の目次
Claude CodeにGemini APIの画像生成スキルを組み込むことで、SEO記事のサムネイル・提案資料の挿絵・SNSバナーなど、さまざまな用途の画像生成を「コマンド一発」で自動化できます。
「毎回Canvaや画像生成ツールを開くのが手間」「デザインのトーンマナーが揃わない」——こうした課題を抱えながら、AIを活用しきれていない企業は少なくありません。
この記事では、Google Gemini APIを使った画像生成スクリプトの構築から、Claude Codeカスタムスキルへの組み込み、macOS Keychainによる安全なAPIキー管理まで、実務運用を前提に解説します。
Gemini APIの画像生成機能とは?モデル別の特徴
Gemini APIとは、Google DeepMindが開発したマルチモーダルAI「Gemini」をAPIとして利用できるサービスです。テキスト生成だけでなく、2026年現在では高品質な画像生成にも対応しており、3種類のモデルが用途に応じて選択できます。
Nano Banana(gemini-2.5-flash-image)—— 高速・低コストの標準モデル
社内では「Nano Banana」と呼んでいる gemini-2.5-flash-image は、高速処理と低コストが特徴のモデルです。解像度は1K固定で、Google検索との連携には非対応ですが、日常的なサムネイル生成や挿絵制作には十分な品質を提供します。
Nano Banana 2(gemini-3.1-flash-image-preview)—— テキスト描画が向上した最新モデル
2026年2月にリリースされた gemini-3.1-flash-image-preview は、日本語テキストの描画精度が大幅に向上したモデルです。512px / 1K / 2K / 4Kの4段階の解像度に対応しており、Google検索を活用したグラウンディング機能も利用できます。日本語タイトルを画像に埋め込む用途(サムネイルなど)では、このモデルを優先して選択することをおすすめします。
Nano Banana Pro(gemini-3-pro-image-preview)—— 最高品質が必要なケースに
gemini-3-pro-image-preview は3モデルの中で最も高品質な出力が得られるモデルです。1K / 2K / 4Kに対応しており、重要な提案資料や印刷物向けの素材生成に適しています。処理速度はflash2よりも遅く、コストも高めのため、用途を絞って使うのが実務的です。
| モデル名 | 解像度 | Google Search | 主な用途 | コスト |
|---|---|---|---|---|
| flash(Nano Banana) | 1K固定 | 非対応 | 日常的なサムネイル | 低 |
| flash2(Nano Banana 2) | 512px / 1K / 2K / 4K | 対応 | 日本語テキスト入り画像 | 中 |
| pro(Nano Banana Pro) | 1K / 2K / 4K | 対応 | 高品質素材・印刷物 | 高 |
ポイント日本語テキストをサムネイルに描画する場合、flash2モデルが最もバランスが取れています。2Kで生成しておくことで、WordPressや各SNS媒体での縮小表示でも文字の視認性が確保されます。
事前準備:APIキーの取得とKeychainへの登録
Gemini APIを使用するには、Google AI StudioでAPIキーを発行し、安全に管理する必要があります。環境変数(.envファイル)への記載はGitリポジトリへの誤コミットリスクがあるため、macOS Keychainを使った管理を強く推奨します。
Google AI StudioでAPIキーを発行する
- Google AI StudioにGoogleアカウントでログインします
- 左側のメニューから「Get API key」をクリックします
- 「Create API key」ボタンを押し、プロジェクトを選択(または新規作成)します
- 表示されたAPIキーをコピーして安全な場所に控えておきます
APIキーは一度しか表示されないわけではありませんが、コンソール上で確認できる機会を最小限にするためにも、取得後すぐに次のKeychain登録を行いましょう。
macOS Keychainへの登録と読み出し方法
macOS Keychainとは、macOSに標準搭載されたパスワード・認証情報の管理機能です。アプリケーションのパスワードやAPIキーを暗号化して安全に保存でき、securityコマンドでCLIから読み書きできます。
Keychainへの登録(ターミナルで実行):
security add-generic-password \ -a "$USER" \ -s "GEMINI_API_KEY" \ -w "ここにAPIキーを貼り付け" \ -U
PythonスクリプトからKeychainを読み出す実装例:
import subprocessimport osdef get_api_key_from_keychain(): """macOS KeychainからGEMINI_API_KEYを取得する""" try: result = subprocess.run( ["security", "find-generic-password", "-a", os.environ.get("USER", ""), "-s", "GEMINI_API_KEY", "-w"], capture_output=True, text=True, timeout=5 ) if result.returncode == 0: return result.stdout.strip() except (subprocess.TimeoutExpired, FileNotFoundError): pass return None# APIキーの取得(環境変数 > Keychain の優先順位)api_key = os.environ.get("GEMINI_API_KEY") or get_api_key_from_keychain()
この実装により、.envファイルなしでAPIキーを安全に利用できます。チーム開発においても、各メンバーが自分のKeychainにAPIキーを登録するだけで、コード側の変更は不要です。
Claude Codeの導入や活用方法について、個別にご相談いただけます。「Gemini APIをどう業務に組み込むか」「スキルの設計で詰まっている」という段階からでも対応しています。
\ Claude Codeの導入、何から始めればいいかわかります /
法人向けClaude Code個別指導の無料相談はこちらPythonスクリプトの実装——基本構造と設計ポイント
APIキーの準備ができたら、実際に画像を生成するPythonスクリプトを実装します。google-genaiライブラリを使うことで、数十行のコードでGemini APIの画像生成機能を呼び出せます。
仮想環境のセットアップ(nano-banana-venv)
スクリプト専用の仮想環境を用意することで、システムのPython環境を汚染せずに依存パッケージを管理できます。
# 仮想環境の作成とパッケージのインストールpython3 -m venv /tmp/nano-banana-venvsource /tmp/nano-banana-venv/bin/activatepip install google-genai Pillow
/tmp/ 以下に配置することで、OSの再起動時に自動削除されます。永続的に保存したい場合は ~/.venv/nano-banana/ などの固定パスを使用してください。
基本的な画像生成のコード構造
以下は、google-genaiを使ったシンプルな画像生成の実装例です。実際の運用では、引数解析(argparse)やエラーハンドリングを加えたスクリプトとして管理するのが効率的です。
import osfrom google import genaifrom google.genai import types# APIキーの設定api_key = os.environ.get("GEMINI_API_KEY") # またはKeychain読み出し関数client = genai.Client(api_key=api_key)# 画像生成の実行response = client.models.generate_content( model="gemini-3.1-flash-image-preview", # Nano Banana 2 contents=["A minimalist corporate thumbnail with dark navy background"], config=types.GenerateContentConfig( response_modalities=["TEXT", "IMAGE"], image_config=types.ImageConfig( aspect_ratio="16:9", image_size="2K", ) ))# 画像の保存for part in response.candidates[0].content.parts: if hasattr(part, "inline_data") and part.inline_data: with open("output.png", "wb") as f: f.write(part.inline_data.data) print("画像を output.png に保存しました")
解像度・アスペクト比の設定方法
解像度は image_size パラメータ("512", "1K", "2K", "4K")、アスペクト比は aspect_ratio パラメータ("16:9", "1:1", "9:16" など)で指定します。
| 用途 | 推奨アスペクト比 | 推奨解像度 |
|---|---|---|
| Webサイト/ブログ アイキャッチ | 16:9 | 2K |
| X(旧Twitter)記事サムネイル | 5:2(生成後クロップ) | 2K |
| Instagram / SNS投稿 | 1:1 | 1K |
| スマホ向け縦型コンテンツ | 9:16 | 1K |
| 印刷物・高品質素材 | 用途に応じて | 4K |
コマンドライン引数として外部から指定できるようにしておくと、用途に応じて柔軟に変更できます。
# 使用例source /tmp/nano-banana-venv/bin/activate && \python3 generate_image.py \ --prompt "ダークネイビー背景のコーポレートサムネイル。白い大きな日本語タイトル「AI研修」" \ --output ~/Desktop/thumbnail.png \ --model flash2 \ --aspect-ratio "16:9" \ --resolution 2K
Claude CodeスキルへのSKILL.md設計
画像生成スクリプトが動作したら、Claude Codeのカスタムスキルとして組み込む設計を行います。スキルとして管理することで、「画像を生成して」「サムネを作って」といった自然言語の指示でスクリプトを呼び出せるようになります。
Claude Codeのカスタムスキルとは、SKILL.md という設計書ファイルをベースに動作する拡張機能です。どのような状況でスキルが起動するか(トリガー)、何をどの順序で実行するか(ワークフロー)を記述することで、Claude Codeが自律的に処理を進めます。(Claude Code Skillsの設計パターンはこちら →)
スキルディレクトリ構成
~/.claude/skills/nano-banana/├── SKILL.md # スキルの設計書├── scripts/│ └── generate_image.py # 画像生成スクリプト└── references/ └── style-presets.md # スタイルプリセット一覧(任意)
スクリプトは scripts/ フォルダに配置し、プロンプトのサンプルや利用可能なスタイル一覧は references/ に整理しておくと、スキル自体が自己参照できる構成になります。
SKILL.mdの記述パターン——トリガーとワークフローの設計
---name: nano-bananadescription: Gemini APIで画像を生成・編集するスキル。 「画像を生成」「サムネを作って」「Geminiで画像」などのリクエストでトリガー。---# 画像生成スキル## トリガー- 「画像を生成して」「サムネイルを作って」- 「Nano Bananaで」「Geminiで画像」## ワークフロー1. ユーザーから以下を確認する - 生成したい画像の説明 - 出力先パス - モデル(flash / flash2 / pro) - アスペクト比・解像度(任意)2. venvをアクティベートしてスクリプトを実行する## 実行コマンド\`\`\`bashsource /tmp/nano-banana-venv/bin/activate && \python3 ~/.claude/skills/nano-banana/scripts/generate_image.py \ --prompt "{プロンプト}" \ --output "{出力パス}" \ --model flash2 \ --aspect-ratio "16:9" \ --resolution 2K\`\`\`
スタイルプリセットの設計でブランドを統一する
複数の記事やコンテンツに統一感のある画像を量産する場合、スタイルプリセットの設計が効いてきます。
ある企業のメディアチームでは、「ダークネイビー背景×白の大きな日本語テキスト×テーマ別のホログラムオブジェクト」というデザインルールをプロンプトテンプレートに落とし込み、33種類のプリセットとして管理しています。カテゴリ(AI活用・DX導入・セキュリティなど)ごとに背景色とヒーローオブジェクトを変えるルールを設けることで、画像のバリエーションを保ちながらブランドの統一感を維持しています。
この仕組みにより、以前は1枚あたり15〜30分かかっていたアイキャッチ画像の制作が、プロンプト確認込みで1〜2分に短縮されました。
\ 業務自動化のお悩み、プロが30分で整理します /
法人向けClaude Code個別指導の無料相談はこちら実務活用事例——こんな業務で使える
スキルとして組み込んだGemini画像生成は、さまざまな業務シーンで活用できます。
SEO記事のアイキャッチ画像を自動生成する
記事公開のワークフローに画像生成スキルを組み込んだ事例では、記事タイトルとカテゴリをスキルに渡すだけで、SEOメタに沿ったサイズ(16:9)のアイキャッチ画像が生成されます。WordPressへのアップロードも後続のスキルが自動処理するため、コンテンツ担当者は画像生成の操作を意識せずに記事公開まで完結できます。
具体的には、記事の構成案ファイル(Markdown)をインプットとして受け取り、タイトルからプロンプトを自動組み立て → Gemini APIで画像生成 → WP-CLI経由でアイキャッチとして設定するまでを一連の自動処理として実装しています。
提案スライドに挿絵を一括生成する
提案資料の作成では、スライドの骨子(Markdown形式)をClaude Codeに渡すと、各スライドの内容に合わせた挿絵をGemini APIで一括生成するワークフローを構築できます。
あるコンサルティング会社の事例では、10ページの提案スライド用に10枚の挿絵を一括生成するフローを構築した結果、従来2〜3時間かかっていた挿絵の選定・加工作業が30分以内に収まるようになりました。
SNS用の統一感あるバナーを量産する
SNS運用において、各投稿に統一感のある画像を添付したい場合にも有効です。プリセット化されたプロンプトテンプレートを使えば、担当者がデザインの知識を持たなくても、ブランドカラーやフォントスタイルが統一された画像を量産できます。
うまくいかないときの対処法
APIキーが見つからない場合
Pythonスクリプトが GEMINI_API_KEY が見つかりません と表示する場合、以下の順序で確認します。
- Keychainに登録されているか確認:
security find-generic-password -a "$USER" -s "GEMINI_API_KEY" -w - サービス名のスペルミスを確認(大文字・小文字の区別あり)
- 別の方法として、環境変数に直接設定:
export GEMINI_API_KEY="your-key"
日本語テキストが正確に描画されない場合
Gemini APIの画像生成において、日本語テキストの描画精度はモデルによって異なります。flashモデルでテキストが崩れる場合は、flash2に切り替えることで改善することが多いです。
また、プロンプトに引用符でテキストを明示的に指定することも効果的です(例: display "AI研修" as a massive Japanese headline)。解像度を1Kから2Kに上げることで、文字の視認性が向上するケースもあります。
画像が生成されずエラーになる場合
google.genai モジュールがインポートできない場合は、仮想環境がアクティベートされているか確認してください。source /tmp/nano-banana-venv/bin/activate を実行後に再度試してみてください。
OSの再起動後に /tmp/ 以下の仮想環境が消えている場合は、セットアップコマンドを再実行します。常時利用する場合は、ホームディレクトリ下(例: ~/.venv/nano-banana/)に仮想環境を配置することをおすすめします。
\ AI活用の「次の一手」を一緒に考えませんか /
法人向けClaude Code個別指導の無料相談はこちらよくある質問
Q. Gemini APIの画像生成は無料で使えますか?
画像生成機能には無料枠が設定されておらず、すべてのリクエストが従量課金の対象になります。Imagen 4の場合、Fast版が1枚あたり$0.02、標準版が$0.04、Ultra版が$0.06です。flash2モデルについては公式の料金ページで最新情報を確認することをおすすめします。なお、テキスト生成のGemini APIには無料枠(1日約500リクエスト)が設けられています。
Q. 生成した画像を商用利用してもよいですか?
Google AI Studioの利用規約では、APIを通じて生成したコンテンツの商用利用が認められています。ただし、他者の著作権を侵害するプロンプトや、差別的・有害なコンテンツの生成は禁止されています。企業での利用前に、最新の利用規約を必ず確認してください。
Q. ChatGPT(DALL-E)とGeminiどちらが良いですか?
両者はそれぞれ特徴が異なります。DALL-E 3はリアルな写真風の表現が得意なのに対し、Gemini APIはイラスト・グラフィック・テキスト描画に強みがあります。また、GeminiはGoogleのエコシステム(Google Search、Workspace)との連携が優れており、Claude Codeスキルとしての統合もスムーズです。用途に応じて使い分けるのが実務的なアプローチです。
Q. 解像度を4Kにするとコストはどう変わりますか?
解像度によるコストの変化はモデルと料金プランによって異なります。解像度を上げると処理時間が長くなり、場合によって1リクエストあたりのコストに影響することがありますが、基本的には「1枚あたりの料金」で課金されます。品質と費用のバランスを考えると、Webコンテンツには2K、印刷物には4Kという使い分けが現実的です。
まとめ
この記事では、Gemini APIの画像生成機能をClaude Codeのカスタムスキルとして組み込む方法を解説しました。
- モデル選択: 日本語テキスト描画にはflash2、最高品質にはproを選択する
- APIキー管理: macOS Keychainへの登録でセキュアかつ環境変数不要な運用が実現できる
- スキル化: SKILL.mdにトリガーとワークフローを記述することで自然言語指示で画像生成が動作する
画像生成の自動化はスキル単体でも価値がありますが、記事執筆→サムネイル生成→WordPress公開のように後続スキルと連携させることで、コンテンツ制作ライン全体を自動化できます。まずはGoogle AI StudioでAPIキーを取得し、Keychainへの登録から始めてみてください。
Claude Codeの導入・活用をサポートします
株式会社Nexaでは、Claude Codeを活用した業務自動化の個別指導・企業研修を提供しています。Gemini APIとの連携スキル構築や、画像生成ワークフローの設計など、「何から始めればいいかわからない」という段階からご支援いたします。





