Gemini画像解析ショートカットを作ってみました | イージーライフ日記

🛠 Gemini画像解析・自動ログ保存付き：構成ガイド

STEP 1：事前準備

フォルダ作成: iPadの「ファイル」アプリで、iCloud Drive直下に「Gemini_Logs」フォルダを作成。
APIキー: Google AI Studioのキーを用意。

STEP 2：ショートカットの全行程

スクリーンショットを撮る
Base64エンコード: （入力：スクリーンショット / 折り返し：なし）
テキスト: （後述のJSONコード）
URLの内容を取得: （後述のAPI設定）
辞書の値を取得（★ここが抽出の肝）:
- キー: candidates.1.content.parts.1.text
- 入力: URLの内容
日付を取得: （現在の時刻を取得）
テキスト（ログ整形）:
- [日付]
- （改行キーを一回押す）
- [辞書の値]
- （改行キーを三回押して余白を作る）
- --------------------
ファイル: （手動で作った Gemini_Logs フォルダを一度だけ指定）
テキストファイルに追記:
- 追加するテキスト： ステップ7のテキスト
- ファイル： ステップ8のファイル
結果を表示: [辞書の値]

STEP 3：コピー用データ

① JSON（テキストアクション用）

JSON

{
  "contents": [{
    "parts": [
      {"text": "この画面について日本語で簡潔に解説してください。"},
      {"inline_data": {
        "mime_type": "image/png",
        "data": "[Base64エンコード]"
      }}
    ]
  }]
}

② URLの設定（最新モデル）

URL: https://generativelanguage.googleapis.com/v1beta/models/gemini-3-flash-preview:generateContent?key=あなたのAPIキー
方法: POST
ヘッダ: Content-Type : application/json
要求本文: ファイル（上記JSONを指定）

設定の画面はMacの方がわかりやすかったので、載せておきます

4. 運用のポイント

起動方法: 「設定」>「アクセシビリティ」>「タッチ」から、**「背面タップ」や「AssistiveTouch」**にこのショートカットを割り当てると、どの画面からでも即起動できます。
カスタマイズ: JSON内の「日本語で簡潔に〜」の部分を、「WordPressの修正案を出して」や「予約内容を要約して」と書き換えるだけで、用途別の専用ツールに進化します。

これで、スクリーンショットを撮るだけでGeminiを起動することなく回答を得られるようになりました。ただ、実際に運用してみるとアプリ版の方がレスポンスが速いため、常用はしないかもしれません。とはいえ、シチュエーション次第では非常に強力なツールになると感じています。

カテゴリー: AI

Geminiは「スクショ」で聞くのが一番早い！活用術まとめ

2026年1月28日

プログラム未経験者がゲームを作ってみた

2026年1月30日

PAGE TOP