AI画像生成で「文字が崩れない図解」を作る──編集部が動画制作で使う要素列挙式プロンプトの型

ChatGPT等の画像生成で日本語入りの図解を作ると文字化け・数字の改変が起きやすい。編集部がYouTube動画用の図解で直近8枚連続「日本語・数字の崩れゼロ」を観測した「要素列挙式プロンプト」の型を、実例プロンプト全文と検品手順つきで公開する。

AI画像生成に日本語入りの図解を頼むとき、「いい感じの比較図を作って」ではなく、存在してよい要素を番号付きで全部列挙し、文字列は一字一句指定し、禁止事項まで明記する──この頼み方（編集部内での呼び名は「要素列挙式プロンプト」）に切り替えてから、編集部のYouTube動画用図解は直近8枚連続で日本語・数字の崩れゼロだった。本記事はその型を、実例プロンプト全文と検品手順つきで公開する。

3行まとめ ・「いい感じに」と頼むと文字化け・数字の改変・頼んでいない要素の混入が起きる。AIに構図の自由を渡すほど文字が犠牲になる・対策は要素列挙式：①要素を番号付きで列挙②文字列は一字一句指定③配色はhexコード④禁止事項明記⑤サイズ/比率指定──の5点をプロンプトに全部入れる・編集部の動画用図解で直近8枚連続、日本語・数字の崩れゼロを観測（2026年7月時点・ChatGPT系での検証）

なぜ「いい感じの図解を作って」だと崩れるのか

編集部が実際に踏んだ失敗は3種類ある。

文字化け：日本語が存在しない漢字のような字形になる。特に画数の多い漢字と長い文で起きやすい
数字の改変：「38%」と頼んだのに図の中では「35%」になっている。ぱっと見では気づかない
要素の湧き出し：頼んでいない人物イラスト、英語のダミーテキスト、意味不明なアイコンが勝手に足される

共通の原因は、プロンプトが「何を描くか」をAIの解釈に委ねている点にある。自由度を渡した分だけ、AIは「図解っぽい飾り」を足し、文字を「文字っぽい模様」として描く。逆に言えば、解釈の余地を潰せば崩れは減る、というのが編集部の観測だ。

型：プロンプトに入れる5要素

要素列挙式プロンプトの核は次の5点をすべて入れることだ。

#	要素	書き方	潰したい事故
1	要素の番号付き列挙	「この画像に存在してよい要素は以下の6つだけ」と宣言し、1.タイトル 2.左カラム…と列挙	頼んでいない要素の湧き出し
2	文字列の一字一句指定	「文字列は一字一句この通りに」と明記し、入れる文字を全部書く	文字化け・勝手な言い換え
3	配色のhexコード指定	「背景は#FFFFFF、見出し帯は#1A73E8」	「いい感じの配色」による毎回のブレ
4	禁止事項の明記	「人物・ロゴ・英語のダミーテキスト・グラデーションを入れない」	飾りの混入
5	サイズ/比率指定	「16:9の横長、1枚」	用途に合わない縦横比

ポイントは1の「〜だけ」という閉じ方だ。「これを入れて」ではなく「存在してよいのはこれだけ」と書く。追加を許すか許さないかで、湧き出しの頻度が目に見えて変わった。

実例プロンプト（全文）

架空の題材だが、型は編集部が実運用しているものそのままだ。

16:9の横長インフォグラフィックを1枚作成してください。

この画像に存在してよい要素は以下の6つだけです。
それ以外の要素（人物、ロゴ、アイコン、英語のダミーテキスト、
装飾模様）は一切描かないでください。

1. 上部にタイトル帯（背景#1A73E8、白文字）。
   文字列は一字一句この通りに：「電動自転車 2モデル比較」
2. 左カラムの見出し。文字列：「モデルA」
3. 右カラムの見出し。文字列：「モデルB」
4. 左カラムの本文3行。文字列：
   「価格 98,000円」「航続 45km」「重量 22kg」
5. 右カラムの本文3行。文字列：
   「価格 128,000円」「航続 70km」「重量 19kg」
6. 下部の注記1行（小さめのグレー#666666文字）。
   文字列：「価格は2026年7月時点の税込表示」

配色は背景#FFFFFF、左カラム背景#E8F0FE、右カラム背景#FCE8E6。
グラデーションは使わない。フラットなデザイン。
文字はすべて読みやすいゴシック体で、指定した文字列以外の
文字を画像内に入れないでください。

長い。だが「いい感じに」と3回作り直すより、この1本を書く方が速い──というのが運用しての実感だ。

検品の作法──AIの図の数字は信用しない

生成できたら終わりではない。編集部では生成後に数字と固有名詞を1文字ずつ目視で照合する。「98,000」が「98,000」のままか、「45km」が「45km」か。図全体の雰囲気で確認した気になるのが一番危ない。数字の改変はレイアウトが綺麗なときほど見逃す。

崩れていた場合は、全部を作り直させず「要素4の『98,000円』が『96,000円』になっています。要素4だけ修正して再生成してください」と、番号で該当要素だけを指摘する。番号付き列挙はこの再指示のためのインフラでもある。

編集部での実績と、この記事を書いている当事者の話

この型は机上の提案ではない。本サイトの記事図版と、編集部YouTubeチャンネルの動画内図解は、実際にこの頼み方で運用している。動画用の図解では、要素列挙式に切り替えてから直近8枚連続で日本語・数字の崩れゼロを観測した（2026年7月時点）。8枚という数字は誇張でも丸めでもなく、そのままの枚数だ。切り替え前は「文字だけ後からPillow（画像処理ライブラリ）で焼き込む」フォールバックを常備していたが、現在は出番がほぼない。

正直に書いておく限界

モデルの世代で挙動が変わる。本記事は2026年7月時点のChatGPT系画像生成での検証で、将来のモデルや他社モデルで同じ結果になる保証はない
グラフの正確な比率は苦手。棒グラフの高さや円グラフの角度を数値通りに描かせるのは安定しない。編集部では「比率は模式的でよい」と指示し、比率が正確である必要があるグラフはコード（matplotlib等）で描いている
再現性はない。同じプロンプトでも毎回同じ絵は出ない。「型で事故率を下げる」ものであって「同じ図を再生成する」手段ではない

出典・但し書き

本記事の「直近8枚連続で崩れゼロ」は、AI時短ラボ編集部の動画用図解制作における観測事実であり、統制された比較実験ではない。サンプル数も8枚と少ない
検証環境は2026年7月時点のChatGPT系画像生成。他モデル・他時点での再現は未確認
実例プロンプト内の製品・数値はすべて架空

この型を試して「崩れた/崩れなかった」の報告をもらえたら、モデル別の傾向として本記事に追記していく。編集部の8枚に読者の観測が積み重なるほど、型の輪郭は正確になる。

AI画像生成で「文字が崩れない図解」を作る──編集部が動画制作で使う要素列挙式プロンプトの型

なぜ「いい感じの図解を作って」だと崩れるのか

型：プロンプトに入れる5要素

実例プロンプト（全文）

検品の作法──AIの図の数字は信用しない

編集部での実績と、この記事を書いている当事者の話

正直に書いておく限界

出典・但し書き

📎 出典・一次ソース

このニュースの解説動画も作っています

コメント

AIについて聞きたいことはありますか？

関連記事

AI翻訳はどこまで任せていいか──Google・DeepL・AirPodsの現在地と実務の線引き（2026年版）

AIに「ルールを読め」は効かない──読むまで作業をブロックする仕組み（hooks）の作り方

AIに資料を頼むなら「HTMLで」と言う──企画書・比較表・レポートの頼み方を変える一言