寫 AI 繪圖 prompt 最常見的方法是「一隻企鵝在用電腦」這樣丟一句話,然後等 AI 隨機給結果。運氣好偶爾能用,運氣不好要重新生 7、8 次。把 prompt 結構化之後,成功率能從大概三成拉到七成。這篇整理小企鵝實際在用的方法。

Prompt 的四層結構

寫 prompt 拆成四個區塊,每個區塊回答一個問題:

第一層:主體。要畫什麼?

最基本的一層。描述主角、場景、動作。越具體越好。「一隻企鵝」跟「一隻戴著橘色圍巾、坐在書桌前的小企鵝,面前有一台打開的筆電」,生出來的結果完全不同。

第二層:風格。什麼風格?

水彩、3D 渲染、像素風、彩色鉛筆、日系插畫、極簡線條。風格決定整張圖的「感覺」。彩色鉛筆和平面插畫風是相對不會有 AI 味的選擇。

第三層:構圖。怎麼擺?

鏡頭角度(俯視、平視、仰角)、主體在畫面的位置(中央、三分法偏左)、留白位置(右邊留空放文字)、比例(16:9 橫幅、1:1 方形)。

第四層:約束。不要什麼?

這層很多人會忽略,但對控制產出品質很有效。「不要文字」「不要黃色嘴巴」「不要過度飽和的顏色」「不要照片寫實風」。

Prompt 四層結構

Gemini/ChatGPT 實際指令範例

以下幾組是小企鵝在 Gemini 上實際用過的格式。

範例 1:部落格封面圖

主體:一隻小企鵝坐在桌前,面前擺著三台螢幕,螢幕上顯示不同的 AI 工具介面
風格:彩色鉛筆風格,柔和暖色調,略帶手繪感
構圖:16:9 橫幅,企鵝在畫面左三分之一處,右側留白可放標題文字
約束:不要照片寫實風,不要過度銳利的邊緣,不要黃色尖嘴(嘴巴是橘色圓形)

範例 2:社群配圖

主體:一隻小企鵝拿著放大鏡,看著一段散發光芒的程式碼
風格:平面插畫風格,色塊分明,有輕微紋理
構圖:1:1 方形,主體置中,背景簡潔
約束:不要 3D 效果,不要漸層背景,背景用單一淺色

範例 3:教學步驟示意圖

主體:一個簡單的流程圖,左邊是麥克風圖示,中間是 AI 處理的齒輪圖示,右邊是字幕文字圖示,用箭頭連接
風格:線條插畫,深藍配橘色,乾淨俐落
構圖:16:9 橫幅,三個元素等距排列
約束:不要寫實圖片,不要多餘裝飾元素,如果有文字請用英文

這些範例的共同特點:用中文寫、結構清楚、每個部分各佔一行。Gemini 對這種格式的理解度很高,不需要像 Midjourney 那樣用英文加上一堆 -- 參數。

更多場景 Prompt:直接複製就能用

上面三組偏工具型。下面這幾組是實際工作時最常切換的場景。

文章封面圖(部落格、新聞稿)

場景: 部落格文章、電子報、新聞稿要配的主圖。尺寸通常 16:9,右側要留給標題。 適用工具: Gemini/ChatGPT(首選,指令理解最好)、Midjourney(翻成英文後用) 使用方式: 把主題和標題關鍵字填進去,貼進 Gemini 聊天視窗。

主體:桌上散落著三本筆記本、一杯冒著熱氣的咖啡、一台打開的筆電,螢幕顯示簡單的文字編輯器
風格:水彩風格,柔和的早晨光線,略帶紙張紋理
構圖:16:9 橫幅,物件集中在左半邊,右半邊留空白可以疊標題文字
色調:暖米色背景配淺褐和淡藍,整體飽和度偏低
主題關鍵字:[填主題,例如:晨間寫作習慣]
禁止:文字、logo、3D 效果、過度銳利的邊緣、高飽和度的鮮豔色塊

小企鵝提示: 部落格封面要記得跟版面主色相呼應。實際做法是先貼一張既有封面,告訴 Gemini「參考這張的色調」,一致性會好很多。

社群貼文配圖(IG、Threads、X)

場景: 短貼文要配的方形圖或 4:5 直幅圖。要吸睛、在滑動時能停住視線。 適用工具: Gemini、ChatGPT、Midjourney 使用方式: 依平台選比例,1:1 放 X 和 Threads,4:5 放 IG 和 Facebook。

主體:一個簡單的視覺隱喻,表達 [貼文主題,例如:資訊焦慮]
風格:平面插畫,色塊分明,有一點點手繪不規則感
構圖:1:1 方形,主角置中偏上,下方留三分之一空間給疊字
色調:低飽和的莫蘭迪色系,主色深藍灰配一點暖橘
氛圍:安靜、帶一點幽默感,像朋友在說一件小事
禁止:文字、臉部特寫、高飽和霓虹、漸層背景、3D 渲染

小企鵝提示: 社群圖最怕「太像」其他人。固定一個配色 palette(例如深藍灰加暖橘),每張貼文都套同一組,看久了粉絲會認得這是你的圖。

產品宣傳圖(電商、募資)

場景: 電商商品頁、募資頁的情境圖。要讓人看到就想買,又不能像罐頭素材。 適用工具: Gemini/ChatGPT(首選,可以上傳產品照參考)、Midjourney(做氛圍圖用) 使用方式: 一定要上傳一張真實的產品照再用這段 prompt。

主體:參考上傳的產品,把它放進一個日常使用的場景:[例如 週末下午的書桌上,旁邊放著翻開的書和一杯茶]
風格:生活攝影感,自然光,淺景深
構圖:4:5 直幅,產品在畫面中央偏下三分之一的位置,上方背景稍微虛化
光線:側光,從畫面右上方進來,在產品上形成柔和的陰影
氛圍:慢、安靜、有生活感,像隨手拍下的一瞬間
禁止:塑膠感、過度光滑、AI 味人物、握手和西裝商務場景、偽造產品細節
重要:產品的外觀、顏色、logo 必須跟上傳的圖完全一致,不能改動

小企鵝提示: 最後一行「產品外觀不能改動」很重要。Gemini 有時候會善意地幫忙「美化」產品,結果畫出來的東西跟實品差一個色號,客戶會生氣。

人物插圖(避免 AI 臉的技巧)

場景: 部落格插圖需要出現人物。AI 畫的臉常常有不自然的眼神和牙齒。 適用工具: Gemini、ChatGPT、Midjourney 使用方式: 關鍵是避開正面特寫、改用背影或側臉。

主體:一個人坐在窗邊的書桌前,從背後或側面看過去,手邊有一本書和一支筆
風格:彩色鉛筆手繪風,紙張紋理明顯,線條略有抖動感
構圖:16:9 橫幅,人物在畫面左側三分之一處,不顯示正面五官
角度:從後斜上方 45 度俯視,看到後腦勺和肩膀,臉部朝向窗外
色調:午後陽光的暖橘配淡綠,低飽和
禁止:正面人臉、牙齒特寫、對視鏡頭的眼神、塑膠感皮膚、完美五官

小企鵝提示: 只要 prompt 裡有「正面」「特寫」這類字,AI 就很容易畫出怪臉。改用「背影」「側臉 45 度」「只到肩膀」這些描述,幾乎不會出錯。如果真的需要臉,建議改用真人素材或自己拍。

資訊圖表(流程圖、比較圖)

場景: 文章裡要一張簡單的示意圖說明流程或比較。不是正式的 infographic。 適用工具: Gemini/ChatGPT(可以畫簡單線條圖)、手動用 Figma 做(最穩,AI 出來的圖常常字會糊) 使用方式: 如果圖裡有文字,建議讓 AI 畫純圖形,文字自己用 Figma 疊上去。

主體:一張簡單的三步驟流程圖,三個圓角方塊由左到右排列,中間用箭頭連接
元素:
  第一格:一張紙的圖示,代表輸入資料
  第二格:齒輪和 AI 晶片的組合,代表處理
  第三格:一個對話框圖示,代表輸出
風格:極簡線條插畫,粗細一致的描邊,沒有填色或只填淺色
構圖:16:9 橫幅,三個方塊等距排列,背景留白
色調:背景純白 #FFFFFF,線條深灰 #2D3748,重點色用一點淺藍 #90CDF4
禁止:任何文字(中英都不要)、3D 立體、漸層、陰影、多餘裝飾

小企鵝提示: 最後那句「任何文字都不要」是關鍵。AI 畫字幾乎一定會糊或錯字,不如直接留空,回 Figma 再疊乾淨的中文。這招可以省掉一整輪重試。

參考圖:提高一致性的關鍵

純文字 prompt 有一個天花板:AI 對「腦中的畫面」永遠只能猜。參考圖可以大幅拉近這個差距。

實際做法是直接把圖片上傳到 Gemini,然後告訴它「參考這張圖的風格和角色造型,生成以下內容」。

這招在解決角色一致性問題上特別有效。例如品牌企鵝有橘色圓嘴,但 AI 的訓練資料裡真企鵝都是黃色尖嘴,光用文字強調「橘色圓嘴」常會被模型「拉回」黃色尖嘴。附上參考圖之後,錯誤率明顯下降。

Prompt 最佳化前後對比

怎麼降低 AI 感

AI 生圖有一種一眼就能認出來的「AI 感」。高飽和度、過度光滑的質感、每個邊緣都銳利到不自然、光影太完美、漸層。降低這個問題有幾種方式:

指定有紋理的風格。 彩色鉛筆、水彩、粉彩、蠟筆。這些風格自帶不規則的筆觸和紋理,天然就比 3D 渲染風格更不像 AI。

降低飽和度。 在 prompt 裡加上「柔和色調」「低飽和」「muted colors」。AI 預設的顏色偏向高飽和,壓下來之後整體看起來舒服很多。

加一點不完美。 「略帶手繪感」「邊緣不要太銳利」「自然的光影,不要過度 HDR」。這些小指令可以讓成品少一點那種「太乾淨」的感覺。

避開 AI 最擅長的風格。 超寫實人像、科幻場景、3D 產品渲染圖。這些是 AI 的舒適區,一生成就很明顯是 AI 做的。彩色鉛筆、手繪這類「不完美」風格的 AI 感反而會低很多。

小企鵝品牌的配圖幾乎都用彩色鉛筆風格,原因很單純:最不容易被一眼看出是 AI 生成的。

踩坑:企鵝嘴巴的故事

這個坑值得單獨講,因為它呈現了 AI 生圖的一個根本限制。

品牌企鵝有橘色圓嘴。很簡單的特徵,但 AI 就是會畫錯。

第一個直覺是 prompt 寫得不夠清楚,於是加了 the penguin has an brown rounded beak, NOT yellow, NOT pointy。有改善,但還是偶爾出錯。

實際原因是模型訓練資料裡有數百萬張企鵝照片,絕大多數企鵝嘴巴都是黃色尖的。prompt 再怎麼強調,模型的「本能」還是會把它拉回黃色尖嘴。

最終解法是參考圖加文字約束一起上。附上一張嘴巴正確的參考圖,同時在 prompt 裡明確寫出「orange rounded beak」。雙管齊下之後成功率才穩定。

教訓:AI 的產出跟訓練資料有很強的關聯。要的東西跟訓練資料裡的常見樣式不同時,光靠文字描述不夠,一定要給視覺參考。

各工具 Prompt 寫法比較

比較項目Gemini(Nano Banana Pro / Nano Banana 2)Midjourney 最新版ChatGPT 內建(GPT Image 2.0)
語言中文、英文都行只吃英文中文可以(對話自動轉譯)
格式自然語言,不用特殊語法需要 --ar--style 等參數自然語言,對話式
負面約束直接寫「不要 XX」--no 參數直接寫「不要 XX」
參考圖上傳圖片加文字描述用圖片 URL 加 /describeChatGPT 對話可以附圖
風格控制用文字描述風格--style raw 加風格關鍵字用文字描述,控制力較弱
上手難度

不同模型版本的細節差異可以再看 Gemini 免費版 vs Pro 版差異

完整生圖流程

從想圖到完成的流程:

  1. 先想好這張圖的用途和放置位置
  2. 用四層結構寫 prompt(主體、風格、構圖、約束)
  3. 如果涉及品牌角色,附上參考圖
  4. 生成 3-4 張,挑最接近的
  5. 如果都不對,調整 prompt 裡最弱的那一層,再生一輪
  6. 挑好之後用 Figma 做最後微調(加文字、調配色、裁切)

整個流程一張圖大約 5-15 分鐘。第一次畫的新場景會久一點,因為要多試幾輪抓到對的方向。

FAQ

AI 繪圖 prompt 怎麼寫才不會出奇怪的圖?

關鍵是結構化。把 prompt 拆成四個區塊:主體、風格、構圖、約束。每個區塊寫得越具體,AI 偏離預期的機率越低。特別注意約束層,明確告訴 AI 什麼不要,比告訴它什麼要更有效。

為什麼 AI 畫的圖看起來很假?

多半是風格問題。AI 預設的渲染風格偏向高飽和、光滑質感、過度銳利,這就是所謂的「AI 感」。指定手繪、水彩、彩色鉛筆等有紋理的風格可以大幅降低這種感覺。

AI 繪圖 prompt 可以用中文寫嗎?

看工具。Gemini 與 ChatGPT 對中文 prompt 的理解度很好,直接用中文寫就行。Midjourney 只吃英文,要自己翻譯或請 AI 幫忙轉成英文 prompt。

Prompt 裡最容易被忽略的部分是什麼?

約束層。大部分人只告訴 AI「要什麼」,但沒說「不要什麼」。加上負面約束(不要文字、不要過度飽和、不要黃色嘴巴之類的),能大幅減少需要重新生成的次數。

怎麼讓 AI 每次生出風格一致的圖?

附參考圖是最有效的方法。把一張已經確認 OK 的圖上傳,然後請 AI 參考這張圖的風格。同一個 session 內連續生成也能維持一定的一致性,但隔天重開就會跑掉。


小企鵝的經驗

小企鵝最早接觸 AI 生圖是在 Midjourney 早期 Discord 介面那段時間。後來主力切到 Gemini 與 ChatGPT,理由很簡單:中文指令服從度好、可以直接上傳參考圖、品牌角色一致性比純文字描述穩很多。Canva 的 AI 生圖也試過一陣子,色彩漸層的處理跟整體質感不太合用,後來就沒再回去。

「彩色鉛筆 + 禁漸層」這組關鍵字是小企鵝品牌圖的固定底色。原因是 AI 預設那種高飽和、漸層、3D 質感的風格太容易被一眼認出,彩色鉛筆風格自帶手繪紋理和不規則感,掉到 AI 味的機率最低。

Prompt 庫的累積也是這幾年慢慢做出來的習慣。每次找到好的指令結構就存下來,下次需要類似主題的圖直接拿出來改幾個字,比每次從零開始快很多。pen-pings 系列就是把這些常用 prompt 整理出來的分享格式。

Prompt 這件事沒有盡頭。每次換一個工具版本,之前好用的寫法可能就不管用了,不同模型跑出來的也會有不一樣結果。長期來看,能穩定產出可用圖的關鍵在於建立自己的指令庫,依照工具版本逐步迭代,而不是死守某一組「神 prompt」。

延伸閱讀


整理:Penna|小企鵝 Penchan