
01.
🎬 方案一:角色扮演·导演指令法
不要直接把小说原文扔给 AI,它会懵。你要找一个“懂行”的中间人。
🧠 核心逻辑(分步拆解)
- 设定身份
告诉 deepseek/豆包:“你是一位获得奥斯卡奖的电影摄影师和 AI绘图提示词专家”。 - 下达任务
把小说片段发给它,要求它“将这段文字改写为中英文绘画提示词”。 - 规定格式
要求它按 `[主体] + [环境] + [动作] + [构图] + [光影] + [风格]` 的结构输出。 - 原理
利用 LLM (大语言模型) 强大的理解能力,先把“文学语言”翻译成“摄影语言”,再喂给绘画 AI。
📝 提示词建议
💡 发送给 LLM 的指令:
“你是一位精通 Midjourney 的 AI 绘画专家。请阅读下面这段小说文字,提取其中的画面要素,将其转化为一段高质量的英文绘画提示词。 要求: 1. 去掉所有心理描写,转化为面部表情或肢体动作。 2. 补充合理的每一个环境细节(如天气、光线)。 3. 增加专业的摄影术语(如景深、镜头焦段)。 4. 格式为:Subject, Action, Environment, Lighting, Camera, Style –ar 16:9 小说原文:[在此粘贴你的小说片段]”
🛠️ 建议工具 (含官网直达)
- ChatGPT
https://chat.openai.com (逻辑理解能力最强) - 豆包
https://www.doubao.com (国内免费,中文理解能力极佳,非常适合处理中文小说) - Kimi
https://kimi.moonshot.cn (擅长处理长文本,可一次性分析整章小说)
02.
🧩 方案二:要素拆解·5W1H填空法
如果你不想用 AI 改写,可以自己用“填空题”的方式来强制具体化。
🧠 核心逻辑(分步拆解)
- 提取 Who (主体)
是谁?穿什么衣服?(具体到材质、颜色) - 提取 Where (环境)
在哪里?(具体到时间、天气、周围物品) - 提取 What (动作)
在做什么?(具体到手势、眼神) - 补充 How (形式)
什么画风?什么视角?什么光线? - 原理
强迫自己把“他很生气”这种抽象词,拆解为“紧握的拳头”、“暴起的青筋”、“红色的背景光”等视觉元素。
📝 提示词建议
- 原文
“风雪中,他艰难地前行。” - 转化后 Prompt
`A man in tattered black cloak, walking against heavy snowstorm, leaning forward, struggling, face covered in frost, extreme wide shot, cinematic lighting, cold blue tone –ar 16:9` 一个身着破旧黑袍的男人,顶着暴风雪艰难前行,身体前倾,步履蹒跚,脸上覆盖着寒霜,极远景镜头,电影感打光,冷蓝色调 –ar 16:9 - 技巧
遇到形容词(如“艰难”),一定要问自己:“画面上怎么画出艰难?” > 身体前倾、积雪没过膝盖。
🛠️ 建议工具 (含官网直达)
- Excel / Notion
建立一个表格,列出 `主体 | 动作 | 环境 | 镜头 | 光影` 五列,把小说每一句填进去。
03.
❤️ 方案三:情绪转译·客观描述法
小说里全是“孤独”、“悲伤”、“喜悦”这种词,AI 画不出来怎么办?
🧠 核心逻辑(分步拆解)
- 寻找对应物
文学上叫“客观对应物”。用环境来隐喻心情。 - 孤独 -> 视觉化
一个人 + 空旷的广场 + 只有一盏路灯 + 长长的影子。 - 快乐 -> 视觉化
跳跃的动作 + 暖色调阳光 + 飞舞的鸽子 + 模糊的动态背景。 - 原理
AI 是“唯物主义者”。不要告诉它“心情”,要告诉它“物理现象”。
📝 提示词建议
- 原文
“一种绝望的情绪笼罩着他。” - LLM 转化指令
“请把‘绝望’这个词转化为具体的视觉画面描述,不要出现抽象词汇。” - Result
`A man sitting on the floor in a dark empty room, head in hands, shaft of dim light from a small window, dust floating in air, high contrast, noir style` (黑暗房间,抱头坐地,微光,黑色电影风格)
🛠️ 建议工具 (含官网直达)
- 百度文心一格 / 豆包
(国内免费) 直接问它:“怎么用画面表现‘焦虑’?”它会给你很多视觉灵感。

Midjourney分镜示例
04.
🎥 方案四:视听语言·镜头加持法
小说文字通常是“上帝视角”或“第一人称”,缺乏镜头的概念。
🧠 核心逻辑(分步拆解)
- 判断重点
这段文字重点是表现环境?还是人物表情?还是人物关系? - 匹配镜头
-
表现大环境/孤独感 > Extreme Long Shot (大远景) -
表现动作/关系 > Medium Shot (中景) -
表现微表情/心理 > Close-up (特写) / Extreme Close-up (大特写)
-
- 加入运镜
`Low angle` (低角度仰拍,显高大/压迫感),`Over the shoulder` (过肩镜头,对话感)。 - 原理
加上镜头术语,画面瞬间就有“电影感”,不再像普通的插画。
📝 提示词建议
- Prompt
`Close-up shot of [Character]’s eye, reflection of fire in the pupil, intense look, macro photography –ar 16:9` (眼部特写,瞳孔反射火光…) - 常用词
`Cinematic composition` (电影构图), `Depth of field` (景深/背景虚化).
🛠️ 建议工具 (含官网直达)
- Midjourney
对镜头语言支持最好。 - PromptHero
https://prompthero.com (搜索 “Cinematic” 学习别人的镜头词)
05.
🧠 方案五:细节脑补·扩写法
小说里往往只写“他走进了一个房间”,没写房间里有啥。AI 如果不知道,就会乱画。
🧠 核心逻辑(分步拆解)
- 识别空白
找出原文中未描述的背景细节。 - 合理脑补
根据故事背景(古代?科幻?现代?)和人物身份,填充合理的道具。 - 生成指令
要求 LLM “请根据赛博朋克的背景,详细描写这个房间的内饰,包括墙壁材质、灯光颜色、杂物细节”。 - 原理
AI 的“幻觉”有时候是好事,但我们需要可控的幻觉。让 LLM 先“幻觉”出文本,确认无误后再让AI生图工具画,比直接让生图工具乱画要安全。
📝 提示词建议
- LLM 指令
“小说背景是19世纪伦敦。原文:‘他走进书房’。请扩写书房的视觉细节,体现出他是一个落魄的侦探。” - 扩写结果
`Cluttered study, messy desk covered with papers and maps, cigarette smoke in the air, vintage oil lamp, peeling wallpaper, rainy window background` (凌乱书房,满桌纸张,烟雾,复古油灯,剥落墙纸…)
⚠️ 风险提示
一致性风险:脑补的细节(如书房布局)在下一张图中可能会变。建议把脑补好的环境词固定下来,作为“环境垫图”或固定 Prompt 后缀。
🛠️ 建议工具 (含官网直达)
- Claude 3
https://www.anthropic.com (创意写作能力极强,脑补细节非常合理) - 文心一言 / 豆包
(国内免费) 让它进行“扩写练习”。
06.
🖼️ 方案六:参考图·风格迁移法
文字描述再精准,也不如一张图直观。
🧠 核心逻辑(分步拆解)
- 找意向图
去 Pinterest 或电影截图网,找一张和你想象中画面构图/光影相似的图(内容不一样没关系)。 - 垫图/Sref
- Midjourney
使用 `–sref [图片URL]` (风格一致) 或 `–cref [图片URL]` (角色一致)。 - Stable Diffusion
使用 ControlNet (Depth/Canny) 来控制构图。
- Midjourney
- 文字修改
Prompt 只需描述你的内容,风格和构图交给参考图。 - 原理
用“别人的骨架”装“你的血肉”。解决了文字难以描述复杂的构图和光影质感的问题。
📝 提示词建议
- Prompt
`Two people arguing in a restaurant –sref [URL of a movie screenshot]` - 效果
AI 会画出两个人吵架,但色调、光影、胶片质感完全模仿你提供的电影截图。
🛠️ 建议工具 (含官网直达)
- Shotdeck
https://shotdeck.com (最专业的电影截图库,找参考图神器,付费) - FilmGrab
https://film-grab.com (免费的电影截图库) - 花瓣网
https://huaban.com (国内素材库,免费)
07.
📊 方案七:分镜表格·批量工作流
如果是做漫剧,不要一句句转。要批量转。
🧠 核心逻辑(分步拆解)
- 分段
把小说按“场次”分开。 - 制表
让 LLM 生成一个 CSV 表格,包含:`序号 | 原文 | 画面描述(Prompt) | 景别 | 备注`。 - 校对
人工快速扫一眼 Prompt 列,修正不合理的脑补。 - 批量生图
复制 Prompt 列,使用“方案三”中的批量生图技巧。 - 原理
标准化作业,保证整部剧的节奏感和连贯性。
📝 提示词建议
💡 发送给 LLM 的指令:
“请把下面这章小说改写为 AI 绘画分镜表。输出为 Markdown 表格。 列 1:原文摘要 列 2:英文绘画 Prompt (包含主体、动作、环境、光影、风格) 列 3:建议景别 (Close-up/Wide shot) 保持赛博朋克风格。”
🛠️ 建议工具 (含官网直达)
- 飞书 / 钉钉文档
(国内免费) 支持 Markdown 表格导入,方便团队协作。 - Excel
传统的王道工具。

小说转画面示例
08.
🥊 实战演练:组合拳案例
单纯用一个方案可能不够,高手都是组合出击。下面以经典故事《龟兔赛跑》为例,展示如何灵活拼接 方案一(LLM翻译) + 方案六(风格参考) + 方案七(表格管理),完成一套高质量分镜。
1. 第一步:找“导演”写分镜 (调用方案一)
💡 发送指令给 ChatGPT/豆包
“你现在是迪士尼的动画导演。请把《龟兔赛跑》中‘兔子在树下睡觉,乌龟慢慢爬过’这一段,改写为3个关键画面的英文提示词。 要求:Pixar 3D 风格,画面生动可爱,光线明亮,构图富有张力。”
LLM 输出参考:
- 镜头1 (近景)
兔子靠在树干上呼呼大睡,鼻子上有一个鼻涕泡。 `Close-up of a cute cartoon rabbit sleeping against a large oak tree, snot bubble coming out of nose, peaceful expression, Pixar 3D style, bright sunny day` 
- 镜头2 (中景)
乌龟带着决心的表情,满头大汗地爬过草地,背景模糊看到睡着的兔子。 `Medium shot of a determined turtle crawling on grass, sweat drops on forehead, wearing a red headband, background blurry rabbit sleeping under tree, Pixar 3D style, vibrant colors` 
- 镜头3 (远景)
: 乌龟的背影远去,兔子还在前景睡觉,夕阳西下。 `Wide shot from behind the turtle moving towards the finish line, foreground shows sleeping rabbit, golden hour lighting, warm atmosphere, Pixar 3D style` 
2. 第二步:找“参考”定调性 (调用方案六)
为了保证画风统一,不让兔子一会儿像 2D 一会儿像 3D。
- 找图
去 Pinterest 找一张《疯狂动物城》或《超级马里奥大电影》的剧照。 - 提取参数
假设图片 URL 是 `https://example.com/zootopia.jpg`。 - 合成指令
在每个 Prompt 后面加上 `–sref https://example.com/zootopia.jpg –sw 100` (Midjourney 风格权重参数)。
3. 第三步:进“表格”做管理 (调用方案七)
最后整理成表格,方便批量复制:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
09.
🛡️ 进阶技巧:负面提示词
在把抽象文字转化为画面时,除了告诉 AI “要什么”,告诉它 “不要什么” 往往能奇效地解决画面“脏、乱、丑”的问题。
🧠 核心逻辑
AI 有时候会过度解读或者产生噪点。负面提示词就是“过滤器”,帮你滤除不需要的元素。
📝 常用负面词库 (建议收藏)
- 通用画质优化
`blurry, low quality, pixelated, ugly, deformed, watermark, text` (模糊、低画质、像素化、丑陋、变形、水印、文字) - 防止氛围跑偏
-
如果你要开心的画面:`–no moody, dark, horror, gloomy` (不要阴郁、黑暗、恐怖) -
如果你要写实的画面:`–no cartoon, illustration, drawing, anime` (不要卡通、插画、动漫)
-
- 防止人物崩坏
`bad anatomy, extra fingers, missing limbs, distorted face` (解剖结构错误、多指、肢体缺失、面部扭曲)
💡 使用示例 (Midjourney):
`A beautiful princess smiling –no ugly, dark, blurry, extra fingers`
💡 总结:
把小说变成画,本质上是一次“翻译”。
不是中译英,而是“意译形”(意思翻译成形态)。
善用 LLM 做“翻译官”,善用电影截图做“参考系”,你的文字就能变成惊艳的画面!
本文作者:AI求道者Siri,感谢分享。


