一、前言
本文的灵感来源是佬友的帖子 Nano Banana 动漫图转真人 cos 照总是不够真实?试试这个方法!
再加上之前刷到有佬友说 https://labs.google 网站可以白嫖使用nano banana pro(前提是有个 google 账号),所以想起写这篇教程,希望佬友也能收获心仪的图片,接下来直接上步骤。
应佬友们的建议,先贴上成品图

没错,其实我就是吴彦祖(bushi
二、准备工作
一张你的自拍
要求:
正脸或微侧脸
清晰
不要滤镜太重
一张动漫角色图
此处特别提醒,不要选择场景复杂的漫画角色图片,最好是纯净的角色立绘,不然根据场景的复杂程序要进行不同程序的提示词微调
要能看清:
- 发型
- 衣服
- 饰品
工具
推荐用:
使用 Google 的 Nano Banana Pro 或者 Openai的 GPT images 2 (实测图生图的效果还是 Nano Banana Pro 好一点,不知道是不是因为我的 GPT 是 free 号,效果属实一般)
豆包(根据图片生成内容描述,这个随便哪个能识图的工具都行,我用豆包只是顺手而已)
三、一步一步做(照着来就行)
下面的提示词会提供中英双语版,英语建议直接复制粘贴使用,中文的用以理解步骤并进行自己的微调
Step 1:先生成“真人全身”(锁住人物)
上传:
只上传【自拍图】
提示词
中文:
基于参考图 1,生成一张逼真的、包含全身的影棚风格照片,人物须与参考图 1 中的对象完全一致。
身份要求:
保持与图 1 中完全一致的面部特征。
必须是同一人,不得有任何改动。
姿势:
直立站姿,正对镜头。
双臂放松,自然垂放。
全身可见(从头到脚)。
环境:
- 纯绿色幕布背景(干净、均匀、无纹理)。
视觉质量:
-
逼真的皮肤质感,毛孔清晰可见。
-
自然的影棚布光效果。
-
呈现单反相机拍摄的质感。
严格限制:
禁止生成动漫、卡通、插画或 3D 渲染风格的图像。
手中不得持有任何道具。
不得对人物外貌进行任何修改。
英文:
Based on reference image 1, generate a realistic full-body studio photo of the exact same person.
Identity requirements:
Keep the exact same facial identity as image 1.
Same person, no alteration
Pose:
Standing straight, facing the camera
Arms relaxed and hanging naturally
Full body visible (head to toe)
Environment:
- Plain green screen background (clean, even, no texture)
Visual quality:
-
Realistic skin texture with visible pores
-
Natural studio lighting
-
DSLR photography look
Strict constraints:
No anime, no cartoon, no illustration, no 3D render
No props in hands
Do not modify appearance
成功标准:
看起来像真人
没有动漫感
身体比例正常
不满意就多生成几次,选最自然的一张(记得检查脸!!!)
Step 2:锁脸 + 换衣服
上传:
Step1 生成图
动漫角色图
提示词:
中文:
利用图1(人物)和图2(角色)生成一张逼真的Cosplay影棚照片。
身份特征:
使用图1中的人物形象
面部特征必须与图1保持完全一致
服装还原度(严格要求):
发型与发色必须与图2相符
服装样式必须与图2完全一致(禁止自行设计)
保留图2中的所有配饰及鞋履
姿势:
挺直站立
正面对向镜头
双臂放松,自然垂下
全身入镜
环境:
- 纯绿色幕布背景
视觉效果:
-
逼真的皮肤质感
-
逼真的布料质感
-
自然的发丝细节
-
呈现单反相机拍摄的写实风格
严格限制:
禁止对服装进行任何重新设计
禁止出现动漫、卡通、插画或3D渲染风格
英文:
Generate a realistic cosplay studio photo using image 1 (person) and image 2 (character).
Identity:
Use the person from image 1
Keep identical facial identity as image 1
Costume accuracy (strict):
Match hairstyle and hair color from image 2
Match outfit exactly as image 2 (do not redesign)
Preserve all accessories and shoes as image 2
Pose:
Standing straight
Facing camera
Arms relaxed and hanging naturally
Full body visible
Environment:
- Plain green screen background
Visual quality:
-
Realistic skin texture
-
Realistic fabric texture
-
Natural hair strands
-
DSLR photography look
Strict constraints:
Do not redesign costume
No anime, no cartoon, no illustration, no 3D render
成功标准:
脸没变
衣服接近角色
还是“真人感”
不满意就多生成几次,选让你看起来感觉最舒服的一张,还是一定要多检查脸!!!
Step 3:把动漫图变成“动作参考”
把动漫图转成线稿(或者简单理解为“姿势参考图”)
目的:
保留动作
保留构图
去掉动漫风
上传:
动漫角色图
提示词:
中文:
将图像 1 转换为黑白分镜草图。
保留元素:
-
构图
-
镜头角度
-
身体姿态
-
手部位置
-
面部朝向
-
场景布局
转换要求:
-
移除所有色彩
-
移除动漫风格渲染
-
仅保留简单的线条草图
-
粗略的分镜风格
风格特征:
-
铅笔手绘感
-
低细节度
严格限制:
-
不得出现写实风格的面部
-
不得出现精细打磨的插画效果
-
不得使用 3D 渲染
英文:
Convert image 1 into a black and white storyboard sketch.
Preserve:
-
Composition
-
Camera angle
-
Body posture
-
Hand position
-
Facial direction
-
Scene layout
Transformation:
-
Remove all colors
-
Remove anime rendering
-
Keep only simple sketch lines
-
Rough storyboard style
Style:
-
Pencil sketch
-
Low detail
Strict constraints:
-
No realistic face
-
No polished illustration
-
No 3D render
Step 4:获取图片场景描述
这一步直接找可以识图描述场景的工具就行,比如豆包,描述尽量不要太长了,不然容易喧宾夺主,把下一步的主体提示词盖过去了
上传:
动漫角色图
提示词:
根据图片内的场景提供 3 句描述,不要描述面部和神态
Step 5:最终合成
上传:
Step2 生成的影棚图
Step3 生成的线稿图
提示词:
中文:
让图1中的Coser重现图2中的场景。
人物特征:
-
保持与图1完全一致的面部特征
-
保持与图1相同的服装、发型及配饰
-
构图参照图2
-
拍摄角度参照图2
-
身体姿态参照图2
-
手部位置参照图2
-
面部朝向参照图2
场景设置:
-
移除绿幕背景
-
替换为逼真的现实环境
视觉效果:
-
逼真的皮肤与布料质感
-
自然的光影效果
-
呈现单反相机拍摄般的质感
严格限制:
-
禁止出现动漫、卡通、插画或3D渲染风格
-
禁止出现多余肢体或手指畸形等错误
场景描述:
> 再加上第四步中AI输出给你的场景描述
英文:
Make the cosplayer from image 1 recreate the scene from image 2.
Identity:
-
Keep the exact same facial identity as image 1
-
Keep same costume, hairstyle, and accessories as image 1
-
Composition as image 2
-
Camera angle as image 2
-
Body posture as image 2
-
Hand position as image 2
-
Facial direction as image 2
Scene:
-
Remove green screen
-
Replace with a realistic environment
Visual quality:
-
Realistic skin and fabric texture
-
Natural lighting
-
DSLR photography look
Strict constraints:
- No anime, no cartoon, no illustration, no 3D render
- No extra limbs, no distorted fingers
Scene Description:
> 英文也要加上场景描述,不过要记得先翻译成英文再加上去
补充小Tips:如果在上面的步骤中你觉得图片中的人物不像你的时候
在每一步结尾加一句:
优先保证人物一致性,其次保证真实感
或英文:
Prioritize identity consistency over everything
四、总结
以上就是全部步骤了,可能有时候不能一次跑通,可以每个环节多出几张图,选效果最好的继续下一步,我实测下来 google 的这个 flow 平台还是有一定的额度的,可能在 20 张左右吧(估计的,因为我当时作图是间隔好几天断断续续在弄,最终效果还是不错的),佬们赶紧去试试吧 ![]()
5 个帖子 - 5 位参与者