我用AI做了一组“动漫角色真人COS”

一、前言 本文的灵感来源是佬友的帖子 Nano Banana 动漫图转真人 cos 照总是不够真实?试试这个方法! 再加上之前刷到有佬友说 https://labs.google 网站可以白嫖使用nano banana pro(前提是有个 google 账号),所以想起写这篇教程,希望佬友也能收获心...
我用AI做了一组“动漫角色真人COS”
我用AI做了一组“动漫角色真人COS”

一、前言

本文的灵感来源是佬友的帖子 Nano Banana 动漫图转真人 cos 照总是不够真实?试试这个方法!

再加上之前刷到有佬友说 https://labs.google 网站可以白嫖使用nano banana pro(前提是有个 google 账号),所以想起写这篇教程,希望佬友也能收获心仪的图片,接下来直接上步骤。

应佬友们的建议,先贴上成品图

image
:down_arrow:
image

没错,其实我就是吴彦祖(bushi

二、准备工作

:one: 一张你的自拍

要求:

正脸或微侧脸

清晰

不要滤镜太重

:two: 一张动漫角色图

此处特别提醒,不要选择场景复杂的漫画角色图片,最好是纯净的角色立绘,不然根据场景的复杂程序要进行不同程序的提示词微调

要能看清:

  • 发型
  • 衣服
  • 饰品

:three: 工具

推荐用:

使用 Google 的 Nano Banana Pro 或者 Openai的 GPT images 2 (实测图生图的效果还是 Nano Banana Pro 好一点,不知道是不是因为我的 GPT 是 free 号,效果属实一般)

豆包(根据图片生成内容描述,这个随便哪个能识图的工具都行,我用豆包只是顺手而已)


三、一步一步做(照着来就行)

下面的提示词会提供中英双语版,英语建议直接复制粘贴使用,中文的用以理解步骤并进行自己的微调

Step 1:先生成“真人全身”(锁住人物)

上传:

只上传【自拍图】


提示词

中文:

基于参考图 1,生成一张逼真的、包含全身的影棚风格照片,人物须与参考图 1 中的对象完全一致。

身份要求:

保持与图 1 中完全一致的面部特征。

必须是同一人,不得有任何改动。

姿势:

直立站姿,正对镜头。

双臂放松,自然垂放。

全身可见(从头到脚)。

环境:

  • 纯绿色幕布背景(干净、均匀、无纹理)。

视觉质量:

  • 逼真的皮肤质感,毛孔清晰可见。

  • 自然的影棚布光效果。

  • 呈现单反相机拍摄的质感。

严格限制:

禁止生成动漫、卡通、插画或 3D 渲染风格的图像。

手中不得持有任何道具。

不得对人物外貌进行任何修改。

英文:

Based on reference image 1, generate a realistic full-body studio photo of the exact same person.

Identity requirements:

Keep the exact same facial identity as image 1.

Same person, no alteration

Pose:

Standing straight, facing the camera

Arms relaxed and hanging naturally

Full body visible (head to toe)

Environment:

  • Plain green screen background (clean, even, no texture)

Visual quality:

  • Realistic skin texture with visible pores

  • Natural studio lighting

  • DSLR photography look

Strict constraints:

No anime, no cartoon, no illustration, no 3D render

No props in hands

Do not modify appearance


成功标准:

:check_mark: 看起来像真人

:check_mark: 没有动漫感

:check_mark: 身体比例正常

不满意就多生成几次,选最自然的一张(记得检查脸!!!)


Step 2:锁脸 + 换衣服

上传:

Step1 生成图

动漫角色图


提示词:

中文:

利用图1(人物)和图2(角色)生成一张逼真的Cosplay影棚照片。

身份特征:

使用图1中的人物形象

面部特征必须与图1保持完全一致

服装还原度(严格要求):

发型与发色必须与图2相符

服装样式必须与图2完全一致(禁止自行设计)

保留图2中的所有配饰及鞋履

姿势:

挺直站立

正面对向镜头

双臂放松,自然垂下

全身入镜

环境:

  • 纯绿色幕布背景

视觉效果:

  • 逼真的皮肤质感

  • 逼真的布料质感

  • 自然的发丝细节

  • 呈现单反相机拍摄的写实风格

严格限制:

禁止对服装进行任何重新设计

禁止出现动漫、卡通、插画或3D渲染风格

英文:

Generate a realistic cosplay studio photo using image 1 (person) and image 2 (character).

Identity:

Use the person from image 1

Keep identical facial identity as image 1

Costume accuracy (strict):

Match hairstyle and hair color from image 2

Match outfit exactly as image 2 (do not redesign)

Preserve all accessories and shoes as image 2

Pose:

Standing straight

Facing camera

Arms relaxed and hanging naturally

Full body visible

Environment:

  • Plain green screen background

Visual quality:

  • Realistic skin texture

  • Realistic fabric texture

  • Natural hair strands

  • DSLR photography look

Strict constraints:

Do not redesign costume

No anime, no cartoon, no illustration, no 3D render


成功标准:

:check_mark: 脸没变

:check_mark: 衣服接近角色

:check_mark: 还是“真人感”

不满意就多生成几次,选让你看起来感觉最舒服的一张,还是一定要多检查脸!!!


Step 3:把动漫图变成“动作参考”

把动漫图转成线稿(或者简单理解为“姿势参考图”)

目的:

保留动作

保留构图

去掉动漫风

上传:

动漫角色图


提示词:

中文:

将图像 1 转换为黑白分镜草图。

保留元素:

  • 构图

  • 镜头角度

  • 身体姿态

  • 手部位置

  • 面部朝向

  • 场景布局

转换要求:

  • 移除所有色彩

  • 移除动漫风格渲染

  • 仅保留简单的线条草图

  • 粗略的分镜风格

风格特征:

  • 铅笔手绘感

  • 低细节度

严格限制:

  • 不得出现写实风格的面部

  • 不得出现精细打磨的插画效果

  • 不得使用 3D 渲染

英文:

Convert image 1 into a black and white storyboard sketch.

Preserve:

  • Composition

  • Camera angle

  • Body posture

  • Hand position

  • Facial direction

  • Scene layout

Transformation:

  • Remove all colors

  • Remove anime rendering

  • Keep only simple sketch lines

  • Rough storyboard style

Style:

  • Pencil sketch

  • Low detail

Strict constraints:

  • No realistic face

  • No polished illustration

  • No 3D render


Step 4:获取图片场景描述

这一步直接找可以识图描述场景的工具就行,比如豆包,描述尽量不要太长了,不然容易喧宾夺主,把下一步的主体提示词盖过去了

上传:

动漫角色图


提示词:

根据图片内的场景提供 3 句描述,不要描述面部和神态


Step 5:最终合成

上传:

Step2 生成的影棚图

Step3 生成的线稿图

提示词:

中文:

让图1中的Coser重现图2中的场景。

人物特征:

  • 保持与图1完全一致的面部特征

  • 保持与图1相同的服装、发型及配饰

  • 构图参照图2

  • 拍摄角度参照图2

  • 身体姿态参照图2

  • 手部位置参照图2

  • 面部朝向参照图2

场景设置:

  • 移除绿幕背景

  • 替换为逼真的现实环境

视觉效果:

  • 逼真的皮肤与布料质感

  • 自然的光影效果

  • 呈现单反相机拍摄般的质感

严格限制:

  • 禁止出现动漫、卡通、插画或3D渲染风格

  • 禁止出现多余肢体或手指畸形等错误

场景描述:

> 再加上第四步中AI输出给你的场景描述

英文:

Make the cosplayer from image 1 recreate the scene from image 2.

Identity:

  • Keep the exact same facial identity as image 1

  • Keep same costume, hairstyle, and accessories as image 1

  • Composition as image 2

  • Camera angle as image 2

  • Body posture as image 2

  • Hand position as image 2

  • Facial direction as image 2

Scene:

  • Remove green screen

  • Replace with a realistic environment

Visual quality:

  • Realistic skin and fabric texture

  • Natural lighting

  • DSLR photography look

Strict constraints:

- No anime, no cartoon, no illustration, no 3D render

- No extra limbs, no distorted fingers

Scene Description:

> 英文也要加上场景描述,不过要记得先翻译成英文再加上去

补充小Tips:如果在上面的步骤中你觉得图片中的人物不像你的时候

在每一步结尾加一句:

优先保证人物一致性,其次保证真实感

或英文:

Prioritize identity consistency over everything

四、总结

以上就是全部步骤了,可能有时候不能一次跑通,可以每个环节多出几张图,选效果最好的继续下一步,我实测下来 google 的这个 flow 平台还是有一定的额度的,可能在 20 张左右吧(估计的,因为我当时作图是间隔好几天断断续续在弄,最终效果还是不错的),佬们赶紧去试试吧 :hugs:

5 个帖子 - 5 位参与者

阅读完整话题

来源: LinuxDo 最新话题查看原文