首页
学习
活动
专区
圈层
工具
发布

AI小白如何快速制作自家宠物的专属3D手办,手把手教会你

前一段时间Nano-banana生成手办在网上爆火,作为养宠家庭,我们也看到了一些AI生成手办带来的机会,因此,我们上网搜索了很多Nano-banaba风格手办的提示词尝试自己制作和生成。但是受限于我们的网络环境和对AI的了解程度,一直没有办法生成比较符合要求的效果图。在此之后,我尝试自己去理解AI在进行此类工作时的“思考过程”,并将自己想象成AI,重新手写提示词。慢慢的,我感觉摸索到了一些脉络获得了一些小成果。

使用的AI工具

照片生成3D效果图:Coze

效果图生成3D模型:腾讯混元AI、Blender

生成可打印的3D手办图的基本流程是:上传照片->照片转3D效果图->生成三视图->三视图生成3D模型。整个流程中,最重要的环节是照片转3D。根据我们的尝试,网上流传的很多所谓Nano-banana提示词很多只是将图片主体等比例缩小,而不是真的转换成可打印的手办图。如果我们生成了足够精细的3D效果图,后续的环节其实就很简单了,所以今天也主以照片转3D效果图和生成三视图为主进行分享。

部分通过AI生成的3D手办效果

探索过程

在整个过程里,我尝试了非常多不同方向的验证和优化,这里仅把我认为算是比较灵光一闪的环节摘出来。

让我们开始吧!

思考过程:提供给AI的提示词应该要比较全面和准确的描述自己的需求,在此基础上我能否尝试自己写一个让AI生成三视图的提示词?

思考过程:我是否应该告诉AI,在生成三视图时,应该保持这几张图的动作一致性?

思考过程:经过几轮尝试,我发现AI并不理解人类的左右手的概念,而上面生成的结果中,除了手部动作是错误的,第二张图实际上是AI生成的右视图——也就是说,AI并不理解我脑子里的所谓左右视图是什么,它仅仅是根据我的描述,基于AI的计算得出了一个它认为正确的结果。我才意识到其实我对面的这个“人”,它可能具备无穷多的技能,但是并不具备人类的对生理视角的基本了解,比如你左我右,或从左边看和从右边看应该看到什么样子。为了验证我的想法,我做了下面这件事:

思考过程:看来我的猜测是对的,AI其实并不理解人类视角,所以我应该换一个思路和AI进行对话。而且看起来,AI在进行不同视角生成时,不但不理解视角,每张图片在细节上也有一些不同之处,后续处理时,需要让AI注意细节的一致性。

思考过程:看来我的优化方向是对的,我们在与AI对话时,应该用客观描述代替我们习以为常的日常描述,对最终结果需要有一个明确的定义。在此基础上,我可以再次尝试让AI生成左视图和右视图。

思考过程:经过多次尝试和优化,在目前的阶段,AI已经能比较好的生成和理解需求了。但是好像AI对视角的理解仍然不是特别理想。我猜测的原因有很多,其中我认为影响比较大的有两个,第一AI对左右的理解不明确,那么我可以尝试放弃关于左右的描述,转而让AI直接生成侧视图和后视图,这样就避免了左右不分的问题;第二在同一个对话中最好只让AI反复持续做一件事,那么我就可以将生成效果图和拆分三视图分成两个不同的对话来操作。于是我尝试进行以下操作:

1)首先让AI通过图片生成一张符合要求的3D手办效果图;

2)另起一个对话,让AI通过3D手办效果图生成侧视图和后视图;

思考过程:我猛然想起AI生成结果有一定的随机性,并在这一步之后我让AI又根据刚才的要求生成了三个结果。

思考过程:我觉得应该再次验证一下刚才的提示词和结果随机性,所以我决定同时提供给AI几张同一只狗狗的图片,并让AI直接产出多个结果试试看。

思考过程:既然照片生成3D效果图已经差不多了,我应该另起一个对话,让AI根据生成的3D效果图来生成侧视图和后视图了。同时,需要让AI明确所有细节必须保持一致。

思考过程:截至这里,我已经得到了基本符合要求的结果。接下来保持持续优化和探索进一步自动化的可能性。

思考过程:1)当我要求AI以自然站立姿势生成图片时,AI生成了不止一次双足站立的结果,因此我需要让AI明白我上传的图片是猫咪或者狗狗,正常的站立姿势应该为四足站立;2)在后面的结果中猫咪出现了面带口罩的情况,我检查了AI对特征的理解和描述,发现AI主动使用了“面部‘口罩’状毛色”这样的描述,因此我应该告诉AI避免使用比喻或类比的修辞手法,要严格按照客观情况进行描述。

思考过程:我觉得应该对毛发纹理和质感进行约定,以让AI能够理解我想要的生成结果,而且还能够适应打印需求,但是根据以往的尝试,如果直接告诉AI用于打印,那么AI会自动进行各种适配于打印的调整,往往这些调整会在很大程度上忽略生成结果本身的准确性。所以我不能直接告诉AI用于打印,而是应该更加精确描述我对生成的毛发有什么要求。

另外,AI为了哄我开心,还特意自主做了四个不同的动作,所以我应该告诉AI,不需要调整动作。

思考过程:针对毛发纹理,AI确实有保留和改进,但是目前的毛发纹理过深,过于锐利,我尝试能否让AI将毛发纹理改的温和一些。

思考过程:我觉得生成结果仍然有改进空间,特别卷毛品种的毛发表现,静待我后续继续测试和优化。

截止到目前的提示词

照片生成3D效果图(抽卡版):我将会提供给你一张或几张图片,这些图片中的主体为同一只猫咪或狗狗,请充分理解和客观描述图片中的主体特征,需要包含对毛发质感和纹理的描述,避免使用比喻和类比等修辞手法,并根据图片融合生成Q版3D手办图,不需要会动,手办高度在6cm,主体动作为正常四足站立,材质为树脂(无需拆件),生成图需要删除背景仅保留主体。要求手办风格为可爱萌系,头身比为1:1.5,在有适当的圆润度的同时微微还原毛发纹理(但不要产生明显的凸起或沟壑),但要尽量还原主体特征,头面部相似度保持在80%以上。请根据我提供的照片将以上要求执行4次,生成4个结果,无需进行差异化设计。在生成后,请着重检查头面部相似度、毛发质感、毛色分布、头身比例等主要特征。

3D效果图生成三视图:我将提供一张图片给你,这张图片是一个手办的效果图,请你根据这张图生成对应的侧视图和后视图,要求图片主体的表情、动作幅度、主要特征、颜色、比例等需要与原图保持完全一致。请生成。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OjklKWm3X8T7xPpJspBbkI6A0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券