白驹过隙,而立之年,毕业时扬言立于技术之巅的梦想觉得越来越远。以前的学习是针对于某一方向/语言不同知识点的学习,能想象到的就是,成为一个集前后端开发于一体的开发者。
那时候我对AI的认知,仅仅是类似基于数据深度学习、回归预测以及NLP之类的概念,再加上后来的TensorFlow和Pytorch。但是AI就像一个自己没有机会去触及的东西,而它却真实存在这个世界里。
最近这两年,首先是ChatGPT横空出世,后来是AI绘画Stable Diffuion,刚听到这些技术的时候,觉得和自己八竿子打不着关系。后来社区有了AI绘画产品的征文,那是我第一次接触到用Prompt生成图片。
第一次使用这个AI绘画产品的时候,说实话。无论是图片与prompt契合度,还是图片分辨率,都很不尽如人意。以为当时因为还花钱买了资源包,正所谓爱之深责之切,所以在那篇征文中吐槽了AI绘画产品。
我这个人的思想观念容易先入为主,再加上后来一些AI产品的负面新闻,让我觉得AI绘画可能又是一个噱头,沦为了一个产品亮点的代名词。
但是在第二次AI绘画产品征文时,使用了与AI绘画和解,和AI绘画共成长作为标题,因为再次使用这个产品,从用户体验上感觉有了很大的提升,一瞬间觉得这个真的有用心去做这个产品,AI绘画有点搞头。
上面是我使用AI绘画产品图生图功能生成的一张图片,左侧是输入,右侧是输出。这张图对于当下的AI回话产品看起来,的确是效果一般,但是现在回头想可能有我自己的原因,因为当时刚接触AI绘画产品,对于构建prompt以及一些放大工具还不熟悉。
可是即便是如此,当时觉得AI绘画居然能识别我输入的图片,包括人物姿态、画面内容以及一些元素等等,当时还没学习stable diffusion,觉得这种功能还是很不可思议的。
后来机缘巧合下,开始自学stable diffusion。对于我这么一个传统的代码开发者来说,学习这种理论性的东西还是有点难度的,所以当时就翻阅了很多的资料去学习stable diffuion。
首先在本地电脑搭建了一个stable diffuion webUI,这样才能更好的去认识这个产品。
接着就从stable diffusion的组成架构开始学习,包括VAE、U-Net模型、Clip等,又了解到了像素空间和Latent空间,以及diffusion正向和逆向扩散的原理。然后根据自己浅显的理解,写了一篇扩散的科普文章:03:一文搞懂stable diffusion扩散原理,玩转AI绘画
在学习的过程中,也学习到了很多之前没有接触过的学术性名词,例如cross attention、embedding等等,也接触了很多有趣的checkpoint模型和LoRA模型。作为“好记性不如烂笔头”的拥护者,毫无疑问,我做了很多的笔记,防止在我这记忆力衰退的年纪里,以后忘记了这一部分的知识。
当然在学习stable diffusion的过程中,想要写一个系列的学习文章,不过后来写到了采样器(sampler)就搁置了。
在此次的学习过程中,也进修了一下prompt,简单的记录了一下经常使用的词汇。
这一部分其实可以使用一些prompt网站去查询生成。
刚学完stable diffusion,就有了用武之地,再到后来的HAI,支持独立的服务部署和自定义模型,给了开发者更多的发挥空间,这时候我才开始真正体验到了云化AI绘画的魅力。
HAI让我在我的Mac上通过浏览器就能使用AI绘画,解决了显卡的问题。后来在HAI:用AI圆了我的插画梦这篇文章中,给我的AI绘画的学习之路交了一份答卷。
"混元者,元气未分,混沌为一,元气之始也。"
在国内无法正常手段访问ChatGPT的日子里,腾讯元宝属于拯救了我脑细胞的工具。每年年底项目验收,都会根据年初的立项功能点,来写cosmic作为衡量项目工作量的标准。按理说,销售立项、研发开发产品、实施部署产品、公司收款,作为一个底层开发者,都没参与项目,最后苦活累活都分到身上了。
所以每年年底都觉得头疼,然后我就抱着试试的心态,就把我的需求告诉了元宝,结果元宝就成了我的“员工”。
然后我就有化身成了CV大师,疯狂地CV和修改格式,然后再也不用为了凭空编造这些功能点睡不着觉了。
虽然最早听说智能体还是coze,但是第一次接触的智能体就是元器,后来在元器平台上体验了一把智能体的搭建,然后调用API在微信小程序中接入了元器智能体。腾讯元器:为了荒天帝,自学从零开发了一个微信小程序...
我属于是智能体零基础,但是在元器中就轻而易举的构建了自己的智能体,在接入微信小程序的过程中也很顺利,每个智能体元器都提供了统一完善的API管理,让智能体走近手机里。
经常自嘲自己是一个CV工程师,确实很多时候脑子确实不太够用,很多知识点的实现细节都记不太清,所以搜索工具就成了一个“非正式编制”的开发工具。
但是搜索工具并不是为IT定制,搜索结果内容也是良莠不齐,在很多时候去验证答案的准确性比解决问题花费的时间还要多。其实早内心已习惯了这种搜索模式,直到后来遇到了代码助手。
代码助手可谓是百花齐放,从腾讯云AI代码助手到MarsCode以及通义灵码。但是目前看腾讯云AI代码助手更在意用户的体验感和满意度,是不是就会有运营部的工作人员,以问卷的形式收集用户反馈。因为之前感受到了腾讯云AI代码助手在项目开发中对开发效率的提升,所以每次我都留下一大堆的想法。
AI代码工具的确让开发更加简易,不要把它当做一个搜索工具,因为它甚至都不用你输入你的问题内容,它更像是项目的“解释器”,能够对项目中用到的代码做出理解,以及遇到的问题给出解决方案。
不知不觉,AI从理论走进了现实,这一刻AI突然在我的开发和工作中具象化了。后来总想着用AI做一些有趣的东西,因为在摩友圈有很多帅气的追焦照片,就想用AI绘画做一些风格化的照片,例如赛博朋克机甲机车、手绘机车风,想法很久但是确实拖延症和一些强迫症(都是借口)。
拖延症就不用说了,强迫症就是总想搞一些花里胡哨的东西。当时我就搞了stable diffusion webui去做机甲机车照片,然后我觉得每生成一次就要重新设置参数,正好comfyui工作流来了,我就去学comfyui,结果comfyui学起来还挺费劲,经常因为一个节点要鼓捣好久。
我记得clip节点,他有个输入框可以输入prompt提示词。
但是我在一些地方看到别人的clip节点是文本的形式,当时我就试了好多方法都没有成功,最后搞到半夜,不知道翻了多少博客和视频,搞了一晚上,最后发现右键点击节点有个“转换为文本输入”的选项。
这种情况还有很多,有时候挺讨厌自己这种钻牛角尖的性格。
临近三十,韶华易逝。总感叹年轻的人生在了好的年代,可以通过当下的互联网获取更多新的知识,接触到更多优秀的人。还记得刚接触计算机那会儿,还都是离线的学习资料,在有限的知识范围内努力去提升自己的编程能力。可如今对于我来说,再也不缺学习途径了,而缺的是时间。
但是细细想来,时间还在,只是被碎片化了。刷一个短视频、浏览一个新闻、玩一会手机。有时候玩着玩着就焦虑起来了,然后才想起来学点东西,希望以后能平衡好时间比例。
我经常劝诫自己,学点东西总归是好的,包括我刚参加工作时的师父也告诉我,”每周哪怕学习两个小时,你也超过了很多人“。这句话我一直记得,也经常勉励自己,告诉自己每次学习都要有自己的思考,收获属于自己的东西,正所谓“学而不思则罔”,这一刻我打破砂锅问到底的强迫症性格也有了属于自己的价值。
最后的最后,希望自己能够继续保持学习的热情,在未来的很多年里,还能够与优秀的开发者们在这条路上并肩前行,用自己的知识积累建设属于自己的城墙。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。