大家好,我是 Jack。
今天清明,小伙伴们都去哪里玩了?
上个月我已经出去浪过了,清明就老实在家歇着了。
翻看了一些最近热点的开源项目,发现还是 AIGC 的天下。
今天,我将继续着重挑选几个近期的优质开源项目,相信这些项目对于我们的日常工作、学习生活,都会有一定的帮助。
今天整理分享给大家,希望对你有所启发。
我相信,会有越来越多针对特定领域的 GPT 大模型出现。
各个领域都训练出一个非常专业的 GPT 大模型,到了那个时候,再加上一个上层调度模块,一个各领域全能的 AI 就出现了。
ChatDoctor 就是医学领域的一次尝试,它是在 Meta 开源的 LLaMA 基础上 fine-tune 得到的。
ChatDoctor:你哪里不舒服?
模型一共进行了多轮的微调:
开发者的愿景是希望使用这些量身定制的医患对话对 LLMs 进行微调,由此产生的模型具有巨大的潜力来理解患者的需求,提供明智的建议,并在各种医疗相关领域提供有价值的帮助。
项目地址: https://github.com/Kent0n-Li/ChatDoctor
除了这个已经开源的 ChatDoctor,还有金融界的大模型 BloombergGPT。
BloombergGPT 是由全球最大的财经资讯公司彭博社亲手打造的,公司成立的 40 年时间里,收集了海量的金融市场数据,针对金融场景,拥有巨大优势的彭博社自然不甘落后,于是开发了这个 500 亿参数的大语言模型 BloombergGPT。
不过这个看看就好,如果 BloombergGPT 效果真得不错,99.99% 不会开源,金融数据也不会,毕竟这才是实打实的“技术壁垒”。
中文名白泽,自称可以通过 chatgpt 在几个小时内训练一个你自己的 chatbot,并且只需要一张 GPU 显卡。
目前开源的模型有:
中文版的模型,很快也会开源,这个项目还是非常值得期待一下的。
项目地址: https://github.com/project-baize/baize-chatbot
tomesd 还是很有用的,简单概括它的功能就是:加速。
使用 tomesd 可以在保证图片生成质量的基础上,大幅提升 stable diffusion 生成图片的速度。
FID 是图像生成质量的评估指标,可以看到,使用 tomesd 后,SD 图片生成速度提升了 2 倍多,内存占用下降了5倍多,图像生成质量依然很高,这也算是大规模生成图片的利器了,节省了不少的 GPU 资源和内存资源。
项目地址: https://github.com/dbolya/tomesd
对,它的中文名就是贾维斯,它就是我上文所提到的上层调度系统。
它能根据你的输入,例如“请生成一张一个女孩正在读书的照片,她的姿势跟我提供的 example 图片类似。然后再使用你的声音描述下这张图片。”
这个调度系统会根据你的输入,自动分析要调用哪些 AI 模型,实现你所说的要求,直接调用 HuggingFace 上的相应模型,帮你执行完成。
好吧,现在“调包侠”的工作,也有 AI 帮你做了。
项目地址: https://github.com/microsoft/JARVIS
Text2Video 顾名思义,使用文本描述,生成视频。
比如输入:一只熊猫,在时代广场弹吉他。
再比如输入:一只可爱的小猫,在草坪上奔跑。
项目也在 Hugging Face 上部署了,想要体验的可以直接与逆行。
项目地址: https://github.com/picsart-ai-research/text2video-zero https://huggingface.co/spaces/PAIR/Text2Video-Zero
文章的最后,再说说刚刚发生的事:ChatGPT 停售 Plus 会员。
官网 Plus 升级按钮变为灰色的了。
有网友说这是一种营销手段,让各方报道的热度不断。
之前我也申请了 GPT 4.0 的 API 接口,至今没有通过。
再加上,ChatGPT 遭联名封杀的事件愈演愈烈,好像一下子,全世界都燃起了一股围剿 ChatGPT 的势头。
在之前的各大佬的联名公开信中,签明人数已经上升到了 9000 多人。
https://futureoflife.org/open-letter/pause-giant-ai-experiments/
上两天,我发起了一波关于 GPT-4 的研究是否有必要暂停 6 个月的投票,这是咱们读者的投票结果:
AI 大模型的发展,到底何去何从,拭目以待吧。