首页
学习
活动
专区
圈层
工具
发布

Open-LLM-VTuber:能离线跑的 Live2D AI 陪聊,啧,麻烦也是真的麻烦

以下文章来源于AI工具教程,作者AI工具教程

老鬼看这种 AI 陪聊项目,第一眼通常不看“陪伴感”这种词,先看两件事:能不能本地跑,出了问题是不是又要折腾一堆 API Key。

Open-LLM-VTuber 这个点确实戳人。它不是网页上挂个聊天框,而是把 LLM、语音识别、TTS、Live2D 形象都串起来,目标是做一个能语音聊天、能打断、能看摄像头/屏幕、还能趴在桌面上的 AI 角色。README 里写得很直:功能可以完全离线跑在本机上,支持 Windows、macOS、Linux,也有 Web 和桌面客户端两种模式。

这就很现实。

现在很多 AI 语音工具最烦的不是“会不会说话”,而是链路太碎:ASR 一个服务,TTS 一个服务,LLM 又一个服务,换个模型还要改配置,隐私数据还得往外跑一圈。Open-LLM-VTuber 至少把这个方向讲清楚了:你可以接 Ollama 这类本地模型,也可以接 OpenAI-compatible API、Gemini、Claude、DeepSeek 这些后端;语音识别和合成也留了不少方案。

但先别急着吹。

README 里有个提醒我反而更在意:如果不是 localhost,而是想远程访问,比如电脑跑服务、手机打开页面,就得自己配 HTTPS,因为前端麦克风需要安全上下文。哎,部署这事最烦的就是这种地方,第一天跑起来挺开心,第二天证书、反代、浏览器权限一起闹脾气。

它有意思的地方也不只是“能说话”。桌面宠物模式支持透明背景、置顶、鼠标穿透,可以把 Live2D 角色拖到屏幕边上,不挡你干活;还能做触摸反馈、表情映射、显示 AI 没说出口的“内心想法”。这个设计有点二次元,但不空。对天天开着 IDE、浏览器、文档的人来说,悬浮在屏幕上的角色比单独打开一个聊天网页更像“常驻工具”。

我比较喜欢 TTS 翻译这个小点。比如中文对话,让角色用日语声音说出来。它不是刚需,但很适合虚拟角色玩法。再加上 Live2D 模型可导入、Prompt 可改、声音能折腾,最后做出来的就不是“某个默认 AI 助手”,而是你自己捏出来的一套本地陪聊壳子。

不过边界也摆在那:项目还在活跃开发,README 提到 v2.0 正在重写和规划,v1 主要继续修 bug,甚至不建议再给 v1 提新功能需求。换句话说,这玩意儿适合爱折腾的人,不适合想点一下就完美运行的人。

老鬼会怎么用?大概就是本地 Ollama 跑一个轻量模型,先不开远程,先把语音、Live2D、桌面宠物模式跑通。能稳定陪聊,再谈摄像头、语音克隆这些花活。

想要一个离线、可改、能看见你屏幕和摄像头、还带 Live2D 皮套的 AI 桌面角色,Open-LLM-VTuber 值得扫一眼。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/ONYFBKrEzMkvzgVKWuSlVisA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券