“男子和车载语音吵架3小时,最后被AI安慰到泪崩。”
虽然是个令人发笑的段子,但足以说明人们对智能交互的期待——谁不想要个“能接梗、会哄人”的车机呢?
而阶跃星辰和吉利联手发布的开源大模型,足以让这个梦想提前实现。
开源不是噱头,而是落到实地的技术普惠
2月18日,吉利与阶跃星辰宣布开源多模态大模型,其中最重磅的Step-Audio语音模型,能让AI听懂方言、模仿明星唱歌,甚至扮演“知心姐姐”。
而普通人通过跃问APP,不用写一行代码就能体验这些功能——比如用AI生成游戏,或者拍一部微电影。
跃问APP的功能有多离谱?
语音对话:你的“赛博闺蜜”
测试时,我故意用四川话说:“小跃,我失恋咯。”它居然用川普回应:“莫慌嘛,请你吃火锅,毛肚管够!”
更绝的是,它能模仿周杰伦唱《青花瓷》,虽然高音有点垮,但这玩意一旦发到家族群,嘿!那可真是会炸了锅!
创意板:零代码基础做游戏
即使你跟程序员根本不搭边,你也可以让APP生成一个上班摸鱼可玩的小游戏,输入需求后,3分钟就拿到了可玩版本。
虽然画风像N年前的,但同事表示:这下上班有事干了!
AI视频创作:人人都是老谋子
用跃问生成了一段“未来城市飞行汽车”的视频,导出后发到短视频平台,评论区都在问:“这是实拍还是特效?”
最离谱的是,整个制作过程只花了5分钟,比市面上常见的AI工具都快多了!
开源大模型如何重构汽车行业?
普通人玩得嗨,车企的算盘打得更是噼啪响。
对吉利而言,Step-Video-T2V开源相当于在全球智能汽车赛道“放诱饵”。
开发者用这个模型生成的虚拟路况数据越多,吉利的智驾系统就能吸收更多训练素材,形成“越多人用,我越强”的良性循环。
而Step-Audio开源的真正野心,在于制定车载语音交互的“中国标准”——当海外车企想接入中文语音服务时,大概率得兼容吉利的方言库和情感算法。
更深层的变革在产业协同
以往车企搞AI总是单打独斗,现在通过开源吸引开发者、高校、创业公司共建生态,相当于收集全社会的脑洞。
打个比方,也许有团队用跃问的创意板做了个“智能停车小游戏”,玩家通过手势控制虚拟车辆入库,而这套交互逻辑转头就被吉利整合到实车的AR-HUD里。
传统车企开发一个语音功能,成本动辄千万级。而开源模型让中小厂商也能调用顶级AI能力
正如春节期间火遍全球,令马斯克称赞、OpenAI奥特曼自叹弗如的DeepSeek一般,中国企业的顶级“阳谋”,技术反哺与生态霸权正在改写全球科技规则。
领取专属 10元无门槛券
私享最新 技术干货