9月25日,OpenAI发布了新版本的ChatGPT,允许用户通过语音、图像的方式,与ChatGPT进行互动。
OpenAI展示了一个例子。
用户给它发送了一张自行车照片,问它「如何调整座椅高度」,ChatGPT给出了相关的操作步骤,提到要找到对应的快拆杆,需要什么工具等等;然后用户又发送了一张自行车座椅局部的照片,问图中的零件是快拆杆吗?ChatGPT回答不是,然后告诉用户使用什么样的工具,如何操作这个零件,调整座椅高度。
更厉害的来了,用户给ChatGPT发送了自己工具箱的照片,询问ChatGPT,工具箱里有他所需的工具吗?ChatGPT看了一眼照片回答道,用户所需的工具就在工具箱的什么什么位置。
毫不夸张的说,这样多模态的分析、交互能力已经超越了很多AI工具,进一步扩大了ChatGPT的应用范围。
另外在语音方面,像很多儿童陪伴机器人一样,ChatGPT可以给孩子讲睡前故事,了但不同的是,他可以根据故事内容,回答孩子提出的问题,交互能力、理解能力会更强,而且OpenAI为此请来了五名专业配音人士,提供了五种不同的声音选择。
未来两周,这些能力会提供给ChatGPT的付费用户。
领取专属 10元无门槛券
私享最新 技术干货