一个现象:生活中越来越多人摒弃拼音输入功能,转而使用语音输入功能,微信、QQ等社交软件语音功能已十分成熟,百度搜索、搜狗搜索等也都添上语音输入功能,语音输入取代拼音输入的劲头显现。
从锤子科技发布会,到乌镇大会搜狗CEO王小川的演讲,语音识别和机器翻译技术成了万众瞩目的焦点。一夜之间,传统的键盘输入法似乎即将被颠覆,语音输入法技术真的有这么牛吗? 乌镇大会上,搜狗CEO王小川用自
倪捷,腾讯云高级产品经理。北京邮电大学硕士。现在腾讯云大数据与人工智能产品中心AI应用产品组担任高级产品经理,负责智能语音相关AI产品,拥有互联网、金融等行业人工智能落地的丰富经验。本文来自倪捷在“2018携程技术峰会”上的分享。
语音识别就是把语音变成文字的过程,相信大家在平时生活也已经用到过一些语音识别的场景,比如说语音输入法、地图产品的语音输入。近年来,随着互联网的发展,各种音频数据和文本数据得到不断积累和丰富,CPU、GPU硬件的发展,以及深度学习算法大规模的应用,语音识别技术的应用开始获得大规模的商业化拓展。
语音并不是一个新鲜事物,2011年,Siri被内置在iPhone 4s之中横空出世时,曾掀起一波语音技术和讨论热潮和语音助手的创业热潮。时隔五年之后,Google AlphaGo人机大战将AI(人工智能)从实验室技术变成坊间热议的话题,人工智能成为国内外科技巨头的争夺焦点,语音则成为巨头进军AI的必经之路。 • Google I/O大会上,最重要的项目便是Google Assistant(谷歌助理)和Google Home(类似于Amazon Echo的智能家庭音箱助手),Google Home的基础
胡建人和东北银玩成语接龙一定是酱紫滴:心心相印→认(印)贼做父→互(父)相伤害→还(害)想咋滴!2333不同方言碰撞到一起会产生奇妙的化学反应,充满趣(槽)味(点)。日前,讯飞输入法联合AcFun发起#AI方言保护计划#公益行动,用AI留下你的乡音! 📷 这是一场方言Show,也是打破次元壁的“利剑”。讯飞输入法不仅开创语音输入的时代,还致力于用人工智能技术不断提升用户的语音输入体验,针对带口音和讲方言的用户全行业首家推出22种方言语音输入,让输入法能够听懂你的家乡话。为了更好地保护不断式微的方言,讯飞输入
域名作为互联网上的“门牌号”,如果只能“写”而不能“读”的话,在现今电子设备智能化便携化的趋势下将极其不便。人工智能有两大基础:语音和视觉,智能音箱之所以取代电视机顶盒和路由器成为智能家居的入口,就是因为把握住智能语音这个基础点,倘若域名也能通过语音输入,将极大地推动细小的便携性智能设备(例如手机、手表、VR和AR等)对于互联网应用的语音接入。“语音域名”既要兼容传统域名的同时,又要创新式地开启互联网应用语音交互这一特性,这样,“语音域名”既能通过语音输入来访问互联网应用,也能让人类通过眼睛来轻易辨认以便记忆和认证。
8月1日,百度发布了2018年二季度财报。财报显示,百度二季度营收260亿元人民币,同比增长32%,净利润64亿人民币,同比增长45%,移动端收入占比77%,高于去年同期的72%。当然,作为公司核心战略,AI依然是百度财报最高频出现的元素。不论是成为收入增长新驱动的信息流业务,还是给百度编织未来的DuerOS和Apollo,均与AI直接相关。
今天,智能语音助理融入我们生活之中已经很久,赋能各个行业已经成为了社会的共识。当电子地图可定制的语音包上线,实现了通过极其简单的流程就可以完成复杂的工作,人工智能时代离我们越来越近的感受,也愈发真切了起来。
人工智能有两大基础:语音和视觉,智能音箱战胜电视机顶盒和路由器成为智能家居的入口,靠的是语音操控方便老人和小孩。目前手机、手表、VR、AR、自动驾驶和智能家居等产品都离不开语音操控,可是讯飞、阿里、腾讯和百度等语音接口服务提供商有各自的语音指令操控,没有一个通用的方式来访问外部应用,应用提供商都受制于语音接口的流量控制,我认为语音输入中文域名直接访问网站服务是解决语音访问网站服务最通用和直接的互联网基础应用。以下视频是安卓手机版360浏览器实现语音输入中文域名“小度.中国”直接访问小度官网的示例。
编辑导语 近日,腾讯云正式上线智能语音服务。智能语音是由腾讯微信AI团队自主研发的语音处理技术,可以满足语音识别、语音合成、声纹识别等需求。 这是继微信支付提速、微信公众号CDN加速、微信公众号安全护航等一系列动作之后,腾讯云联合微信发布的又一重大举措。腾讯云智能语音服务将以强大的垂直领域定制化服务,打造专业高效的语音大脑。 一、识别率行业领先云端+嵌入式开放 语音作为继键盘、鼠标、触屏之后人机交互的新体验,其识别技术被广泛应用在呼叫中心、网络搜索、智能终端、移动应用、人工智能等各大领域。 腾讯云平台联合微
安装使用“法官助手” 开启“语音录入”智能模式 “本院认为,公民享有生命健康权,公民、法人由于过错侵害他人财产人身的,应当承担民事责任……”12月26日,在禄丰法院交通事故类审判团队法官办公室,一名法官在技术人员的指导下使用法官语音助手,对着话筒用语音书写判决书。只见话音刚落,立即被转换为文字显示在电脑上。禄丰法院加快智慧法院建设步伐,近日为全院28名入额法官安装了32寸宽屏电脑和法官语音助手,并在两个数字法庭安装了庭审语音助手,开启了智慧法院“左看右写、语音录入”的工作模式,标志着该院在智慧法院建设上
免费开放微信AI团队在机器翻译,智能语音领域的业界领先成果,使开发者简便地在小程序中加入机器翻译,智能语音能力。
在云知声的构想中,“智慧医院”是由面向医务工作者的智慧医疗、面向患者的智慧服务、面向医院的智慧管理构成的。
继推出维吾尔语、粤语识别,近期,捷通华声联合中国民族语文翻译局,推出藏、彝、蒙、朝鲜语语音识别技术,为藏族、彝族、蒙古族、朝鲜族同胞的日常办公、沟通交流提供语音识别服务。 民族语言识别 为企事业单位办公、民众交流提供便利 灵云语音识别技术,已广泛应用于国内的企事业单位会议、公检法、医疗等领域。 通过应用灵云藏、彝、蒙、朝鲜语语音识别技术,少数民族企事业单位可以应用语音识别技术,识别日常工作会议发言,快速生成会议记录;地区公安、检察、法院等政法机构可以应用语音识别来转写办案过程中的讯问发言,快速生成办案笔录;
你知道吗? 全球每2周就会有一种语言消失。 语言的消亡意味着珍贵的多样性文化信息流失,与物种的灭绝毫无二致。 现实情况是,濒危语言消亡的速度比濒危动物消亡的速度还要快,据测算,到本世纪末,世界上50%-90%的语言将会消亡。 保护濒危语言是保护文化多样性的重要一步,那么,人工智能又能做什么呢? 语音技术发展到今天,其应用能力已经媲美甚至超越人类平均水平。从历史视角看,不管是地理位置障碍还是语言障碍,它都将是促进和增强人与人、人与机器自然对话的强大工具。 在濒危语言文化保护上,我们由此也看到了新的思路
可以看到,语音识别的应用场景越来越广泛,我们在做小程序开发的时候,也经常会遇到使用语音识别的场景;其中语音输入法是非常基础的功能场景,如果能实现这个基础功能,那其他场景都可以基于这个功能来打造更有趣的小程序服务。
随着技术的升级、消费者需求的爆发以及大环境的变好,智能语音行业的发展愈发如火如荼,智能语音也在悄无声息地渗透进人们的日常生活。以输入方式为例,语音输入已经超越拼音输入和手写输入,成为当下主流输入方式。
1. 引言 随着Windows Phone SDK 8.0的发布,其包含的新特性也受到了广大开发者的关注,其中之一就是语音方面的提升。其实在Windows Phone SDK 8.0发布之前,Kinect for Windows也更新了其SDK,支持了其他新的语言,可惜没有看到支持中文的选项。而Windows Phone SDK 8.0的Speech中包含了中文的支持,这点令我们中文用户感受到了MS对中国市场的重视。这点大家可以在Windows Phone 8 模拟器中看到,将模拟器的语言设置为中文
前两天,HTC 发布年度旗舰手机U11,可谓亮点满满,算得上是HTC手机业务的救火队员:不只是有双曲面玻璃机身带来的高颜值,还有骁龙835处理器、DxOMark突破90分的拍照能力,在软件层面则引入了
“AI+IoT”将是未来的风口,各种应用和商机将成井喷式增长,国内外各大互联网巨头早已提前布局AI+IoT的战略,这同时也是恩智浦的核心战略之一。AI+IoT技术的应用,大到汽车和电视,小到灯泡、闹钟,都可以使用AI的控制技术。
通过亚马逊Alexa和Google Home安全验证的第三方应用程序,现在被证实可以在暗中窃听用户并窃取用户密码。
10月14日,中信银行联合腾讯云召开“语见·美好未来”发布会,中信银行手机银行推出智能语音服务产品,这是全国首个可以通过手机银行进行纯语音、全流程办理转账等金融业务的语音产品,彻底改变了用户与手机银行的交互方式。
前脚刚拿到智能语音行业最大融资的云知声,后脚就发布了一款完全自主设计的AI芯片。 今天下午,国产芯又添一员大将! 刚拿到智能语音行业最大融资的云知声,在北京正式发布全球首款面向物联网领域的AI芯片“雨燕”(Swift)。作为云知声UniOne系列的第一代物联网AI芯片,“雨燕”完全由云知声自主设计研发。 芯片完全自研 采用CPU+uDSP+DeepNet架构将算力提升50倍 “雨燕”由云知声自主研发,采用云知声自主AI指令集,拥有具备自主知识产权的DeepNet、uDSP(数字信号处理器),支持DNN/LS
一直以来,我们使用的是以视觉界面交互为主的3C产品。iPhone,Google Glass,Apple Watch,以及增强现实的Magic Leap, Microsoft Hololens,这些产品都在主打视觉交互,期望用户在视觉界面上完成他们的需求任务。这些产品需要用户将全部注意力都集中在界面上,用户需要专注于界面的交互体验,因此,无法在同一时间做其他的事情。然而在现实生活中,我们往往并不在同一时间只专注于同一件事情的。而语音交互在这方面则具备潜在的优势,它能够让你在同一时间处理多项任务。值得注意的是,
先回顾下,生活、工作中你使用过哪些语音识别相关的产品或者服务? 培训/考试相关的小程序,使用语音识别来判断回答是否正确; 英语口语练习的小程序,使用语音识别来打分; 你画我猜类的小程序,使用语音识别来判断是否猜对; 活动营销类的小程序,比如口令识别、口令红包等; 直播/短视频类小程序,使用语音识别生成字幕; 客服类的小程序,使用语音识别、语音合成来实现智能客服。 可以看到,语音识别的应用场景越来越广泛,我们在做小程序开发的时候,也经常会遇到使用语音识别的场景;其中语音输入法是非常基础的功能场景,如果能实
多数时候,开挂神器很有用,而不经意间,它又变成了“猪队友”。 12道问题、3个选项、10秒时间……由“国民老公”王思聪带来的“直播答题”模式火了。继冲顶大会之后,今日头条的“百万英雄”、花椒直播的“百万赢家”、一直播的“黄金十秒”……一时间,各家平台都如“飞蛾”般纷纷上线直播答题活动,形式上也是大同小异。 王思聪、周鸿祎等大手撒币 王小川、李彦宏“耍流氓作弊” 在百万奖金的诱惑下,越来越多的人开始参与直播答题节目,甚至在各个平台之间进行流窜答题,不可谓不辛苦。 不过,气人的是,在玩家们为了增加答题正确率而呼
年初有一篇《搜索引擎百度已死》的文章在全网刷屏,文章尖锐指出百度搜索有一半以上结果导向了自己的百家号,而百家号上大量低劣和营销的内容严重误导了用户,事后百度回应说其百家号的内容占比小于10%。
近日,讯飞输入法新版本正式上线,在随声译和快捷翻译功能里增加了日译中、韩译中、泰、越、西、法、德、俄与中文互译,合计18种翻译,这也使得讯飞输入法成为中文与外语互译最多的输入法产品。
---- 新智元报道 编辑:好困 【新智元导读】《人工智能系列报告:2021年中国对话式AI市场报告》出炉,腾讯云智能位列领先梯队获四项第一。 今日,沙利文联合头豹研究院发布《人工智能系列报告:2021年中国对话式AI市场报告》。 报告显示,腾讯云智能在中国对话式AI市场中位居领导者梯队。其中,在Frost Radar创新指数、增长指数相关的四项指标排名第一,企业级智能客服应用能力、对话理解能力、智能语音处理、智能语音合成能力得分最高。 当前,中国对话式AI市场处于快速增长阶段。沙利文报告指出,伴
近日,据 The Information 消息称,在完成对京东 5.5 亿美元的投资之后,Google 将在其电商平台上销售自家硬件设备,如智能音箱等。
ChatGPT 是一种基于 GPT 系列模型的自然语言处理技术,其全称是 Conversational Generative Pre-training Transformer。在过去的几年中,自然语言处理领域的研究人员们一直在探索如何让计算机更加智能地处理自然语言,而 GPT 系列模型正是其中的佼佼者之一。本文将介绍 ChatGPT 的背景、原理、应用和未来发展。
---- 新智元报道 编辑:Emil、小匀 【新智元导读】数据稀缺以及开发成本高,多语种识别和翻译被认为是机器翻译技术难以跨越的难题。但随着国际交流日益频繁,跨地域、跨文化间的无障碍沟通成为不断增长的刚性需求。近期科大讯飞表示,通过系统性创新,他们将在10年内让机器在70+语言之间实现互通。 下一个十年,人工智能会从「黑盒」变「白盒」吗? 下一个十年,人机共存时代会真正到来吗? 下一个十年,哪个学科又会与人工智能深入交叉,引发颠覆式的革新呢? 人工智能核心技术的逐渐成熟推动智能产品的落地,以语
对攻击语音识别系统的研究表明,某些隐藏的语音命令人类无法听见,但是这些声音却可以控制系统。在最近的一些实验中,研究者设计了一个完全听不见的攻击:DolphinAttack,通过将人声负载在高频载波上,可以通过Siri使iPhone发起FaceTime通话。
机器之心报道 机器之心编辑部 在大型语言模型的加持下,智能音箱领域的「拐点」即将到来? 在智能音箱风靡的那些年,很多人都希望能与音箱来一场深度对话。可惜事与愿违,智能音箱的对话能力显然达不到人类的要求。如今,智能音箱的市场红利期已经过去,昔日光环消退,渐渐不再为人提起。 一位名为「GPTHunt」的 Up 主也是一样,自述是智能语音音箱的「轻度爱好者」。只是失望的次数太多了,也就不再抱有希望。 比如,他买过亚马逊的 Alexa 音箱,但发现自己英语水平不太够,此外音箱产品设计也不够 local,试用了一阵
软件绿色联盟已发布了7期应用适配体验报告,覆盖了日常生活、地图导航、视频、购物比价、外卖、新闻资讯、票务出行&房产类APP,本期我们将对云闪付、中国工商银行、中国建设银行这三大金融理财类应用,重点从页面功能、交易的安全性、智能语音助手、人工客服等维度进行适老化服务体验。
哈喽!各位小伙伴大家好呀! 最近的AI换脸很热, 比如“ZAO”这个APP就上了一波热搜。 AI技术大放光彩时, 我们也慢慢意识到, AI带来的不仅仅是便利, 也给了不法分子可乘之机。 今年三月,据
我们在前面已经介绍了关于语音识别的应用,这一章我们在介绍一下实现人工智能语音识别的处理方式。
李根 假装发自 金寨路96号 量子位 报道 | 公众号 QbitAI 📷 △ 科大讯飞08年上市以来股价走势 桃李春风一杯酒,江湖夜雨十年灯。 18年筚路蓝缕后,科大讯飞正在迎来(史上)最好的资本市场时光。 截至8月18日收盘,这家深交所代码“002230”的安徽合肥企业,每股股价60元,市值高达833.22亿,而且看起来所受的期待和期望,还要更高。 这一切皆拜人工智能所赐,自AlphaGo摧枯拉朽般把AI概念普及至千家万户后,外界开始意识到主打语音技术的讯飞,竟是一家几乎被遗忘
提到虚拟歌姬,你的第一反应是谁? 洛天依、初音未来、乐正绫、巡音、Gumi、言和、镜音、东方栀子......。(没上榜的记得评论区留言) 在二次元的世界里,虚拟歌姬是一个特殊的存在,他们不是"活人",但有粉丝、有流量、有作品,其影响力、待遇不亚于一个鲜活的网红IP。 以洛天依为例,她是全世界第一款中文声库和虚拟形象,也是首位登上中国主流电视媒体的虚拟歌手,与杨钰莹、周华健、王源等一众明星在春晚同台合唱和歌舞表演。 她们一步一步成长,不断给我们带来“一字一句的美妙体验”。而成就这种“美妙体验”的,正是得益于
小米智能音箱肩负重要使命,人们要如何面对时刻“监听”你谈话的机器
锤子科技夏季发布会上,老罗又给我们带来了许多惊喜,其中关注度比较高的就是一款即时通讯软件了,叫子弹短信。
与第一季度的溃败不同,科大讯飞第二季度打了个翻身仗,让2020年上半年得以完美收官。
阿里巴巴达摩院的语音交互智能实验室正在尝试架起「人机交互」和「个性化服务」的桥梁。而上升到技术层面来总结,语音交互智能将成为IoT与互联网内容和服务的桥梁。
提到虚拟歌姬,你的第一反应是谁? 洛天依、初音未来、乐正绫、巡音、Gumi、言和、镜音、东方栀子......。(没上榜的记得评论区留言) 在二次元的世界里,虚拟歌姬是一个特殊的存在,他们不是"活人",但有粉丝、有流量、有作品,其影响力、待遇不亚于一个鲜活的网红IP。 以洛天依为例,她是全世界第一款中文声库和虚拟形象,也是首位登上中国主流电视媒体的虚拟歌手,与杨钰莹、周华健、王源等一众明星在春晚同台合唱和歌舞表演。 她们一步一步成长,不断给我们带来“一字一句的美妙体验”。而成就这种“美妙体验”的,正
“重复唤醒,答非所问,这不是人工智能,是‘人工智障智障’。”这是大部分智能网联汽车用户对语音交互的抱怨。
在百度2019AI开发者大会上有很多相对精彩的公开课,DuerOS相关的公开课有4场,分别是:
李根 发自 凹非寺 量子位 报道 | 公众号 QbitAI 在刚刚结束的全球合作伙伴大会上,腾讯第一次把AI喊得响亮。 “Make AI Everywhere!”腾讯上上下下都在这样说。 不过,不
领取专属 10元无门槛券
手把手带您无忧上云