这几天,忙着给学生指导论文开题,错过了许多有意思的新闻。偶然打开微信,惊觉朋友圈突然被讯飞语音输入法刷屏了。
最近在做一个文本转语音TTS(Text to Speech)的第三方软件封装,使用的是国内语音技术龙头安徽科大讯飞公司提供的离线引擎AiSound5.0,主要用于汽车导航用途。科大讯飞还提供了AiTalk用于语音识别,AiWrite用于手写识别服务等。另外还有针对6种平台的SDK和开发示例。
一个现象:生活中越来越多人摒弃拼音输入功能,转而使用语音输入功能,微信、QQ等社交软件语音功能已十分成熟,百度搜索、搜狗搜索等也都添上语音输入功能,语音输入取代拼音输入的劲头显现。
来源:CSDN、整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来。 今天是 2022 年 10 月 28 日,在 1838 年的今天,芬兰人弗雷德里克·伊德斯坦(Fredrik Idestam)出生,他在芬兰的“诺基亚河”沿岸创建了一家木材纸浆厂,取名诺基亚。诺基亚走过了一条漫长的发展道路,不断剥离非核心业务,并于 20 世纪 90 年代做出了以移动通信为核心业务的决定,成就了移动通信的一代传奇。科技历史上的 10 月 28 日还诞生了许多关键事件,让我们看看这些事件是如何改变了世
语音并不是一个新鲜事物,2011年,Siri被内置在iPhone 4s之中横空出世时,曾掀起一波语音技术和讨论热潮和语音助手的创业热潮。时隔五年之后,Google AlphaGo人机大战将AI(人工智能)从实验室技术变成坊间热议的话题,人工智能成为国内外科技巨头的争夺焦点,语音则成为巨头进军AI的必经之路。 • Google I/O大会上,最重要的项目便是Google Assistant(谷歌助理)和Google Home(类似于Amazon Echo的智能家庭音箱助手),Google Home的基础
在位于合肥规划中三到四平方公里的中国语音产业园,建筑机械群正在紧张作业。在竣工的讯飞大厦里,两千多名科大讯飞员工围绕“声音”忙碌着。在移动互联网的风口,兼具软件和互联网公司特征的讯飞,站在了2B和2C市场的十字路口,前途看上去机会重重但又充满凶险。 近期,受科大讯飞邀请,笔者与一些媒体人前往合肥,对讯飞的技术、处境,以及讯飞怎么看待语音市场的竞争态势与格局,做了采访与了解。 一、移动语音市场要爆发了!是真的吗? 今年是中国语音市场最热闹的一年。创业新秀云知声刚获得1500万美元投
锤子M1手机发布会结束之后,M1系列手机能否在诸多强敌面前成功突围眼下还不明朗,然而,多次被老罗推介的输入法,讯飞输入法却意外地火了起来却是事实。 在发布会之后的几天,这款输入法甚至成功登顶了AppS
©原创2015-02-28罗超 duang,成龙给中文输入法出了个难题,大家都在duang、duang、duang时,就是没有一个输入法可以打出“上成下龙”那个奇葩的新字。这个与文字相关的“输入法事件”被电商网站、杜蕾斯们搭上顺风车时,输入法却缺席了,我在朋友圈问,百度输入法和搜狗输入法,谁会率先支持duang?虽然搜狗输入法昨日在官方微博上表示搜狗输入法很快就能打出duang,可duang的热度已降温搜狗输入法仍未实现这一功能。而百度手机输入法却有所动作,不论用安卓系统还是iOS,在输入框中输入“加特效”
从锤子科技发布会,到乌镇大会搜狗CEO王小川的演讲,语音识别和机器翻译技术成了万众瞩目的焦点。一夜之间,传统的键盘输入法似乎即将被颠覆,语音输入法技术真的有这么牛吗? 乌镇大会上,搜狗CEO王小川用自
天猫双11全天交易额落在了1207亿这个数字上,比我预期中少了一点。不过,天猫双11依然给我带来了很大的震撼——不是数字,而是我在双11媒体中心24小时看到的点点滴滴。 有人说,双11是中国的黑色星期
前些日子,Roam Research 出了 iOS 客户端,用户们奔走相告。只不过,当时还是 Testflight 测试版本,只给 believer 使用。Believer 是指趸交了 5 年费用(500 美金)的高级用户们。
移动互联网之后智能互联网时代已然来临。不过,究竟什么是人工智能?AlphaGo战胜人类棋手除了可以作为谈资之外其实与大多数人没关系,用人工智能技术调度外卖配送员我们普通人也感受不到其威力。在我看来,人工智能技术最典型且最先普及的应该是语音——如果说人工智能是互联网上的皇冠,那么,语音技术就是这颗皇冠上最璀璨的那颗明珠。 种种迹象表明,智能语音正在改变我们的生活或者生产方式: 在上海一家肯德基餐厅内,度秘可接收顾客的语音命令帮客人点餐; Amazon Echo和Google Home为代表的智能音箱,正在成为
唯物按:9月份锤子的发布会结束后,科大讯飞股票应声上涨,成为罗永浩相声专场的最大赢家。 这其中有一些运气的成分,但在这种运气之前,讯飞已经做了很多铺垫工作。科大讯飞在2014年就发布了中国的人工智能品
AI 科技评论按:语音到文字的转换是语音研究领域的重要课题。自引入神经网络的方法以来,语音识别正确率有了长足的进展,也为苹果 Siri、亚马逊 Echo、科大讯飞语音输入法等等实际产品提供了生长的土壤。面对算法识别总还是比人类要差一些的现状,微软刚刚发布一篇博文公布了自己的最新成果,达到人类水平已经不是梦想。AI 科技评论编译如下。 2016年,微软语音和对话研究团队对外公布了一则里程碑性的消息,他们在 Switchboard 数据库的对话语音识别任务中达到了人类的一致性水平,这意味着他们的系统识别对话中文
别人晒朋友圈,他留言说不中听的话;你见他突然妄自菲薄,开导劝慰他,却被辩驳甚至骂一通;一点儿小事儿,都能激起他胸中的愤怒,大吼大叫甚至不惜撕破脸……
IT派 - {技术青年圈} 持续关注互联网、区块链、人工智能领域 自2011年苹果在发布iPhone4s时,同场发布苹果系统级语音助手siri, 语音助手甚至是更深入的语音识别技术,已经在公众视线内
https://itunes.apple.com/cn/app/id1243368435
倪捷,腾讯云高级产品经理。北京邮电大学硕士。现在腾讯云大数据与人工智能产品中心AI应用产品组担任高级产品经理,负责智能语音相关AI产品,拥有互联网、金融等行业人工智能落地的丰富经验。本文来自倪捷在“2018携程技术峰会”上的分享。
“整天都在说人工智能,可人工智能到底在哪里呢,为什么到了2022年,自动倒车入库的功能都没普及,导致科目二考试还是那么难。”除了文字上的抱怨,还特意加了张某自动驾驶企业的宣传图。
8月1日,百度发布了2018年二季度财报。财报显示,百度二季度营收260亿元人民币,同比增长32%,净利润64亿人民币,同比增长45%,移动端收入占比77%,高于去年同期的72%。当然,作为公司核心战略,AI依然是百度财报最高频出现的元素。不论是成为收入增长新驱动的信息流业务,还是给百度编织未来的DuerOS和Apollo,均与AI直接相关。
大约一年前,中国移动以13.6亿人民币的代价获得了科大讯飞15%的股权,后者股价一路攀升,从不足30元到最高61元,成为一大牛股,市值高达240多亿人民币。而在刚刚过去的长假中,“云知声”也高调宣布获得金额为千万美金折合约1亿元人民币A轮融资。虽然其体量尚无法和科大相比,但这对沉寂一年的语音识别市场却是重大利好。 而同样涉足该领域的百度、腾讯、搜狗也正在加快技术迭代的脚步,作为战略级标配,语音技术在巨头眼中都格外重要。与国外巨头占领语音市场相似,业内普遍认为,受技术门槛的限制,语音市场创业窗口或已
记者:胡祥杰 2016年8月3日下午,中文搜索公司搜狗发布语音交互引擎 ——知音。搜狗CTO 杨洪涛首次披露了公司未来8年主要的发展方向,搜狗语音交互中心负责人王砚峰则详细介绍“知音”。在发布会现场,王砚峰告诉新智元,3月份时,搜狗委托第三方测评机构对搜狗、科大讯飞和百度的语音输入进行实测,结果显示,搜狗和讯飞能力基本持平,整体领先百度。此外,搜狗语音技术也会跟一系列企业进行合作。 搜狗人工智能战略方向:自然交互+知识计算 人工智能技术是搜索的基础,在搜索公司占有绝对重要的地位,搜狗CTO 杨洪涛在本次发布
作为人工智能第一股,在技术研发方面,科大讯飞一直走在前沿,尤其讯飞语音一直是这家公司的王牌业务。
一切都与令人不胜其烦的骚扰电话有关。而且,这次央视的曝光让更多人了解到,给你打骚扰电话的可能根本就不是一个人,而是没有感情的机器人。
这次出手的,又是谷歌 AI 团队。刚刚,他们为旗下的一款手机输入法 Gboard (不要跟谷歌拼音输入法搞混了啊~)上线了新功能:离线语音识别。目前这一新功能,只能在其自家的产品 Pixel 系列手机上使用。
在移动互联网汹涌澎湃的十余年时间里,第三方输入法可以说是见证历史的史诗级产品:经历了智能手机普及初期的高速增长,经历了消费人群迭代的习惯变迁,经历了用户增长趋缓的多元探索,并且正在经历人工智能浪潮对输入法的新一轮重塑。
编辑:张乾 【新智元导读】近年来,人工智能在全球范围内蓬勃兴起,语音交互、人脸识别等技术与传统金融业务快速结合,在推动金融业态转变的同时,也给商业银行带来了新机遇。1月18日,兴业银行与科大讯飞、京东金融在北京签署战略合作协议,三方联手成立“AI家庭智慧银行联合实验室”,建立“金融智能语音硬件产业联盟”,共同布局物联网金融。 继本月10日携手微软公司共建数字化智能银行后,兴业银行拥抱金融科技又有新动作。 1月18日,兴业银行与科大讯飞、京东金融在北京签署战略合作协议,三方联手成立“AI家庭智慧银行联合实验室
---- 新智元报道 编辑:好困 David 【新智元导读】一转就是十七年,这台「创新发动机」,从来没停过! 安徽合肥的大蜀山脚下,一群研发人员正在紧张有序的工作着。 在各个办公区的中间,张贴着年轻同学们的技术海报、各个方向的研究路径。 还有一块写满了各种公式的白板,上面「用正确的方法,做有用的研究」这几个字面积不大却引人注目。 在18岁成人礼前夕,新智元对中国科学技术大学博士,科大讯飞研究院执行院长刘聪进行了一次专访。 刘聪博士是语音及语言信息处理国家工程研究中心副主任,科技创新2030「新
文章不是简单的的Ctrl C与V,而是一个字一个标点符号慢慢写出来的。我认为这才是是对读者的负责,本教程由技术爱好者成笑笑(博客:http://www.chengxiaoxiao.com/)写作完成。如有转载,请声明出处。
Windows Android Mac IOS Windows Browser Microsoft New Edge Chrome 已经完全被 Microsoft New Edge 替代 Browser Extensions AdBlock 在设置页面可以直接订阅中国区域的 blacklist TamperMonkey Nimbus Screenshot SingleFile 可以将网站保存为单个文件 Proxy SwitchyOmega Katalon Recorder OneTab
某天,编辑看到一位同事拿着手机和电脑在“声情并茂”地朗读他自己写的稿件。 是不是太激动,觉得自己这篇可以点击量“十万+”?怀着这样的疑问,编辑听他用“湖南塑普”读了一会。然后,他又朗读了一遍。 编辑实在忍不住了:“朋友,你这么开心?在干嘛?” 这位同事“炫耀”式地拿着一段文本给编辑看——“你看准确率高不高?” 噢!他在测试讯飞语音的准确率!本着相互较劲能促使进步的理念,编辑自信地用国家认证的一级乙等普通话也读了一遍。结果,准确率相较于这位“湖南塑普”同事,让人大跌眼镜。 你以为编辑这篇要讲技术和背后原理?不
近日,讯飞输入法新版本正式上线,在随声译和快捷翻译功能里增加了日译中、韩译中、泰、越、西、法、德、俄与中文互译,合计18种翻译,这也使得讯飞输入法成为中文与外语互译最多的输入法产品。
新智元推荐 来源:科大讯飞、华为 编辑:克雷格 【新智元导读】最近,科大讯飞与华为签署战略合作协议,双方在B端和C端市场同时发力,在公有云服务、ICT基础设施产品、智能终端以及办公四大领域深度合作
胡建人和东北银玩成语接龙一定是酱紫滴:心心相印→认(印)贼做父→互(父)相伤害→还(害)想咋滴!2333不同方言碰撞到一起会产生奇妙的化学反应,充满趣(槽)味(点)。日前,讯飞输入法联合AcFun发起#AI方言保护计划#公益行动,用AI留下你的乡音! 📷 这是一场方言Show,也是打破次元壁的“利剑”。讯飞输入法不仅开创语音输入的时代,还致力于用人工智能技术不断提升用户的语音输入体验,针对带口音和讲方言的用户全行业首家推出22种方言语音输入,让输入法能够听懂你的家乡话。为了更好地保护不断式微的方言,讯飞输入
“产品使用攻略”、“上云技术实践” 有奖征集啦~ 图片案例名称案例简介用腾讯云 AI 语音识别零基础实现小程序语音输入法介绍如何用腾讯云 AI 语音识别在小程序里实现一个简单的语音输入法,其他场景都可以基于这个功能来打造更有趣的小程序服务。用腾讯云 AI 人脸融合实现云毕业照推广活动小程序介绍如何用腾讯云 AI 人脸融合实现云毕业照推广活动小程序,活动策划融入 AI 能力,打造一个有趣味性、有人文关怀的小程序活动。用腾讯云 AI 意愿核身为电话合规保驾护航介绍如何使用腾讯云 AI 意愿核身更加智能地实现对高
可以看到,语音识别的应用场景越来越广泛,我们在做小程序开发的时候,也经常会遇到使用语音识别的场景;其中语音输入法是非常基础的功能场景,如果能实现这个基础功能,那其他场景都可以基于这个功能来打造更有趣的小程序服务。
本人最爱之一——橙子 在App使用这方面,我一直是一个挑剔的人,或者可以称得上喜新厌旧。现在做一个小软件的门槛越来越低,各种出色的、各种功能的、能够解决一些小问题的APP也越来越多。但是他们可能都不那么必须,可能还很鸡肋、功能上还很小题大做。有时候用脱离手机的较为传统的方式来解决问题才是触及到了问题的根本。好比某一些为了提高效率的APP,时间管理的APP,让你注意力集中的APP,都比不上实实在在的坐下来,动纸笔写下计划,踏踏实实的完成,期间根本不需要手机的参与。 所以,我手机里的小应用越用越少,更替速
腾讯云语音产品,基于业界领先的语音识别(ASR)和语音合成(TTS)技术,为各行业提供从标准化到定制化全方位智能语音服务,更以卓越的性能与极具竞争力的价格赢得了市场的广泛认可。广泛应用于录音质检、会议转写、语音输入法、智能客服、有声阅读、新闻播报、数智人、电商直播、短视频制作等行业场景。
5月4日,有着最难语音识别任务之称的CHiME-6成绩揭晓:科大讯飞联合中科大语音及语言信息处理国家工程实验室(USTC-NELSLIP)在给定说话人边界的多通道语音识别两个参赛任务上夺冠。
【新智元导读】作为中国人工智能产业的标杆企业,科大讯飞2016年度发布会受到业界高度瞩目。11月23日北京国家会议中心,科大讯飞携产业链合作伙伴的人工智能+黑科技澎湃而来。A.I.+万物互联输入法、A.I.+教育、A.I.+翻译、A.I.+司法….. 人工智能+生态系统越来越强大,讯飞植根产业链的深厚积累迎来爆发。科大讯飞董事长刘庆峰在会上强调,正在经历第三次热潮的人工智能并不是概念泡沫,而确实可以运用到所有这些行业中。科大讯飞一年来再次挑战AI巅峰,在被称为“代替图灵测试”的Winograd 挑战赛中摘得
先回顾下,生活、工作中你使用过哪些语音识别相关的产品或者服务? 培训/考试相关的小程序,使用语音识别来判断回答是否正确; 英语口语练习的小程序,使用语音识别来打分; 你画我猜类的小程序,使用语音识别来判断是否猜对; 活动营销类的小程序,比如口令识别、口令红包等; 直播/短视频类小程序,使用语音识别生成字幕; 客服类的小程序,使用语音识别、语音合成来实现智能客服。 可以看到,语音识别的应用场景越来越广泛,我们在做小程序开发的时候,也经常会遇到使用语音识别的场景;其中语音输入法是非常基础的功能场景,如果能实
所谓活到老,学到老,本篇开始我写的Android代码尽量都转为Android指定的官方语言Kotlin,一是技多不压身,二是Kotlin的语法与我接触的第一门开发语言Delphi有点像,学起来也不太难,所以直接在代码中开始使用才能掌握的更快。
语音识别就是把语音变成文字的过程,相信大家在平时生活也已经用到过一些语音识别的场景,比如说语音输入法、地图产品的语音输入。近年来,随着互联网的发展,各种音频数据和文本数据得到不断积累和丰富,CPU、GPU硬件的发展,以及深度学习算法大规模的应用,语音识别技术的应用开始获得大规模的商业化拓展。
最近刚换了三星的Note9,深度体验了一下Bixby的语音功能,觉得挺不错的,而且上周的人工智能大会上,分布屏幕两边的分别是科大讯飞和腾讯提供的服务:讯飞听见和腾讯同传。两者的表现也都是让人眼前一亮。
很多计算机专业大学生经常和我交流:毕业设计没思路、不会做、论文不会写、太难了......
回顾国内第三方输入法赛道近十余年的发展,移动互联网的市场红利催生了科大讯飞、百度、搜狗等颇具规模和实力的头部厂商。与此同时,历经多年、多方角逐,第三方输入法市场进入存量阶段,升级技术、优化用户体验来挖掘存量,成为决定竞争胜负的关键。
卸掉qq语音输入法。bug来了,原来我设置的输入法就只存了qq语音,现在卸掉了却没改。微软拼音彻底用不了了。语言栏也消失了,参考了网上各种办法,始终没用,然后发现是因为我设置了任务栏透明,语言栏也透明,全部透明,我看什么?
无论我们在闪烁的电脑屏幕前工作,也不管如何完成某种创造性的任务,还是被动地从事日常活动,都要求有效地从意识中取消或排除大量来自当下环境的东西。
那天他说一只手很不方便,我说你忍忍都过去了几个月手好了就满血复活了,你知道杨过离开小龙女为什么那么厉害么?为啥?是不是因为有大雕在身边?我说错了,他和你一样都是左手,他知道下半生基本都要依靠右手,右手练多了就厉害了,你也要多练练自己的右手。
领取专属 10元无门槛券
手把手带您无忧上云