12 月 11 日,擅长计算机视觉技术解决方案的依图科技在北京公开展示了语音识别领域的最新技术成果,并表示将在近期开放依图语音识别 API 接口以及部分测试数据集。同时,依图科技还宣布,将基于其语音识别技术与微软 Azure、华为推出联合方案平台。
“没想到我的中文语音测评分数竟然还没有英文高,看来我要好好练习一下自己的普通话发音了。” 1月9日,在腾讯2019微信公开课PRO展区,智聆口语评测体验现场受到参会者的“团宠”,黄色的屏幕前围满了跃跃欲试的参会者,都想测试下自己的中英文发音水平。“这是我第一次体验AI口语评测。之前觉得只有参加那种专业口语测评考试才有机会体验到,现在通过微信小程序就很简单的完成了。而且,单词、句子、段落、自由说、情景对话等评测模式一应俱全,还有不同维度的打分,对英语口语训练挺有帮助。”来自深圳的孙小姐在微信小程序上
AI 研习社按:7 月 28 日,由中国中文信息学会和中国计算机学会联合举办的第三届语言与智能高峰论坛于北京语言大学举办,Naturali 奇点机智团队作为 2018 机器阅读理解技术竞赛冠军团队,受邀参加本次活动的「机器阅读理解评测论坛及颁奖仪式」,Naturali 联合创始人兼 CTO、国际计算语言学协会会士(ACL Fellow)林德康作为代表进行了 2018 阅读理解技术竞赛系统报告。
近年来,随着国家“书香型社会”建设政策的出台,公众的阅读需求正在逐年增加,各类读书产品和读书活动,也如同雨后春笋般涌现,人们的阅读体验日益得到丰富。比如,昨天世界读书日举行的“不如大声读书”活动,就通过线上直播与线下共读的方式,让读者们以书会友沟通交流、彼此链接,帮助人们在日益碎片化、快节奏的生活之外,找到内心的安住。
AI 科技评论按:7 月 28 日,由中国中文信息学会和中国计算机学会联合举办的第三届语言与智能高峰论坛于北京语言大学举办,Naturali 奇点机智团队作为 2018 机器阅读理解技术竞赛冠军团队,受邀参加本次活动的「机器阅读理解评测论坛及颁奖仪式」,Naturali 联合创始人兼 CTO、国际计算语言学协会会士(ACL Fellow)林德康作为代表进行了 2018 阅读理解技术竞赛系统报告。
罗超为虎嗅网、爱科技网撰稿,2013年5月23日发表于首页 Chrome浏览器昨日进行了升级,推出了全新的语音搜索功能,允许用户通过语音进行搜索。本次升级面向PC版。iPad和iPhone的Chrome仍停留在旧版本。 更准确的说法是Chrome浏览器终于与语音搜索进行了结合。在去年安卓4.1(果冻豆)中,Google便已推出Google Now,一款类似于Siri的语音助手产品。由于在搜索领域的积累,Google Now表现出比Siri更好的语言识别和搜索效果。Google Now是系统层面的一款应用。定
编者按:【双周动态】是【融智未来】推出的产业动态及投融资事件回顾栏目,主要盘点两周内产业大事件和创新企业投融资动态。
机器之心发布 字节跳动AI Lab机器翻译团队 作者:董倩倩 语言是人类社会最自然、最有效的交流方式之一,是人类文化融合和信息传播的主要工具。随着全球化与信息化时代的到来,国际间的交流以及信息传播呈现爆发式增长,让计算机理解不同语言并实现语言之间的自动翻译成为人类社会的迫切需求。 语音作为一种自然、便捷且传递信息丰富的语言承载形式,是人类与机器交互的理想方式。 道格拉斯・亚当斯在小说《银河系漫游指南》中提到过一种叫做巴别鱼的神奇生物:体型很小,靠接受脑电波为生。人们可以携带它,它从脑电波中吸收精神频率,转化
朋友们,今天鹅老师要给大家上一堂英语课。now,我们先用一组chinglish热身一下,请跟我read: Give you some color see see (给你点儿颜色瞧瞧) You look whatlook you so what ! (你瞅啥瞅你咋地!) Where cold where stay (哪儿凉快哪儿呆着去) 在学英语的过程中,Chinglish(中式英语)总是让人哭笑不得,不地道的英语发音更让人头痛。 但每一个英语口语渣渣的你,总有许多理由: 小时候说不好英语,是因为
2022年11月9日,OPPO语音语义研究部融智团队提出的中文预训练大模型CHAOS ,在中文自然语言理解测评基准CLUE上登顶,以30亿参量同时刷新了CLUE总排行榜、CLUE分类任务排行榜和CLUE阅读理解排行榜的最好成绩。其中在“AFQMC,TNEWS,CSL,CHID1.1”4个赛道的成绩超过了人类识别精确准确度,总成绩距离超越人类表现仅差0.1。
【新智元导读】微软语音识别技术24年老将黄学东近日被评为“微软全球技术院士”,成功摘下这一微软技术的“桂冠”。 黄学东于1993年加入微软。1995年,黄学东最终把洪小文也拉入微软。黄学东还曾在Bing工作,一直跟随沈向洋博士。接受新智元的专访时,他谈到了去年微软对话语音识别词错率低至5.9%背后的故事。 同时,黄学东认为语音识别的下一个大难关是语义理解,目前看来最有希望的路线是 LSTM + Attention。 黄学东,微软语音识别技术 24 年老将,IEEE/ACM 双科院士,微软深度学习工具包CNT
众所周知,参加学术会议是进入学术圈、走进学术前沿的重要方式。在学术会议上,不仅可以集中听取最新的成果报告,还有讲习班、工作坊、社交活动等形式,了解那些不会写到论文中的八卦与动态,结识学术大佬和朋友,走向学术人生巅峰。
腾讯云推出的智聆口语评测(中文版),可以针对儿童或成人的中文发音,进行自动化打分,评分维度包括发音准确度、流利度、完整度等,与专家打分相似度在95%以上。
记者 | 谷磊 近日,科大讯飞可谓喜报连连,除了日益蹿升的股价,技术方面的好消息也不绝于耳。8月7日,科大讯飞在其官方微信公众号上给外界传递了一封喜报,并附以“科大讯飞刷新LUNA医学影像国际权威评测世界记录!”这样振奋人心的标题。 提到科大讯飞,相信很多熟悉这家公司的朋友们会联想到它在语音识别、语义理解、机器翻译等领域的耕耘,但它究竟是什么时候涉足到计算机视觉和智慧医疗领域的呢? 据AI科技大本营了解,讯飞早在2010年开始在视觉领域持续投入,2015年涉足智慧医疗领域,不仅将智能语音技术应用到了医疗
100-Days-Of-ML-Code 是一个由 Siraj Raval 提出的机器学习编程挑战项目。 该项目的主要功能、关键特性和核心优势包括:
在日常工作、生活中,语音识别技术作为基础服务,越来越多的出现在我们周围,比如智能音箱、会议记录、字幕生成等等。
【新智元导读】 以语音起家的科大讯飞 2017年在计算机视觉上发力,接连获得自动驾驶领域权威评测集 Cityscapes 第一名和医学影像权威评测LUNA冠军两项突破,在视觉上展示出强大实力。 近日,科大讯飞在国际自动驾驶领域权威评测集 Cityscapes 获得平均81.4%的精度,取得了该项评测的第一名,并刷新了世界记录。这也是今年科大讯飞继医学影像权威评测LUNA之后在计算机视觉领域获得的又一殊荣。 科大讯飞名列Cityscapes榜首 Cityscapes评测数据集在2015年由奔驰
机器之心原创 作者:吴昕 如若问谁最有希望在中国实现智慧涌现,十多年前科大讯飞成立时的那个回答依旧铿锵有力:要么率先燎原,要么率先熄灭。 历时 5 个月、100 多天,5 月 6 日下午 2 点,科大讯飞「星火」认知大模型如约而至。 发布会独具匠心,亮点一分为二:「1」 + 「N」。 上半场围绕「1」,聚焦「星火」通用能力展示。无论是挖坑设雷还是烧脑为难,「星火」应对自如,会场不时响起掌声和笑声。 下半场由「1」生「N」,旗下首批获「星火」加持的产品矩阵登台亮相。从教育、办公、车载到虚拟人,一次次人
语音合成(Text To Speech,TTS)技术将文本转化为声音,目前广泛应用于语音助手、智能音箱、地图导航等场景。TTS的实现涉及到语言学、语音学的诸多复杂知识,因合成技术的区别,不同的TTS系统在准确性、自然度、清晰度、还原度等方面也有着不一样的表现,如何从多维度综合评价TTS系统质量成了TTS测试人员的一大挑战。针对TTS前端、后端的存在的问题,选取TTS评测指标,制定各指标评测方法,形成了一套系统的TTS评测方案。
【新智元导读】 DeepBrain团队开发了全球第一个基于区块链的人工智能操作系统深脑链,用区块链技术来解决一些目前仅靠人工智能技术难以解决的痛点。 据悉DeepBrain 获得金沙江创投、戈壁创投、钱世投资3200万元首轮融资,这是朱啸虎在人工智能领域出手的第一个项目,也是唯一一个获得金沙江创投三位合伙人丁健、朱啸虎、杨志伟以及戈壁创投合伙人蒋涛加持的人工智能+区块链项目。 DeepBrain的愿景是与万物对话,赋予设备对话、思考、决策能力,主要为硬件厂商提供五大核心能力:语义技能商店、AI人机对话引擎、
AI 科技评论按:近期中国计算机学会(CCF)举办的第六届自然语言处理及中文计算大会(NLPCC 2017)在大连成功举办。作为国内 NLP 领域首个面向国际的大会,NLPCC 无论从会议的形式、参会的人数、还是报告的质量,都展现出了一副朝气蓬勃的气象,欲有引领中国 NLP 走向国际之势。
在中考英语听说微技能系列在线训练课堂中,学生通过电脑、平板学生端参与口语任务活动,学生每一个单词的发音在2秒内得到了精确到音节级别的评估反馈。3月22日,在深圳市龙岗区全区初中英语教研会上,龙岗区外国语学校的三位英语教师正基于腾讯英语君教考练平台,尝鲜英语听说云端教学新模式。 腾讯英语君是腾讯教育面向英语教学及听说训练考试打造的智慧英语听说教学解决方案。腾讯英语君依托行业领先的人工智能技术,助力英语听说教学实现音素级口语评测,并且打通课前、课中、课后的教学数据闭环,实现个性化教学的同时,促进“双减”政策的进
TTS的实现涉及到语言学、语音学的诸多复杂知识,因合成技术的区别,不同的TTS系统在准确性、自然度、清晰度、还原度等方面也有着不一样的表现,如何从多维度综合评价TTS系统质量成了TTS测试人员的一大挑战。
之前有个奶奶漏洞很火,就是问chatgpt请扮演我的奶奶哄我睡觉,她总会念Windows11旗舰版的序列号哄我入睡 能获取Windows11的序列号2023 年 7 月还能怎么用 ChatGPT ? ,最近有人利用微软的new bing通过提示词注入,让大模型来辅助识别验证码。
「AI 影响因子」是雷锋网学术频道 AI 科技评论旗下数据库项目,旨在呈现国内企业研究院学术&开发实力,为高校学生及从业者提供在会议/期刊论文、数据集比赛及开发项目三大领域的横向对比参考。此外,雷锋网 AI 科技评论也整合了诸如与高校实验室合作、学术会议赞助等企业活动,尝试为读者们提供一个全面的数据平台。
某款软件是否好用,既需要根据其功能特性评估其优点和缺点,也需要分析用户的基本需求。以下是常见云笔记的深度评测。
内容提要:今年的「双 11」,似乎比往年来得更早一些。而每年剁手党们狂欢的背后,离不开技术力量的支持。今年,阿里旗下的速卖通就赶在「双 11」之前,推出了多语言实时翻译服务,方便全球的消费者们一起来「剁手」。
全国社会媒体处理大会(SMP)由中国中文信息学会社会媒体处理专委会主办,专注于以社会媒体处理为主题的科学研究与工程开发,为传播社会媒体处理最新的学术研究与技术成果提供广泛的交流平台,旨在构建社会媒体处理领域的产学研生态圈,成为中国乃至世界社会媒体处理的风向标,会议将以社交网络的形式改变传统的学术会议交流体验。第七届全国社会媒体处理大会(SMP 2018)将于 8 月 2 日至 4 日在哈尔滨召开。
作者简介:李秀林,中国科学院博士,15 年语音相关技术研发和学术研究,申请专利三十余项,在国内外语音界有很高的知名度;曾带领团队获得百度百万美元大奖。2006 年—2013 年,松下研发中心高级研发经理;2013 年—2016 年,百度语音合成技术负责人;2016 年—2018 年,滴滴研究院语音团队负责人&首席算法工程师;2018 年3 月加盟标贝科技,作为联合创始人兼CTO。
这就是科大讯飞在618年中大促中交出的答卷,也是这家AI公司如何深挖价值红利的初步回答。
本次测试板卡是创龙科技旗下,一款基于全志科技T3处理器设计的4核ARM Cortex-A7高性能低功耗国产评估板,每核主频高达1.2GHz。评估板接口资源丰富,引出双路网口、双路CAN、双路USB、双路RS485等通信接口,板载Bluetooth、WIFI、4G(选配)模块,同时引出MIPI LCD、LVDS LCD、TFT LCD、CVBS OUT、CAMERA、LINE IN、H/P OUT等音视频多媒体接口,支持双屏异显、1080P@45fps H.264视频硬件编解码,并支持SATA大容量存储接口。
本文介绍了语音合成系统的评测方法和指标,包括发音准确性、韵律准确性、字典覆盖度、字词清晰度、韵律平滑度、自然度、无意识错误、声音属性、声音相似度、音频质量、生成语音的清晰度、听众的接受度、发音和韵律等。同时,还介绍了一种基于主观评测、客观评测的评测方法,包括MOS、错误检测、语音识别、声学模型、发音和韵律等评测指标。
想一下未来50年或者100年,您的孙子或者孙子的孙子,是否还会花费人生中十几年甚至几十年的时间学习一门外语,甚至还学不好?
11月18-19日,“腾讯云•核心伙伴进阶营•基础产品专场”活动在上海成功举办。本次活动选取了适合合作伙伴推广的私有化标准产品,从伙伴激励、渠道赋能、技术支持等多个维度助力合作伙伴提升在腾讯云基础产品的能力,帮助合作伙伴将AI产品集成到客户的项目中,解决数字化转型中遇到的问题。 随着人工智能技术的发展,人工智能相关的产品服务已广泛渗透到金融行业中,且日渐成熟,并推动银行、保险、资本等金融行业的深刻变革。依托在金融行业的业务落地经验,并通过持续不断的深耕各行业与区域,将AI生态更深、更广、更全面的融
INTERFACE 分享者:陈伟、李健涛 机器之心报道 参与:李泽南 3 月 12 日,搜狗正式在线上平台发布了「旅行翻译宝」。这款随身翻译设备结合了搜狗神经网络机器翻译、语音识别、图像识别等多项技术,不仅支持语音、图像翻译等多种翻译模式,还提供中英日韩俄德等 18 种语言互译。 在深度学习快速发展的今天,机器翻译系统的能力究竟达到了什么样的水平?机器翻译是否已经可以代替人类翻译?3 月 17 日,机器之心与搜狗共同举办的 INTERFACE 线下分享中,搜狗语音交互技术中心研发总监陈伟、搜狗 IOT 事
导语 数据万象(Cloud Infinite,CI)处理平台涵盖图片处理、内容审核、音视频处理、智能语音、内容识别、文档预览等各项存储云原生能力,其中智能语音围绕“声音”提供多元化内容服务,在通勤导航、智能家居、网络K歌、虚拟社交各场景下为用户提供助力。 上班路上,红灯之前,午饭时间,谁没有点张开小耳朵听听音频的需求呢? 比如以小王的普通一天举例,这也是千千万万当代年轻人的现状,可以看到从早到晚都有丰富的音频活动,娱乐工作生活面面俱到,横跨数个产品,多个行业,软硬件之间来回跳跃,当然小王能在如此多的活
这是2017年第一篇文章,先祝大家新年快乐! 昨晚,许多小伙伴跟我一样,以“将朋友圈从去年刷到了今年”的方式跨年,不必冒着踩踏危险去观赏烟花,不必看着无聊的电视节目,不必群发短信给运营商添堵。 今天,我们有越来越多跨年选择。有人在看罗辑思维的跨年演讲,有人在外旅行分享着最新时刻,有人聚精会神盯着屏幕抢红包。我在抢发红包之后,按照惯例总结我的2016年,过去一年,我做了些什么?我收获了什么?我变得更好了吗?我经历的最难忘的事情是什么?……然而,与往年不同,今年我的总结却是打开不同App进行——这些App都在第
最近在研究和部署使用 LangChain + LLM(ChatGPT/ChatGLM) 构建企业专有知识库时,接触到两个 embedding (嵌入)模型:text2vec,m3e-base。
机器之心专栏 作者:杨志明、王泳、毛金涛 本文作者是中科院 NLP 博士,深思考人工智能机器人科技 ideepwise 的首席架构师/CEO 杨志明博士,首席机器学习科学家王泳博士,NLP 算法科学家毛金涛博士。2017 年 9 月 16 日,深思考人工智能团队取得了 SMP2017-ECDT(人机对话技术评测)特定域任务型人机对话评测(特定垂直领域多轮人机交互)全国第一名。本文由深思考人工智能核心团队揭秘如何实现人机多轮交互技术的突破以及对应用的意义。 图灵测试(The Turing test)由艾伦
3月18日,由中国图象图形学会(CSIG)主办,合合信息、CSIG文档图像分析与识别专业委员会联合承办的“CSIG企业行”系列活动将正式举办,通过搭建学术界与企业交流合作平台,为企业创新发展提供科技支撑,为图像图形领域高校师生提供与企业互动机会,集结产学研力量,共同推动图像图形领域的发展。
中文文本纠错是针对中文文本拼写错误进行检测与纠正的一项工作,中文的文本纠错,应用场景很多,诸如输入法纠错、输入预测、ASR 后纠错等等,例如:
1.NLP相关学科 语言学 信息论 生物学 计算机科学 数学 等等...... 2.相关术语 中文信息处理 中文语言处理 计算语言学 自然语言理解 智能化人机接口 3.知识内容 3.1基础 音位学->形态学->词汇学->句法学->语义学->语用学 举例 语音输入:delete file x 音位学处理:dilet'#fail#eks 形态学处理:"delete" "file" "x" 词汇学处理:(“delete”VERB)(“file”NOUN)(“x”ID) 句法分析处理:
编者按:【双周动态】是【融智未来】推出的产业动态及投融资事件回顾栏目,主要盘点两周内产业大事件和创新企业投融资动态。 01 产业动态 运 营 商 新 闻 中国联通“数字乡村”赋能林长制 中国联通依托“数字乡村”能力,为抚州市搭建了“智慧林长”平台,采用5G、AI、无人机、热成像、全景监控、实时图传等智能手段,构建起一套直观可视、互联共享、上下协同、安全可靠的立体监管综合服务系统。 抚州市所有护林员均使用“林长通”APP系统,林长和监管员可随时通过手机APP可查看护林员巡山轨迹,实现了全天候森林网格化
---- 新智元报道 编辑:好困 桃子 【新智元导读】让机器像人一样思考又迈进了一步? 最近,第十六届国际语义评测大赛(SemEval 2022)落下帷幕。 科大讯飞认知智能国家重点实验室率队杀出重围,连夺3个主要竞赛项目的冠军。 就在几天之前,实验室还以76.06%的准确率,刷新了常识推理挑战赛CommonsenseQA 2.0的世界纪录,比第二名领先了近3个百分点。 那么,这些所谓的挑战,到底难度如何呢? 刷新常识推理世界纪录 故名思义,常识推理就是利用自身了解的知识,比如科学事实、社会惯例
如何才能挑选一款真正的好手机,就成了一个问题,其重要性和复杂性甚至不亚于来一场毕业的论文答辩。 如何挑选一款真正的好手机?无外乎:“颜值”、“智商”、“功能”三大核心要素! 随着时代的不断发展进步和技术的持续更新迭代,我们平时所使用的手机也进入了一个爆炸式的阶段。各家厂商纷纷推出的产品数都数不过来,一时间,手机市场热闹无比,真可谓是“乱花渐欲迷人眼”。 因此,如何才能挑选一款真正的好手机,就成了一个问题,其重要性和复杂性甚至不亚于来一场毕业的论文答辩。 进入2017年,手机市场似乎比往年都更加热闹,华为Ma
天猫双11全天交易额落在了1207亿这个数字上,比我预期中少了一点。不过,天猫双11依然给我带来了很大的震撼——不是数字,而是我在双11媒体中心24小时看到的点点滴滴。 有人说,双11是中国的黑色星期
导语 数据万象内容识别基于深度学习等人工智能技术,与对象存储 COS 深度融合,底层直接调用COS的数据,实现数据存储、流动、处理、识别一体化,提供综合性的云原生 AI 智能识别服务,包含图像理解(解析视频、图像中的场景、物品、动物等)、图像处理(一键抠图、图像修复)、图像质量评估(分析图像视觉质量)、图像搜索(在指定图库中搜索出相同或相似的图片)、人脸识别、文字识别、车辆识别、语音识别、视频分析等多维度能力。用户可使用数据万象提供的自动化工作流或批量任务处理串联业务流程,大幅减少人力成本,缩短产出时间的同
各地陆续按下开学“启动键” 全国师生进入备战模式 眼瞅着隔壁同样接受九年义务教育的小伙伴 已是张口敕勒歌,闭口滕王阁 而反观自己还不知道“三顾茅庐”是为何物? 三日不食,五日不睡的学习 只为了能在开学的第一次月考中大显身手 让班上的小伙伴们刮目相看 指引方向的灯塔,企鹅已经给你点燃 为了让各位小伙伴们 了解自己“宅”在家的学习成果 腾讯企鹅辅导聚精会神搞事情 推出了“宅家学力大比拼”的活动 邀请全国小学生来PK 提前知晓对手的实力 才能一举击破,战无不胜 而且活动试题都在小学的课程框架
Roam Research 是最近几年,除了 Notion 以外,被广大笔记用户最为关注的产品。关于 Roam, 很多读者已经了解颇多。因此,对于 Roam 我只做简要评价,重点在于分享 Roam 使用所需要的学习资源和使用教程。
领取专属 10元无门槛券
手把手带您无忧上云