语音界大佬、开源语音识别系统 kaldi 的开发者 Dan Povey 被约翰・霍普金斯大学 (JHU) 解雇了。
选自svds 作者:Cindi Thompson 机器之心编译 参与:李泽南、Smith 目前开源世界里存在多种不同的语音识别工具包,它们为开发者构建应用提供了很大帮助。这些工具各有哪些优劣?数据科学
机器之心报道 编辑:shanshan 又一位技术大牛出来创业了! 9 月 13 日,卡内基梅隆大学副教授 Graham Neubig 在 Twitter 上宣布,与 @stefan_fee 和 @odashi_en 一起成立了 Inspired Cognition 公司! 「我们的目标是通过工具和专业知识,让构建 AI 系统(尤其是 NLP)变得更容易、更高效。」 1、致力于优化 AI 系统开发 人工智能 (AI) 正在成为与软件一样推动世界进步的力量。然而,与传统的软件工程不同,人工智能工程引入了各种
微软Build开发者大会、Facebook F8开发者大会以及Google I/O开发者大会被称为行业的风向标,而人工智能已成为绝大多数开发人员无法绕过的技术,聊天机器人、人工智能助理的流行,也预示着应用交互界面将迎变革。人工智能带来哪些困扰和机遇?未雨绸缪,移动开发者应当如何借势人工智能?本次人工智能专场将汇聚人工智能领域的技术精英,解析如何利用人工智能前沿技术,让应用好看、好用、好玩。 本文将带您全方位了解MDCC 2016人工智能与机器人专访细则,大会门票 8 折优惠将于明天结束,欲购从速!五人以上团
1 新智元推荐1 来源:微软研究院AI头条 【新智元导读】继 9月13日微软将对话语音识别错误率降至6.3%的记录后,前天再次宣布进一步将错误率降至 5.9%,首次达成与专业速记员持平且优于绝大多数人的表现。该成功归功于他们采用了一种神经语言模型,该模型在空间中被表现为连续的向量,计算机能通过该模型得知比如“fast”和“quick”是具有紧密联系的近义词。 一个月前,2016年9月14日,微软的对话语音识别技术在产业标准Switchboard语音识别基准测试中实现了词错率(word error rate
机器之心原创 记者:Tony Peng 参与:李亚洲、李泽南 昨天,腾讯正式宣布张潼出任腾讯 AI Lab 实验室主任。同时,前微软研究院的首席研究员、顶级语音专家俞栋也已加入了腾讯 AI Lab,担任副主任一职。 俞栋是语音识别和深度学习领域的著名专家。他于 1998 年加入微软公司,此前任微软研究院首席研究员,兼任浙江大学兼职教授和中科大客座教授。迄今为止,他已经出版了两本专著,发表了 160 多篇论文,是 60 余项专利的发明人及深度学习开源软件 CNTK 的发起人和主要作者之一。 俞栋曾获 2013
开源和闭源,两种截然不同的开发模式,对于大模型的发展有着重要影响。开源让技术共享,吸引了众多人才加入,推动了大模的创新。而闭源则保护了商业利益和技术优势,为大模型的商业应用提供了更好的保障。
谷歌公司推出了Android O, 其亮点之一在于可消除复制粘贴的大麻烦。Android O可自动识别和高亮电子邮件中的名字、地名、地址等文本,用户无需拖动箭头逐字逐句选中内容,便可轻轻松松地完成复制
在本文中,作者列出了 2017 年 GitHub 平台上最为热门的知识库,囊括了数据科学、机器学习、深度学习中的各种项目,希望能对大家学习、使用有所帮助。 GitHub 是计算机科学领域最为活跃的社区
-欢迎 加入AI技术专家社群>> GitHub现在不再仅仅是一个软件寄存管理器,而是软件工程师通过它来共享他们自己开发的工具/库,甚至这些资源对一些公司都很重要。作为一名狂热的数据科学爱好者,我总结了一系列在2017年尤为出名的知识库! 1.学习资源 1.1:Awesome Data Science: 这个GitHub是数据科学的资源指南,它是建立在多年来的积累贡献,从引导指南、信息图表到人们在Twitter,Facebook,Instagram等社交网站上的资源链接,其中有很多资源可供观看,无论是否你是初
关键时刻,第一时间送达! 作为一名狂热的数据科学爱好者,本文作者整理了 2017 年 Github 上尤为实用的数据科学资源,希望和大家共同学习。 📷 学习资源 Awesome Data Science 这个 GitHub 库是数据科学的终极资源指南。 多年来,它建立在各种各样的贡献之上,包括入门指南、信息图、以及人们在 Twitter,Facebook,Instagram 等社交网站上关注的学习内容。无论你是刚刚入门的新手还是经验丰富的数据科学家,都有很多资源可供参考学习。 目录如下: 📷 项目地址:ht
ultimatevocalremovergui 是一个使用深度神经网络的人声去除器的图形用户界面。 该项目提供了以下主要功能、关键特性和核心优势:
机器之心原创 作者:高琳 这个世界上的研究,总会有一些人去坐冷板凳,而坐冷板凳的人,他今天去坐明天不一定去坐。就像深度学习现在这么热,之前也有过很冷的阶段。 创业的这个过程中能够义无反顾,这是思必驰团队非常有特色的一个点。当然不是傻的义无反顾,如果说大家都没有学习能力,只是撞南墙是肯定不行的。但是如果没有这种义无反顾的决心,遇到困难就放弃,我不认为是一个合格的创业者。 对于创业者来讲,如果说他在很多事情上,不能够拿自己底层的东西去拼的话,这个创业,恐怕一遇到困难就会垮掉。 从研究到创业,这是俞凯在机器之心
在本文中,作者列出了 2017 年 GitHub 平台上最为热门的知识库,囊括了数据科学、机器学习、深度学习中的各种项目,希望能对大家学习、使用有所帮助。 GitHub 是计算机科学领域最为活跃的社区,在 GitHub 上,来自不同背景的人们分享越来越多的软件工具和资源库。在其中,你不仅可以获取自己所需的工具,还可以观看代码是如何写成并实现的。 作为一名机器学习爱好者,作者在本文中列出了 2017 年 GitHub 平台上最为热门的知识库,其中包含了学习资料与工具。希望对你的学习和研究有所帮助。 目录 学习
人工智能从幕后走向实用离不开人工智能技术取得的突破和发展。在互联网时代背景下,大数据、新型高性能计算架构以及深度学习帮助人工智能技术实现了从量变到质变的转变。其中,计算机视觉、语音识别技术均已能够规模
本文转载自机器之心 作者:黄小天 5 月 27 日,由机器之心主办、为期两天的全球机器智能峰会(GMIS 2017)在北京 898 创新空间顺利开幕。大会第一天重要嘉宾「LSTM 之父」Jürgen Schmidhuber、Citadel 首席人工智能官邓力、腾讯 AI Lab 副主任俞栋、英特尔 AIPG 数据科学部主任、GE Transportation Digital Solutions CTO Wesly Mukai 等知名人工智能专家参与峰会,并在主题演讲、圆桌论坛等互动形式下,从科学家、企业家、
5月2日,腾讯宣布任命语音识别技术顶级专家俞栋博士为AI Lab(人工智能实验室)副主任,并成立美国西雅图AI实验室。俞栋将负责西雅图AI实验室的运营及管理,推动腾讯在语音识别及自然语言理解等AI领域的基础研究。 这是近段时间以来,腾讯在人工智能领域的第三个大动作。 一个多月前的3月19日,由腾讯AI Lab研发的围棋AI绝艺,在日本UEC杯围棋大赛中夺得冠军。这是低调运行近一年后,腾讯AI Lab首次对外展示研究成果。 就在绝艺夺冠后不久,3月23日,腾讯宣布任命人工智能领域顶尖科学家张潼博士担任腾讯AI
选自Google Research Blog 作者:Jeff Dean 机器之心编译 参与:黄小天、路雪 继谷歌大脑 2016 年盘点之后,谷歌大脑负责人 Jeff Dean 近日撰文回顾了 2017 年的工作,内容包括基础研究工作,机器学习的开源软件、数据集和新硬件。本文是这次盘点的第一部分,谷歌将稍后推出第二部分,介绍机器学习在医疗、机器人等不同科学领域的应用与创造性,以及对谷歌自身工作带来的影响。 谷歌大脑团队致力于拓展人工智能在研究和系统工程方面的进展。去年,我们盘点了 2016 年的工作。2017
作者:Sunil Ray 在本文中,作者列出了 2017 年 GitHub 平台上最为热门的知识库,囊括了数据科学、机器学习、深度学习中的各种项目,希望能对大家学习、使用有所帮助。另,小编恬不知耻地把机器之心的 Github 项目也加了进来,求 star,求 pull requests。 GitHub 是计算机科学领域最为活跃的社区,在 GitHub 上,来自不同背景的人们分享越来越多的软件工具和资源库。在其中,你不仅可以获取自己所需的工具,还可以观看代码是如何写成并实现的。 作为一名机器学习爱好者,作者在
作为人工智能领域的一个重要方向,语音识别近年来在深度学习(Deep Learning)的推动下取得了重大的突破,为人机语音交互应用的开发奠定了技术基础。语音识别技术演进及实现方法、效果,既是语音识别从业者需要系统掌握的知识,也是智能化应用开发者应当了解的内容。日前,微软研究院首席研究员、《解析深度学习-语音识别实践》第一作者俞栋接受CSDN专访,深入解析了基于深度学习的语音识别的最新技术方向,和微软团队的实践心得,并对微软开源的深度学习工具CNTK的迭代思路做了介绍。 俞栋介绍了deep CNN、LFMMI
每周一期,纵览音视频技术领域的干货。 新闻投稿:contribute@livevideostack.com。 ---- LiveVideoStackCon 2022 北京站祝您国庆快乐! ⏰ 活动时间:2022年11月4-5日 🌏 活动地点:北京丽亭华苑酒店 音视频开发之旅(30) -音视频基础知识 从这篇开始我们进入FFmpeg系列的学习实践,作为开篇,我们先来了解下音视频相关的基础知识。 Android FFmpeg系列08--seek和精准seek seek功能的基本实现是比较简单的,不过要做到
20世纪以来随着电子技术的不断发展,以及人类对于自身的不断了解,机器人的研究也在不断的深入。现阶段能做出外表接近人类的机器人,走路接近人类的机器人……但这些都属于很前沿的领域,研究门槛高,实际的商业用途不是很广,所以大多还停留在样品阶段,走进市场的很少。随着互联网和智能手机的大潮,嵌入式处理器正在完成以前台式处理器做不到的事情,于是乎机器人现阶段又被重新定义。在现在的消费领域,某些配备智能处理器和具有互联网功能的产品也被成为了机器人,下面列举一些成熟产品的例子: 下图是两款国内厂家生产的机器人的产品,属于
金磊 发自 凹非寺 量子位 | 公众号 QbitAI AI成精,“逼疯”程序员;AI做高数,成绩超过博士;AI写代码,成功调教智能体…… 看多了这种故事,你是不是也觉得,AI太卷了,要上天了。 今天回归本源,讲点不那么玄幻的。AI为什么会进化?底层其实没有秘密,无非是语言、视觉等几大基本功。 其中,语言能力对AI的智能水平有决定性影响。视觉研究怎么“看”,语言研究“听”、“说”和“理解”。 对人类来说,“听”、“说”、“理解”相加,基本等于思维能力,对AI,道理也差不多。 最近,咨询机构Gartner发布《
原文标题:15 Trending Data Science GitHub Repositories you can not miss in 2017 作者:SUNIL RAY 翻译:杨金鸿 校对:闵黎 本文长度为3400字,建议阅读5分钟 本文为你分享2017年最热门的GitHub项目列表。 简介 GitHub最初的只是一个控制软件版本的工具,如今已经发展成为由来自不同背景的GitHub使用者共享他们自己开发的工具/库,甚至是有用代码库。 GitHub是一座蕴藏了丰富资源的知识宝库,您不仅可以看到最优
如今,很多大公司都会利用神经网络来完成一些模拟人类思维的任务。 最初实现的任务是语音识别,但是现在IBM的超级电脑沃森(Watson)及其他各种各样的神经网络正在不断实现各种认知过程,从诊断疾病到象棋、扑克以及围棋游戏,再到沃森计算系统,机器都战胜了人类。事实上,IBM已将一项名为CognizeR的扩展添加到了R数据库语言,从而使程序员能直接使用沃森的认知计算功能。 美国国际数据公司(IDC)的研究主任Dave Schubmehl指出:“神经网络技术已显著提升了各种各样的技术,有了神经网络,现在的语音识别要
“数据猿年度重磅活动预告:2020年度金猿策划活动(金猿榜单发布+金猿奖杯颁发+2.0版产业图谱+落地颁奖大会)即将推出,敬请咨询期待!
本视频上半部分为天猫精灵、小米智能音箱、叮咚智能音箱的简单测评;下半部分为CSDN创始人蒋涛对目前语音交互技术及趋势的一段精彩点评。 AI 滔滔是CSDN旗下一档关于科技类的评论节目,内容涵盖当下的科技热点内容,欢迎广大科技爱好者关注。 提示:文末有送书福利 作为消费级AI应用的首个载体,智能音箱今年特别的火。 但故事却要从2014年说起,当时亚马逊在其官网上低调的上线了一款智能音箱Echo,它搭载了Amazon 自家的智能语音助手Alexa,外形和普通的蓝牙音箱没有太大的区别,也没有显示屏,
InfoQ 特别面向新一代信息技术领域技术中坚群体正式推出的「中国技术力量」之「开源创新 30 人」栏目持续进行中,本期嘉宾是小米集团副总裁、集团技术委员会主席崔宝秋。
tensorflow高质量资料,让您又快又好地学习和应用tensorflow。 本文汇总tensorflow的高质量资料,包括:文档、论文、书籍、课程和案例。 1 文档 1 Getting Started With TensorFlow,从这里开始学习和认识tensorflow。 2 Tensorflow编程人员指南,指导如何用tensorflow编程。 3 Tensorflow教程,介绍tensorflow如何解决一些经典问题。例如:图像识别、文本挖掘等 2 论文 1 TensorFlow: Large-
百度在公司年度人工智能开发者大会上宣布已开始量产中国第一辆L4全自动巴士Apolong。Apolong是与中国客车制造商金龙合作开发的,由百度Apollo自动驾驶开放平台提供动力,将在北京,深圳,雄安,武汉和福建平潭等城市投入商业运营,并将目光瞄准海外市场。在会议上,百度还宣布了最新升级到Apollo 3.0以更好地支持区域内的自动驾驶。
导读:读书,伴随技术人的一生。技术人通过读书增长见闻、精进技术,提升人生境界。4月23日,恰逢世界读书日,腾讯技术工程官方号特别邀请腾讯AI实验室主任、杰出科学家张潼博士,腾讯AI实验室副主任,杰出科
【新智元导读】科技巨头纷纷投入 AI,谁将在这场军备竞赛中胜出?本文介绍谷歌等主要几家巨头公司的AI布局。不过,无论谁最后胜出,消费者都将受益。 人工智能正在迅速成为科技领域最流行的话题之一,科技巨头们也毫不忽视这一趋势。所有的大公司似乎都在以某种方式投资机器学习。 谁将在这场AI军备竞赛中胜出?现在得出定论还太早,但对消费者来说,无论谁胜出消费者都将受益。AI在日常服务以及产品中的渗透只会提升终端用户的体验。 市场研究公司IDC预测,到2020年,AI的市场规模将从今年的80亿美元增长到470亿美元。本文
全球顶尖人工智能专家、百度首席科学家吴恩达在《哈佛商业评论》撰文讨论了当前人工智能的能力与不足。吴恩达谈到: 许多企业高管问我人工智能够做些什么,他们想要知道人工智能会如何颠覆其所在的行业以及他们可以如何利用人工智能来重塑自己的公司。但最近的一些媒体报道对人工智能能力的描绘有点不切实际,如人工智能会统治整个世界。人工智能现在已经改变了网络搜索、广告、电子商务、金融、物流、媒体等领域。作为谷歌大脑(Google Brain)团队创办人、斯坦福人工智能实验室(Stanford Artificial Intell
选自Analytics Vidhya 作者:Sunil Ray 机器之心编译 在本文中,作者列出了 2017 年 GitHub 平台上最为热门的知识库,囊括了数据科学、机器学习、深度学习中的各种项目,希望能对大家学习、使用有所帮助。另,小编恬不知耻地把机器之心的 Github 项目也加了进来,求 star,求 pull requests。 GitHub 是计算机科学领域最为活跃的社区,在 GitHub 上,来自不同背景的人们分享越来越多的软件工具和资源库。在其中,你不仅可以获取自己所需的工具,还可以观看代
2017年5月2日,腾讯宣布任命语音识别技术顶级专家俞栋博士为AI Lab(人工智能实验室)副主任,并成立美国西雅图AI实验室。 俞栋博士将负责西雅图AI实验室的运营及管理,推动腾讯在语音识别及自然语言理解等AI领域的基础研究。 这是近段时间以来,腾讯在人工智能领域的第三个大动作。 一个多月前的3月19日,由腾讯AI Lab研发的围棋AI绝艺,在日本UEC杯围棋大赛中夺得冠军。这是低调运行近一年后,腾讯AI Lab首次对外展示研究成果。 绝艺团队参加UEC比赛时 就在绝艺夺冠后不久,3月23日,腾讯
斯坦福大学近日重磅发布了 AI 指数 2017 年度报告,从学术、产业、技术等多个角度盘点了 AI 领域的动态和进度。 毋庸置疑 ,AI 是近年来的行业热点,吸引了越来越多的从业者、行业领袖、决策者
2017年5月2日,腾讯宣布任命语音识别技术顶级专家俞栋博士为AI Lab(人工智能实验室)副主任,并成立美国西雅图AI实验室。 俞栋博士将负责西雅图AI实验室的运营及管理,推动腾讯在语音识别及自然语言理解等AI领域的基础研究。 这是近段时间以来,腾讯在人工智能领域的第三个大动作。 一个多月前的3月19日,由腾讯AI Lab研发的围棋AI绝艺,在日本UEC杯围棋大赛中夺得冠军。这是低调运行近一年后,腾讯AI Lab首次对外展示研究成果。 就在绝艺夺冠后不久,3月23日,腾讯宣布任命人工智能领域顶尖
舒石 李林 编译整理 量子位 报道 | 公众号 QbitAI 都在押注人工智能,所以抢人是一件不可不免的事。腾讯,现在遇上了西雅图。 腾讯很早就在旧金山湾区的Palo Alto设有核心机构,而且近期还
2017 年,在深度学习技术的加持下,CV、NLP、数据分析等领域全面开花,同时大量新开发工具和开源软件的涌现,降低了人工智能开发的门槛,加速了深度学习的普及。本文从深度学习、CV、NLP 的方面盘点 2017 年 AI 研习社报道过的 AI 领域新开源软件,为各位读者提供开发和设计的参考。 如果本文没有涵盖你心目中最爱的 AI 开发工具,欢迎你在评论区留言讨论。 深度学习 BigDL BigDL 是 Intel 开源的一个基于 Apache Spark 的分布式深度学习库。通过使用 BigDL,用户可
机器之心整理 演讲者:俞栋 5 月 27-28 日,机器之心在北京顺利主办了第一届全球机器智能峰会(GMIS 2017),来自美国、加拿大、欧洲,中国香港及国内的众多顶级专家分享了精彩的主题演讲。在这
TensorFlow™ 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。它灵活的架构让你可以在多种平台上展开计算,例如台式计算机中的一个或多个CPU(或GPU),服务器,移动设备等等。TensorFlow 最初由Google大脑小组(隶属于Google机器智能研究机构)的研究员和工程师们开发出来,用于机器学习和深度神经网络方面的研究,但这个系统的通用性使其也可广泛用于其他计算领域。
ASRT 是一套基于深度学习实现的语音识别系统,全称为 Auto Speech Recognition Tool,由 AI 柠檬博主开发并在 GitHub 上开源(GPL 3.0 协议)。本项目声学模型通过采用卷积神经网络(CNN)和连接性时序分类(CTC)方法,使用大量中文语音数据集进行训练,将声音转录为中文拼音,并通过语言模型,将拼音序列转换为中文文本。基于该模型,作者在 Windows 平台上实现了一个基于 ASRT 的语音识别应用软件它同样也在 GitHub 上开源了。
编者按:本文原作者 Cindi Thompson,美国德克萨斯大学奥斯汀分校(University of Texas at Austin)计算机科学博士,数据科学咨询公司硅谷数据科学(Silicon Valley Data Science,SVDS)首席科学家,在机器学习、自然语言处理等领域具有丰富的学术研究和产业界从业经验。AI 研习社编译。 作为 SVDS 研究团队的成员,我们会经常接触各种不同的语音识别技术,也差不多见证了语音识别技术近几年的发展。直到几年之前,最先进的语音技术方案大多都是以语音为
五一来了,放松下来的你,是不是偶尔会打开直播,与长发锥子脸的主播来一场亲密的互动秀聊? 在直播这块娱乐大市场,人工智能到底有何用武之地? 面对每天在直播间诞生的超大量级的数据,人工智能到底能帮上哪些忙? 直播的背后,初创科技公司到底有哪些创业机会? 今天,我们会介绍两家公司,他们分别在直播的链条上,做着自己的布局,运用人工智能以及相关技术,让人们在直播间玩得爽的同时,分食这块600亿的大蛋糕。 第一家公司,竹筏科技,它是如何以强悍的数据处理能力,游走在直播间,嗅觉灵敏地提炼着其中最优质地内容。而第二家公
智能外呼在国内已发展多年,整体的技术早已非常成熟。那么一个简单的智能外呼系统应该包含哪些东西呢?
最近,斯坦福“人工智能百年(AI100)”专家小组(非盈利性项目AI Index)发起了一项AI指数报告,追踪学术界、产业界、开源软件和公共兴趣范畴的18个分立的视角评估人工智能活跃度,盘点计算机视觉
从“冷板凳”到“最热风口”,俞凯博士(思必驰联合创始人、首席科学家)一直相信人机交互,将带给人类一个更美好的未来。并且,他还有一个更远大的目标,借助科技,沟通万事、打理万物,从而改变世界。
本文探讨了人工智能指数报告的重要性,指出其有助于了解AI技术的发展趋势和全球AI发展不平衡的问题。文章还讨论了人工智能技术成熟度方面的进展,并提出了在AI发展中应对泡沫和过渡期挑战的建议。
领取专属 10元无门槛券
手把手带您无忧上云