首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    「形色」专访:爆款识花软件的炼成之路

    有人提出这样一种看法,「形色识别的准确度比较高是因为前期训练数据比较多,而微软花识别率太低是因为训练数据少,但他们的算法相对来说比较优秀。」...,数量的上限大约在 500 种,超过这个数量级,系统的工作量和数据库的承载能力都无法实现。...形色表示,在某种程度上,计算机可以看到很多人眼无法辨识的特征。...现在,形色 App 已经入驻上百万植物专家和植物爱好者,当系统碰到实在无法别的植物,用户可以直接上传到鉴定区,植物专家和爱好者会在几分钟内给出他们的答案。...除了中国版,形色也推出海外版花软件 PictureThis,对于推出海外版的原因,形色对雷锋网 AI 研习社如是说道,「一方面,全球化是目前软件发展的趋势,软件做大后肯定要走向更广阔的市场;另一方面

    2.2K40

    下一代听歌曲技术——从信号处理到深度学习

    LiveVideoStackCon 2022 北京站邀请到了腾讯音乐的孔令城老师,为我们介绍QQ音乐在听歌方面的成熟方案。...我会通过以下四个方面来介绍我们天琴实验室在听歌方面所做的工作。 -01- 经典听歌曲系统 当特别想听某一首歌的时候我们会采取什么措施?熟悉的歌曲可以直接在音乐APP上搜索歌名。...怎么衡量一款听歌曲效果的好坏?什么样的听歌曲才是好的系统?QQ音乐的听歌曲到底效果怎样呢?来看看用户的反馈。 用户的期望可以总结为曲库全、识别准、速度快、灵敏度高以及旋律识别的模糊性。...即便是更短的片段时长,QQ音乐识别的精准率仍然保持在100%,尽管在更短的情况召回率降低,但在一定程度上也能提升用户体验。 使用经典听歌曲系统,无结果中的样本中,翻唱歌曲占60%甚至更多。...可以看到对一些检索库中不存在的翻奏例子或者翻唱的例子,经典听歌曲系统无法识别。 从19年开始翻唱、改编歌曲呈爆发性增长。其中的原因我们也不言而喻。因此我们迫切需要进行技术更新。

    1.9K50

    Python 自定义包的导入问题 和 打包成exe无法别的电脑运行的问题

    问题描述 在一个文件中要引入一个自定义包中的模块,出现模块无法导入问题, 此时采取第一种解决方法: 先导入sys模块 然后通过sys.path.append(path)函数来导入自定义模块所在的目录 导入自定义模块...上面的解决方法会导致以下问题: 可以在本地成功运行,但是打包成exe以后,到别的电脑上无法运行,因为sys.path.append(path)里面的path在别的电脑上不一定存在。...第二种解决方法: 不在代码里使用sys.path.append(path),保证代码里不存在本地绝对路径,把要导入的自定义包拷贝到site-packages目录下, 然后再打包成exe以后就可以在别的电脑上成功运行

    2.6K20

    移动硬盘无法访问提示此卷不包含可识别的文件系统怎么办?

    移动硬盘无法访问提示"此卷不包含可识别的文件系统"怎么办?如何修复?移动硬盘里有重要数据,有办法恢复吗?不要着急,小编一一为你解答。...本文谈到的"此卷不包含可识别的文件系统"也会发生在移动硬盘上。将移动硬盘接到电脑上,打开文件管理器,双击移动硬盘分区,系统会弹出下图的错误信息"位置不可用。无法访问。此卷不包含可识别的文件系统。...移动硬盘无法访问提示"此卷不包含可识别的文件系统"怎么办? 第一步:进行移动硬盘数据恢复,将重要数据恢复到其他分区。...第二步:将无法访问的移动硬盘格式化 移动硬盘无法访问提示"此卷不包含可识别的文件系统"问题最简单的解决方式是格式化。不过,在格式化之前,建议先查看下已经恢复的数据。...总结 以上就是移动硬盘无法访问提示"此卷不包含可识别的文件系统"的解决方法了。小编提醒大家,如果移动硬盘里的数据非常重要,在数据成功恢复之前千万不要进行格式化等操作。

    5K30

    “人工智能”的边际

    那么除了这些条件以外,还有别的吗?有啊,电力!也就是能量,没有电,一切人工智能都会虾米。如何有电呢,用煤炭、天然气、石油、水里、风力、太阳光、等等用来发电才能有电。...心法无形无相,心法可以出生物质法(色法),但反过来却不能成立,是虚妄想,而人工智能确实是人类的前六通过外在物质方面的功能延伸。...那么继续向极限的方向考虑,也就是原则上,虽然在工具或术的实际功能和性能方面,人工智能可能达到并超过大部分正常人类的前六在相同的功能和性能方面的效果。但充其量,也是人类利用自己的智慧制造的工具而已。...原因是直觉是人类的第七所直接负责,而第七只有佛法的修行人才可以如实全面的现观其功能体性,属于“心法”,而出生人工智能的人类第六意识必须有第七识才能出生,这就是人工智能无法有真正直觉的原因。...无论未来人工智能如何发展,都无法实现第七意根和第八如来藏,也无法代替前六,也就是人工智能不仅毫无超越人类本身的可能性,而且从本质上说连动物的智能都无法超越,无论任何低级动物。

    2.5K90

    微信AI从物到通用图像搜索的探索揭秘

    作者:lincolnlin,腾讯 WXG 专家研究员 微信物是一款主打物品识别的 AI 产品,通过相机拍摄物品,更高效、更智能地获取信息。...电商场景:我们要识别的集合是无限大的,而且还是动态的。所以我们是通过动态图像召回。从召回的结果上推断出商品的具体款式。 动植物汽车这种场景:集合是相对固定的。而且需要一些专业的数据库。...前面提到服务端的检测是带有类别的,比如图中输出鞋子,那么我们就走鞋子的专用检索模型提取特征,再到鞋子库中检索。这是最朴素的版本。...检索篇 | 通用以图搜图之无监督的分库 上面提到的是物的检索方案实现,回到通用的以图搜图场景,我们无法简单的把图片定义成 N 个库出来,所以我们用了无监督的分库方法。...另一方面,基于微信的图片应用场景,我们开拓出了微信物、长按识图等新的尝试入口。相信紧贴用户场景,通过技术的不断沉淀积累,一定可以孕育出更多的智能产品。 ?

    3.3K30

    音乐识别探索之路|音色识别亮相IJCNN,UAE惊艳ICASSP

    更多听歌曲相关的科普,欢迎阅读听歌曲科普文 ☞ 链接1: QQ音乐听歌曲系列之五 ☞ 链接2:QQ音乐听歌曲系列之四 ☞ 链接3:QQ音乐听歌曲系列之三 ☞ 链接4:QQ音乐听歌曲系列之二...这种算法作为哼唱识别的主流方法被广泛使用。我们也同时在探索一些更新的基于深度学习的哼唱识别方案,期待能进一步提升用户体验。 翻唱识别:翻唱识别可以称之为下一代听歌曲技术。...经过我们调研,业界最新的歌手识别的指标大大落后于主流说话人声纹识别的表现。...下图是我们的一些歌声声纹识别的应用案例,我们将在落地场景上继续不断探索。 ? ?...International Conference on Acoustics, Speech and Signal Processing)即国际声学、语音与信号处理会议,是全世界最大的,也是最全面的信号处理及其应用方面的顶级会议

    4.9K20

    基于信息理论的机器学习-中科院自动化所胡包钢研究员教程分享04(附pdf下载)

    ▌概述 本次tutorial的目的是,1.介绍信息学习理论与模式识别的基本概念与原理;2.揭示最新的理论研究进展;3.从机器学习与人工智能的研究中启发思索。...本次tutorial的目的是,1.介绍信息学习理论与模式识别的基本概念与原理;2.揭示最新的理论研究进展;3.从机器学习与人工智能的研究中启发思索。...但是它们均无法在拒分类学习中胜任。而互信息分类器在拒分类学习中表现了独特的优势。该方法能够根据数据的分布自动平衡误差类别与拒类别。...另一方面我们首次考察了拒分类以及多值分类中代价矩阵的独立参数个数,这与分类器类型无关。 存在问题:如何发展互信息为学习目标(基本上为非凸函数)的高速有效的学习方法仍是开放问题。...本课程试图给出这方面两个原理性研究样例。我们认为目前人工智能研究更多是“工具”式研究。当这方面工作十分必要时,读者还应该思考未来的发展趋势。 ?

    1.8K70

    人民大学提出听音物AI框架,不用人工标注,嘈杂环境也能Hold住,还可迁移到物体检测

    对于人类而言,听音物是一件小事,但是放在AI身上就不一样了。 因为视觉和音频之间对应关系无法直接关联,过去算法往往依赖于手动转换或者人工标注。...聚类的每一个簇,被认为能够代表一种语义类别的视觉表征集合。 由此一来,AI便在无形之中掌握了不同乐器在外观和声音上的关系,也就是可以听音物了。...第二阶段中,研究人员让这个框架先能从视觉方面定位出画面中存在的不同物体,然后再根据声音信息过滤掉不发声物体。 其中,定位物体这一步用到了第一阶段中得出的物体视觉表征字典。...△每行前3张为真实演奏场景,后4张为合成场景 在具体表现上,研究人员分别使用了合成音乐、二重奏等4个数据集来测试这个框架识别的水平。...作者分别展示了成功和失败的一些例子: △一些成功案例 △一些失败案例 作者表示,出现失败的情况中,一方面无法定位到正确的声源位置(如上图第一行)。

    53640

    专访 | 蚂蚁金服生物识别技术负责人陈继东:数据驱动人工智能引发行业变革

    机器之心:能否分享一下如何将人脸识别精度提升到金融交易应用级别的要求? 陈继东:在保证极低误率的同时拥有很高的准确率,是人脸识别金融级精准度的基础要求。...但是在金融的场景下,这个误率是无法满足的,这意味着有可能别人试了一千次就有一次进入我的账户,盗用我的资金,这个安全等级是远远不够的。...我们至少是需要万分之一,甚至十万分之一,到未来是百万分之一的误率。在这个误率的情况下,你对的概率能到多少呢?...人脸的角度、光线、表情、年龄、化妆、遮挡、照片质量等方面会使同一个人差异比较大;在机器识别的人数增加的时候,不同的人出现长得比较像的概率也会增加,差异反而变小,这是人脸识别一个最大的难点。...在实验室环境下,机器进行人脸识别的准确率已经超过肉眼,但在真实应用中还受到很多其他方面的影响,所以如果只看实验室的数据,到真实应用的时候会发现准确率远远没有那么高。

    3.2K130

    挑战真实场景对话——小爱同学背后关键技术深度解析

    关于特征,首先是NLU部分,NLU是利用小爱大脑意图识别的能力,给出domain和意图的打分。...策略拒还存在缺点,由于拒策略的设计是基于一部分特征,而不是综合利用所有特征,也就无法学习特征的组合。 当不同特征的策略有冲突的时候,这种办法就很难处理了。 1.2语义拒 ?...介绍一下我们的做法,数据方面,人工标注大约26K的训练集,采用的特征,首先策略拒中用到的一些文本特征,针对query提取表示向量,然后加一些统计特征,比如query的频次、统计特征,从一方面也能反映query...比如一段无意义的人声如果被识别成有头部意图的query的话,很容易干扰拒的工作。 第二个问题是有些时候我们无法单纯从文本确定是不是在和小爱说话,比如用户对着旁边的孩子说给我背一下《弟子规》。...而在全双工的拒方面,如果能利用多模态的信息,可以对拒的准确率有更好的提升。 再一方面是情绪对话,也是小爱在尝试的一个方向。情绪对话包含两方面:一方面是小爱的情绪,一方面是用户的情绪。

    5.1K40

    基于信息理论的机器学习-中科院自动化所胡包钢研究员教程分享03(附pdf下载)

    ▌概述 ---- 本次tutorial的目的是,1.介绍信息学习理论与模式识别的基本概念与原理;2.揭示最新的理论研究进展;3.从机器学习与人工智能的研究中启发思索。...思考为什么M2与M3无法区分,列为同序B?“元准则”可以理解为是期待底层准则要尽量可以包容的特征。Meta3是对Meta2的进一步期待要求。 ?...第4章总结 ---- 不同于已有的“分而治之”各种方法,要理解拒决策为机器学习带来了新的研究空间,而拒子空间研究工作仍有不足。拒分类方式符合人类的智能决策原理。...由此如何“合理”评价拒分类是个理论与应用方面的问题。根据“丑小鸭定理”,我们首次提出了显式表达的“元准则”策略方法。...本章在拒决策中从“误差类别”与“拒类别”同时考察的角度展开研究。这也是来源于应用中的问题。由于常规分类评价指标已经无法适用于拒结果评价,我们对24个信息论指标进行系统性考察。

    1.2K70

    【祝贺】模式识别国家重点实验室正式对外开放30周年纪念活动在北京举行!

    、类脑智能等方面发力,取得了丰硕的成果。...谭铁牛院士表示他一路走来见证了模式识别实验室的风风雨雨,实验室的场地从模小楼到自动化大厦,智能化大厦,也是模实验室发展壮大的缩影,在这三十年间实验室培养了大批模式识别的人才。...三十年来模实验室的成就值得在模式识别的发展历史里记下重要的一笔。最后胡院士表达了对模实验室的衷心祝愿与期望。...他们也对大家作出了期待,希望能够在模式别的领域有所突破,可以看到一些“新面孔”,开辟出新的方向。...学术沙龙 在学术沙龙中,室友王蕴红教授,现为北京航空航天大学计算机学院副院长,介绍了图像视频多维度理解方面的问题。

    1.5K60

    下一代听歌曲技术探索;银河音效技术实践;歌唱评价与内容理解实践;音乐驱动虚拟人

    下一代听歌曲技术探索 Topic 《QQ音乐下一代听歌曲技术》 孔令城  腾讯音乐天琴实验室 音频识别组组长 传统的听歌曲技术是一种严格的基于音频内容的匹配检索技术,如果要通过传统听歌曲技术识别到一首被人翻唱或者改编的歌曲...随着移动互联网的崛起,直播、K歌、短视频等用户翻唱、改编的歌曲越来越多,尤其是热门歌曲同质化严重,如果基于传统听歌曲技术的系统,检索库不及时、大量的更新入这种内容,那么就会导致很多歌曲无法识别。...为了解决当前用户痛点,我们探索出下一代听歌曲技术。 1. 听歌曲面临的挑战 2. 听歌曲中翻唱识别技术 3. 听歌曲中多模态识别技术 4....一方面,空间环绕效果一直深受广大用户追捧,也是银河音效在听歌体验方面持续优化的一种沉浸式效果。另一方面,面向音效发烧友的专业制作工具大大激发了用户创作个性化音效的热情,从而形成了高度活跃的音效社区。...本演讲将重点介绍TME天琴实验室在音乐驱动领域的 Music XR Maker 系统,包括虚拟人舞蹈生成、歌唱表演生成、音乐灯光秀等方面的最新进展。 1. Music XR Maker 2.

    98130

    科技白震东:基于图像分析技术与边缘计算,守好最佳数据入口 | 镁客·请讲

    图 | 臻科技SVP高级副总裁 白震东 部署在前端的边缘计算,是臻科技的“一大杀器”。...臻科技SVP高级副总裁白震东说到。 发展至今,成立了11年的臻科技在核心业务智能交通方向已经取得了骄人的成果,但是说到公司的“第一桶金”,并不在智能交通赛道。...基于这一考虑,他们凭借自身算法在字符、车辆信息、结构化特征识别的优势,再结合国情、经济越来越好,停车需求激增的市场需求,最终将自己的首个核心业务定位在智能交通。...大厂的团队不管是产品设计还是业务模式,几乎都是围绕传统方式进行,而我们有算法,且这个可以经过行业千锤百炼的智能算法能够部署在前端;其次,我们的团队是多元化的,来自图像处理公司的精英团队帮助公司进一步增强对成像的理解,且臻本身在硬件供应方面的能力也很强...至于公司下一步的规划,白震东表示,在继续保持静态智能交通行业第一的前提下,将通过城市的“路面停车”切入更多的政府级项目,同时,臻科技还将继续加大对安防、商业、门禁、管理等方面的投入,力图在边缘端做到最强

    82820
    领券