注意,声学工程师和音频工程师可不是同一岗位,前者会更侧重于硬件,后者侧重于软件层面。但是关于声音的一些基础内容还是相同的,可以多多了解!!!
本系列博客包括6个专栏,分别为:《自动驾驶技术概览》、《自动驾驶汽车平台技术基础》、《自动驾驶汽车定位技术》、《自动驾驶汽车环境感知》、《自动驾驶汽车决策与控制》、《自动驾驶系统设计及应用》,笔者不是自动驾驶领域的专家,只是一个在探索自动驾驶路上的小白,此系列丛书尚未阅读完,也是边阅读边总结边思考,欢迎各位小伙伴,各位大牛们在评论区给出建议,帮笔者这个小白挑出错误,谢谢! 此专栏是关于《自动驾驶汽车环境感知》书籍的笔记。
Pine 发自 凹非寺 量子位 | 公众号 QbitAI 现在,在芯片中也可以用声波传输数据了。 看到这里你可能会疑惑: 光学芯片不是还在发展中,怎么又出来个声学芯片? 其实,声学集成电路一直都在发展,声波相较于光来说速度会更慢,但这种“迟缓”的属性未尝不是一件好事—— 在设计量子电路时,为了提升探测精度,需要不断引入新材料,让载波信号在尽量短的距离内“折返”以获取数据。 如果用速度更快的光波,“折返”一次所需的距离会更大,可能会超出现有设备能测量的范围,也限制了探测精度的进一步提升。 因此,声学芯片一直
物联网将各种信息传感设备与网络结合起来而形成的一个巨大网络。物联网建设如火如荼,预计2023年底,在国内主要城市初步建成物联网新型基础设施,连接数突破20亿。
生活中无论是手机解锁、智能门锁、打卡机等,都还会用到指纹解锁。电影中还会出现这样的桥段,有心之人将某人的指纹提取复制出来,然后用其指纹为非作歹,比如……代替他人打卡。
本文节选自《语音识别基本法:Kaldi实践与探索》一书! ---- --正文-- 从起初的一声巨响,到梵音天籁,到耳旁的窃窃私语,到妈妈喊我回家吃饭,总离不开声音。 声音是这个世界存在并运动着的证据。 假设我们已经知道了声音是什么。 我们可以找到很多描述声音的词语,如“抑扬顿挫”“余音绕梁”。 当我们在脑海中搜索这类词语时,描述对象总绕不过这两个:人的声音和物的声音。 人的声音,就是语音;物的声音,多数是指音乐。 这样的选择源于人的先验预期:语音和音乐最可能有意义,有意义的事情人们才会关注。估计不会有人乐
新型微小型天线未来可用于无线通信、物联网、可穿戴设备、智能手机等。 近日,《自然通讯》杂志发布了一篇文章,它描述了一种新型天线设计方案,文中表示,根据此方案将能制造出比当前小型天线还要小一百倍的天线。 图 | 目前的小型天线产品 目前,现有的小型天线都是基于电磁共振,因此天线的尺寸需要根据电磁波的波长。现实应用的天线长度至少都要大于波长的十分之一,近十年来,天线的进一步小型化已经是一个公开的难题。 而设计的新型ME天线(尺寸小于波长的千分之一)在最先进的小型天线上实现了1-2个数量级的缩小,而且性能也没有下
现在抖音快手各种短视频也算是深入人心了,短视频剪辑中有一个非常重要的功能,就是音视频合成,选择一段视频和一段音频,然后将它们合成一个新的视频,新生成的视频中会有两个音频的混音。 下面我们来拆分一下音视频合成的做法:
在短视频兴起的背景下,音视频开发越来越受到重视。接下来将为大家介绍音频开发者入门知识,帮助读者快速了解这个领域。
昨天上海又新增了快六千多例,早上醒来的第一眼都很关注,这个时候,在想如果无人驾驶送餐车在各个街道行驶送餐那该多好,希望这一天能早点到来,让无人驾驶遍布咱们生活的每个角落。OK,言归正传,首先讲讲什么是超声波雷达。
为了能更好的理解后续的音质概念与进一步分析,本文首先带大家回顾并科普一些音频相关的基础概念。
大家有没有听过音叉发出的声音?音叉振动产生的声波很接近正弦波。计算机合成的纯正正弦波,点击下面的音频即可试听。下面是频率为 100 HZ 的音频。
我站在墙前,想看到拐角处我视线范围之外的事物,除了伸长脖子或者走过去,还有别的方法吗?
声音始于空气中的振动,如吉他弦、人的声带或扬声器纸盆产生的振动。这些振动一起推动邻近的空气分子,而轻微增加空气压力。压力下的空气分子随后推动周围的空气分子,后者又推动下一组分子,依此类推。高压区域穿过空气时,在后面留下低压区域。当这些压力波的变化到达人耳时,会振动耳中的神经末梢,我们将这些振动听为声音。
同一时间,赛微电子也发布公告宣布,近日,旗下控股子公司赛莱克斯微系统科技(北京)有限公司(简称“赛莱克斯北京”或“北京 FAB3”)以 MEMS (微机电系统)工艺为某客户制造的系列 BAW(Bulk Acoustic Wave,带谐振腔体声 波)滤波器完成了小批量试生产阶段。2023 年7月15日,该客户已与赛莱克斯北京同步签署《长期采购协议》, 赛莱克斯北京开始进行 BAW 滤波器的商业化规模量产。
时隔65年,在近日Google Research软件工程师Inbar Mosseri和Oran Lang发表的论文《Looking to Listen at the Cocktail Party》中,采用了一个全新的视听模型为“鸡尾酒会”问题提供了一个合适的解决之道,这一突破为语音识别不仅带来了更多新可能,同时也成为该领域一个划时代的分水岭。
WAV是一种波形音频文件格式(Waveform Audio File Format)。虽然是一种古老的格式(九十年代初开发),但今天仍然可以看到这种文件。 WAV具有简单、可移植、高保真等特点。
激光雷达的波长介于750nm-950nm之间, 以单线或多线束机制辐射光束,接收目标或环境的反射信号, 以回波时间差和波束指向测量目标的距离和角度等空间位置参数。 激光雷达主要优点如下: (1)波长短,测量精度高 (2)多线束的探测, 可以实现对场景的三维成像。 激光雷达的主要缺点是: (1)抗干扰能力低, 易受天气影响, 在雨雪雾等天气的作用下, 激光雷达使 用受限。 (2)激光发射、被测目标表面粗糙等因素都对测量精度有影响。 (3)结构复杂, 除激光器本身, 还必须添加精密伺服机构, 实现对探测空域 机械扫描, H前的成本以数万美元计。
双十一将至,购物车装的怎么样了?每年一到这时候,各大商家都已开始密集部署活动,等你剁手。
---- 新智元报道 编辑:Aeneas 桃子 【新智元导读】一心豪赌纯视觉方案的特斯拉,这次官宣把超声波雷达弃了。 山无棱,天地合,马斯克初心未改。 作为纯视觉一贯的忠实信徒,他近日宣布:特斯拉即将采用100%纯视觉方案! 继2021年5月特斯拉弃用毫米波雷达后,这次连仅有的超声波雷达也扔掉了。 你如何看? 网友表示:不敢看,以后看见特斯拉就要躲远点。 超声波雷达被弃了! 近日,特斯拉官方称,从10月开始,欧洲、北美、中东地区交付的Model 3、 Model Y将移除超声波雷达传感器(
摄像头:可分为数字摄像头和模拟摄像头两大类。数字摄像头可以将视频采集设备产生的模拟视频信号转换成数字信号,进而将其储存在计算机里。模拟摄像头捕捉到的视频信号必须经过特定的视频捕捉卡将模拟信号转换成数字模式,并加以压缩后才可以转换到计算机上运用。数字摄像头可以直接捕捉影像,然后通过串、并口或者USB接口传到计算机里。
摄像头可分为数字摄像头和模拟摄像头两大类。数字摄像头可以将视频采集设备产生的模拟视频信号转换成数字信号,进而将其储存在计算机里。模拟摄像头捕捉到的视频信号必须经过特定的视频捕捉卡将模拟信号转换成数字模式,并加以压缩后才可以转换到计算机上运用。数字摄像头可以直接捕捉影像,然后通过串、并口或者USB接口传到计算机里。
NVH(Noise、Vibration、Harshness噪声、振动与声振粗糙度)是衡量汽车制造质量的重要参数,可分为发动机NVH、车身NVH和底盘NVH三大部分。NVH直接决定着驾乘汽车的舒适度,有统计资料显示,整车约有1/3的故障问题是和车辆的NVH问题有关系,而各大公司有近20%的研发费用消耗在解决车辆的NVH问题上。
在倒车入库,慢慢挪动车子的过程中,在驾驶室内能听到”滴滴滴“的声音,这些声音就是根据超声波雷达的检测距离给司机的反馈信息。
现实中的声音是一段连续的信号, 现在大部分的声音是以离散的数字信号保存下来,例如CD、MP3音频格式。 在保存这些信息时,考虑到对声音质量和存储的效率, 需要对声音的几个重要的基本属性进行研究。
【新智元导读】吴恩达曾经预测当语音识别的准确率从95%上升到99%时,语音识别将会成为人类与计算机交互的新方式。归功于深度学习,这4%的准确率的提升使得语音识别从难以实际应用的技术变成有无限的应用潜力
超声波雷达听着很陌生,但其实一直被广泛使用在倒车上,与毫米波雷达不同的是:超声波能被任何材质的障碍物反射,毫米波只能被金属物体反射,超声波雷达的探测距离又很近,到底工作原理是什么,下面我带大家一起来来看看。
VR可以说是当下最火热的科技趋势之一,但VR音频技术却从没有在专业音频领域获得热捧。虽然音频技术几乎是和视频服务一起进入市场,但在VR游戏、VR电影等中的表现却远不如画面更“吸睛”。
杨净 丰色 发自 凹非寺 量子位 | 公众号 QbitAI 100%纯视觉信念者马斯克,现在扔掉了最后一个雷达。 如今的特斯拉传感器方案,有且只有8个摄像头,换而言之不论是L2级的辅助驾驶还是无人驾驶能力的FSD,都完全靠这8个摄像头。 而被他扔掉的,正是雷达三剑客中性价比之王——超声波雷达。 它售价不过数十元,部署一整套自主泊车系统也不过500块,跟毫米波雷达、激光雷达相比不足为道。 更有人直言:超声波雷达只有好处,没有坏处。 而结合上次马斯克扔掉毫米波雷达,网友们更是坐不住了: 「幽灵刹车」到现在还
从字面意思很容易理解, SAW是声表面波,BAW是声“体面”波?是不是BAW更加体面一些?为什么要折腾来折腾去,让声波来回跑?
蝙蝠使用生物声呐,为夜晚在丛林中飞行导航。他们的超声波脉冲,可以比人造声呐装置更精确地对声音进行定位。为复制、驾驭这种能力,IBM 学院奖获得者 Rolf Müller 教授协同他在弗吉尼亚理工学院(Virginia Tech)的团队,设计了一种人造蝙蝠耳。 Rolf Müller 的研究引起了 IBM 的注意。IBM 专家韩金萍(音译)的神经计算团队,和 IBM Watson 语音专家崔晓东(音译)和他的同事, 看到了 Müller 教授人造“动态外耳”(dynamic peripheral,蝙蝠可转
在上一次分享中,我介绍了毫米波雷达的原理、数据特性及优缺点。毫米波雷达的低环境敏感和低成本的特性使得其在ADAS和自动驾驶领域得到了广泛的应用。
本节主要介绍语音感知和听觉特性,包括人体的语音听觉系统,客观度量和主观听觉感受以及听觉特性三方面内容。
智能音箱近两年走入了很多家庭的生活,成为了娱乐、购物、日程管理、儿童陪伴甚至教育方面的帮手。但是,智能音箱的安全问题也日益受到关注。继今年 11 月份,有研究使用激光黑掉智能音箱后,又有新的破解方法来了。这回直接用定向声波。
自动驾驶汽车包括五大核心部分:感知、传感器融合、定位、规划和控制,这五大部分涉及的内容及相互之间的关联楼主会在后续几篇中逐步介绍,这篇楼主先从感知部分说起。
视频是Tesla自动驾驶简述 给自动驾驶一双”通天眼” ——环境感知器篇 ▌智能驾驶感知任务
一幅图像可定义为一个二维函数 f(x,y)f(x,y)f(x,y),其中 xxx 和 yyy 是空间(平面)坐标,而任何一对空间坐标 (x,y)(x,y)(x,y) 处的幅值 fff 称为图像在该点处的强度或灰度。当 x,yx,yx,y 和灰度值 fff 是有限的离散数值时,我们称该图像为数字图像。数字图像处理是指借助于数字计算机来处理数字图像。
从字面上来说,数字化 (Digital) 就是以数字来表示,例如用数字去记录一张桌子的长宽尺寸,各木料间的角度,这就是一种数字化。跟数位常常一起被提到的字是模拟 ( Analog/Analogue) ,模拟的意思就是用一种相似的东西去表达,例如将桌子用传统相机 将三视图拍下来,就是一种模拟的记录方式。 两个概念:
据台湾媒体今日报道,苹果未来的iPhone手机可能将会采用高通独家的超声波屏幕指纹识别方案。
这里为啥讲到了声波,讲到了我们的中学物理上的知识,因为我想大家能从根本理解后面音频编码的各种参数以及原因。当然这些知识网上都能搜到,我只是整合一下。
小缺陷可能会在工厂机器中造成巨大故障,同时增加能耗并减少利润。声学传感器可以在此类问题失控之前诊断机器的健康状况。
Adobe Audition 的是一款专业音频编辑和混合环境,其前身为 Cool Edit Pro(1997年由Syntrillium开发),2003 年被 Adobe 收购,并将其音频技术融入到了旗下 Premiere、After Effects 等影视相关的软件中。
CMP 设备通过化学腐蚀与机械研磨的协同配合作用,实现晶圆表面多余材 料的高效去除与全局纳米级平坦化。目前集成电路组件普遍采用多层立体布线, 集成电路制造的工艺环节要进行多次循环,每完成一层布线都需要对晶圆表面进 行全局平坦化和除杂,从而进行下一层布线。CMP 设备在晶圆完成每层布线后实现全局纳米级平坦化与表面多余材料的高效去除,保证光刻工艺套刻精度和多层金属互联的高质量实现。
如果你的本能反应是:「不!」然后突然迟疑,「哈?这可能吗?」我的反应也和你一样。在 Applied Physics Letters 的新论文《A single feature for human activity recognition using two-dimensional acoustic array》中,一个中国团队正致力于通过回声定位的计算机系统来达到隐私和安全的复杂平衡。通过训练人工智能来筛选来自声学传感器阵列的信号,系统可以逐渐学会只使用超声波来分析你的动作,不论是站着、坐着还是摔倒。
12月14日,继去年推出首款自研芯片马里亚纳 MariSilicon X 整整一年之后,OPPO在深圳召开的“OPPO 未来科技大会”上正式发布了第二款自研芯片—— 马里亚纳 MariSilicon Y。不同于面向“计算影像”领域的MariSilicon X,OPPO这一次推出的MariSilicon Y则瞄准的是“计算音频”领域,是一款旗舰级蓝牙音频SoC芯片,带来了音质的重大突破。
安声科技创始人&CEO刘益帆表示,“三维空间内的声音即为‘声场’,而利用算法、模型等,通过三维空间中某些点的数值计算出整个‘场’的函数关系,就是声全息技术。目前全球专业从事相关技术研发和应用落地有代表性的公司仅有5家左右,安声就是其中之一。”
最近又一家半导体设备上成功上市科创板,叫盛美半导体。以前知道有这么一家公司,好像是做清洗槽的,一个做槽子的公司竟然能上市,而且市值接近600亿。
【新智元导读】2016年12月18日,新智元百人峰会闭门论坛在微软亚洲研究院举行。云知声CEO黄伟在会上带来了《构建AI生态,技术和商业应该是一个良性循环 》的分享。黄伟认为:人工智能领域里面虽然BAT很重视AI,而且有了很强的人才团队,但是跟行业结合恰恰是BAT很难做到的,因为他们在上面。AI和IoT是新的一波机会。 以下是黄伟演讲实录。 大家下午好!今天前面杨总(新智元杨静)说了雾霾天出来做这样的交流其实都是真爱,前面二位老总介绍的一些微软包括海尔做的事情,我非常高兴的一点是,我们选择的方向都是对的,都
人们常看到这种现象:电磁波能在真空任意传播,但声波却不能。科学家也一直认为声波几乎不可能穿越真空。事实上这是个大误会。我们深入研究后发现,声波同样能穿越 真空传播。这一发现极具研究价值。
领取专属 10元无门槛券
手把手带您无忧上云