深度学习是一种非常强大的机器学习技术,它在许多领域都有广泛的应用。其中,图像识别是深度学习最成功的应用之一。本文将详细介绍深度学习在图像识别方面的应用。
近日,NEC宣布开发了更易于提高识别精度的深度学习自动优化技术。 以往进行深度学习时,很难基于神经网络构造(注1)进行调整,所以无法在整个网络进行最优化的学习,因而无法充分发挥其识别性。此次开发的技术, 可以基于其结构自动优化神经网络学习的进度,从而轻松实现比以往更加精准的识别。 此技术的出现,使得应用了图像识别及声音识别等深度学习技术的各个领域,均有望实现识别精度的进一步提高。例如,人脸识别和行为分析等视频监控识别精度的提高、基础设施等点检工作效率的提高,实现自动检测灾害、事故和灾难等。 一、背景 近年来
开车打开地图导航,是再平常不过的事情。但如果这个场景置换到自动驾驶中,恐怕就行不通。要想实现 L3 以及更高级别的自动驾驶,对地图的要求就更高,换言之,也就是我们所说的高精度地图。
高精度地图,通俗来讲就是精度更高、数据维度更多的电子地图。精度更高体现在精确到厘米级别,数据维度更多体现在其包括了除道路信息之外的与交通相关的周围静态信息。
---- 新智元推荐 来源:至顶网 【新智元导读】IBM Research 称,已经开发出了一种内存计算新方法,可以为微软和谷歌寻求的高性能和机器学习应用的硬件加速器提供答案。该方法被称为“混合精度内存计算”,论文发表在 Nature Electronics 期刊。 IBM Research 称,已经开发出了一种内存计算新方法,可以为微软和谷歌寻求的高性能和机器学习应用的硬件加速器提供答案。 在近日 Nature Electronics 期刊上发表的一篇论文中,IBM 研究人员描述了这种新的 “混
该算法通过研究细胞的变化来进一步研究相关疾病的变化,获得了多项人类尚未发现的研究成果。 眼睛是心灵的窗口,但从去年开始,谷歌的研究团队就利用机器学习将眼睛转化为检查人体健康的“窗口”,他们通过算法分析人体的高精度3D视网膜照片发现,图像里面包含的信息可以用来判断出一个人的血压、年龄和吸烟状况。 近日,研究团队又获得了新的进展,利用算法分析其亚细胞结构(如线粒体、染色体、DNA链等)的变化后,发现了通过分析“眼睛”,我们可以判断一个人是否有患心脏病的风险。 不同于以往,这里的研究成果不断,背后的首要功臣是谷歌
作者 | Weize Quan , Kai Wang, Dong-Ming Yan , Xiaopeng Zhang
随着深度学习等AI技术的成熟,生物识别成为了关注度较高的领域,指纹、人脸、虹膜等识别技术,正在越来越多的场景中得到应用。根据前瞻产业研究院的数据,目前中国生物识别技术的市场规模已超过300亿元,到2023年,这一数字将达到379亿元。虽然人脸识别、虹膜识别近几年大有成为「后起新贵」之势,但指纹识别凭借其“证据之王”的权威性和较高的安全性,仍然占据整个生物识别领域的半壁江山(52%)。
学校食堂明厨亮灶监控系统通过Python基于YOLOv7卷积神经网络学习与图像识别技术,学校食堂明厨亮灶监控系统对现场画面进行24小时实时分析,如:厨房出现老鼠狗猫、厨师未戴口罩、厨师未戴厨师帽、厨师服穿戴识别、抽烟识别、玩手机识别,同时实时抓拍相关情况,全程记录留痕。YOLOv7 在 5 FPS 到 160 FPS 范围内,速度和精度都超过了所有已知的目标检测器。并在V100 上,30 FPS 的情况下达到实时目标检测器的最高精度 56.8% AP。YOLOv7 是在 MS COCO 数据集上从头开始训练的,不使用任何其他数据集或预训练权重。
2020年,为了让更多人学习机械臂知识,我们推出了世界上最小的6轴机器人手臂:myCobot,之后陆续推出码垛机械臂mypalletizer,小六轴mechArm,双臂myBuddy。将昂贵的工业机械臂转化成桌面级机械臂,通过较低的价格,搭建了一个机器人研究和教育平台,降低了AI人工智能领域的学习门槛。
近几年,人工智能计算机视觉技术在安防、工业制造等场景的产业智能化升级进程中发挥着举足轻重的作用。“人员进出管理”作为各行业中的关键场景,应用需求十分迫切。如居家防盗、机房管理以及景区危险告警等场景,需要对异常目标(人、车或其他物体)不经允许擅自进入规定区域进行及时检测。利用深度学习视觉技术,可以及时准确地对闯入行为进行识别并发出告警信息,切实保障人员的生命财产安全。相比传统人力监管的方式,不仅可以实现7X24小时不间断的全方位保护,还能极大地降低管理成本,解放劳动力。
AI 科技评论按:目前全球汽车行业公认由美国高速公路安全管理局(NHTSA)和国际自动机工程师学会(SAE)提出的的分级制度,把自动驾驶分成 L0 到 L5 级,分别承担相应的职责,而 L4 作为级别第二高的无人驾驶,是指在特定场景下(如高速公路)可以在完全没有人干预时进行全自动无人驾驶,到现在为止,实现 L4 无人驾驶依旧是人工智能领域最具挑战性、最复杂的难题之一。
密歇根大学的研究人员开发了一种基于深度学习的系统,该系统执行实时面部识别并根据相应的护照和政府颁发的身份证件验证照片。该方法有助于执法机构防范欺诈行为,可以作为新的付款方式,也可以防止已知的犯罪分子进入敏感地段或防护区。
图像分割技术在医疗病灶分析、自动驾驶车道线分割、绿幕人像抠图等领域发挥着举足轻重的作用。相比目标检测、图像分类等技术,图像分割需要将每个像素点进行分类,在精细的图像识别任务中不可替代。
作者:黄武陵 【新智元导读】黄武陵从事无人车系统研发、无人车标准评估体系构建、无人车挑战赛等工作多年,每次发表观点都非常详尽,本文从自动驾驶近期热点入手,结合挑战赛八年积累,深入分析了传感、感知、车联
支撑影视人像抠图、医疗影像分析、自动驾驶感知等万亿级市场背后的核心技术是什么?那就要说到顶顶重要的图像分割技术。相比目标检测、图像分类等技术,图像分割需要将每个像素点进行分类,在精细的图像识别任务中不可替代,也是智能视觉算法工程师拥有关键核心竞争力的关键!
你们知道,支撑影视人像抠图、医疗影像分析、自动驾驶感知等万亿级市场背后的核心技术是什么吗?
“无穷小亮的科普日常”经常会发布一些鉴定网络热门生物视频,既科普了生物知识,又满足观众们的猎奇心理。今天我们也来鉴定一下网络热门植物!最近春天很多花都开了,我正好趁着清明假期到户外踏青并拍摄了不少花卉的照片。
说到地图,我们从一个简单的问题开始。你最常用的导航地图是什么?可能是你的车载地图或手机地图。
链接 | https://zhuanlan.zhihu.com/p/147885624
本文涵盖了所有行业中各种创新且有价值的计算机视觉应用。一起来了解市场上最好的计算机视觉项目、计算机视觉创意和高价值案例吧。
监控抽烟检测识别算法采用yolov7系列网络模型深度学习图像识别技术,监控抽烟检测识别算法能够准确识别人员抽烟的动作和烟雾,监控抽烟检测识别算法一旦发现有人员在禁烟区域内抽烟,将立即触发预警。监控抽烟检测识别算法中用倒地YOLO框架模型的结构非常简单,就是单纯的卷积、池化最后加了两层全连接,从网络结构上看,与前面介绍的CNN分类网络没有本质的区别,最大的差异是输出层用线性函数做激活函数,因为需要预测bounding box的位置(数值型),而不仅仅是对象的概率。所以粗略来说,YOLO的整个结构就是输入图片经过神经网络的变换得到一个输出的张量。
深度学习是人工智能模型的先驱。从图像识别、语音识别,到文字理解,甚至自动驾驶,深度学习的来临极大地丰富了我们对AI潜力的想象。
问耕 发自 凹非寺 量子位 报道 | 公众号 QbitAI 自动驾驶初创公司Momenta今日宣布获得B轮4600万美元投资。 这轮融资由蔚来资本领投,戴姆勒集团(梅赛德斯-奔驰母公司)、顺为资本、创
随着企业继续投资利用人工智能软件和平台功能的项目,预计全球在人工智能(AI)系统上的支出将保持强劲的增长轨迹。根据最近更新的国际数据公司(IDC)发布的《全球人工智能系统支出指南》里指出,到2023年,人工智能系统的支出将达到979亿美元,是2019年375亿美元支出的两倍半。同时IDC的专家表示:“人工智能(AI)已经远远超越了原型设计,进入了执行和实施阶段。“各行各业的战略决策者现在都在努力解决如何有效地进行AI规划的问题。
在当今工业领域,自动化技术的不断发展为生产制造带来了巨大的变革。其中,焊接作为制造业中不可或缺的一环,其自动化程度对于提高生产效率和质量至关重要。焊缝跟踪传感器作为焊接自动化的关键组成部分,正逐渐受到工业界的关注与青睐。
随着人脸识别技术的广泛落地,为了提高识别的准确率,针对人脸重建的技术也在不断迭代升级,重建精度越来越高。
支撑影视人像抠图、医疗影像分析、自动驾驶感知等万亿级市场背后的核心技术是什么?那就要说到顶顶重要的图像分割技术。相比目标检测、图像分类等技术,图像分割需要将每个像素点进行分类,在精细的图像识别任务中不可替代,也是智能视觉算法工程师拥有关键核心竞争力的关键! 图1 图像分割应用 正因如此,DeepLabv3、OCRNet、BiseNetv2、Fast-SCNN等优秀算法层出不穷,然而在实际产业落地过程中往往需要综合考虑硬件性能、精度等多方面因素,对算法的需求也是苛刻的。往往业界算法在保障高识别精度的情况下
近日,墨奇科技宣布已顺利完成 2.5 亿元人民币 B 轮融资。墨奇科技成立于 2016 年,致力于从人工智能的源头问题出发,研发领先的人工智能技术来自动化地处理 AI 知识数据,最终增强人类处理信息的能力。目前,墨奇科技的两大核心业务为新型 AI 知识数据库和新一代生物识别平台。此轮融资后,墨奇科技将会重点投入在AI 底层数据的通用处理技术,持续发力以 AI 知识为核心的新型非结构化数据库。 图像、视频、音频等非结构化数据在大数据中占比巨大,而现有的方式往往针对特定类型数据来做训练,得到的模型并不通用。如何以统一的方式处理非结构化数据成为 AI 未来发展的关键挑战。 墨奇科技开创性地发展了新型 AI 知识数据库来解决这一问题。利用新型 AI 知识数据库的关键技术,墨奇科技打造了首个行业应用,即面向未来身份识别认证需求的新一代生物识别平台。
支撑影视人像抠图、医疗影像分析、自动驾驶感知等万亿级市场背后的核心技术是什么?那就要说到顶顶重要的图像分割技术。相比目标检测、图像分类等技术,图像分割需要将每个像素点进行分类,在精细的图像识别任务中不可替代,也是智能视觉算法工程师拥有关键核心竞争力的关键! 图1 图像分割应用 正因如此,DeepLabv3、OCRNet、BiseNetv2、Fast-SCNN等优秀算法层出不穷,然而在实际产业落地过程中往往需要综合考虑硬件性能、精度等多方面因素,对算法的需求也是苛刻的。往往业界算法在保障高识别精度的情况下,
从数据分析、经典机器学习到搜索、推荐,再到语言处理和图像识别,每个 AI 任务运行的背后都需要海量的数学计算。可以说,AI 真的就是数学,但却是很多很多的数学。
大众集团日前宣布,将加大投资力度来加强其位于德国慕尼黑AI数据实验室的实力,专门致力于人工智能技术的研发。大众方面称,虽然目前正在削减内部开支,但作为IT计划的一部分,大众在慕尼黑的AI数据实验室并未受到影响,会有更多的人力投入人工智能团队的建设。 据了解,大众数据实验室的研究团队将继续发展无人驾驶技术和机器人学,主要研究方向包括机器学习技术,即引导机器人和传感器加强识别能力,以对行驶中遇到的物体和不同情形作出辨识,换言之,团队希望提高汽车摄像头的检测能力,减少无人驾驶汽车因拍摄盲区等而存在的安全隐患。 另
对鸟类群体的持续观测和保护一直是相关保护区工作的重中之重,但是由于保护区面积大、范围广,依靠传统的鸟类人工调查难以实现高效的对鸟类重要栖息地的连续监测,无法及时发现鸟类变化情况,随着AI识别技术的发展,利用其时效性强、获取快捷等优势特点,结合安装高清高变倍摄像头,可以及时识别保护区内鸟类种类及数量,创新保护区鸟类监测技术,为保护区的综合管理提供重要支撑。
目前提高CNN精度的方法,主要是通过任意增加CNN深度或宽度,或使用更大的输入图像分辨率进行训练和评估。
安全帽佩戴检测系统在监控摄像头可监控到的地区画面中自动检索施工工作人员是不是戴安全帽、反光衣,假如见到工作人员不戴安全帽、反光衣,安全帽佩戴检测系统将开展语音播报,纪录违纪行为。在工程建筑、电力安装工程、煤矿业、石油化工、化工企业等高危企业,可以预防重大事故的合理防止,不用人工手动操作进行,提升安全生产智能化系统管理效率。安全帽佩戴检测系统运用智能视频分析沿深度神经网络技术相结合,具备高精度、兼容强、特点可靠性强的特性。
前天,雷锋网撰文《爆料:曹旭东创立自动驾驶公司Momenta 首次公开项目细节》,正式公布曹旭东及其创业项目Momenta,此项目致力于打造自动驾驶大脑,核心技术是基于深度学习的环境感知、高精度地图、
目前在零售行业的实际运营过程中,会产生巨大的人力成本,例如导购、保洁、结算等,而其中,尤其需要花费大量的人力成本和时间成本在识别商品并对其进行价格结算的过程中,并且在此过程中,顾客也因此而需要排队等待。这样一来零售行业人力成本较大、工作效率极低,二来也使得顾客的购物体验下降。
千平 发自 凹非寺 量子位 出品 | 公众号 QbitAI 自动驾驶公司Momenta完成B2轮融资,凯辉中法创新基金领投,GGV跟投。据介绍,本轮融资将用于AI人才招募、加速产品落地和研发高频刚需场
我们非常高兴能够将训练后的 float16 quantization 作为模型优化工具包(Model Optimization Toolkit)的一部分。这套工具包括了:
在6月29日的CCF-GAIR 2018全球人工智能与机器人峰会上,CCF-GAIR的承办方雷锋网联合近30家创投与资本机构、资深学者与产业界代表一起,共同为12个领域共计36家创新公司颁出2018 AI最佳成长奖榜单。
智能视觉测量是指用计算机视觉技术实现对物体的尺寸测量,它在工业、林业、物流等领域有重要的应用。一般做法是用相机或激光雷达对物体拍照/扫描,然后识别图像中的待测量物体,得到其边界或形状信息,最后在坐标系中计算物体的尺寸。本文将以原木智能检尺(直径测量)为例,介绍智能视觉测量系统的技术原理,以及需要解决的难点问题。
都怪这些购物软件太了解我的喜好,我脑子里想什么大聪明们就给我推什么、“引诱”我“剁手”,更何况各类折扣活动算得人云里雾里,如何才能占到最大的便宜将资金进行合理支配。
这是新的系列教程,在本教程中,我们将介绍使用 FPGA 实现深度学习的技术,深度学习是近年来人工智能领域的热门话题。
随着城市化的快速推进及人口流动的快速增加,传统社区治理在人员出入管控、安防巡逻、车辆停放管理等典型场景下都面临着人力不足、效率低下、响应不及时等诸多难题。而人工智能技术代替人力,实现人、车、事的精准治理,大幅降低人力、物质、时间等成本,以最低成本发挥最强大的管理效能,有效推动城市治理向更“数字化、自动化、智慧化”的方向演进。
随着数字化时代的到来,OCR(光学字符识别)技术在各行各业中的应用越来越广泛,如金融、医疗、教育等领域。然而,图片组成的PDF文件识别一直以来都是OCR技术的难点。腾讯云OCR技术凭借其领先的识别能力,可以快速准确地识别图片PDF文件。结合openai接口,我们可以将识别结果构建成知识库,为用户提供更高效便捷的服务。本文将以滴滴出行的行程单为例,展示腾讯云OCR技术在实际应用中的优势。
最近,一组来自CMU和UC Berkeley等研究机构的研究人员率先推出了全球首个AI宇宙三维模拟器。这个模拟器不仅速度快而且精度高,调参后无需训练仍能准确模拟,甚至连它的创造者都不知道它是如何做到的。
机器人视觉使机器人具有视觉感知功能的系统,是机器人系统组成的重要部分之一。目前,广泛应用于电子、汽车、机械等工业部门和医学、军事领域。对于机器人视觉技术的设计,存在以下几个难点: 一、打光的稳定性 工业视觉应用一般分成四大类:定位、测量、检测和识别,其中测量对光照的稳定性要求最高,因为光照只要发生10-20%的变化,测量结果将可能偏差出1-2个像素,这不是软件的问题,这是光照变化,导致了图像上边缘位置发生了变化,即使再厉害的软件也解决不了问题,必须从系统设计的角度,排除环境光的干扰,同时要保证主动照
领取专属 10元无门槛券
手把手带您无忧上云