本篇干货整理自清华大学自动化系教授张长水于2018年4月27日在清华大学数据科学研究院第二届“大数据在清华”高峰论坛主论坛所做的题为《机器学习和图像识别》的演讲。
在大数据“养料”的供给下,沉寂的人工智能重现活力。自从谷歌阿法狗一战成名,助力人工智能变得家喻户晓。如今,人工智能的发展遇到瓶颈的声音再次出现。
【新智元导读】4月18日,清华大学《人工智能前沿与产业趋势》系列讲座第四讲,深睿医疗首席科学家、美国计算机协会杰出科学家、IEEE Fellow俞益洲为大家介绍了目前计算机视觉的应用和落地,特别是在医疗影像方面的发展状况、遭遇的挑战、以及克服挑战的思路。最后和清华大学自动化系副教授、博导鲁继文以及知名天使投资人、梅花创投创始合伙人吴世春一起对计算机视觉的落地机会进行了畅想。
VGG是一款经典图像分类算法。图像分类是计算机视觉技术的基础任务,比如给定一张图像,判断它是猫、狗、飞机,还是建筑。
近日,2023第十二届中国智能产业高峰论坛(CIIS 2023)在江西南昌顺利举行。大会由中国人工智能学会、江西省科学技术厅、南昌市人民政府主办,南昌市科学技术局、中国工程科技发展战略江西研究院承办。本次大会重点关注AI大模型、生成式AI、无人系统、智能制造、数字安全等领域,汇集了来自中国工程院、国际欧亚科学院、国际核能院等多个学术机构的院士进行主题报告演讲、专题论坛研讨。近200位人工智能领域专家学者同场交流分享,吸引了线上线下超千万人次观会。
一个偶然的机会,36氪和“优图团队”进行了接触,他们是腾讯内部专注于图像处理、模式识别、机器学习、数据挖掘等领域的核心技术团队,由毕业自清华、北大、中科院、上海交大等院校的博士、硕士组成。 腾讯优图团队隶属于腾讯社交网络事业群,基于整个腾讯的社交网络平台,为QQ空间、腾讯地图、腾讯游戏、等50多款产品提供图像技术支持。每天QQ空间有2亿上传图片的活跃用户,团队单日最多处理照片达6亿张,累计已经分析处理了超过300亿张照片 36氪:作为纯粹的技术团队,怎么平衡技术和产品之间的矛盾? 我们首先会对一些关键技术,
近日,36氪和“优图团队”进行了接触,他们是腾讯内部专注于图像处理、模式识别、机器学习、数据挖掘等领域的核心技术团队,由毕业自清华、北大、中科院、上海交大等院校的博士、硕士组成。 腾讯优图团队隶属于腾讯社交网络事业群,基于整个腾讯的社交网络平台,为 QQ 空间、腾讯地图、腾讯游戏、等 50 多款产品提供图像技术支持。每天 QQ 空间有 2 亿上传图片的活跃用户,团队单日最多处理照片达 6 亿张,累计已经分析处理了超过 300 亿张照片 36氪:作为纯粹的技术团队,怎么平衡技术和产品之间的矛盾? 我们首先会对
AI 科技评论按:2019 年 6 月 21 日,清华大学人工智能研究院视觉智能研究中心成立仪式暨技术前沿与产业报告会在清华大学 FIT 楼举行。这是继知识智能研究中心、听觉智能研究中心、基础理论研究中心、智能机器人研究中心、智能人机交互研究中心、智能信息获取研究中心之后成立的第七个研究中心。清华大学副校长、清华大学人工智能研究院管委会主任尤政院士,清华大学人工智能研究院院长张钹院士出席成立仪式并共同为中心揭牌。清华大学人工智能研究院院长助理朱军教授主持了成立仪式。
本内容选自清华大学电子系副教授、深鉴科技联合创始人汪玉于2018年4月27日在清华大学主楼接待厅数据科学研究院举办的第二届“大数据在清华”高峰论坛所做题为《针对机器视觉的深度学习处理器》的演讲。
【新智元导读】ImageNet 竞赛在今年正式完结。那么,图像识别未来的重点将是什么,ImageNet 竞赛之后又会出现什么呢?WebVision 竞赛被誉为接棒 ImageNet的大规模图像识别竞赛,今年有 100 多个团队参与。本文介绍 WebVision 竞赛,后附冠军团队码隆科技的技术分享。 2017 年 7 月 26 日,CVPR 2017 研讨会“超越 ILSVRC”将正式宣布 ImageNet 竞赛结束。然而,这并不代表着领域对图像识别兴趣的消退。实际上,相关的关注度正在走高。 ImageNe
导语:2019年7月11日,由腾讯高校合作主办,以“连接产学最强大脑,探索科技创新突破”为主题的“首届八大高校联合实验室联席技术峰会"在深圳腾讯总部滨海大厦举办。本届大会吸引了来自八大高校联合实验室及全面合作平台的40余位高校实验室主任、核心团队老师以及来自腾讯公司100余位研发人员参与,同时腾讯内部线上参与大会人数高达800余人次。 7月11日下午,首届八大高校联合实验室联席技术峰会通过五场技术分论坛有效地连接腾讯技术团队与高校联合实验室之间更深一步的技术碰撞。论坛技术方向覆盖计算机视觉与多媒体、自
基于忆阻器的神经形态计算系统为神经网络训练提供了一种快速节能的方法。但是,最重要的图像识别模型之一——卷积神经网络还没有利用忆阻器交叉阵列的完全硬件实现。此外,由于硬件实现收益小、变化大,设备特性不完善,其结果很难媲美软件实现。
上腾讯街景,看SIGGRAPH Asia 2014实景盛况 12月3日~6日, SIGGRAPH Asia2014亚洲电脑图像和互动技术展览及会议在深圳会会展中心举行,这次会议首次引入了腾讯街景,用户可以在腾讯地图或大会主页上参观高清全景,漫游大会展区。 用户还可以用手机通过腾讯街景官网、微信公众号、微信扫街景、腾讯地图客户端等方式随时随地查看、分享、评论街景。至今,腾讯街景已上线152座城市,覆盖1500家旅游景区、1600家酒店、500家地产、700家高校。 全景体验请点击页面底部的【阅
【新智元导读】彭军(James Peng)和楼天成(楼教主)的Pony.ai 迎来了公司成立以来最重量级的大咖的加入——图灵奖得主、中科院院士姚期智先生出任Pony.ai首席顾问。未来,Pony.ai将来会配合姚先生在清华交叉信息研究院开展自动驾驶课程,还会面向全世界建立智能驾驶图像识别数据库,打造下一个ImageNet。 9月里北京的阳光并不比加州逊色多少,清华园里色调温暖而明快。树荫下斑驳的阳光半梦半醒地摇曳着,像是在迎接远道而来的客人。刚刚从加州硅谷飞回北京的Pony.ai的高管团队刚下飞机便赶来赴约
经过前六章的阅读,我从三个世界、数据法则、信息纽带、知识升华、自然智能以及人工智能六个方面对于信息科学技术与创新有了深层次的认识与了解。从对于三个世界的描述中,我了解到了物理、生物和数字世界的区别和联系。同时也明白了物质、能量与数据构成了人类所赖以生存和发展的客观和主观世界。通过这样的三个世界基本底层架构的认知,展开了之后的讨论,之后详细地了解到数据的作用,例如数据在生命的产生与演化中起着至关重要的作用,在生命体内DNA中的数据就记录了遗传的基本信息,大脑中的储存数据量与神经元细胞和它们的数量存在着正相关的关系。 数据之间的快速传导使各网络之间可以不考虑地理上的联系而重新组合在一起。信息的传递和交换也变得日益频繁。而在之后对于信息的定义及作用介绍之中,通过对于信息法则的介绍以及对于信息编码过程的展示,让我明白了信息的结构、含义与效用。信息的提取与升华成为知识,我对知识的描述性与程序性、显性与隐性、公共性与私密性有了进一步的认识。由知识的不断进化集合的过程中,自然智能也逐渐彰显出其作用,自然智能也拥有其法则。无独有偶,针对于自然智能的研究也不断启发着人工智能的发展。上一章重点讲述了人工智能的历史、概念、算法以及人工智能的面临障碍。使我对于人工智能的理解有了很大提升。本章就人工智能的应用技术进行了更深层次的分析与讲解。同时本章讨论的课题如下:
俗称光学字符识别,英文全称是Optical Character Recognition(简称OCR),它是利用光学技术和计算机技术把印刷体或手写体文本进行读取识别,转化成计算机和人都能够识读的格式。此间OCR技术是关键一环。OCR技术中,印刷体的文本识别是最成熟的一个,因其开展最早。早在1929年就被欧美国家利用来处理大量的报刊杂志、文件和单据报表等。经过40多年的发展和完善,文本识别技术更加成熟,逐步实现了信息处理的“电子化”。
自适应计算(adaptive computation)是指ML统根据环境变化调整其行为的能力。
若朴 发自 凹非寺 量子位·QbitAI 报道 △ 这张票有点抢手 早就没票了。 今天下午,Facebook人工智能研究院院长Yann LeCun,将在清华大礼堂主讲一场两个小时的讲座,题目是《深度学
不久前的6月,生数科技刚刚完成了天使轮投资,投后市场估值1亿美金(约7.2亿人民币)。
5月4日,谷歌团队在arXiv上提交了一篇论文《MLP-Mixer: An all-MLP Architecture for Vision》,引起了广大计算机视觉的研究人员的热烈讨论。
有一款软件叫扫描全能王,想必一些小伙伴听过,这是一个OCR集成软件,可以将图像内容扫描成文字。
杨净 明敏 发自 凹非寺 量子位 报道 | 公众号 QbitAI 又到了各路校友认领自己学校的时候了。 泰晤士新一届中国学科排名已出炉。 这一次表现突出的选手有: 浙江大学,A级上榜学科最多,而且总上榜学科数也超过清北。 南科大,所有上榜学科全为A。 江苏大学,在非双一流学校中表现最好,其次是深圳大学、扬州大学。 不过,还有一些意外的点。 一直在排名上落单的中国人民大学,这次计算机竟然评级为A-,跟电子科大、深圳大学同级。 也没看到兰州大学的身影。 没看到兰大,离谱。 …… 这究竟是一个什么排名? 浙大
---- 新智元报道 作者:朱小佩 编辑:好困 【新智元导读】众所周知,打印一张图揣身上就能骗过图像识别,那你知道如何才能骗过红外识别么? 在疫情期间,红外行人识别系统被广泛应用。 这得益于热红外识别的系统的两个重要的优势: 1. 对于温度敏感,红外图像的成像利用了物体的热辐射,所以可以反映出物体的温度,这一特性对于人体的非接触式测温具有重要的应用。 2. 红外成像具有一定的「透视」特性,即使人体被一些衣物遮挡,但是热辐射依然可以透过衣物被接收器感知到,所以可以透过遮挡进行成像。 尽管目前红外行
据腾讯研究院统计,截至2017年6月,全球人工智能初创企业共计2617家。美国占据1078家居首,中国以592家企业排名第二,其后分别是英国,以色列,加拿大等国家。本文中选取了国外和国内部分有代表性的AI产业链条上相关公司就行分析(排名不分先后),希望对有志于从事人工智能相关工作或者想了解AI行业目前发展现状的朋友能有所帮助。小编会从AI芯片、应用层算法、应用领域等方面对相关公司进行盘点,由于部分公司可能会涉及产业链条上不同的领域,文中侧重选取了某些点进行分析阐述。备注:文中涉及到的企业估值均源于公开资料,本文对数字真实性不做任何担保;对于企业的明星指数是小编根据公开资料以及行业内部朋友反馈做的综合评估,不作为投资参考。
---- 新智元报道 编辑:编辑部 【新智元导读】6月14日凌晨,旷视首席科学家、旷视研究院院长孙剑博士突发疾病去世,享年45岁。 6月14日凌晨,一位AI巨星陨落。 刚刚,旷视研究院发文,旷视首席科学家、旷视研究院院长孙剑博士去世。 我们万分难过,旷视首席科学家、旷视研究院院长孙剑博士因突发疾病抢救无效,于2022年6月14日凌晨,永远离开了我们。 孙剑博士一生专注于科研工作。他的不幸离世,让旷视失去了一位在人工智能技术领域探索和创新的领路人。每一位和他共事过的旷视同学,失去了一位智慧谦和
4月23日上午9点30分至11:30 ,来自上海大学、上海交通大学、清华大学、河北师范大学、中国海洋大学等高校50位师生,通过视频会议+ 远程访问的方式参加NVIDIA举办的全栈式深度学习开发体验课程。他们在NVIDIA企业开发者社区经理何琨和李奕澎的指导下,一对一远程访问NVIDIA Jetson Xavier NX计算节点,进行实际AI开发操作。本次远程深度学习实践活动也是NX GPU计算体验平台的首次开放。该平台共有50个节点。每台计算节点可以提供高达21TOPS 深度学习计算能力,可利用 NVIDI
近期,2023年中国模式识别与计算机视觉大会(PRCV)在厦门成功举行。大会由中国计算机学会(CCF)、中国自动化学会(CAA)、中国图象图形学学会(CSIG)和中国人工智能学会(CAAI)联合主办,多媒体可信感知与高效计算教育部重点实验室、厦门大学人工智能研究院、厦门大学信息学院承办,是国内模式识别和计算机视觉领域的学术盛会。
AI 研习社按:本文作者qqfly,上海交通大学机器人所博士生,本科毕业于清华大学机械工程系,主要研究方向机器视觉与运动规划,会写一些好玩的内容在微信公众号:Nao(ID:qRobotics)。本文整理自知乎回答:有没有将深度学习融入机器人领域的尝试?有哪些难点? 现在深度学习这么火,大家都会想着看看能不能用到自己的研究领域里。所以,将深度学习融入到机器人领域的尝试也是有的。我就自己了解的两个方面(视觉与规划)来简单介绍一下吧。 █ 物体识别 这个其实是最容易想到的方向了,比较DL就是因为图像识别上的成果而
2019年度腾讯 “犀牛鸟精英人才培养计划”开放申请中,该项目是一项面向学生的校企联合人才培养项目,为期一年。入选学生将受到业界顶尖技术团队与高校导师的联合指导及培养,并获得3个月以上带薪到访腾讯开展科研的机会,基于真实产业问题及海量数据,验证学术理论、加速成果应用转化、开阔研究视野。同时项目组将引进沟通技巧、商业分析、创新思维等定制课程,全面提升学生综合素质。 今年共有10大方向,81个子课题 申报截止日期:2019年1月28日 申报截止倒计时12天 同学们,抓紧时间申报哦 下面让我们一起来
搜狗公司CEO王小川在2016年最后一期《一站到底》结束时为大家留下的悬念:“我会让搜狗的机器人来替我‘报仇’的!” 依约,王小川“派来”的搜狗问答机器人汪仔登陆了新年全新改版《一站到底》。在人类获胜
半个月前,Yann LeCun要来清华演讲的消息在国内AI圈一经传开,各位AI界人士便坐不住了。作为Facebook人工智能研究院院长、纽约大学终身教授、卷积神经网络之父,LeCun已然成为了AI人心目中的男神。 演讲当天(3月22日),AI科技评论也来到了LeCun的演讲现场。演讲开始前,只见许多想要听演讲,却无奈没有得到票的同学,焦急地坚守在演讲大厅门前,希望能一睹男神风采,或运气爆棚能偶得一票。一个专业性质极强的学术演讲能吸引这么多人来参加,也再一次体现了Yann LeCun的个人魅力和在AI界的
向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程 公众号:datayx 项目描述 本项目是一个带有超级详细中文注释的基于GPT2模型的新闻标题生成项目。 本项目参考了GPT2-Chinese、GPT2-chitchat、CDial-GPT、GPT2等多个GPT2开源项目,并根据自己的理解,将代码进行重构,添加详细注释,希望可以帮助到有需要的人。 本项目使用HuggingFace的transformers实现GPT2模型代码编写、训练及测试。 本项目通过Flask框架搭建了一个Web服务,将新
此前,清华大学与旷视科技曾通过结构重参数化将7年老架构VGG“升级”为性能直达SOTA的RepVGG模型。
6月24日下午,钛媒体和杉数科技主办的2017 AI 大师论坛在京举行,论坛邀请了五位算法优化、机器学习领域的顶尖教授、学者出席并发表学术演讲,他们分别是斯坦福大学李国鼎工程讲座教授叶荫宇,佐治亚理工
1月28日上午,由中国工程院和清华大学联合主办的“长城工程科技会议”第四次会议工业大数据分会在清华大学信息科技大楼召开。中国工程院院士李伯虎、工业和信息化部信息化和软件服务业司副司长李冠宇、中国工程院制造业研究室主任屈贤明、中国信息通信研究院总工程师余晓辉、百度集团副总裁王海峰、富士康科技集团幕僚长陈辉龍、富士康科技集团资讯长胡智深等出席。会议由清华大学软件学院院长、数据科学研究院副院长、大数据系统软件国家工程实验室执行主任、工业大数据系统与应用北京市重点实验室主任王建民教授主持,主题为“大数据与工业互联网
首先我们需要安装PIL和pytesseract库。 PIL:(Python Imaging Library)是Python平台上的图像处理标准库,功能非常强大。 pytesseract:图像识别库。
全球最大存储器厂商(三星)和全球最大Fintech独角兽(蚂蚁金服)的加持对这家成立不到两年的初创公司意味深长。 昨天,深鉴科技召开了成立以来的第一次新品发布会,正式宣布已完成约4000万美金的A+轮融资。本轮融资由蚂蚁金服与三星风投领投,招商局创投与华创资本跟投。深鉴科技创始人、CEO 姚颂表示,本次融资将继续用于安防、数据中心领域及后续芯片产品的开发。深鉴与三星将展开包括存储在内的多方面合作。而蚂蚁金服的战略资源注入,将帮助深鉴进一步开拓包括金融在内的更多应用场景,而关于金融领域的进一步布局,深鉴没有
千平 发自 凹非寺 量子位 出品 | 公众号 QbitAI 自动驾驶公司Momenta完成B2轮融资,凯辉中法创新基金领投,GGV跟投。据介绍,本轮融资将用于AI人才招募、加速产品落地和研发高频刚需场
来源:量子位、腾讯科技、全球创新论坛 编译:问耕 李林 本文多图、较长,建议阅读20分钟+ 本文整理了近两年互联网趋势报告中与AI相关的内容,并分享《互联网趋势2017报告》全文。 本文含有335页《互联网趋势2017报告》中文版全文,建议您在WiFi环境下观看。 后台回复关键词“清华大数据”可下载中英文完整版互联网趋势2017报告PDF。 今日凌晨,来自KPCB的“互联网女皇”玛丽·米克尔(Mary Meeker)照例在Code大会上发布《互联网趋势2017报告》。 自从1995年以来,这已经是
图像识别技术是信息时代的一门重要的技术,其产生目的是为了让计算机代替人类去处理大量的物理信息。随着计算机技术的发展,人类对图像识别技术的认识越来越深刻。图像识别技术的过程分为信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。简单分析了图像识别技术的引入、其技术原理以及模式识别等,之后介绍了神经网络的图像识别技术和非线性降维的图像识别技术及图像识别技术的应用。从中可以总结出图像处理技术的应用广泛,人类的生活将无法离开图像识别技术,研究图像识别技术具有重大意义。 1、图像识别技术的引入 图像识别是人
夏乙 若朴 发自 凹非寺 量子位 出品 | 公众号 QbitAI 何恺明第三次斩获顶会最佳论文! 昨天下午,ICCV 2017最佳论文公布。 何恺明为一作的Mask R-CNN论文,不负众望获得最佳论文(Marr Prize)。 📷 另外,何恺明参与的另一篇论文:Focal Loss for Dense Object Detection,也被大会评为最佳学生论文。 📷 作为计算机视觉领域的顶级会议,ICCV 2017共收到2143篇论文投稿,其中621篇被选为大会论文(入围比
你的脑洞,在这里都已实现:虚拟人Siren、AI画师YUI、腾讯丽影、智慧商超、智能弹幕、微派机器人······ 2018年12月4日到7日,第11届SIGGRAPH Asia在日本东京举行。作为国际顶级专业学术会议,SIGGRAPH Asia从2008年起每年召开,这也是有计算机图形图像研究领域“奥斯卡”之称的SIGGRAPH唯一的分会。SIGGRAPH Asia 2018汇聚了全球从事科研(硬件、软件)、电影、游戏、艺术、动画、人机交互、教育和新兴技术等方向的最前沿的专家、创意人员以及爱好者,
对于有志于投身AI研发的同学,有没有一些既能发论文,又贴进产业前沿,还比较近的实习机构?
AI科技评论按:近日,《最强大脑》第四季落下帷幕,凭借在人脸识别和图像检索方面的出色表现,百度人工智能机器人小度荣获“脑王” 称号。4月11日,百度以此为主题在北京举办了“第五届百度技术开放日”的活动。百度研究院院长、深度学习技术及应用国家工程实验室主任林元庆做了“最强大脑背后的技术”主题演讲,详细解释了小度在“脑王”对决中的台前幕后,涉及图像检索、声纹识别、人脸识别等方向。 随后林元庆还介绍了百度将在人工智能方面着重发力的方向及下一步的计划,AI科技评论总结如下: 将图像识别技术做到极致 完善声纹
访谈伊始,孙茂松首先简单概括了一下人工智能近几年的发展状况。他说道,人工智能这几年的发展,大家接触比较多的是图像方面的成果,包括很多创业公司的人脸识别、刷脸等技术,我们可以看到图像方面的进步非常快。但是,图像只是智能的一部分,人的智能区别于动物其实最主要的特征是语言。人工智能领域有一句话:自然语言理解是人工智能皇冠上的明珠。
伴随着图像处理技术的飞速发展,推动了图像识别技术的产生和发展,并逐渐成为人工智能领域中重要的组成部分,并广泛地运用于面部识别、指纹识别、医疗诊断等等领域中,发挥重要作用。
领取专属 10元无门槛券
手把手带您无忧上云