谷歌在 Google AI 上撰文进行对刚刚发布的 ML Kit 中的核心技术:Learn2Compress 自动模型压缩技术进行了详细介绍和实战测试。
AI 研习社按: Google I/O 2018 上,谷歌发布了可供开发者定制移动端机器学习模型的 ML Kit 开发套件,关于该套件中的核心技术:Learn2Compress 模型压缩技术,谷歌也火速在 Google AI 上撰文对其进行了详细介绍和实战测试,AI 研习社将其内容编译如下。
论文解读: Quantized Convolutional Neural Networks for Mobile Devices
近期,先是在MegaFace百万级人脸识别竞赛中夺冠,接着又亮相了世界首个AI合成主播,在国内外引发大量关注。搜狗有AI,AI能力挺厉害,这些成果都是明证。
图像识别作为深度学习算法的主流实践应用方向,早已在生活的各个领域发挥作用,如安全检查和身份核验时的人脸识别、无人货架和智能零售柜中的商品识别,这些任务背后的关键技术都在于此。
父老们,乡亲们!你知道人脸、商品、车辆识别,以图搜图乃至自动驾驶,背后的技术是什么嘛?
上腾讯街景,看SIGGRAPH Asia 2014实景盛况 12月3日~6日, SIGGRAPH Asia2014亚洲电脑图像和互动技术展览及会议在深圳会会展中心举行,这次会议首次引入了腾讯街景,用户可以在腾讯地图或大会主页上参观高清全景,漫游大会展区。 用户还可以用手机通过腾讯街景官网、微信公众号、微信扫街景、腾讯地图客户端等方式随时随地查看、分享、评论街景。至今,腾讯街景已上线152座城市,覆盖1500家旅游景区、1600家酒店、500家地产、700家高校。 全景体验请点击页面底部的【阅
一个偶然的机会,36氪和“优图团队”进行了接触,他们是腾讯内部专注于图像处理、模式识别、机器学习、数据挖掘等领域的核心技术团队,由毕业自清华、北大、中科院、上海交大等院校的博士、硕士组成。 腾讯优图团队隶属于腾讯社交网络事业群,基于整个腾讯的社交网络平台,为QQ空间、腾讯地图、腾讯游戏、等50多款产品提供图像技术支持。每天QQ空间有2亿上传图片的活跃用户,团队单日最多处理照片达6亿张,累计已经分析处理了超过300亿张照片 36氪:作为纯粹的技术团队,怎么平衡技术和产品之间的矛盾? 我们首先会对一些关键技术,
近日,36氪和“优图团队”进行了接触,他们是腾讯内部专注于图像处理、模式识别、机器学习、数据挖掘等领域的核心技术团队,由毕业自清华、北大、中科院、上海交大等院校的博士、硕士组成。 腾讯优图团队隶属于腾讯社交网络事业群,基于整个腾讯的社交网络平台,为 QQ 空间、腾讯地图、腾讯游戏、等 50 多款产品提供图像技术支持。每天 QQ 空间有 2 亿上传图片的活跃用户,团队单日最多处理照片达 6 亿张,累计已经分析处理了超过 300 亿张照片 36氪:作为纯粹的技术团队,怎么平衡技术和产品之间的矛盾? 我们首先会对
作者:lincolnlin,腾讯 WXG 专家研究员 微信识物是一款主打物品识别的 AI 产品,通过相机拍摄物品,更高效、更智能地获取信息。2020 年,微信识物拓展了更多识别场景,上线了微信版的图片搜索。本篇文章将与大家分享微信识物从识物拓展到通用图像搜索领域的发展过程。 微信识物 以上小视频简单介绍了识物的产品形态,它对微信扫一扫的扫封面能力进行了升级。打开微信扫一扫,左滑切换到“识物”功能,对准想要了解的物品正面,可以获取对应的物品信息,包括物品百科、相关资讯、相关商品。在微信识物发布不久,也
介绍到这里会有人问,有了webdriver等ui自动化后为什么还要用图像识别呢?我认为主要有以下这几点:
1 图像识别是什么? 2 图像识别的应用场景有哪些? 什么是图像识别 图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。根据观测到的图像,对其中的物体分辨其类别
AI 研习社按:移动设备相较于 PC ,携带便携,普及率高。近年来,随着移动设备的广泛普及与应用,在移动设备上使用深度学习技术的需求开始涌现。
本文主要介绍了多端自动化的实践经历而非作为airtest的科普文章(因为airtest的官方文档真的是已经特别全了,非常建议实践之前先看一遍文档,大部分问题都能达到答案),主要叙述了在面对多端大规模场景时,自动化的技术选型、方案设计、实践难点等等。
应用背景:安全帽作为一种最常见和实用的个人防护用具,能够有效地防止和减轻外来危险源对头部的伤害。但在现场操作过程中,安全帽的佩戴很容易人为忽略,引发了不少人身伤害事故。为了保证工作人员都能在作业中佩戴安全帽,保障作业人员安全,清眸图像安全帽识别算法系统应运而生。
众所周知,市面上有很多自动化测试工具,web自动化有selenium,robotframework,playwright等,接口自动化测试工具有httprunner,postman,jmeter等,性能测试有jmeter,loadrunner,locust,nGrinder等,移动端测试有appium,airtest等等。那有没有同时支持多端的工具呢?肯定是有的,airtest支持移动端和web测试,但不支持接口测试(当然可以自行编写脚本实现)。robotframework支持web端、移动端和接口测试,但不支持性能压测。另外,同类的测试工具,各个工具都有自身的特点,比如airtest支持图像识别控件,robotframework可以看成是selenium和appium的高级别封装,降低了代码编写成本,httprunner让接口测试用例通过配置化完成,降低了编写脚本的门槛,也可直接将接口用例转化为性能测试用例,利用locust实现性能测试。那有没有可能将这些工具都整合起来,放在一个框架里实现呢?基于此种构想,airobots诞生了。
应用背景:安全帽作为一种最常见和实用的个人防护用具,能够有效地防止和减轻外来危险源对头部的伤害。但在现场操作过程中,安全帽的佩戴很容易人为忽略,引发了不少人身伤害事故。为了保证工作人员都能在作业中佩戴安全帽,保障作业人员安全,富维图像安全帽识别算法系统应运而生。
8月31日,华为发布了新一代顶级人工智能手机芯片——麒麟980,成为全球首款采用7nm制程工艺的手机芯片。麒麟980能做到人脸识别、物体识别、物体检测、图像分割、智能翻译等,实现AI识别质的飞跃。
移动互联网、智能手机以及社交网络的发展带来了海量图片信息,根据BI五月份的文章,Instagram每天图片上传量约为6000万张;今年2月份WhatsApp每天的图片发送量为5亿张;国内的微信朋友圈也是以图片分享为驱动。不受地域和语言限制的图片逐渐取代了繁琐而微妙的文字,成为了传词达意的主要媒介。图片成为互联网信息交流主要媒介的原因主要在于两点:
Google刚刚息鼓,苹果又燃战火!这一战,来自移动应用的AI化之争。 近日,苹果发布专为移动端优化的Core ML后,移动开发者对此的需求到底有多强烈?去年大获成功的AI应用Prisma又能告诉我们什么?苹果的新武器Core ML具体该怎么用?野心勃勃的苹果在移动端机器学习上的布局到底有着怎样的心机?苹果真能撼动Google、Facebook的优势地位吗?未来AI的走向会不会就此改变?此中答案,本文将娓娓道来。 作者 | 胡永波 本届WWDC,Core ML是苹果送给移动开发者的一份大礼。使用它,
著名的大型性教育科普网站Pornhub每年都会发布一次数据,在其最新发布的2017年度数据中,有以下有趣的点:
懒人阅读:人工智能芯片是人工智能的“大脑”,可以分为终端和云端两个应用方向。目前主流CPU、CPU+GPU、CPU+FPGA、CPU+ASIC架构。人工智能芯片具有两个突出特点:一是算法与芯片的高度契合,面向终端和云端不同需求提升计算能力;二是专门面向细分应用场景的智能芯片,如语音识别芯片、图像识别芯片、视频监控芯片等。
在人工智能产业中,应用层是一个极大的部分,是人工智能技术最终的目的地。除了机器人、无人机和无人驾驶等硬件产品之外,人工智能的软件应用在单独商业化的同时,也在为这些硬件产品提供服务,像智能家居的语音控制
上个星期分享了《基于Sikuli GUI图像识别框架的PC客户端自动化测试实践》,但sikuli看起来怎么都像是上个世纪的界面风格,且功能过于简陋。而同样基于图像识别框架的Airtest,则无疑强大了许多,本次分享的内容是基于Airtest实现Windows应用的自动化测试,内容大纲:
如果你也有同样的烦恼,不如试试「微软小蜜」小程序。有了它,你只需上传几张图片,就能轻松制作好看的 PPT。
编辑 | 明明 1月19日,在极客公园创新者大会IF2018的现场,Google Brain首席工程师陈智峰发表题为:《找答案从定义问题开始 ——TensorFlow 可以用来做什么?》的演讲,分享了Google Brain最近一年到两年时间里面的研究方向,以及在TensorFlow方面的一些工作、成果、进展。以下为演讲实录: 深度学习 深度学习这几年非常流行,在Google的搜索流量里面,深度学习在过去的7-8年时间里,增长了大概100倍,从这个侧面也反映出学界和工业界对这个技术的关注程度,是在迅
多模态机器学习,英文全称 MultiModal Machine Learning (MMML),旨在通过机器学习的方法实现处理和理解多源模态信息的能力。目前比较热门的研究方向是图像、视频、音频、语义之间的多模态学习。
问耕 假装发自 伊珐 量子位 出品 | 公众号 QbitAI 如果你关注华为,麒麟970不是一个陌生的名字。 去年底,关于这款芯片的基本参数就已经曝光完毕。不过有件事,华为一直憋着没说。直到今年7月底
李根 假装发自 Amoy 量子位 报道 | 公众号 QbitAI 你是不是也想要一张插画风格的头像?又要像你,又要插画风格、彩绘色系? OK,美图AI绘画机器人Andy上线了。 之前美图专门给Angelababy打造的“插画风格”AI绘画师,现在已升级迭代到最新版本美图秀秀App中。 只要上传一张自拍照,“Andy”就能画出不同风格的插画像,风格达10多种。 其实更早之前,美图还推出过“手绘自拍”的功能,不过相比“Andy”还是弱爆了。 二者区别在于,手绘自拍
机器之心原创 记者:CZ、Tony Peng 当地时间 5 月 17 日,谷歌在山景城开启了本年度的谷歌 I/O 开发者大会。昨日机器之心对此次大会上将出现的有关人工智能和机器学习的内容进行了梳理。机器之心作为谷歌官方受邀媒体来到现场,近距离为大家报道谷歌人工智能的最新进展。 从大会主题演讲可以看出,谷歌人工智能主要体现在以下五大方面: AI First 的整体战略; TPU 的升级与云服务; 集研究、工具、应用于一体的 Google.ai ; 人工智能技术的产品落地; 基于安卓和 TensorFlow 的
五一节前最后一天,百度发布Q1财报,总营收为127.25亿元人民币,较2014年同期增长34%;营业利润为21.55亿元人民币,较2014年同比下降9.2%。最大亮点为移动营收占比突破50%,成为BAT中移动商业化进展最快的巨头。尽管用数据证明了在移动转型上的成功,但百度依然要回答一个人们关心的问题:移动营收占比增长之后,整体营收和利润如何增长?根据财报以及百度业务布局来看,未来百度在以下业务上的成果将决定其是否能获取更高的增长。 1、基于移动构建新商业模式 移动营收占比不断提高的背景是百度移动流量在201
AI科技评论按:7月份,在经历了长达几个月外界对苹果AI技术落后的质疑后,苹果又有了一些新动作,首先是在7月20日上线了苹果机器学习官方博客(Apple Machine Learning Journal),并发表了第一篇博文;其次提交的论文被CVPR 2017收录,获最佳论文。 苹果CEO库克面对外界对苹果AI技术落后的质疑,曾向媒体回应说,苹果精神是“just work ”(实干精神),之所以外界看不到苹果AI技术的进展,是因为苹果只喜欢谈论即将上线的产品功能。这么来看,公众最多只能通过公开的博客和学术论
看到腾讯和支付宝推出AR红包,BAT三巨头之一的百度也不甘落后。最近,百度发起了一个用AR技术复原老北京九大城门的活动。借此,百度还宣布成立百度AR实验室,推出AR平台DuMix。 据了解,百度AR实验室隶属于吴恩达负责的百度研究院,是百度继硅谷人工智能实验室、北京深度学习实验室以及北京大数据实验室成立的第四个实验室,由此可见,百度是准备在AR领域大干一场了。 百度的AR应用和布局 去年5月份的时候,百度在某个公益活动现场推出了AR儿童安全教育视频。通过手机百度app,借助其内嵌的AR插件,对准某个品牌的包
01 框架介绍 APAIST是用于开发游戏自动化AI的开源框架(开源项目名为GameAISDK)。项目的特点是以游戏图像为输入,直接输出模拟触屏操作,不依赖游戏端提供任何API接口。 APAIST 框架 APAIST框架主要包括SDKTool(配置文件工具),AI SDK两部分。SDKTool帮助我们生成跟具体游戏相关的AI SDK所需要配置文件。如游戏运行过程中,整个流程中需要动作交互的UI,需要识别的游戏元素等。AI开发过程中用到的信息可来自于游戏图像(AIClient获取)或其他数据。ait
导读:深度学习技术已经在互联网的诸多方向产生影响,每天科技新闻中关于深度学习和神经网络的讨论越来越多。深度学习技术在近两年飞速发展,各种互联网产品都争相应用深度学习技术,产品对深度学习的引入也将进一步影响人们的生活。
随着信息技术的发展,我国餐饮建设也发生了很大变化。目前食堂大多以人工为主,推行一卡通消费,即自助选菜然后人工结算,这与以往使用饭票或现金结算相比,省去了找零的麻烦,在效率上有一定的提升。人工结算之所以效率低下,是因为食堂工作人员需要首先识别菜品种类,然后对应每种菜品价格,最后口头累计消费数额并打卡,同时在计算金额的过程中也可能会出错。这整一过程不仅需要较长时间,而且准确率也难以保证。
日前,德勤全球发布了《2017科技、传媒和电信行业预测》报告,其中涉及到生物识别、5G网络、数字化变革、平板电脑发展趋势研究等多项内容。其中在《边缘“大脑”:机器学习移动化》一节中,德勤提出了机器学习移动化的大趋势,并就其来龙去脉进行了简要论述。AI 科技评论将针对此章节内容为您进行重点分析解读。 根据德勤全球的预测,2017 年超过3亿部智能手机——或售出的超过五分之一——将具备机载神经网络机器学习能力。这些计算机模型旨在模拟人脑结构与功能的方方面面,用各个组件来代表神经元及其互连情况。也就是说,机器学习
【新智元导读】谷歌大脑负责人Jeff Dean上周在“嵌入式视觉年度峰会”上发表演讲《智能计算系统中的大规模深度学习》,结合多年应用实例,讨论在从手机到数据中心等不同环境中部署机器学习模型的不同方法,
又到了要推送的时候,总觉得昨天刚刚推送过文章一样…… 聊一下ios11里的一些AR吧。 这个公众号的文章推送一般都有一个月左右的滞后期,也就是说推送的内容一般都是一个月以前接触和思考的。 我比较喜欢作者与读者不同步的感觉。就像一些漫画的连载,当读者在杂志上看到第3话时,作者已经在绘制第7话的内容了。这么做的原因当然是最大程度的排除其他因素的影响,比如在郁闷的时候依然可以正常的推送一些欢乐的东西。 之前有提过,ARKit由于刚出来,而且有着一定的的门槛,所以暂时还没有普及。 但是在第一时间更新到ios11,并
随着人工智能的不断发展,各行各业与人工智能的融合也越来越多,智能化测试就是其中之一,本期我们采访了 ArchSummit 全球架构师峰会(上海站)专题出品人李永刚老师,他从软件测试的发展历程入手,为我们分享了智能化测试案例、自动化测试与智能化测试异同以及企业如何做到智能化测试等等,本文为采访整理文,期待对你有所启发~
【导读】七月就要结束了,在即将到来的 7 月最后一个周末,人工智能头条为大家整理了本月 ML 最受欢迎的十大开源项目。就算放假在家也可以知道大家现在都在学些什么,学习放假两不误。这个周末我们一起过~~
就会跟上面所说的那样,被迫成为一个全栈,这是比较尴尬的。 若你想比较准确的针对某个方向学习,那就继续往下看吧。
作为 GitHubDaily 的运营者,过去几年我接触到了非常多优秀的开源软件,今天就借着这个机会,跟大家分享一下,那些我一直在使用的开源软件吧!
大家都知道,macOS 的默认视频播放器 Quick Time Player 对一些视频格式的支持不是很好,之前我尝试过用 MPlayerX、VLC 等作为替代方案,但效果都不是很好,直到我发现了 IINA。
吴恩达导师、伯克利大学教授Micheal I. Jordan在近期接受大数据文摘访问时,描绘了这样一个认知物联网的应用场景:在网上下单买一台冰箱运到北美,并确保其在一周内送到。 这件司空见惯的小事绝没有听起来那么简单。 首先,这台冰箱不能在下单的时候才从印度装船,企业需要考虑,怎样才能保证5个月前冰箱已经被造出来,并被送到正确的地址;其次,企业需要考虑意外情况出现,比如印度洋上遇上了台风,船只不能运作了,怎么办? 满足这些需求要大量的数据支持和精密的计算。人类无法做这些规划,但统计学和
大叔在日常工作的时候,经常会遇到一些繁琐重复的操作,情不自禁的会想到自动化。甚至有的时候会想,什么时候能实现自动化编写文章,自动化剪辑视频?
上个月,谷歌正式宣布推出针对移动设备和嵌入式设备的轻量级解决方案 TensorFlow Lite。而在此之前,今年 5 月份的谷歌 I/O 大会上他们已经对此进行了预告。承袭 TensorFlow 在服务器、IoT 设备等平台的良好表现,TensorFlow Lite 的推出将使得移动端的机器学习模型部署得以大范围推广。 模型下载:download.tensorflow.org/models/tflite/smartreply_1.0_2017_11_01.zip 项目代码:https://github
随着技术进入成熟期,在最容易实现落地的B端市场,图像识别正逐渐扩大自己的市场。 近日,美国权威杂志《MIT科技评论》(MIT Technology Review)公布了2017年度全球十大突破技术,其中属于AI范畴有三项技术,分别是强化学习、自动驾驶货车和刷脸支付。 其中,值得我们注意的是,虽然同属于2017年的突破性技术,但在距离进入成熟期的时间上,相对于强化学习和自动驾驶货车的还需要1-2年和5-10年时间,刷脸支付技术现在就已经进入了这一阶段。 根据平安证券发布的《通信行业人工智能图像识别专题报告》显
领取专属 10元无门槛券
手把手带您无忧上云