首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    固定参数的模型有多大潜力?港中文、上海AI Lab等提出高效视频理解框架EVL

    机器之心专栏 机器之心编辑部 来自香港中文大学、上海人工智能实验室等机构的研究者提出了高效的视频理解迁移学习框架 EVL,通过固定骨干基础模型的权重,节省了训练计算量和内存消耗。 视觉基础模型近两年取得了瞩目发展。从一方面而言,基于大规模互联网数据的预训练已经给模型预置了大量的语义概念,从而具有良好的泛化性能;但另一方面,为充分利用大规模数据集带来的模型尺寸增长,使得相关模型在迁移到下游任务时面临着低效率问题,尤其是对于需要处理多帧的视频理解模型。 论文链接:https://arxiv.org/abs/2

    02

    细数自然环境OCR应用,牵手机器人最具市场前景

    从古至今,文字经历了数代变革,最终发展成为现在的简体字。近来以来,随着科技的发展,人类变得越来越“懒”,从抛弃纸笔投入电脑的怀抱,再到现在从键盘到语音的转移。虽然不管如何发展,文字依然是人们不可丢弃的东西,但是出于让生活更便利的目的,它也在随着科技而发生变化,比如担当着人工智能基础之一的文字识别技术(OCR)。 OCR是指光学设备(扫描仪、数码相机等)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程,其本质就是利用光学设备去捕获图像并识别文字,将人眼的能力延

    03

    《最强大脑》第三场《核桃计划》比赛难点及技术解析

    近日,江苏卫视《最强大脑》第四季人机大战第三场已经结束。从未失算的“水哥”王昱珩,在图像识别方面与搭载百度大脑的小度机器人进行实力交锋。最终,“小度”以2:0的战绩战胜对手,并以3:1的总战绩,斩获2017年度脑王巅峰对决的晋级资格。 本场竞赛题目为 “核桃计划”:通过三段在夜幕下分别从行车记录仪、高位摄像头和女生手机中拍到的模糊动态影像中,让“小度“和水哥识别三位“嫌疑人”的特征后,从30位性别相同、身高体重年龄均相似的候选人现场拍照中,准确找出三位“嫌疑人”。 比赛虽已结束,但对于相关人工智能识别技术的

    02

    街景车弱爆了,照片游技术会取而代之?

    尼泊尔发生了本世纪陆地第五次八级大地震,加德满都12座世界遗产建筑被不同程度损毁,尼泊尔专家称能工巧匠需要用大约10年时间才可修复这些古迹。在他们实现这一目标之前,百度拿出了一个快速解决方案:基于照片游技术,号召全球网友上传加德满都相关景点照片,尝试用技术在虚拟世界对被损毁的景点进行360°还原。这听上去是一个巨大的“拼图”工程,好在有一项名为“照片游”的技术,而这项技术未来甚至有望取代街景车,做到真正还原世界每一个时刻的每一个角落。 照片游技术收集和还原真实世界 百度地图还原加德满都的计划,使用被称为照

    05

    Siri创始人:人工智能领域正面临这4大机遇窗口

    人工智能先驱、Siri之父诺曼·威纳尔斯基近日现身北京,在他的新书《产品改变世界:Siri如何成功创造千亿市场》分享会上,首次谈到了他对人工智能未来两年的趋势预测。 人工智能将迎来四大机遇窗口 诺曼认为,中国具备了人工智能领域创业的优质土壤和良好要素:首先,中国有着受过计算机教育的庞大劳动力供给;其次,具备浓厚创业精神的中国人也很多;另外,中国人的工作标准或者是工作道德非常高,因为中国人工作非常努力,而且工作时间很长,直到自己能创造出真正有价值的东西。 他称,中国诞生过阿里巴巴和腾讯这样的大企业,就充分

    07
    领券