首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何用Transformer分清12位女排运动员?这个「时空路」框架刷群体行为识别SOTA

群体行为识别(Group Activity Recognition)不同于寻常的关于个体动作的行为识别(Action Recognition),需要通过分析视频中所有参与群体活动的个体之间的关系,进一步结合场景信息...以下面排球比赛视频为例,算法需要分析场上12位运动员的动作、交互以及场景内容,综合判断得到场上在进行左侧击球(left-spike)群体行为。 ‍...被忽略的互补建模顺序 由于群体行为识别的多粒度特性以及明确的粒度含义(个体-群体),GCN、transformer以及CNN的attention模块都经常被用作对群体进行建模的工具。...图4 全监督提供12位运动员的精细标注 为了进一步减少标注成本,也为了检验模型的鲁棒性,文章提出有限数据设定(limited data),验证模型在有限标注数据(如50%)下的表现;同时,文章也在弱监督设定...重点从事深度学习与计算机视觉、模式识别与机器学习等人工智能前沿研究。

2.1K40

如何用Transformer分清12位女排运动员?这个「时空路」框架刷群体行为识别SOTA

群体行为识别(Group Activity Recognition)不同于寻常的关于个体动作的行为识别(Action Recognition),需要通过分析视频中所有参与群体活动的个体之间的关系,进一步结合场景信息...以下面排球比赛视频为例,算法需要分析场上12位运动员的动作、交互以及场景内容,综合判断得到场上在进行左侧击球(left-spike)群体行为。 ‍...被忽略的互补建模顺序 由于群体行为识别的多粒度特性以及明确的粒度含义(个体-群体),GCN、transformer以及CNN的attention模块都经常被用作对群体进行建模的工具。...图4 全监督提供12位运动员的精细标注 为了进一步减少标注成本,也为了检验模型的鲁棒性,文章提出有限数据设定(limited data),验证模型在有限标注数据(如50%)下的表现;同时,文章也在弱监督设定...重点从事深度学习与计算机视觉、模式识别与机器学习等人工智能前沿研究。

2K40
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    全球首个机器人公民索菲亚亮相201712知商节 引爆全场知识产权新高潮

    近日,一场精彩绝伦的全球知商盛会——201712知商节国际知商高峰论坛在广州隆重举行。来自政界、商界、产业界、学术界的大咖齐聚一堂,面对面探讨知识产权未来发展。...△机器人索菲亚亮相201712知商节 发表中英文致辞:非常荣幸参与汇桔网12知商节 论坛上,机器人索菲亚发表中英文致辞。...她表示非常荣幸参加由汇桔网主办的12知商节,特别感谢人类长期以来对机器人成长的关注。...她的“大脑”采用人工智能和谷歌语音识别技术,能识别人类面部、理解语言以及记住与人类的互动,甚至还会开玩笑。...机器人索菲亚在12知商节上的精彩亮相,让我们看到人工智能领域的知识产权成果。在建设创新型国家的进程中,知识产权的创造、运用、保护、管理能力至关重要,是经济社会发展的新动力源。

    2.5K90

    DJI goggles-维修进度90%

    没有什么技术含量的事情~ 最近买的配件都回来了,开始折腾: 精美包装 先焊接点小东西把手热一下 钱花了哪里哪里好。...一定要买好焊锡,以后没有好焊锡,我宁愿不动手。 下面是做了一个电源,这个电源可以自由的设置电流和电压。我是想着进行用电器的测试。...可以买一个 这个是一个简单的识别流程 这个是QC2.0的识别算法 软件流程为: MCU上来就把DP_UP_IO输出1,DP_IO OD或推挽输出0.这样D+上电压0.6V。...这个很好记忆 D+有一个+号,说明是加电压,D-是减电压,最后测试的确如此 D+因为平时是0.6V,所以脉冲就是高电平这样的: D-平时3.3V,脉冲就是低电平: 这个是百度经验的识别算法 捡垃圾的心

    2.2K20

    AI大牛沈向洋就职清华演讲全录:人类对AI如何做决定一无所知

    导读:2019 年 11 月 14 日凌晨,在微软服务 23 年的微软全球执行副总裁沈向洋博士宣布离开微软;2020 年 3 月 5 日,清华大学在线上举行了活动“沈向洋聘教授聘任仪式暨春风讲堂第四讲...会后,沈向洋发表了主题为 “如何设计和构建负责任的 AI” 的全英文演讲,本文对重点内容进行了整理。 作者:沈向洋,整理:冬梅、陈思 来源:AI前线(ID:ai-front) ?...2005 年,沈向洋曾以聘教师的身份在清华任教,并于 2015 年参与了清华、华盛顿大学、微软共同成立的全球创新学院(GIX)。...由于演讲为全英文,InfoQ 整理了重点内容供广大开发者参考。 01 沈向洋:如何设计和构建负责任的 AI ? 话题 1:AI 的可解释性 之前,我们谈论的 AI 都是出现在科幻小说或电影里。...需要了解偏见来自哪里,就需要知道数据的来源。在微软、IBM 和 Face ++ 制定的面部识别算法中,黑人女性比白人的面部识别准确率要低。 ? ?

    1.1K10

    查找论文文献的小技巧

    而这个过程说到底就两句话: 去哪里找 在哪里下 本文以工科论文为背景撰写, 以查找 "模式识别" 这一关键词为例. 去哪里找 1....当你切换到英文的维基百科, 文献更是扑面而来: 维基百科上的描述需要人工维护, 因此中英文模式下看到的内容是不一样的, 同样搜索 "模式识别", 英文下的参考文献达到22条, 而中文下只有4条....可能对于大部分人, 硬啃英文维基是比较有难度的, 这时候可以挑着来找. 比如我要找模式识别的应用, 直接点击导航的 Uses 关键词, 就不用通篇硬啃了....百度学术有个优点是查找中英两种关键词比较方便, 比如查找 "模式识别" ,直接点击上方的按钮就可以查到英文文献, 不需要自己翻译关键词....另一个优点是相关研究点的推荐, 不知道怎么对论文研究点进行挖掘, 可以尝试搜索一下: ---- 去哪里下 说完了去哪里找, 再来说说去哪里下.

    2K10

    使用率太低!谷歌停止向中国大陆提供翻译服务

    没错,因为这就是个「截图」而已…… 不管你点击哪里,都会直接被重新定向到谷歌翻译的香港域名——translate.google.hk。 显然,这个对于大陆的用户来说,是无法访问的。...时任工业和信息化部部长李毅中同年3月12日在回应「谷歌退出中国事件」时说,中国的互联网是开放的,进入中国市场就必须遵守中国法律。...在英翻中的英文对话框输入「新闻」,「传播」等词汇,中文部分显示的仍然是「新闻」和「传播」。 但在英文对话框输入「艾滋病毒」等类似词汇,中文翻译就会显示恶毒攻击中国的词汇。...「曹哲的杂货铺」认为这是有意制造的: 为什么恰好会有人找到谷歌翻译,又恰好翻译这些并不常用的词语,又叒叕恰好把忽略系统建议硬把源语言设成「英文」呢?...输入一段中文,然后硬告诉程序这是英文,让他把这玩意「翻译」成中文,其直接后果无非就是程序被你玩炸了,程序会认为这条「英文」它不会翻译,这时候只要有心人把这个用汉语写成的「冷门英文单词」在翻译社区提交翻译建议

    1.3K20

    前端上传文件到腾讯云(对象存储)

    买的过程就就不写了,毕竟我也不参与,买好了以后需要配置的地方简单的说一下: 第一要申请一个bucket(存储桶) ? ?...name=123&sex=nan,那么您的这个URl是不是可以被腾讯云识别,就要看您的这个CORS里面有没有配置这个。...写到这里基本就完成了,但是相信您不是很明白,所以我也不知道怎么说可以说的更明白,只能哪里不明白您再问吧! 更新 更新时间:2018-7-24 更新内容:解决问题 问题1:签名怎么来的?...也就是SecretId和SecretKey两个参数哪里看的?...回答:这个怎么调试其实是根据自己的经验来的,他和我们平常出错调试是一样的,直接打开页面F12进入调试页面(如果您的是mac笔记本的话,直接右上角三个点的地方,点击开发者工具)首先看console是不是报错

    14.2K55

    连线清华,沈向洋离职后首次公开演讲:构建负责任的AI

    大数据文摘出品 作者:刘俊寰 前几日,清华大学官宣了前微软全球执行副总裁、人工智能与研究事业部负责人沈向洋的最新动态:加入清华大学高等研究院,以聘教授的身份重新回归到大众的视线中。...其实早在2005年,沈向洋就首次受聘成为了清华大学高等研究院聘教授,距今已经过去了15年,严格来说,这应该是“续聘”。...聘任仪式后,沈向洋在Zoom直播平台,用全英文进行了主题为Engineering Responsible AI的课程演讲,分享了他对目前AI可解释性与AI偏见相关的研究与看法。...一旦哪里出现问题,我们需要对操作文件进行复盘,找出问题所在。但是,AI没有这种检修表,这就让我们对其中的问题更加迷茫。...调查后得到的结论是,机器学习工程师面临的最大问题之一就是,有时候他们知道系统出问题了,但不知道具体是哪里,也并不知道为什么。

    59020

    腾讯云文字识别之通用印刷体识别

    在AI开放平台逐渐成熟的今天,你在谷歌里搜索一下通用印刷体识别,搜出来的第一个就是腾讯云的通用印刷体识别,你看一下: image.png 关于通用印刷体识别,你知道的,有多少?...你随便拿一本书的一页纸来拍一张,想识别出上面的文字,这就叫做通用印刷体识别。...Product=ocr&Version=2018-11-19&Action=GeneralFastOCR&SignVersion= image.png 那它所提供的能力优势又在哪里呢?...适用于快速文本识别场景,准召率有一定损失,价格更优惠 识别准确率 96% 99% 91% 价格 中 高 低 支持的语言 中文、英文、中英文、日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、...俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语 中文、英文、中英文 中文、英文、中英文 自动语言检测 支持 支持 支持 返回文本行坐标 支持 支持 支持 自动旋转纠正 支持旋转识别

    5.4K21

    使用率太低!谷歌停止向中国大陆提供翻译服务

    没错,因为这就是个「截图」而已…… 不管你点击哪里,都会直接被重新定向到谷歌翻译的香港域名——translate.google.hk。 显然,这个对于大陆的用户来说,是无法访问的。...时任工业和信息化部部长李毅中同年3月12日在回应「谷歌退出中国事件」时说,中国的互联网是开放的,进入中国市场就必须遵守中国法律。...在英翻中的英文对话框输入「新闻」,「传播」等词汇,中文部分显示的仍然是「新闻」和「传播」。 但在英文对话框输入「艾滋病毒」等类似词汇,中文翻译就会显示恶毒攻击中国的词汇。...「曹哲的杂货铺」认为这是有意制造的: 为什么恰好会有人找到谷歌翻译,又恰好翻译这些并不常用的词语,又叒叕恰好把忽略系统建议硬把源语言设成「英文」呢?...输入一段中文,然后硬告诉程序这是英文,让他把这玩意「翻译」成中文,其直接后果无非就是程序被你玩炸了,程序会认为这条「英文」它不会翻译,这时候只要有心人把这个用汉语写成的「冷门英文单词」在翻译社区提交翻译建议

    48810

    谷歌官方TensorFlow开发者认证来了,吴恩达:学我的课,报名费五折

    目前,twitter上除了英文世界的人,日本人和韩国人都对这个官方认证产生了兴趣。 ? ? 你还有机会去当第一个持有TensorFlow认证的中国人哦。...TensorFlow官网给划的重点是: 机器学习和深度学习的基本原则; 在TensorFlow中建立机器学习模型; 用深度神经网络和卷积神经网络建立图像识别、目标检测、文本识别算法; 用不同形状、不同大小的真实世界的图像...按照现在的汇率,能省350块呢,可以买好多口罩了。 现在,谷歌、亚马逊、Uber、Twitter……美国一群科技公司都在家办公了,全球人民都在家里蹲,这个时候出点学习资源还是挺不错的。

    1.1K00

    革新OCR结构化技术应用,揭秘百度中英文OCR结构化模型StrucTexT预训练模型

    2.中英文场景上效果全面领先:覆盖4w+中英文常见字词,实现业界最大规模5千万OCR中英文场景数据预训练,深度挖掘不同模态间的语义关联。...3.完备的OCR字段解析能力:基于粒度输出框架,灵活的建模粒度选择,可支持字符信息抽取、字段信息抽取和字段连接预测三种结构化信息提取任务。...在粒度表征下,模型能够实现字符和字段粒度的信息抽取任务,实现灵活选型和场景适配。...4.票据排版复杂:医疗单据属于多类型文字混排,包含中英文、数字和特殊符号,文字识别难度大。...基于中英文字段级多模态特征增强的OCR结构化模型StrucTexT,可以对社会各行各业的办公流程输入、各类文档证件进行数字化录入,为促进无纸化办公、企业数字化转型、实现国家“碳”目标奠定了良好的基础。

    2.8K10

    这篇游记,为你剧透了旅游城市的未来(多图预警)

    下周的腾讯全球数字生态大会,各位机票都买好了吗? 当然,有事到不了现场的小伙伴,也可以预约直播~ 二维码送上,请查收~ 首次“三会合一”的“腾讯全球数字生态大会”为什么会选择在云南昆明举办?...“刷脸”背后是腾讯优图的“人脸识别”的技术。在光线、场景等各类因素的干扰下,机器仍能保持99%的一次通过率。 张亮亮每次出去玩,都喜欢找导游做讲解,因为“够深度”。...闫薇现在有了一本移动的教科书:微信打开“识花君”小程序,拍照识别,AI告诉你这些“奇花异草”姓甚名谁,有什么特别之处。...目前,拍照识花功能已完成6000多种花卉的识别学习,涵盖了云南主要花卉及16个州市的特色植物。 人有三急,事关重大。我们把厕所信息也装进了“游云南”,系统会推荐距离最近的厕所位置,并告知空位情况。...“神器”的另一面:到了厕所门口,还能直接看哪里是空位。 利用物联网中的NB-IoT智能门锁开关、厕位红外人体感应和厕所入口人流量检测等多种方式,腾讯云将厕所信息实时展示给游客。

    2.8K10

    UI 设计中的视觉无障碍设计

    UI 设计中的视觉无障碍设计 2017-12-10 10:58 我给博客改了主题色,从 这样的 改成了 这样的;然而我问小伙伴看看效果他却并没有发现改变...在网上搜索“色盲模拟器”,或者英文的“color blindness simulator”可以得到很多的模拟工具,大体思路是将红色、绿色或蓝色分量模拟成另一种颜色分量。...▲ 可见光 而这种感觉从哪里来?从视锥细胞接收到的刺激到大脑皮层的处理这些都是形成感觉的重要部分。...所以,在这一段中,我们将达成一个认知—— 三种不同的视锥细胞决定了我们对于颜色的感知和识别。我们将人类这种通过三种颜色感知细胞对颜色的识别称为三色视觉。...假如异人觉得蕨类植物比较好吃,狗尾草吃着恶心,那么他们便能通过颜色一眼从草丛堆种识别出这两种草来。

    1.5K20
    领券