开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何使用空间标注？

stream was reset: CANCEL

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

如何进行数据标注（2）

现在网络上关于深度学习算法的文章很多，但深度学习其实是数据驱动型。很多时候数据足够好，能给算法开发提供很大的便利。今天来介绍一下如何进行数据标注。

01

ICASSP 2018 | 思必驰和上交大提出口语语义理解新方法：基于对抗多任务学习的半监督训练

机器之心专栏作者：Ouyu Lan, Su Zhu, Kai Yu 为期 5 天 ICASSP 2018，已于当地时间 4 月 20 日在加拿大卡尔加里（Calgary）正式落下帷幕。ICASSP 全称 International Conference on Acoustics, Speech and Signal Processing（国际声学、语音与信号处理会议），是由 IEEE 主办的全世界最大的，也是最全面的信号处理及其应用方面的顶级学术会议。今年 ICASSP 的大会主题是「Signal Pro

06

LT-Net：标签转移网络（CVPR 2020）

今天分享一篇发表在CVPR 2020上的论文：LT-Net: Label Transfer by Learning Reversible Voxel-wise Correspondence for One-shot Medical Image Segmentation (原文链接：[1])。

02

深入理解Sora技术原理

OpenAI 发布的视频生成模型 Sora(https://openai.com/sora)，能根据文本生成长达一分钟的高质量视频，理论上支持任意分辨率，如 1920x1080 、1080x1920 ，生成能力远超此前只能生成 25 帧 576x1024 图像的顶尖视频生成模型 Stable Video Diffusion。

01

CVPR 2018：阿里提出新零样本学习方法，有效解决偏置问题

大多数现有的零样本学习（Zero-Shot Learning，ZSL）方法都存在强偏问题：训练阶段看不见（目标）类的实例在测试时往往被归类为所看到的（源）类之一。因此，在广义ZSL设置中部署后，它们的性能很差。在本文，我们提出了一个简单而有效的方法，称为准完全监督学习（QFSL），来缓解此问题。我们的方法遵循直推式学习的方式，假定标记的源图像和未标记的目标图像都可用于训练。在语义嵌入空间中，被标记的源图像被映射到由源类别指定的若干个嵌入点，并且未标记的目标图像被强制映射到由目标类别指定的其他点。在AwA2，

02

论文阅读理解 - Zero-shot Image Tagging by Hierarchical Semantic Embedding

许多细粒度视觉类别的标签获取较为困难，zero-shot 图像标注(image tagging) 旨在采用训练样本中不存在的新标签来标注图像.

04

弱水三千，只取你标！AL（主动学习）结合GAN如何？

众所周知，深度学习的崛起和广泛应用是依靠着大量的标注数据的，但在很多场合下，大规模数据的标注成本太高，同时也可能导致训练时间过长。主动学习可挑出所谓高信息的数据去标注，从而降低标注成本、减少训练时间，还可以迭代提升模型表现。

02

小样本利器3. 半监督最小熵正则 MinEnt & PseudoLabel代码实现

在前两章中我们已经聊过对抗学习FGM，一致性正则Temporal等方案，主要通过约束模型对细微的样本扰动给出一致性的预测，推动决策边界更加平滑。这一章我们主要针对低密度分离假设，聊聊如何使用未标注数据来推动决策边界向低密度区移动，相关代码实现详见ClassicSolution/enhancement

03

写给大家看的机器学习书【Part2】训练数据长什么样？机器学到的模型是什么？

作者：徐晗曦原文：写给大家看的机器学习书（第二篇） https://zhuanlan.zhihu.com/p/25439997 前文：写给大家看的机器学习书【Part1】什么是机器学习？机器

03

AutoML在计算机视觉领域的能与不能

最近几年AutoML炙手可热，一时风头无两。各大公司都推出了自己的AutoML服务。谷歌云的Cloud AutoML

02

如何理解Rust的核心特性（所有权、借用、生命周期）

上一篇文章，我简单讲解了一下，我作为一个前端是如何看待Rust的，里面稍微提及了一下Rust的所有权机制和内存安全，说着的，Rust的所有权机制以及后续带来的生命周期问题确实不好理解，我一边看了TRPL的讲解，另一边又找了好几篇博文，最终写了这篇文章，这篇文章的布局和写作顺序可能有与其他人的文章不同，包含了我完全个人的理解和知识框架，因此也难免会有疏漏，如有疏漏，也请大家可以谅解，共同讨论与学习。

05

四篇AAAI 2020论文，解读微信大规模跨领域文本内容建模研究

随着社交媒体和移动信息流应用的发展，许多应用积累了海量多种类型的图文视频等多媒体内容。

01

纪念碑谷式错觉图像都被「看穿」，港大、TikTok的Depth Anything火了

人类有两只眼睛来估计视觉环境的深度信息，但机器人和 VR 头社等设备却往往没有这样的「配置」，往往只能靠单个摄像头或单张图像来估计深度。这个任务也被称为单目深度估计（MDE）。

01

【NLP】综述|少量标注数据下的命名实体识别研究

近年来，深度学习方法在特征抽取深度和模型精度上表现优异，已经超过了传统方法，但无论是传统机器学习还是深度学习方法都依赖大量标注数据来训练模型，而现有的研究对少量标注数据学习问题探讨较少。本文将整理介绍四种利用少量标注数据进行命名实体识别的方法。

02

学界 | 联合学习离散句法结构和连续词表征的无监督方法

数据标注是监督学习方法应用于许多问题的主要瓶颈。因此，直接从无标签数据中学习的无监督方法显得越来越重要。对于与无监督句法分析相关的任务来说，离散生成模型近年来占据着主导地位，如词性标注（POS）归纳（Blunsom and Cohn, 2011; Stratos et al., 2016）和无监督依存分析（Klein and Manning, 2004; Cohen and Smith, 2009; Pate and Johnson, 2016）。尽管类似的模型在一系列无监督任务中取得了成功，但它们大多忽略了有监督自然语言处理应用中显而易见的连续词表示的作用（He et al., 2017; Peters et al., 2018）。本文着眼于利用并显式地表征句法结构的无监督模型中的连续词嵌入。

02

【地理信息分析系统】ArcGIS 软件 10.8 3.0 中文版下载安装

ArcGIS Pro是由美国Esri公司研发的一款世界著名的地理信息系统软件，被广泛应用于GIS数据管理、地图制作、空间分析等领域。ArcGIS Pro具有强大的数据处理能力和数据可视化能力，可以帮助从业人员更便捷和高效地处理和分析地理信息数据。

02

统计学习方法法导论_1

统计学习的对象是数据data。统计学中的数据通常是以变量或者变量组来表示数据。数据分为连续型和离散型，书中主要讨论的是离散型数据。

02

学界 | CVPR 最新医学影像 AI 论文：利用学习图像变换进行数据增强

近日，由麻省理工学院（MIT）电子工程与计算机科学（ECCS）实验室多位博士所著的医学影像AI论文被CVPR 2019收录。

02

IROS 2021 | 基于无监督学习环境模型的机器人运动控制

导读：本文是机器人领域顶级会议 IROS 2021入选论文《基于无监督学习环境模型的机器人运动控制（DMotion: Robotic Visuomotor Control with Unsupervised Forward Model Learned from Videos）》的解读。该论文由北京大学前沿计算研究中心董豪课题组主导完成。

01

主动学习（Active Learning）简介综述汇总以及主流技术方案

在机器学习(Machine learning)领域，监督学习(Supervised learning)、非监督学习(Unsupervised learning)以及半监督学习(Semi-supervised learning)是三类研究比较多，应用比较广的学习技术，wiki上对这三种学习的简单描述如下：

02

主动学习（Active Learning）简介综述汇总以及主流技术方案

主动学习(Active Learning)综述以及在文本分类和序列标注应用项目链接fork一下，含实践程序，因篇幅有限就没放在本博客中，如有需求请自行fork

02

Spring-不同配置方式的比较

对于Spring来讲，为实现Bean的信息定义，提供了基于XML、基于注解、基于JAVA类、基于Groovy这4种选项，同事还允许各种配置方式复合共存。

01

CAD2007操作教程下

图层相当于图纸绘图中使用的重叠图纸，创建和命令图层，并为这些图层指定通用特性。通过将对象分类放到各自的图层中，可以快速有效地控制对象的显示以及其进行更改。（例如墙体或标注）

03

Linear-chain CRF的推导

在我们想要标注book这个词的时候，是将其标注成名词noun或者动词verb是需要取决于当前词的前一个词的。在这种情境下，前一个词‘a’的词性一个限定词（determiner），所以我们选择将book标注成noun（名词）。对于这样的序列标记任务，以及更一般的结构化预测任务，Linear-chain CRF对标签之间的上下文依赖关系建模是有帮助的。

02

2019年主动学习有哪些进展？答案在这三篇论文里

目前推广应用的机器学习方法或模型主要解决分类问题，即给定一组数据（文本、图像、视频等），判断数据类别或将同类数据归类等，训练过程依赖于已标注类别的训练数据集。在实验条件下，这些方法或模型可以通过大规模的训练集获得较好的处理效果。然而在应用场景下，能够得到的数据实际上都没有进行人工标注处理，对这些数据进行类别标注所耗费的人力成本和时间成本非常巨大。在一些专门的应用领域，例如医学图像处理，只有专门学科的专业医生能够完成对医学影像图像的数据标注。显然，在这种情况下必须依赖大规模训练集才能使用的方法或模型都不再适用。为了减少对已标注数据的依赖，研究人员提出了主动学习（Active Learning）方法。主动学习通过某种策略找到未进行类别标注的样本数据中最有价值的数据，交由专家进行人工标注后，将标注数据及其类别标签纳入到训练集中迭代优化分类模型，改进模型的处理效果。

02

CVPR 2018 中国论文分享会之「人类、人脸及3D形状」

本文为2018 年 5 月 11 日在微软亚洲研究院进行的 CVPR 2018 中国论文宣讲研讨会中最后一个Session ——「Human, Face and 3D Shape」环节的三场论文报告。

02

清华大学&英伟达最新｜Occ3D：通用全面的大规模3D Occupancy预测基准

自动驾驶感知需要对3D几何和语义进行建模。现有的方法通常侧重于估计3D边界框，忽略了更精细的几何细节，难以处理一般的、词汇表外的目标。为了克服这些限制，本文引入了一种新的3D占用预测任务，旨在从多视图图像中估计目标的详细占用和语义。为了促进这项任务，作者开发了一个标签生成pipeline，为给定场景生成密集的、可感知的标签。该pipeline包括点云聚合、点标签和遮挡处理。作者基于Waymo开放数据集和nuScenes数据集构造了两个基准，从而产生了Occ3D Waymo和Occ3D nuScene基准。最后，作者提出了一个模型，称为“粗略到精细占用”（CTF-Occ）网络。这证明了在3D占用预测任务中的优越性能。这种方法以粗略到精细的方式解决了对更精细的几何理解的需求。

04

隐马尔可夫模型、最大熵马尔科夫模型、条件随机场

在介绍马尔可夫模型之前，先简单介绍下马尔可夫过程。马尔可夫过程是满足无后效性的随机过程。假设在一个随机过程中，

06

7种常用的数据标注工具

标注工具是数据标注行业的基础，一款好用的标注工具是提升标注效率与产出高质量标注数据的关键。

00

如何通过构建平台搞定数据标注难题？

数据标注行业流淌这么一句话：“有多少智能，就有多少人工”。大量的训练数据是进行深度学习的前提，数据的质量决定了模型的上限，而训练数据产生离不开数据标注，数据标注作为机器学习工程中重要的一环，是构建 AI 金字塔的基础。以旷世科技 AI 独角兽为例，它的标注员工多达 405 人，占公司员工比例的 17.2 %

02

Mastercam如何变更图层？

当图面中有许多图形要素时，时常会干扰到识图及图形选择，因此，可以透过图层管理来对画面中的要素进行分类管理。例如在下图中可以看到画面中包含尺寸标注，使图面看起来比较混乱，尝试将画面中的所有尺寸标注移动到别的图层。

01

语音数据标注工具与平台

Praat是目前已经成为比较流行也比较专业的语音处理的软件，可以进行语音数据标注、语音录制、语音合成、语音分析等等，具有免费、占用空间小、通用性强、可移植性好等特点官网链接 http://www.fon.hum.uva.nl/praat/ 汉化版下载 http://www.hejingzong.cn/blog/ViewBlog_54.aspx#vidio

04

《统计学习方法》笔记一统计学习方法概论

输入与输出所有可能取值的集合成为输入空间与输出空间。每个具体的输入是一个实例，通常由特征向量表示，所有特征向量存在的空间成为特征空间。

02

统计学习及监督学习概论

统计学习（statistical learning）是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。统计学习也称为统计机器学习（statistical machine learning）。

03

GIS空间数据模型: 注记文本模型

---- 我的GIS/CS学习笔记：https://github.com/yunwei37/ZJU-CS-GIS-ClassNotes <一个浙江大学本科生的计算机、地理信息科学知识库 > ---- 注记文本模型空间数据模型分为：矢量模型栅格模型注记文本模型注记文本模型是GIS的空间数据模型的一种。分类 GIS的注记可以分为以下3类：注记标签 annotation label：选择要素层中的某个属性值作为标记，附着在各要素的旁边显示，与要素具有正式的连接关系标签的显示风格与

02

周志华：弱监督学习的综述

在《国家科学评论》(National Science Review, NSR) 的机器学习专题期刊中，介绍了南京大学周志华教授发表的一篇论文《A brief introduction to weakly supervised learning》，本文对此做编译介绍，希望这篇文章能对你有所帮助，让你在学习和应用AI技术的道路上更进一步！

01

每类13张标注图就可从头学分类器，DeepMind新半监督模型超越AlexNet

DeepMind 近期的一项研究利用对比预测编码（Contrastive Predictive Coding，CPC）来解决这一难题，该方法是一种从静止图像中抽取稳定结构的无监督方法。得到的结果是一种表征，使用该表征和简单的线性分类器在 ImageNet 上可实现优于其他方法的分类准确率，性能超越全监督 AlexNet 模型。即使给出少量标注图像（每个类别 13 张标注图像），该表征也能保持强大的分类性能，Top-5 准确率超出当前最优的半监督方法 10%，超出当前最优监督方法 20%。

03

OpenTag模型：减少人工标注，自动提取产品属性值

（1）将问题形式化为序列标注任务，并提出利用递归神经网络（双向 LSTM）捕获上下文和语义的联合模型，并且利用条件随机场（CRF）来约束标注连贯性；

02

什么是LIDAR（激光雷达），如何标注激光点云数据?

自动驾驶汽车严重依赖输入的训练数据来做出驾驶决策，从逻辑上来说，数据越详细，车辆做出决策就越好，最重要的是更安全。虽然现代相机可以捕捉到非常详细的真实世界特征，但输出结果仍然是2D的，效果并不够理想，因为它限制了我们可以提供给自动驾驶汽车神经网络的信息，这意味着汽车必须学会对3D世界做出猜测。与此同时，相机捕捉信息的能力有限，比如在下雨的时候，相机捕捉到的图像几乎无法辨别，而激光雷达仍然可以捕捉信息。因此，2D相机无法在所有环境下工作，由于自动驾驶汽车是神经网络一个高危应用场景，我们必须确保构建的网络尽可能完美，这一切要从数据说起。理想情况下，我们希望我们的网络将3D数据作为输入，因为它需要对3D世界进行预测，这就是激光雷达的用武之地。

05

SuperLine3D：从3D点到3D线

这个工作来自于浙江大学和DAMO academy。在点云配准领域，尽管已经有很多方法被提出来，但是无论是传统方法，还是近年来蓬勃发展的基于深度学习的三维点云配置方法，其实在真正应用到真实的LiDAR扫描点云帧时都会出现一些问题。造成这种困窘的一个主要的原因在于LiDAR扫描到的点云分布极不均匀。具体而言，相较于RGBD相机，LiDAR的有效扫描深度要大很多。随着深度的增大，其激光发射出去的扇面将会变得稀疏。因此，即使是扫描同一目标或场景的点云帧之间，其尺度并不一致。导致想要研究的关键点周围的邻域点分布也存在较大不同，难以通过这些3D点的特征描述关联起点云帧。这个问题一直以来都十分棘手。这个工作独辟蹊径，提出对于这种点云数据，不再通过3D点来构建关联以实现点云配准，而是研究点云数据中的高层次的几何原语。这种做法直观来说是有道理的，因为这些高层次的几何原语通常会有较大的支撑点集，换句话说，其对于点云扫描和采样具有较大的鲁棒性，通常不会因为某个点没有被记录而影响相应几何原语的提取。同时，几何原语通常具有更具体的特征和几何结构，例如一条直线、一个平面等，其更容易构建不同帧间的关联，避免误匹配。但是，这种研究思路通常难度较大，原因在于缺乏足够的有标签的数据集。在这种情况下，这个工作显得极其重要，它不仅仅提供了一个数据集自动标注模型，同样也是少数真正开始探索几何原语用于点云配准任务的先河性的工作。

02

Bengio团队Nature发文：四个维度讲AI for Science，还讨论了AI跨界核心挑战

从数据收集到模型构建，从实验设计到过程控制，AI跨界正在改变科学研究方式，成为科学发现引擎。

04

Learning to Adapt Structured Output Space for Semantic Segmentation

对语义分割来讲基于卷积神经网络的方法，依赖像素级ground-truth标记，但是对未知领域可能泛化效果并不好。因为标记过程是沉闷和耗时的，开发将源ground truth标记到目标域引起了很大的关注。本文我们提出一种对抗训练方法在语义分割的内容中进行域适配。考虑语义分割作为结构输出包含源域和目标域的空间相似性，在输出空间中，我们采用对抗训练。为了进一步增强适配模型，我们构建一个多层对抗网络，在不同特征级别上有效的执行输出空间域适配。一系列的实验和消融研究在不同域适配下进行，包括合成到真实和跨城市场景。我们表明提出的方法在精度是视觉质量方面，超过了现有的最先进的方法。

02

如何为计算机视觉任务选择正确的标注类型

机器学习中的注释（Annotation）是标记数据的过程，可以是文本，视频，图像或音频等形式。在计算机视觉任务中，图像注释有助于计算机更好的理解图像，计算机尝试在带注释的数据中学习出适用于新数据识别的相似的规则。

03

商汤及联合实验室入选论文重点解读 | ECCV 2018

9月8日-14日，备受瞩目的2018欧洲计算机视觉大会（ECCV 2018）在德国慕尼黑召开， ECCV两年举办一次，与CVPR、ICCV共称为计算机视觉领域三大顶级学术会议，每年录用论文约300篇。

04

8.6K Star开源免费的地理信息系统软件,解锁地理数据的无限可能,而且跨平台

02

中科院提出 DTLLM-VLT | 利用连贯提示框架和大语言模型为视觉语言跟踪提供多粒度语义增强 !

单目标跟踪（SOT）是计算机视觉任务中的关键，专注于在视频序列中跟踪移动目标。研究行人一致观察到，在内容更复杂的长时间视频中，大多数跟踪器的性能有限。此外，仅依赖视觉模态大大限制了这种系统的多功能性。因此，一些研究开始为SOT任务提供语义标注，导致了视觉语言跟踪（VLT）任务的产生。VLT任务的提出帮助SOT研究更接近人类方式，并拓宽了其应用前景。与边界框（BBox）相比，自然语言提供了更用户友好和直观的目标描述方式，允许从空间位置到高级语义细节的精确描述，以提高跟踪性能。在定义VLT任务时，研究行人从两个主要观点整合文本标注：

01

CAD复习资料

11.AutoCAD中命令调用的方法：屏幕菜单、在命令行输入命令、工具菜单、下拉菜单

00

SAM-Med | 英伟达基于SAM提出医学图像标注效率神器

使用即时学习方法展示了SAM对下游医学分割任务的泛化能力。结果显示，仅使用大约5个输入点就显著提高了分割精度。

01

南京大学周志华教授综述论文：弱监督学习

选自NSR 作者：周志华机器之心编译在《国家科学评论》(National Science Review, NSR) 2018 年 1 月份出版的机器学习专题期刊中，介绍了南京大学周志华教授发表的一篇论文《A brief introduction to weakly supervised learning》。机器之心经授权对此论文部分内容做了编译介绍，更完整内容可查看英文论文原文。摘要：监督学习技术通过学习大量训练样本来构建预测模型，其中每个训练样本都有一个标签标明其真值输出。尽管当前的技术已经取得了巨

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭