Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >从“打字描述”到“标签”

从“打字描述”到“标签”
EN

Stack Overflow用户
提问于 2014-08-12 12:27:38
回答 1查看 111关注 0票数 0

背景

我确实有一个图像数据集(类似于http://www.image-net.org/),该数据集为每个图像提供了一个“带有打字的描述”。我想对这个家伙运行一些深卷积神经网络,但我需要首先生成“标签”。所以,问题是:

问题

如何从“带有排字的描述”生成类别的“标签”?

技术信息

数据集有大约13M幅图像,并有相应的(有效的)“描述”和可选的“输入”。“描述”的一些例子如下:

想法

我正在考虑用以下的方法来处理这个问题。

  1. 修正排版:
    • 运行拼写检查以识别拼写错误;
    • 通过找到可以修复它的更好的词
      • 查看数据集中的其他描述,或
      • 检查图像并手动纠正错误;

  1. 生成最终标签:
    • 在句子嵌入(将句子映射到ℝᴺ中的函数)上运行聚类算法(例如k均值)
    • 使用最经常出现的词。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-08-12 18:46:05

这里有一些想法:

  1. 你应该清楚地进行拼写检查,否则你的标签会更吵。选项:

代码语言:javascript
运行
AI代码解释
复制
- Check a Information retrieval course and implement the checking, google lecture3-tolerant-retrieval-handout-6-per.pdf (I bet this is not the way to go) In case you want frequencies, google "Natural Language Corpus Data"
- Use some code [http://norvig.com/spell-correct.html](http://norvig.com/spell-correct.html) (in many languages)

  1. 关于标签(我猜你是想要自动的,否则会有半自动的方法):

代码语言:javascript
运行
AI代码解释
复制
- Use [http://viget.com/extend/tagging-text-automatically](http://viget.com/extend/tagging-text-automatically) I have never used them but it should work reasonable well
- I would not recommend using k means because you do know the number of groups
- Use the most recurrent word might work for few examples (like the ones you show there) but it might not work for many cases.

我希望这是有用的

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/25273507

复制
相关文章
从图像到语言:图像标题生成与描述
对图像中的视觉内容进行归纳和总结,并使用合适的词汇与合理的语法结构将其重新组织并表达出来,是图像标题生成与描述的主要研究内容。 如图 1 所示,首先对图像中的视觉内容进行解析,将其转换成视觉语义编码,然后根据编码内容进行解码,将其映射到语言空间中,生成相关词汇,并组合成用词准确、结构合理的自然语言。 本节围绕该基本框架,从视觉特征提取、视觉语义选择和模型设计与优化等方面,介绍当前流行的方法和模型架。
苏州程序大白
2021/08/13
1.8K0
从图像到语言:图像标题生成与描述
去除WordPress分类描述P标签
  我们知道栏目页调用栏目描述直接用<?php echo category_description(); ?>就ok了,但是使用上面的代码调用Wordpress分类描述,会自动出现P标签,如<p>这里
ytkah
2019/08/07
8210
Spring从入门到精通(七)—Bean标签详解
用于配置对象交由Spring 来创建。 默认情况下它调用的是类中的无参构造函数,如果没有无参构造函数则不能创建成功。
共饮一杯无
2022/11/28
2640
vim 从嫌弃到依赖(11)——标签页操作
各位小伙伴们,你们好,我又更新了! 之前介绍了vim关于多窗口的操作,vim中多窗口是将多个窗口在一个屏幕中显示,这似乎与我们常见的ide有点不一样,一般的ide都是新开一个窗口之后在新的标签页中显示,通过不同的标签页对应不同的文件。我们的浏览器就是一个典型的例子。
Masimaro
2022/05/12
6450
vim 从嫌弃到依赖(11)——标签页操作
从视频到语言: 视频标题生成与描述研究综述
来源:专知本文约5000字,建议阅读9分钟最新视频视频标题生成与描述研究综述论文。 视频标题生成与描述是使用自然语言对视频进行总结与重新表达. 由于视频与语言之间存在异构特性, 其数据处理过程较为复杂. 本文主要对基于“编码−解码” 架构的模型做了详细阐述, 以视频特征编码与使用方式为依据, 将其分为基于视觉特征均值/最大值的方法、基于视频序列记忆建模的方法、基于三维卷积特征的方法及混合方法, 并对各类模型进行了归纳与总结. 最后, 对当前存在的问题及可能趋势进行了总结与展望, 指出需要生成融合情感、逻辑
数据派THU
2022/03/04
5230
什么是description,如何优化描述标签?
网站优化中常说的description实际上是描述标签,它是HTML代码中Head部分除标题标签外与SEO有关的另一个标签,用于说明页面的主体内容。
茹莱神兽
2022/09/14
5360
什么是description,如何优化描述标签?
【MATLAB 从零到进阶】day11 描述性统计
均值mean 方差var和标准差std 最值max/min 极差range 中位数median 分位数quantile/prctile 众数mode 变异系数std/mean k阶原点矩 mean(score.^2) k阶中心距moment(score,k) 偏度skewness 峰度kurtosis
统计学家
2019/04/10
1.6K0
【MATLAB 从零到进阶】day11 描述性统计
WordPress添加关键词和描述标签
关键词和描述标签作为SEO的基础配置,在wordpress中没有默认添加,这里记录一下在Wordpress中自动添加关键词和描述标签的方法。
ianzhi
2023/10/19
6630
xmake从入门到精通4:常用C/C++项目描述设置详解
xmake是一个基于Lua的轻量级现代化c/c++的项目构建工具,主要特点是:语法简单易上手,提供更加可读的项目维护,实现跨平台行为一致的构建体验。
ruki
2019/11/18
1.4K2
打字课堂 for Mac(学习打字软件)
想要在苹果电脑上来学习打字?为什么不用打字课堂 Mac版呢?是可以为你带来基础的入门打字的知识供你来学习,打字课堂 Mac版还带有了超多的打字游戏给你来体验哦,当然你在这款学习打字软件中也是能查看到自己的打字速度以及正确率等数据.
用户10121095
2023/04/17
8800
让wordpress分类和标签的描述支持HTML代码
默认 WordPress 后台分类和标签的编辑页面,分类和标签的描述是不支持 HTML 代码的,我们可以通过在当前主题的 functions.php 文件添加如下代码让分类和标签的描述支持 HTML 代码:
ytkah
2022/03/14
4470
WordPress 技巧:让分类和标签的描述支持 HTML 代码
默认 WordPress 后台分类和标签的编辑页面,分类和标签的描述是不支持 HTML 代码的,我们可以通过在当前主题的 functions.php 文件添加如下代码让分类和标签的描述支持 HTML 代码:
Denis
2023/04/15
3820
微信小程序从注册appid到熟悉静态微信特有标签
这时所有的代码以及pages里的文件我们都可以不要我们可以自己重新创建自己想要的文件项
淼学派对
2022/11/20
2.5K0
微信小程序从注册appid到熟悉静态微信特有标签
请描述django模板中标签的作用?_抽奖券模板
if标签相当于Python中的if语句,有elif和else相对应,但是所有的标签都需要用标签符号({%%})进行包裹。if标签中可以使用==、!=、<、<=、>、>=、in、not in、is、is not等判断运算符。示例代码如下:
全栈程序员站长
2022/09/19
7720
CSS从入门到喜欢,从喜欢到着魔
如果把网页比作一个人的话,html就是他的骨架,而css是他的皮肤,javascript是神经控制着行动。html,css,javascript都是构建网页的核心技术。
呆呆
2021/09/28
4980
CSS从入门到喜欢,从喜欢到着魔
如果把网页比作一个人的话,html就是他的骨架,而css是他的皮肤,javascript是神经控制着行动。html,css,javascript都是构建网页的核心技术。
呆呆
2021/11/25
4300
从DTFT到DFS,从DFS到DFT,从DFT到FFT,从一维到二维
因为要移植CSK得写快速傅里叶变换的算法,还是二维的,以前在pc平台上只需调用库就可以了,只是有点印象原信号和变换之后代表的是什么,但是对于离散傅里叶变换的来龙去脉忘得已经差不多了,最近要用到,于是重新来学习一遍,翻出了自己大三当时录的吴镇扬老师讲的数字信号处理的视频,DFT-FFT这里老师讲了有10讲之多,但每讲都不是很长,20分钟左右,这里记录一下学习的过程,前面的推导有点多,简书又打不了公式,mathtype的直接复制也不过来,截图又太麻烦,也为了自己再推导一遍,手写了前面一部分的内容。图片形式传上来。 简单说几句:DTFT有了之后为什么还要搞出来一个DFT呢,其根本原因就是因为DTFT的频域是连续的,无法用计算机进行处理。根据我们之前得到的的傅里叶变换的规律:
和蔼的zhxing
2018/09/04
1.9K0
从DTFT到DFS,从DFS到DFT,从DFT到FFT,从一维到二维
企业面试题: 一个页面从输入 URL 到页面加载显示完成,描述过程
(1)当发送一个URL请求时,不管这个URL是Web页面的URL还是Web页面上每个资源的URL,浏览器都会开启一个线程来处理这个请求,同时在远程DNS服务器上启动一个DNS查询。这能使浏览器获得请求对应的IP地址。
舒克
2019/08/09
6680
从数据仓库到百万标签库,产品经理如何用好大数据?
大数据深度挖掘、大数据精准营销、大数据科研等是目前比较热门的大数据应用关键词,随着大数据发展,利用大数据做营销的手段越来越丰富,但也越来越难了。
孔雀
2020/04/17
1.2K0
从数据仓库到百万标签库,产品经理如何用好大数据?
点击加载更多

相似问题

如何在描述块中输入描述?(打字本)

20

元标签描述

12

元描述标签

22

SEO META标签og:描述与描述

10

Android权限描述标签

10
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文