Loading [MathJax]/jax/output/CommonHTML/config.js

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >从“打字描述”到“标签”

问从“打字描述”到“标签”
EN

Stack Overflow用户

提问于 2014-08-12 12:27:38

回答 1查看 111关注 0票数 0

背景

我确实有一个图像数据集(类似于http://www.image-net.org/)，该数据集为每个图像提供了一个“带有打字的描述”。我想对这个家伙运行一些深卷积神经网络，但我需要首先生成“标签”。所以，问题是：

问题

如何从“带有排字的描述”生成类别的“标签”？

技术信息

数据集有大约13M幅图像，并有相应的(有效的)“描述”和可选的“输入”。“描述”的一些例子如下：

想法

我正在考虑用以下的方法来处理这个问题。

修正排版：
- 运行拼写检查以识别拼写错误；
- 通过找到可以修复它的更好的词
  - 查看数据集中的其他描述，或
  - 检查图像并手动纠正错误；

生成最终标签：
- 在句子嵌入(将句子映射到ℝᴺ中的函数)上运行聚类算法(例如k均值)
- 使用最经常出现的词。

text-processing

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-08-12 18:46:05

这里有一些想法：

你应该清楚地进行拼写检查，否则你的标签会更吵。选项：

- Check a Information retrieval course and implement the checking, google lecture3-tolerant-retrieval-handout-6-per.pdf (I bet this is not the way to go) In case you want frequencies, google "Natural Language Corpus Data"
- Use some code [http://norvig.com/spell-correct.html](http://norvig.com/spell-correct.html) (in many languages)

关于标签(我猜你是想要自动的，否则会有半自动的方法)：

- Use [http://viget.com/extend/tagging-text-automatically](http://viget.com/extend/tagging-text-automatically) I have never used them but it should work reasonable well
- I would not recommend using k means because you do know the number of groups
- Use the most recurrent word might work for few examples (like the ones you show there) but it might not work for many cases.

我希望这是有用的

票数 1

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/25273507

复制

相关文章

从图像到语言:图像标题生成与描述

模型测试 NLP技术机器学习神经网络深度学习

对图像中的视觉内容进行归纳和总结,并使用合适的词汇与合理的语法结构将其重新组织并表达出来,是图像标题生成与描述的主要研究内容。如图 1 所示,首先对图像中的视觉内容进行解析,将其转换成视觉语义编码,然后根据编码内容进行解码,将其映射到语言空间中,生成相关词汇,并组合成用词准确、结构合理的自然语言。本节围绕该基本框架,从视觉特征提取、视觉语义选择和模型设计与优化等方面,介绍当前流行的方法和模型架。

苏州程序大白

2021/08/13

1.8K0

从图像到语言:图像标题生成与描述

去除WordPress分类描述P标签

　　我们知道栏目页调用栏目描述直接用<?php echo category_description(); ?>就ok了，但是使用上面的代码调用Wordpress分类描述，会自动出现P标签，如<p>这里

ytkah

2019/08/07

8210

Spring从入门到精通(七)—Bean标签详解

spring 网络安全容器编程算法网站

用于配置对象交由Spring 来创建。默认情况下它调用的是类中的无参构造函数，如果没有无参构造函数则不能创建成功。

共饮一杯无

2022/11/28

2640

vim 从嫌弃到依赖(11)——标签页操作

ide 编程算法

各位小伙伴们，你们好，我又更新了！之前介绍了vim关于多窗口的操作，vim中多窗口是将多个窗口在一个屏幕中显示，这似乎与我们常见的ide有点不一样，一般的ide都是新开一个窗口之后在新的标签页中显示，通过不同的标签页对应不同的文件。我们的浏览器就是一个典型的例子。

Masimaro

2022/05/12

6450

vim 从嫌弃到依赖(11)——标签页操作

从视频到语言: 视频标题生成与描述研究综述

图像处理深度学习

来源：专知本文约5000字，建议阅读9分钟最新视频视频标题生成与描述研究综述论文。视频标题生成与描述是使用自然语言对视频进行总结与重新表达. 由于视频与语言之间存在异构特性, 其数据处理过程较为复杂. 本文主要对基于“编码−解码” 架构的模型做了详细阐述, 以视频特征编码与使用方式为依据, 将其分为基于视觉特征均值/最大值的方法、基于视频序列记忆建模的方法、基于三维卷积特征的方法及混合方法, 并对各类模型进行了归纳与总结. 最后, 对当前存在的问题及可能趋势进行了总结与展望, 指出需要生成融合情感、逻辑

数据派THU

2022/03/04

5230

什么是description，如何优化描述标签？

网站优化中常说的description实际上是描述标签，它是HTML代码中Head部分除标题标签外与SEO有关的另一个标签，用于说明页面的主体内容。

茹莱神兽

2022/09/14

5360

什么是description，如何优化描述标签？

【MATLAB 从零到进阶】day11 描述性统计

均值mean 方差var和标准差std 最值max/min 极差range 中位数median 分位数quantile/prctile 众数mode 变异系数std/mean k阶原点矩 mean(score.^2) k阶中心距moment(score,k) 偏度skewness 峰度kurtosis

统计学家

2019/04/10

1.6K0

【MATLAB 从零到进阶】day11 描述性统计

WordPress添加关键词和描述标签

php wordpress 小程序迁移标签

关键词和描述标签作为SEO的基础配置，在wordpress中没有默认添加，这里记录一下在Wordpress中自动添加关键词和描述标签的方法。

ianzhi

2023/10/19

6630

xmake从入门到精通4：常用C/C++项目描述设置详解

打包 ide c++编程算法

xmake是一个基于Lua的轻量级现代化c/c++的项目构建工具，主要特点是：语法简单易上手，提供更加可读的项目维护，实现跨平台行为一致的构建体验。

ruki

2019/11/18

1.4K2

打字课堂 for Mac(学习打字软件)

想要在苹果电脑上来学习打字？为什么不用打字课堂 Mac版呢？是可以为你带来基础的入门打字的知识供你来学习，打字课堂 Mac版还带有了超多的打字游戏给你来体验哦，当然你在这款学习打字软件中也是能查看到自己的打字速度以及正确率等数据.

用户10121095

2023/04/17

8800

让wordpress分类和标签的描述支持HTML代码

默认 WordPress 后台分类和标签的编辑页面，分类和标签的描述是不支持 HTML 代码的，我们可以通过在当前主题的 functions.php 文件添加如下代码让分类和标签的描述支持 HTML 代码：

ytkah

2022/03/14

4470

WordPress 技巧：让分类和标签的描述支持 HTML 代码

php html wordpress 后台技巧

默认 WordPress 后台分类和标签的编辑页面，分类和标签的描述是不支持 HTML 代码的，我们可以通过在当前主题的 functions.php 文件添加如下代码让分类和标签的描述支持 HTML 代码：

Denis

2023/04/15

3820

微信小程序从注册appid到熟悉静态微信特有标签

小程序微信 json javascript

这时所有的代码以及pages里的文件我们都可以不要我们可以自己重新创建自己想要的文件项

淼学派对

2022/11/20

2.5K0

微信小程序从注册appid到熟悉静态微信特有标签

请描述django模板中标签的作用?_抽奖券模板

编程算法 php java https 网络安全

if标签相当于Python中的if语句，有elif和else相对应，但是所有的标签都需要用标签符号（{%%}）进行包裹。if标签中可以使用==、!=、<、<=、>、>=、in、not in、is、is not等判断运算符。示例代码如下：

全栈程序员站长

2022/09/19

7720

CSS从入门到喜欢，从喜欢到着魔

css html javascript java

如果把网页比作一个人的话，html就是他的骨架，而css是他的皮肤，javascript是神经控制着行动。html，css，javascript都是构建网页的核心技术。

呆呆

2021/09/28

4980

CSS从入门到喜欢，从喜欢到着魔

css html javascript java

如果把网页比作一个人的话，html就是他的骨架，而css是他的皮肤，javascript是神经控制着行动。html，css，javascript都是构建网页的核心技术。

呆呆

2021/11/25

4300

从DTFT到DFS，从DFS到DFT，从DFT到FFT，从一维到二维

因为要移植CSK得写快速傅里叶变换的算法，还是二维的，以前在pc平台上只需调用库就可以了，只是有点印象原信号和变换之后代表的是什么，但是对于离散傅里叶变换的来龙去脉忘得已经差不多了，最近要用到，于是重新来学习一遍，翻出了自己大三当时录的吴镇扬老师讲的数字信号处理的视频，DFT-FFT这里老师讲了有10讲之多，但每讲都不是很长，20分钟左右，这里记录一下学习的过程，前面的推导有点多，简书又打不了公式，mathtype的直接复制也不过来，截图又太麻烦，也为了自己再推导一遍，手写了前面一部分的内容。图片形式传上来。简单说几句：DTFT有了之后为什么还要搞出来一个DFT呢，其根本原因就是因为DTFT的频域是连续的，无法用计算机进行处理。根据我们之前得到的的傅里叶变换的规律：

和蔼的zhxing

2018/09/04

1.9K0

从DTFT到DFS，从DFS到DFT，从DFT到FFT，从一维到二维

企业面试题: 一个页面从输入 URL 到页面加载显示完成，描述过程

php tcp/ip http dns css

（1）当发送一个URL请求时，不管这个URL是Web页面的URL还是Web页面上每个资源的URL，浏览器都会开启一个线程来处理这个请求，同时在远程DNS服务器上启动一个DNS查询。这能使浏览器获得请求对应的IP地址。

舒克

2019/08/09

6680

从数据仓库到百万标签库,产品经理如何用好大数据？

大数据数据库 sql 爬虫企业

大数据深度挖掘、大数据精准营销、大数据科研等是目前比较热门的大数据应用关键词，随着大数据发展，利用大数据做营销的手段越来越丰富，但也越来越难了。

孔雀

2020/04/17

1.2K0

从数据仓库到百万标签库,产品经理如何用好大数据？

点击加载更多

相似问题

如何在描述块中输入描述？(打字本)

20

元标签描述

12

元描述标签

22

SEO META标签og:描述与描述

10

Android权限描述标签

10

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

社区富文本编辑器全新改版！诚邀体验～

全新交互，全新视觉，新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能，全面提升创作效率和体验