Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >斯坦福POS标签不标注中文文本

斯坦福POS标签不标注中文文本
EN

Stack Overflow用户
提问于 2013-04-17 20:00:16
回答 1查看 909关注 0票数 5

我第一次使用Stanford标签(这是第一次),虽然它正确地标记了英语,但即使在更改模型参数时,它似乎也不识别(简体)中文。我忽略了什么吗?

我已经从这里下载并解压了最新的完整版本:http://nlp.stanford.edu/software/tagger.shtml

然后,我将示例文本输入到“sam-input.txt”中。

这是一个测试的句子。这是另一个句子。

然后我就跑

/斯坦福-postagger.sh模型/中文-dissim.tagger样本-input.txt

预期的输出是将每个单词标记为词性的一部分,但它将整个文本字符串识别为一个单词:

从标签模型/中文-dissim.tagger加载默认属性 从模型/中文阅读POS标签模型.完成3.5秒。 這是一個測試的句子。這是另一個句子。#NR 标记1字,每秒30.30字。

我很感谢你的帮助。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-04-18 13:14:31

我终于意识到这个pos标签中没有包含标记化/分段。在将这些单词输入标签之前,似乎必须对其进行空格分隔。对于那些对中文最大熵分词感兴趣的人,这里有一个单独的软件包:

http://nlp.stanford.edu/software/segmenter.shtml

谢谢大家。

票数 6
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/16074238

复制
相关文章
解决BRAT无法标注中文标签
你的配置文件,也就是**anntation.conf**,一定要是**UTF-8**编码的。
用户7483561
2020/06/29
1.1K0
构想:中文文本标注工具
项目地址 | https://github.com/crownpku/Chinese-Annotator 自然语言处理的大部分任务是监督学习问题。序列标注问题如中文分词、命名实体识别,分类问题如关系识
小莹莹
2018/04/24
1.9K0
构想:中文文本标注工具
高德地图-设置点标注的文本标签「建议收藏」
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/143196.html原文链接:https://javaforall.cn
全栈程序员站长
2022/08/31
2.2K0
高德地图-设置点标注的文本标签「建议收藏」
显示隐藏高德地图点标注的文本标签「建议收藏」
如下代码是百度地图通用的方法,显示隐藏文本标签,但是用在高德地图上不起作用,网上百度无果
全栈程序员站长
2022/08/27
2.7K0
显示隐藏高德地图点标注的文本标签「建议收藏」
图像标注版本4-多标注框+标注标签+高亮和删除标签
4.0版本在3.0版本基础上增加了双击某个位置时,如果这个位置在标注框内,则对选中的标注框进行标识出来,同时提示是否要删除当前选中的标注框,进行删除处理。
python与大数据分析
2023/09/03
2800
图像标注版本4-多标注框+标注标签+高亮和删除标签
文本标注工具介绍
自然语言处理技术(NLP)在多个领域有着广泛运用,比如情感分析、文本相似度、评论观点抽取、文本分类、词法分析等等,算法模型训练离不开大量标注好的文本,动辄几万条、几十万条,有的公司是算法人员自己用excel标注,效率非常低。最近找到了在线标注的文本标注工具,给大家介绍一下,工具注册链接 biao.jd.com/bz
小瓦匠
2019/06/17
2.8K0
文本标注工具介绍
图像标注版本3-多标注框+标注标签
这个图像标注版本在前面多标注框基础上,增加了标注标签的选择,同时修正了一下之前绘制最后一个标注框的显示问题,现在看起来更像一个标注软件了。
python与大数据分析
2023/09/03
2670
图像标注版本3-多标注框+标注标签
资源 | 斯坦福大学发布Stanford.NLP.NET:集合多个NLP工具
选自斯坦福 机器之心编译 参与:李泽南、Smith 近日,斯坦福大学发布了 Stanford.NLP for .Net,为自然语言处理领域的开发者们提供帮助。顾名思义,它是 Stanford NLP 为.NET 准备的版本。 链接:https://sergey-tihon.github.io/Stanford.NLP.NET/ 该项目包含使用使用 IKVM.NET 将 Stanford NLP.jar 软件包重新编译到.NET 中的构建脚本,这些软件经过测试可以有效工作,该工具包的介绍网站是:https:/
机器之心
2018/05/09
1.5K0
图像标注版本5终版-多标注框+标注标签+高亮和删除标签+打开图片文件+保存标注格式
随着功能越来越多,代码也越来越多,为了让这个标注原型工具有始有终,给他加了两个按钮,打开图片文件,保存标注文件,代码也到了解耦的时候了,这次一共涉及到三个python文件,其实还可以将UI和逻辑做进一步解耦,另外最后也懒了,关于保存标注文件的代码并未真正完成,一来最近事情多了起来,一来不值得为一个原型投入太多精力,后面完整版的也不会发出来。
python与大数据分析
2023/09/03
4240
图像标注版本5终版-多标注框+标注标签+高亮和删除标签+打开图片文件+保存标注格式
文本标注工具brat简介
建议下载brat的release版本,地址:https://github.com/nlplab/brat/releases/tag/v1.3p1
程序员一一涤生
2019/09/05
3.3K0
文本标注工具brat简介
通用文本标注工具 labelme
理查德
2017/11/09
11.4K4
通用文本标注工具 labelme
斯坦福的Stanford.NLP.NET:集合多个NLP工具
-欢迎 该项目包含使用使用 IKVM.NET 将 Stanford NLP.jar 软件包重新编译到.NET 中的构建脚本,这些软件经过测试可以有效工作,该工具包的介绍网站是:https://serg
企鹅号小编
2018/01/26
1.7K0
怎样构建中文文本标注工具?(附工具、代码、论文等资源)
来源:Paperweekly 本文长度为2218字,建议阅读4分钟 本文为你介绍中文文本标注工具的构建方法,并提供多个开源文本标注工具。 项目地址: https://github.com/crownpku/Chinese-Annotator 自然语言处理的大部分任务是监督学习问题。序列标注问题如中文分词、命名实体识别,分类问题如关系识别、情感分析、意图分析等,均需要标注数据进行模型训练。在深度学习大行其道的今天,基于深度学习的 NLP 模型更是数据饥渴。 最前沿的 NLP 技术往往首先针对英文语料
数据派THU
2018/01/30
4K0
怎样构建中文文本标注工具?(附工具、代码、论文等资源)
初学者|一起来看看词性标注
本文根据自己的学习过程以及查阅相关资料的理解,对自然语言基础技术之词性标注进行了相对全面的简绍,包括定义、目前的难点以及常见方法,还推荐了一大波python实战利器,并且包括工具的用法。
zenRRan
2019/11/19
1.8K1
Flutter文本标签TextTagWidget,搜索记录流式布局显示文本标签
题记 —— 执剑天涯,从你的点滴积累开始,所及之处,必精益求精,即是折腾每一天。 重要消息 网易云【玩转大前端】配套课程 EDU配套 教程 Flutter开发的点滴积累系列文章 *** 1 添加依赖 flutter_tag_layout: ^0.0.3 github源码在这里 pub.flutter-io.cn最新版在这里 2 导包 在使用到文本标签的地方 import 'package:flutter_tag_layout/flutter_tag_layout.dart'; 3 标签创建文本 c
早起的年轻人
2020/06/26
1.1K0
基于 Pytorch 的鞋子标签自动标注[译]
涉及的问题是对文本生成描述文本(generating text to describe images).
AIHGF
2019/02/18
1.2K0
初学者|一起来看看词性标注
本文根据自己的学习过程以及查阅相关资料的理解,对自然语言基础技术之词性标注进行了相对全面的简绍,包括定义、目前的难点以及常见方法,还推荐了一大波python实战利器,并且包括工具的用法。
yuquanle
2019/05/29
1K0
HTML的body标签-文本标签学习
<html> <head> <title>HTML的body标签-文本标签学习</title> <meta charset="utf-8"/> </head> <body> <!--标题标签--> <h1 align="center">今天北京天气真好,适合学习</h1> <h2>今天上海天气真好,适合学习</h2> <h3>今天成都天气真好,适合学习</h3> <h4>今天遂宁天气真好,适合学习</h4> <h5>今天郫县天气真好,适合学习</h5> <h6>今天
葆宁
2019/04/18
2.2K0
标签之美二——文本标签 原
定义字体大小:size  例如<font size="4"></font>设置其中文字字号为4。
珲少
2018/08/15
5560
标签之美二——文本标签
                                                                            原
Matplotlib 中文用户指南 4.5 标注
使用text()会将文本放置在轴域的任意位置。 文本的一个常见用例是标注绘图的某些特征,而annotate()方法提供辅助函数,使标注变得容易。 在标注中,有两个要考虑的点:由参数xy表示的标注位置和xytext的文本位置。 这两个参数都是(x, y)元组。
ApacheCN_飞龙
2022/12/01
1.2K0
Matplotlib 中文用户指南 4.5 标注

相似问题

带有斯坦福POS标签的POS直方图

11

斯坦福POS标签返回多个标签

11

斯坦福POS标签OutOfMemoryError阅读标签

16

斯坦福NLP pos标签PRN

11

处理NLTK斯坦福POS标签输出

13
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档