腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
神经标记器是如何工作的?
、
我一直在尝试构建一个NN标记器,其中输入将是字符和输出,令牌。我发现做类似事情的源代码要么是旧的,要么不是简单易学的。你能描述这种模型的输入和输出的形状和意义吗?如果输出是一个热的,那么它是不是太重了,因为令牌的总数大约是100到100万(可能的英语单词数)? 您是否推荐使用keras/tensorflow (希望2.0)训练令牌器的教程或示例?
浏览 0
提问于2020-10-15
得票数 -1
1
回答
斯坦福汉语
分词
器在
Python
中如何不用标点符号返回结果
、
、
、
我试图
用
Python
中的斯坦福
分词
来分割一个中文句子,但是目前的结果中有标点符号。我想返回没有标点符号的结果,只返回单词。做这件事的最好方法是什么?我试着在谷歌上搜索答案,但什么也没找到。
浏览 1
提问于2015-03-06
得票数 2
回答已采纳
1
回答
关键词间余弦相似度
、
、
、
、
我刚开始记录
python
中的相似之处,我对如何处理一些数据感到困惑。基本上,我想得到包含关键字的
分词
之间的余弦相似性。{'keyword': tfidf_score} 我所要做的就是得到这两个
分词
之间的余弦相似性,
用
tfidf分数加权。从网上看,当涉及到文档相似性时,我被所有不同的
python
库/模块淹没了。
浏览 1
提问于2018-12-13
得票数 1
回答已采纳
2
回答
在bash手册中,“扩展是在命令行被拆分成单词之后执行的”,这是什么意思?
我正在读,它说它有7种类型的扩展/替代,包括“
分词
”。另一方面,它在该项目的开头说: 请让我知道什么是“扩展执行后,命令行已被分割成文字”。意思是。word1 = commandword3 = var2$1 = "word" $2 = "splitti
浏览 4
提问于2016-08-25
得票数 2
回答已采纳
4
回答
用
Regex
分词
、
、
我正试着得到这样的结果:“夏天在这里”。为什么下面的代码会生成额外的空格?(目前的结果:‘-夏天-是-这里’) var newA = str.split(/([A-Z][a-z]*)/).join("-");}
浏览 7
提问于2015-07-07
得票数 0
回答已采纳
1
回答
在rails 3.1中如何流式传输大文件(如CSV/XML)?
、
、
、
我试着
用
分词
,不用
分词
,
用
html.erb视图而不是csv.erb,什么都不起作用。 如何在rails 3.1中流式传输大文件?
浏览 2
提问于2011-09-26
得票数 1
回答已采纳
1
回答
ntlk:如何获得词的变化
、
、
我有一个单词列表,将近5000个英语单词,每个单词我都需要这些屈折的形式:动词:不定式,现在简单,现在简单第三人称,过去简单,现在
分词
(形式),过去
分词
副词如何通过
python
从ntlk中的给定单词(例如帮助)中提取这些信息?
浏览 1
提问于2016-05-05
得票数 2
回答已采纳
1
回答
使用GCE自动标度和负载均衡器的永久实例
、
、
谷歌云自动
分词
器中是否有任何选项可以将某些实例标记为永久实例,而这些实例不应该被自动
分词
器销毁? 在我的
用
例中,我需要一直运行一些实例(这也为关键数据提供服务),并且只需要在流量增加/减少时进行缩放。
浏览 0
提问于2018-04-10
得票数 0
1
回答
使用NLTK为中文运行StanfordPOSTagger时的意外格式
、
、
、
、
我安装了
Python
3.6.0,NLTK3.2.4,并下载了Stanford标签3.8.0。#!/usr/bin/env
python
3 print(st.tag('这 是 斯坦福 中文
分词
器 测试'.split()))[('
浏览 6
提问于2017-08-07
得票数 2
回答已采纳
1
回答
python
中的逐个
分词
(
分词
术语a term en
python
)
hello all,需要定义一个函数,该函数可以按术语矩阵或在最坏的情况下,在列表数组之间划分,以便在第三个矩阵中得到结果,
浏览 2
提问于2009-11-23
得票数 3
回答已采纳
1
回答
将IFS设置为非空白字符的Bash中的分字
、
、
、
、
这个名为"args“的脚本有助于演示
分词
示例:printf "%d args:" $#echo$ .但是,当我
用
非空白字符(比如: )替换IFS时,如果我直接将字符串作为参数传递,脚本就不会执行
分词
操作。1 args: <one:two:three> 但是,如果我(1)将字符串
浏览 1
提问于2017-04-01
得票数 8
回答已采纳
5
回答
如何避免重复加载大文件?
、
、
、
、
我正在尝试从
python
中调用一个Java程序(斯坦福中文
分词
程序)。Java程序需要加载一个大的(100M)字典文件(帮助
分词
的单词列表),这需要12+秒。我想知道是否有可能加快加载过程,更重要的是,当我需要多次调用
python
脚本时,如何避免重复加载它?
浏览 4
提问于2012-01-28
得票数 4
回答已采纳
1
回答
在变量中使用sed命令
、
、
如果我
用
当前内容替换变量,它就能工作。 我做错什么了?
浏览 2
提问于2022-06-28
得票数 -2
2
回答
Groff格式
、
、
以及如何禁止
用
破折号
分词
?请帮帮我。
浏览 2
提问于2012-06-09
得票数 0
回答已采纳
3
回答
Lucene :
用
部
分词
搜索
、
、
我正在努力将Lucene集成到我们的应用程序中。Lucene目前正在工作,例如,当我搜索"Upload“时,文档中有一些名为"Upload”的文本,然后它就工作了,但是当我搜索"Uplo“时,它就不起作用了。有什么想法吗? Directory directory = FSDirectory.open(path); IndexSearcher indexSearcher = new
浏览 8
提问于2017-05-03
得票数 3
回答已采纳
1
回答
Shell脚本:命令输出保存到varible后变成一行
、
我想多次处理命令的输出(用于不同的目的)。例如:$ echo $l total 1408 -rwxrwxr-x. 1 xiaohan xiaohan 229 Oct 7 22:50 run.sh -rwxrwxr-x. 1 xiaohan xiaohan 229 Oct 7 22:56 test.sh -rwxrwxr-x. 1 xiaohan xiaohan 1326459 Oct 2 17:29 TMalign -rw-r--r--. 1 xiaohan xiaohan 104175 Oct 2 1
浏览 4
提问于2013-10-07
得票数 1
回答已采纳
1
回答
用
教义搜索部
分词
、
、
、
我正在尝试使用codeigniter和规则来执行全文搜索。我的问题是Doctrine只对整个单词执行搜索。
浏览 0
提问于2011-08-05
得票数 0
2
回答
Python
中的
分词
、
、
我正在尝试在
python
中使用re.split。我想删除所有像" , ; < > { } [ ] / \ ? ! .I这样的角色 re.split("[, \_!?
浏览 4
提问于2015-11-28
得票数 0
回答已采纳
2
回答
正确允许bash中命令替换的
分词
、
这是,出于一个很好的理由,在引用的参数扩展和
分词
的神秘世界中存在许多陷阱、bug和新手陷阱。出于这个原因,建议是“双引号”,但如果我希望
分词
发生呢?在 中,我找不到命令替换后安全、恰当地使用
分词
的例子。docker stats "$(docker ps | awk '{print $NF}' | grep -v NAMES)" 将有一个字符串的换行符分隔的容器名称传递给docker stats这似乎是一个完美的例子,当我想要<em
浏览 2
提问于2016-06-20
得票数 5
回答已采纳
1
回答
Sass监视多个文件和文件夹
、
我有以下文件树 - bg - style.css我需要一个所有应用程序颜色的文件。所以,我做了colores.scss。
浏览 2
提问于2016-08-17
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python R 分词处理
Python实现jieba分词
python结巴分词学习
“结巴”中文分词:做最好的 Python 中文分词组件
死磕Python(5):结巴分词
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券