首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >Spacy自动添加单词到语音中?

Spacy自动添加单词到语音中?
EN

Stack Overflow用户
提问于 2022-02-26 14:03:48
回答 1查看 389关注 0票数 2

我加载了常规的spacy语言,并尝试了以下代码:

代码语言:javascript
运行
AI代码解释
复制
import spacy

nlp = spacy.load("en_core_web_md")

text = "xxasdfdsfsdzz is the first U.S. public company"

if 'xxasdfdsfsdzz' in nlp.vocab:
    print("in")
else:
    print("not")
    
if 'Apple' in nlp.vocab:
    print("in")
else:
    print("not")


# Process the text
doc = nlp(text)

if 'xxasdfdsfsdzz' in nlp.vocab:
    print("in")
else:
    print("not")
    
if 'Apple' in nlp.vocab:
    print("in")
else:
    print("not")

在调用分析后,似乎是空间加载的单词-- nlp(text),有人能解释输出吗?我怎么才能避免呢?为什么"Apple“不存在于词汇表中?为什么"xxasdfdsfsdzz“存在?

输出:

代码语言:javascript
运行
AI代码解释
复制
not
not
in
not
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2022-02-27 20:26:29

spaCy词汇表主要是与存储字符串的内存高效方法接口的内部实现细节。它肯定是,而不是--一个“真实单词”的列表,或者其他你可能会发现有用的东西。

默认情况下,词汇表存储的主要内容是内部使用的字符串,例如POS和依赖项标签。在具有向量的管道中,还包括向量中的单词。您可以阅读有关实现细节这里的更多信息。

nlp对象看到的所有单词都需要存储它们的字符串,因此将出现在词汇表中。这就是你在上面的例子中所看到的无稽之谈。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71280615

复制
相关文章

相似问题

领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文