文章/答案/技术大牛

发布

社区首页 >问答首页 >Spacy自动添加单词到语音中？

问Spacy自动添加单词到语音中？
EN

Stack Overflow用户

提问于 2022-02-26 14:03:48

回答 1查看 389关注 0票数 2

我加载了常规的spacy语言，并尝试了以下代码：

import spacy

nlp = spacy.load("en_core_web_md")

text = "xxasdfdsfsdzz is the first U.S. public company"

if 'xxasdfdsfsdzz' in nlp.vocab:
    print("in")
else:
    print("not")
    
if 'Apple' in nlp.vocab:
    print("in")
else:
    print("not")


# Process the text
doc = nlp(text)

if 'xxasdfdsfsdzz' in nlp.vocab:
    print("in")
else:
    print("not")
    
if 'Apple' in nlp.vocab:
    print("in")
else:
    print("not")

在调用分析后，似乎是空间加载的单词-- nlp(text)，有人能解释输出吗？我怎么才能避免呢？为什么"Apple“不存在于词汇表中？为什么"xxasdfdsfsdzz“存在？

输出：

not
not
in
not

nlp

spacy

python

python-3.x

回答 1

Stack Overflow用户

回答已采纳

发布于 2022-02-27 20:26:29

spaCy词汇表主要是与存储字符串的内存高效方法接口的内部实现细节。它肯定是，而不是--一个“真实单词”的列表，或者其他你可能会发现有用的东西。

默认情况下，词汇表存储的主要内容是内部使用的字符串，例如POS和依赖项标签。在具有向量的管道中，还包括向量中的单词。您可以阅读有关实现细节这里的更多信息。

nlp对象看到的所有单词都需要存储它们的字符串，因此将出现在词汇表中。这就是你在上面的例子中所看到的无稽之谈。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/71280615

复制

相似问题

社区富文本编辑器全新改版！诚邀体验～

全新交互，全新视觉，新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能，全面提升创作效率和体验

问Spacy自动添加单词到语音中？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Spacy自动添加单词到语音中？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Spacy自动添加单词到语音中？
EN