NER概率的spaCy 3波束解析_spacy v3中的训练NER需要在命令行中使用dev.spacy_使用Spacy库的NER在简历解析器上没有给出正确的结果 - 腾讯云开发者社区

、

我有一堆用户查询。其中也有一些包含垃圾字符的查询，例如。I work in Google asdasb asnlkasn我只需要I work in Google import nltk import spacy import truecase words = set(nltk.corpus.words.words()) nlp = spacy.load('en_core_web_lg') def check_ner(word): doc = nlp(word) ner_list = [] for token in doc.ents: n

浏览 0提问于2019-12-12得票数 1

1回答

NER概率的spaCy 3波束解析

、

我正在尝试检索我的spaCy模型在将正确的标签分配给实体时的概率。我使用的是spaCy版本3.0.5。 threshold = 0.5 for i in testing_raw: doc = nlp_updated(i) beams = nlp_updated.beam_parse([ doc ], beam_width = 16, beam_density = 0.0001) entity_scores = defaultdict(float) for beam in beams: for score, ents in n

浏览 11提问于2021-05-06得票数 1

回答已采纳

1回答

在使用spacy的NER模型进行评估时，为什么'las'，'uas‘和'tags_acc’等于0？

、、

import spacy from spacy.gold import GoldParse from spacy.scorer import Scorer from spacy.attrs import ENT_IOB, ENT_TYPE from spacy.tokens import Span nlp = spacy.load('en_core_web_sm') def evaluate(ner_model, examples): scorer = Scorer() fo

浏览 0提问于2018-12-09得票数 2

1回答

使用Spacy NER训练多词动词和名词实体

我遇到的所有NER训练实例都是名词，但是否可以使用Spacy NER训练动词和名词组合的实体。例如“搅拌锅”。我是先使用基于名词的NER，然后在此类短语上训练嵌套NER，还是直接在Spacy NER中训练该短语。我猜答案将取决于Spacy NER是否将POS和依赖功能作为其培训的一部分。

浏览 5提问于2018-10-29得票数 0

1回答

基于现有模型的spaCy v3训练器或在现有模型中添加自定义训练器

、、、

在spaCy < 3.0中，我能够在经过训练的en_core_web_sm模型中训练NER组件 python -m spacy train en model training validation --base-model en_core_web_sm --pipeline "ner" -R -n 10 具体来说，我需要标记器和en_core_web_sm模型的解析器。spaCy的新版本不再使用这些命令，它们需要在配置文件中设置。根据spaCy的网站，这些组件可以与相应的源代码一起添加，然后在配置文件的培训部分插入到frozen_component (我将在这个问题的末尾

浏览 0提问于2021-02-07得票数 5

1回答

在Spacy中如何训练不同波束目标参数的NER模型？

、

我试图用en_core_web_md以外的几轮光束目标来更新经过预先训练的spacy模型beam_width = 1，而且我似乎找不到正确的方法将不同的参数传递到**cfg中，以便该模型使用它们进行训练(在点)。这是我的最新尝试： pipe_exceptions = ["ner", "trf_wordpiecer", "trf_tok2vec"] other_pipes = [pipe for pipe in nlp.pipe_names if pipe not in pipe_exceptions] # only train NER with

浏览 0提问于2020-08-11得票数 2

2回答

spaCy nlp流水线操作顺序

、、、

是否有人按时间顺序列出了由 import spacy nlp = spacy.load('en_core_web_sm') doc = nlp(text) 我可以看到nlp.pipe_names的主要组件 ['tagger', 'parser', 'ner'] 和一个按字母顺序排列的nlp.factories工厂操作列表 {'merge_entities': <function spacy.language.Language.<lambda>>, 'merge_noun_chunk

浏览 1提问于2018-09-28得票数 2

回答已采纳

1回答

在Spacy培训两个连续的NER管道

、、、

我正在进行一个训练分类器以识别文本中引文的项目。我们所处理的引文往往是非常混乱的。以下是一些引用的例子：见A册第3章第7段见A书第3章第7段见A书第7段的“某些章节标题”一章我们已经确定了少数实体往往出现在这些引文中。例如，“书名”、“章号”、“章名”、“段号”。该项目分为两个阶段：文本引文的二元分类引文中引文实体的分类 Spacy (我们正在使用v3)是否有可能有两个连续的NER管道？我希望分类器首先标记引文，然后标记每个引文中的实体。我能够用下面的代码用两个NER管道实例化一个模型： from spacy.lang.en import E

浏览 3提问于2021-04-25得票数 1

回答已采纳

1回答

蟒蛇空间的多线程训练

、、、

我试图找到一种方法来使用多线程在spacy上训练一个新的模型。它看起来像在我的工作计算机(Ubuntu16.04Python3.5)上默认使用多线程，而不是在我的服务器上使用。知道为什么吗？关于服务器上的spaCy & env的信息 Platform Linux-3.14.32-xxxx-grs-ipv6-64-x86_64-with-Debian-8 Python version 3.4.2 Location /home/nlp/.env/lib/python3.4/site-packages/spacy Mod

浏览 0提问于2018-01-30得票数 2

回答已采纳

1回答

为什么Spacy 3 NER在GPU和CPU上使用不同的管道？

、、

Spacy 'train‘命令使用命令行选项--gpu 0，允许在使用GPU和不使用GPU之间进行“最后一分钟”的选择--只使用CPU。但是，使用在GPU和CPU之间进行选择会导致(基本)配置上的重大差异。在我的例子中(与NER打交道)，我得到了两个不同的管道： for CPU：= "tok2vec"，"ner"for GPU:管线= "ner" (下面的组件设置非常不同)。由于我的GPU只有6GB的内存，所以我很快就耗尽了GPU内存--不能使用它。但是，当我切换到只使用CPU时，这两个管道之间的培训行为就大不相同了： "to

浏览 3提问于2021-05-03得票数 1

1回答

Spacy BILOU格式到spacy json格式

、、

我正在尝试升级我的spacy版本到夜间，特别是为了使用spacy transformers 因此我将spacy简单训练数据集转换为如下格式 td = [["Who is Shaka Khan?", {"entities": [(7, 17, "FRIENDS")]}],["I like London.", {"entities": [(7, 13, "LOC")]}],] 以上至 [[{"head": 0, "dep": "", "tag&#

浏览 26提问于2020-11-04得票数 1

回答已采纳

2回答

使用spaCy 3自定义NERs训练抛出ValueError

、、、、

我正在尝试使用spacy 3添加自定义NER标签。我为旧版本找到了教程，并对spacy 3进行了调整。下面是我使用的全部代码： import random import spacy from spacy.training import Example LABEL = 'ANIMAL' TRAIN_DATA = [ ("Horses are too tall and they pretend to care about your feelings", {'entities': [(0, 6, LABEL)]}), ("Do

浏览 1提问于2021-02-22得票数 1

回答已采纳

2回答

禁用部分nlp管道

、、

我在装有python3的windows系统上运行spaCy v2.x。我没有管理员权限，因此我必须将管道调用为： nlp = en_core_web_sm.load() 当我在*nix机器上运行相同的脚本时，我可以像这样加载管道： nlp = spacy.load('en', disable = ['ner', 'tagger', 'parser', 'textcat']) 我所做的就是标记化，所以我不需要整个管道。在windows机器上，如果我像这样加载管道： nlp = en_core_web_sm.load

浏览 55提问于2018-12-20得票数 10

回答已采纳

2回答

获取Spacy错误:没有名为“Spacy.Pipeline.Pipes”的模块；“spacy.pipeline”不是包

、、

我正在尝试测试一个在另一台机器上工作的模型，但是当我尝试将它导入到我的笔记本中时，我得到了这个错误: ModuleNotFoundError:没有名为‘Spacy.Pipeline.Pipes’的模块；'spacy.pipeline‘不是一个包我们已经安装了: Spacy 2.0.18 (冷冻版本，不可更新) 我正在导入： import spacy import thinc import unidecode import nltk from spacy.vocab import Vocab from spacy.language import Language from spa

浏览 106提问于2019-11-07得票数 2

回答已采纳

3回答

找不到函数“spacy-Transers.TransformerModel.v3”在函数注册表‘体系结构’中

、、、

我试图创建一个自定义的NER模型。我使用spacy库来创建模型。这一行代码是从base.config文件创建配置文件。我的代码是: !python -m spacy init fill-config /content/drive/MyDrive/NER_RE_New/NER/base_config.cfg /content/drive/MyDrive/NER_RE_New/NER/config.cfg 错误： catalogue.RegistryError: [E893] Could not find function 'spacy-transformers.Transfo

浏览 10提问于2021-10-24得票数 1

回答已采纳

2回答

如何求出spaCy的NER概率

、

我想把spaCy的NER引擎和一个单独的NER引擎(一个BoW模型)结合起来。我目前正在比较两个引擎的输出，试图找出两者的最佳组合。这两种方法执行得都很得体，但spaCy经常会找到BoW引擎遗漏的实体，反之亦然。我想要的是，每当spaCy找到一个没有被BoW引擎找到的实体时，它就会从它那里访问一个概率分数(或类似的东西)。我能让spaCy为它找到的特定实体打印自己的概率分数吗？比如，“嗨，我是spaCy。我找到了这个标记(或令牌的组合)，X%肯定是一个BLAH类型的实体。”每次spaCy找到一个实体时，我都想知道X这个数字。我想在spaCy的NER引擎内部一定有这样一个数字，加上一个阈值，可能

浏览 5提问于2017-10-25得票数 20

回答已采纳

1回答

SpaCy 3- ValueError：[E973]对于NER数据的意外类型

、

我在这个问题上压力太久了，似乎找不到解决办法。我想训练一个新的模型来识别动物和物种的名字。我创建了一个模拟训练集来测试它。然而，我总是得到一个ValueError: [E973] Unexpected type for NER data 我曾在StackOverflow上的其他帖子上尝试过其他解决方案，包括：使用spacy.blank('en')Installing spacy-lookups-data而不是重复检查培训集的格式和类型是否正确所有这些都会导致相同的错误。 import os import spacy from spacy.lang.en import Eng

浏览 39提问于2022-02-24得票数 1

1回答

在预初始化的spacy文档对象上运行依赖关系解析器。

、、、

我正试图通过web将spacy的依赖解析器集成到java中的遗留代码中。所有其他组件标记器、标记器、merged_words、NER都是从遗留NLP代码中完成的。我只想应用依赖解析器以及spacy 3的依赖规则匹配器。我尝试了以下方法使用创建一个新的doc对象。 from spacy.tokens import Doc sent=["The heating_temperature was found to be 500 C"] words=["The","heating_temperature", "was",

浏览 8提问于2021-09-17得票数 1

回答已采纳

2回答

是否可以在spaCy中的实体链接候选生成中使用NER-Label？

、、、

我想使用spaCy进行实体链接(EL)。我已经在我的领域特定语料库上训练了一个带有自定义标签的spaCy命名实体识别(NER)模型。但是，我的以下示例将使用常规实体标签PERSON和LOCATION。在知识库( KB )中设置别名，知识库返回识别出的实体出现的候选，例如"Paris“的候选可以是维基数据条目Q47899 (巴黎希尔顿)、Q7137357 (巴黎西门)、Q5214166 (丹·巴黎)、Q90 (法国首都巴黎)或Q830149 (巴黎，美国得克萨斯州拉马尔县首府)。我的问题与已识别的实体标签有关。如果NER将"Paris“识别为人称，则从候选人中排除Q90 (法

浏览 6提问于2020-10-09得票数 1

2回答

如何从Spacy NER模型中求出每一个实体的预测概率？

、、、、

我使用这个从零开始训练一个NER模型，使用我自己的训练样本。当我在新文本上使用这个模型时，我想得到每个实体的预测概率。 # test the saved model print("Loading from", output\_dir) nlp2 = spacy.load(output\_dir) for text, \_ in TRAIN\_DATA: doc = nlp2(text) print("Entities", [(ent.text, ent.label\_) for ent in doc.

浏览 3提问于2020-01-23得票数 5

1回答

rasa小鸭模块

、、

我试着基于rasa_nlu训练我的机器人。下面是我的配置文件，我有问题，因为像“下个月”这样的实体被ner_spacy识别为不是时间数据。我希望这种类型的实体只被小鸭模块识别。谢谢语言："en“项目："nav-os”管道：-名称："nlp_spacy“模型："en”-名称："ner_spacy“-名称："tokenizer_spacy”-名称："intent_entity_featurizer_regex“-名称："intent_featurizer_spacy”-名称："ner_synonyms“-名称："i

浏览 8提问于2018-07-18得票数 0

1回答

如何用SpaCy从磁盘加载自定义的NER模型？

、

我已经用以下步骤定制了NER管道 doc = nlp("I am going to Vallila. I am going to Sörnäinen.") for ent in doc.ents: print(ent.text, ent.label_) LABEL = 'DISTRICT' TRAIN_DATA = [ ( 'We need to deliver it to Vallila', { 'entities': [(25, 32, 'DISTRICT')]

浏览 14提问于2022-05-03得票数 0

回答已采纳

1回答

SpaCy:您如何将自定义的NER标签添加到预先培训过的模型中？

、、、

我是SpaCy和NLP的新手。我使用的是SpaCy v3.1和Python3.9.7 64位。 My objective：使用预先培训过的SpaCy模型(en_core_web_sm)，并向现有的NER标签(GPE、PERSON、MONEY等)添加一组自定义标签。这样，模型就可以同时识别默认实体和自定义实体。我看过SpaCy文档，我需要的似乎是一个，特别是一个新管道。但是，在我的工作流程中的哪一点还不清楚我应该添加这个新管道，因为在SpaCy 3中，培训是在CLI中进行的，而且从文档中我甚至不清楚在哪里调用了预培训的模型。您可能拥有的任何教程或指针都会受到高度赞赏。我认为应该这样做，但

浏览 9提问于2021-09-14得票数 7

回答已采纳

1回答

在Spacy的自定义NER训练代码中，这个循环是如何工作的？

、、

我正在编写一个代码，在Spacy的NER引擎中训练自定义实体。我被困在理解一个在线教程的代码的一小部分。这是一个。下面是代码，我无法理解注释# add labels下的两个for循环。我对蟒蛇很陌生。 import spacy ################### Train Spacy NER.########### def train_spacy(): TRAIN_DATA = convert_dataturks_to_spacy("dataturks_downloaded.json"); nlp = spacy.blank('en')

浏览 1提问于2021-01-07得票数 0

回答已采纳

1回答

在Spacy 3中向管道添加自定义组件

、、

我用Spacy3训练了一个NER模型。我想向NER任务的管道中添加一个自定义组件(add_regex_match)。目的是改善现有的新技术成果。这是我想实现的代码： import spacy from spacy.language import Language from spacy.tokens import Span import re nlp = spacy.load(r"\src\Spacy3\ner_spacy3_hortisem\training\ml_rule_model") @Language.component("add_regex_match&

浏览 2提问于2021-03-08得票数 1

回答已采纳

2回答

使用Spacy训练NER从简历中提取技能。什么是转换中的U-实体名称

、、、

我正在使用training spacy NER从resume.But error中提取技能信息在NER模型中找不到名为“U-SKILL”的过渡训练数据： [(U“我有2年的Python经验”，{"entities"：(30，35，"SKILL")})] 代码： other_pipes = [pipe for pipe in nlp.pipe_names if pipe != "ner"] with nlp.disable_pipes(*other_pipes): optimizer = nlp.begin_training()

浏览 46提问于2019-04-17得票数 4

1回答

SpaCy可区分数字或实体

、、、

目前，我正在使用SpaCy NER，并想知道SpaCy NER是否能做以下两件事：案例1 假设我们有两个句子，我们想做的是： increasing.His 糖分水平在他体内的总体健康质量正在提高。我们是否可以将第一句中的“增加”标记为“症状”实体，而在第二句中将“增加”标记为“良好结果”实体？能看到这两个“增加”词之间的区别吗？案例2 我们还有两个不同的句子：我的工资是每月8000美元我的支出是每月5000美元 NER能否将第一句中的数字视为“收入”实体，而将第二句中的数字视为“支出”？谢谢

浏览 1提问于2019-10-09得票数 3

回答已采纳

1回答

保持位置不变的剥离HTML/XML的空间标记器

我对Spacy很陌生，事实上我也是数据科学的新手。我想为NER处理一些XML文件，然后在原始XML中标记它。我想知道如何为NER标记XML。我认为我应该过滤掉XML标记/代码，然后在保留位置的同时输入剩余的文本，这样我就可以得到相对于原始XML的NER结果的位置。这将帮助我识别和标记XML中的确切位置。任何有关这方面的想法和指导都将不胜感激。谢谢

浏览 0提问于2020-09-07得票数 2

3回答

如何消除Spacy POS标签中未知词的名词标记？

、

我正在为一些短信做POS标签。我用spacy来获取POS标签。为什么我要为未知的单词得到名词标签？例如，如果我传递sbxdata，就会得到名词标记。我希望没有像sbxdata这样有意义的词。我想要的是，我不应该得到任何未知单词的标签，或者我只想得到普通英语单词的POS标签。是否有任何库/可用于此的任何方法？举个例子，我有下面的句子。值大列sbxdata实际最大ptsavatar 为此，我将得到以下POS标签。如何去掉sbxdata和ptsavatar的名词标记。类似地，我需要去掉任何未知单词的随机标记。此外，我怀疑，在默认情况下，它是作为名词。任何帮助都会很感激的。这是我的密

浏览 4提问于2020-12-29得票数 0

回答已采纳

3回答

Spacy to Conll格式不使用Spacy的句子拆分器

、、、

Spacy展示了如何使用的标记器获取Conll格式的文本块的依赖关系。这是发布的解决方案： import spacy nlp_en = spacy.load('en') doc = nlp_en(u'Bob bought the pizza to Alice') for sent in doc.sents: for i, word in enumerate(sent): if word.head == word: head_idx = 0 else:

浏览 39提问于2017-12-15得票数 0

2回答

如何在spaCy的INCEpTION注解文本NER中转换？(CoNLL-U到json)

、

我正在使用来注释命名实体，我想用它来训练一个带有spaCy的模型。INCEpTION中有多个选项(例如CoNLL 2000、CoNLL CoreNLP、CoNLL-U)可用于导出带注释的文本。我已经将文件导出为CoNLL-U，我想将其转换为json，因为训练spaCy的NER模块需要此文件格式。有人问过类似的问题，但答案对我没有帮助()。 spaCy的是： python -m spacy convert [input_file] [output_dir] [--file-type] [--converter] [--n-sents] [--morphology] [--lang] 我的第一个

浏览 6提问于2020-12-03得票数 3

1回答

将自定义NER添加到Spacy 3管道

、、

我正在尝试构建一个基于en_core_web_sm管道的自定义Spacy管道。据我所知，在打印时，在管道名称中显示的ner已被正确添加(请参见下面)。由于某些原因，当模型在文本上测试时，我没有得到任何结果，但是当自定义ner被自己使用时，正确的实体就被提取出来并贴上标签。我使用的是Spacy 3.0.8和en_core_web_sm管道3.0.0。 import spacy crypto_nlp = spacy.load('model-best') nlp = spacy.load('en_core_web_sm') nlp.add_pipe('n

浏览 6提问于2022-05-06得票数 0

回答已采纳

1回答

将代码从Spacy2转换为Spacy3 - nlp.update不工作

、、

编辑:谢谢你的评论。我将doc= nlp(文本)更改为doc =nlp.make_doc(文本)。我找到了一个我想复制的密码。它显然是用Spacy2写的： # add NER to the pipeline and the new label ner = nlp.get_pipe("ner") ner.add_label("FOOD") # get the names of the components we want to disable during training pipe_exceptions = ["ner", "trf_

浏览 2提问于2021-02-25得票数 0

1回答

不同word2vec嵌入的空间模型给出了相同的结果

、、、、

我试图通过实现我的预训练向量来提高我的spacy NER模型的性能。我使用不同的文本使用word2vec创建了自己的向量，并将它们保存在.txt文件中。然而，我得到了完全相同的分数，这似乎不对。下面是我为一个带有自定义预训练嵌入的文件执行的步骤： !python -m spacy init vectors en /content/drive/MyDrive/MODELS_W2V/JSTOR_uncleaned_sents_model.txt ./uncl_txt --name JSTOR_unlceaned_sents_model nlp = spacy.load("./uncl_

浏览 17提问于2022-09-01得票数 1

回答已采纳

1回答

无法使用CLI评估spacy 3.0中的自定义ner

、、

我正在尝试从磁盘加载一个带有自定义管道的自定义预训练模型，作为spacy 3.0中的管道：工厂的代码是这样的： @CustomEng.factory("ner-crf") def create_my_component(nlp, name): crf_extractor = CRFExtractor().from_disk("path-to-model") return CRFEntityExtractor(nlp, crf_extractor=crf_extractor) 然后我将'ner-crf‘添加到我的语言类中，如下所示：

浏览 28提问于2021-04-25得票数 1

回答已采纳

2回答

如何在NER上为波斯语提供更快的spacy训练

、、、、

我有一个来自spacy的空白模型，在config file中，我在这个配置中使用小部件：语言=阿拉伯语组件= ner 硬件= CPU 优化为=精度然后在config-file中，我更改了以下内容： [nlp] lang = "ar" 至 [nlp] lang = "fa" 因为没有对GPU (transformer)进行预培训的persian-language。正如您所知，accuracy类型非常慢，我有400,000记录。这是我的config-file [paths] train = null dev = null vectors = nul

浏览 20提问于2022-07-13得票数 3

1回答

在空白和预训练的SpaCy模型上使用nlp.update()时有区别吗？

、、、、

我有一个带注释的数据集(TRAIN_DATA)，我使用它来构建自己的NER模型： nlp = spacy.blank("en") if "ner" not in nlp.pipe_names: nlp.add_pipe("ner", last=True) examples_train = [] for text, annotations in TRAIN_DATA: examples_train.append(Example.from_dict(nlp.make_doc(text) pipe_exceptions = [&

浏览 42提问于2021-08-30得票数 0

0回答

AttributeError:模块“”spacy“”没有属性“”spacy“”

、、

我正在尝试运行示例代码:来自网站 #!/usr/bin/env python # coding: utf8 """Example of training spaCy's named entity recognizer, starting off with an existing model or a blank model. For more details, see the documentation: * Training: https://spacy.io/usage/training * NER: https://spacy.io/usage/ling

浏览 3提问于2017-12-01得票数 1

2回答

为什么我的NLP模型将错误的单词标记为新实体？

、、

我是NLP的新手。从过去的2/3天开始做这件事。使用spacy实现这一点。我正在尝试通过使用以下代码来“训练一个额外的实体类型”…… """Example of training an additional entity type This script shows how to add a new entity type to an existing pre-trained NER model. To keep the example short and simple, only four sentences are provided as examples. I

浏览 47提问于2019-09-08得票数 0

1回答

使用SpaCy Displacy可视化自定义NER标签

、、、

我是spaCy和Python的新手，我想使用这个库来可视化一个NER。这是我找到的示例： import spacy from spacy import displacy NER = spacy.load("en_core_web_sm") raw_text="The Indian Space Research Organisation or is the national space agency of India, headquartered in Bengaluru. It operates under Department of Space which is

浏览 48提问于2021-07-26得票数 1

回答已采纳

1回答

不给出结果或错误的用于训练阿拉伯语spacy NER模型的Python代码

、、、

这是用来训练NER空间模型的代码。我的数据集是阿拉伯语tweets文件。我用机器学习工具手动标记了dataset中的位置，但是代码没有运行。我使用了这个链接的代码 ############################################ NOTE ######################################################## # # Creates NER training data in Spacy format from JSON downloaded from Dataturks. # #

浏览 1提问于2020-05-13得票数 0

回答已采纳

1回答

如何使用100万个标记句子来提高从头开始实现的ner模型的速度

、、

我想使用spacy的NER模型从头开始训练一个使用100万个句子的模型。该模型只有两种类型的实体。这是我正在使用的代码。因为我不能共享数据，所以我创建了一个虚拟数据集。我的主要问题是模型训练时间太长。如果你能强调我代码中的任何错误，或者建议其他方法来加速训练，我将不胜感激。 TRAIN_DATA = [ ('Ich bin in Bremen', {'entities': [(11, 17, 'loc')]})] * 1000000 import spacy import random from spacy.util import mi

浏览 13提问于2019-05-04得票数 2

1回答

Spacy v3 - ValueError：[E030]语句边界未设置

、、

我正在使用spacy 3训练实体链接器模型，并在运行spacy train时得到以下错误 ValueError: [E030] Sentence boundaries unset. You can add the 'sentencizer' component to the pipeline with: nlp.add_pipe('sentencizer'). Alternatively, add the dependency parser or sentence recognizer, or set sentence boundaries by setting

浏览 17提问于2022-01-30得票数 4

1回答

NLP更新不能与spacy 3更新后的元组一起使用

、、、

这是我训练一个已经存在的模型的代码。由于SpaCy中的更新，我收到了这个错误消息，但是我无法解决这个问题。 ValueError:使用两个位置参数调用E989 nlp.update()。这可能是由于spaCy 3.0中的培训数据格式发生了向后不兼容的更改。现在应该用一批示例对象来调用'update‘函数，而不是使用(text, annotation)元组。 def train_spacy(train_data, labels, iterations, dropout = 0.5, display_freq = 1): valid_f1scores=[] t

浏览 11提问于2022-01-07得票数 2

回答已采纳

1回答

尝试训练spacy NER管道以添加新命名实体时出现意外的ner数据类型

、、

我正在尝试向spacy添加一个新的命名实体，但我无法获得用于ner训练的示例对象的良好示例，并且我得到了一个值错误。下面是我的代码： import spacy from spacy.util import minibatch, compounding from pathlib import Path from spacy.training import Example nlp=spacy.load('en_core_web_lg') ner=nlp.get_pipe("ner") TRAIN_DATA=[('ABC is a worldwide or

浏览 13提问于2021-02-25得票数 1

回答已采纳

2回答

文档中句子间的NER相似度

、、、

我一直使用spacy来寻找sentences.My问题的NER，因为我必须计算两个不同文档的句子之间的NER相似度。在python中有没有同样的公式或包呢？提亚

浏览 1提问于2019-04-03得票数 1

1回答

使用spaCy构建自定义模型时出错

、、、、

问题在之后，我尝试添加一个额外的训练数据集，并在本地cpu环境中训练一个模型。但我不会更改base_config.cfg和config.cfg文件的内容。如何修复这些错误来构建模型并对其进行评估？错误我不确定第一个问题是否是一个问题，我也不知道如何填写config.cfg文件。到目前为止，即使在执行以下过程中的代码之后，config.cfg文件仍然是空的。执行列车命令时会显示错误消息。 ℹ Using CPU ✘ Error parsing config overrides paths -> train not a section value t

浏览 4提问于2021-07-23得票数 1

回答已采纳

1回答

使用自定义数据训练Spacy的预定义NER模型，需要考虑复合因子、批次大小和损失值

、、、

我正在尝试训练spacy NER模型，我有大约2600个段落的数据，每个段落的长度从200到800个单词不等。我必须添加两个新的实体标签，产品和规范。如果没有最好的替代方法，这种方法是不是很好呢？如果可以，那么有没有人能给我建议合适的复合因子和批量大小的值，并且在训练时，损失值应该在范围内，有什么想法吗？到目前为止，我得到的损失值在400-5之间。 def main(model=None, new_model_name='product_details_parser', output_dir=Path('/xyz_path/'), n_iter=20): &

浏览 9提问于2019-01-05得票数 2

1回答

spaCy 2.0:保存并加载自定义NER模型

、、

我已经使用自定义标记器在spaCy中训练了一个自定义NER模型。我想不使用记号赋予器来保存NER模型。我使用在spaCy支持论坛中找到的代码尝试了以下代码： import spacy nlp = spacy.load("en") nlp.tokenizer = some_custom_tokenizer # Train the NER model... nlp.tokenizer = None nlp.to_disk('/tmp/my_model', disable=['tokenizer']) 当我尝试加载它时，管道是空的，令人惊讶的是，它有

浏览 6提问于2018-01-30得票数 9

2回答

从spacy中的存储模型加载后，doc.vector无法工作

、、、

我已经按照训练了模型我将它保存到某个目录中，然后加载并再次使用它。但是当我试图访问doc.vector时加载了它之后，它抛出了以下错误。 Traceback (most recent call last): File "C:/Users/ankita.a.rath/Desktop/my_codes/Rasa_nlu/rasa_nlu-master/train_spacy_ner.py", line 248, in <module> main("en", "new_model") File "C:/Users

浏览 3提问于2017-09-10得票数 2