BERT文本分类_使用pytorch进行BERT文本分类_BERT作为分类服务？ - 腾讯云开发者社区

、、

BERT可以用于非文本序列数据吗？我想试试BERT来解决序列分类问题。数据不是文本。换句话说，我想从头开始训练BERT。我该怎么做？

浏览 42提问于2021-07-13得票数 0

回答已采纳

1回答

如何使用另一种经过预先训练的BERT模型和ktrain文本分类器？

、、

我们如何使用不同的预先训练的模型，为文本分类器在the库？使用时： model = text.text_classifier('bert'，(x_train，y_train)，preproc=preproc) 然而，我也想尝试一种单语模式。即荷兰的一个：‘wietsedv/bert-base-荷兰语大小写’，这也是用于其他k-列车实现，。但是，当试图在文本分类器中使用此命令时，它不起作用： model = text.text_classifier('bert', (x_train, y_train) , > preproc=preproc, b

浏览 5提问于2020-09-03得票数 1

回答已采纳

2回答

BERT作为特征提取器与微调BERT层固定的区别

、、、

据我所知，利用BERT进行某些NLP分类任务有两种方法： BERT可以执行“特征提取”，其输出将进一步输入到另一个(分类)模型中。另一种方法是微调一些文本分类任务的BERT，方法是在预培训的BERT中添加一个或多个输出层，并对整个过程进行再培训(有不同数量的BERT层固定)。但是，如果在第二种情况下，我们修复了所有的层，并且添加了分类模型中的所有层，那么第一种和第二种方法实际上是相同的，对吗？

浏览 0提问于2020-03-26得票数 1

1回答

伯特将提取本地特征

Bert是经过预先训练的模型，可以对文本分类进行微调。如何使用BERT提取局部特征

浏览 0提问于2021-08-02得票数 0

回答已采纳

3回答

在使用Spacy，Bert时，是否有必要对文本分类进行停用词删除、词干提取/词汇化？

、、、

当使用Spacy，Bert或其他高级NLP模型来获得文本的向量嵌入时，文本分类是否有必要进行停用词删除、词干提取和词汇化？ Text=“婚礼上供应的食物非常美味” 1.由于Spacy，Bert是在巨大的原始数据集上训练的，在使用bert/spacy生成用于文本分类任务的嵌入之前，在这些文本上应用停用词删除、词干提取和词汇化是否有任何好处？ 2.我可以理解，当我们使用countvectorizer，tfidf向量器来实现句子的嵌入时，去掉停用词，词干提取和词汇化会很好。

浏览 4提问于2020-08-28得票数 7

1回答

来自TensorFlow集线器的BERT编码

、

我使用下面的代码为我的文本分类生成嵌入。 import tensorflow as tf import tensorflow_hub as hub import tensorflow_text as text bert_preprocess =hub.KerasLayer("https://tfhub.dev/tensorflow/bert_en_uncased_preprocess/3") bert_encoder = hub.KerasLayer("https://tfhub.dev/tensorflow/bert_en_uncased_L-12_H-768_A-1

浏览 8提问于2022-02-04得票数 0

1回答

BERT作为分类服务？

、、

我在分类任务中对BERT进行了微调。 bert-as-a-service允许获取单词嵌入，但我想获取输入文本的类。这个问题最好在这里描述：https://github.com/hanxiao/bert-as-service/issues/213 你有什么建议吗？

浏览 10提问于2019-09-19得票数 0

1回答

基于BERT和Tensorflow 2的多标签文本分类

、、、、

我正在尝试使用BERT建立一个简单的多标签文本分类管道；目标是对社交媒体帖子的内容进行分类，任何帖子都可以有多个标签(即，一篇文章可以被标记为“药物”和“身心健康”)。我对伯特非常陌生，并试图效仿我发现的这个例子：，我有一些关于如何为这个任务设置它的问题。在我的Anaconda系统中，我以前安装了Tensorflow 2.0版本。我已经运行了命令"pip install bert-tensorflow“，然后运行以下命令： import tensorflow as tf import tensorflow_hub as hub import bert from bert import

浏览 16提问于2022-06-14得票数 0

2回答

我们能否只使用BERT进行词嵌入，然后使用SVM/RNN进行意图分类？

、、、、

根据本文，"用于意图分类的系统包含以下内容的两个组件:字嵌入和分类器。“本文还对BERT+SVM和Word2Vec+SVM进行了评估。我试图做的相反，比较两个不同的分类器(RNN和SVM)使用伯特的字嵌入。我发现的大多数Python代码都使用BERT来解决整个意图分类问题，这使我感到困惑。示例我只想用BERT将单词映射到向量中，并将结果输入到分类器(SVM/RNN)中。伯特同时支持文字嵌入和文本分类吗？有人有解释吗？我尝试用Python测试的内容可行吗？我有一个有两列的dataframe :意图和问题。这是个小数据集。谢谢!

浏览 0提问于2020-08-04得票数 4

1回答

通过TF-hub导入后冻结BERT层并对其进行训练？

、

我将在这里描述我的意图。我想通过tf-hub函数hub.module(bert_url，trainable = True)导入BERT预训练模型，并将其用于文本分类任务。我计划使用一个大型语料库来微调BERT的权重，以及几个输入为BERT输出的密集层。然后我想冻结BERT的层，只训练BERT之后的致密层。我怎样才能有效地做到这一点呢？

浏览 25提问于2020-03-29得票数 0

1回答

如何对bert微调模型进行再次微调

、

我使用ktrain对文本分类的bert模型进行了微调。同样，我想在另一个文本分类数据上对此模型进行微调。我该怎么做？

浏览 23提问于2021-04-29得票数 1

1回答

关于文本分类任务迁移学习的任何有用提示

、、、

我正在做一个监督的二进制文本分类任务。我想对A、B和C站点的文本进行分类。对于每个站点的文本来说，域内性能看起来都很好。(92%~94%)。然而，如果我将一个站点的文本培训模型直接应用到另一个站点的文本上(不进行微调)，那么性能就会大大降低。(7%-16%的精度降级)。我已经尝试过的方法： Doc2vec嵌入(对一个站点的文本进行训练)+ logistic回归。 Bert嵌入+ logistic回归。(使用bert -as-a-服务来生成基于google预先培训的bert模型的嵌入)。 TF-国防军+ logistic回归。预先训练的Word2vec嵌入(文本的平均单词嵌入)+ lo

浏览 0提问于2020-07-21得票数 2

回答已采纳

2回答

是修改所有的参数，还是只更新最终的分类层？

、、、、

目前正在学习和阅读变压器模型，我发现在预培训阶段，BERT模型是通过MLM和NSP在一个大型语料库上进行训练的。但是在整理过程中，例如试图根据另一文本对情感进行分类时，所有的BERT参数(110M+参数+最终分类层)都是更新的，还是仅仅是最终的分类层？在我一直在寻找的资源中找不到具体的答案。提前谢谢你。

浏览 0提问于2020-09-04得票数 1

1回答

安装成功后无法导入Bert_Text

、、、

Bert是一个非常强大的文本分类模型，但bert的实现需要比任何其他模型多得多的代码。bert-text是pypi包，为开发人员提供了一个现成的解决方案。我已经安装了它，我已经尝试导入，它抛出错误ModuleNotFoundError:没有名为‘bert_text’的模块。我已经正确地写入了名称bert_text。我已经在Kaggle，Colab和本地机器上尝试过了，但是错误是一样的。

浏览 24提问于2019-10-14得票数 0

1回答

如何加载部分预训练的pytorch模型？

、、、、

我正在尝试让pytorch模型运行在句子分类任务上。在处理医学笔记时，我使用的是ClinicalBert (https://github.com/kexinhuang12345/clinicalBERT)，并希望使用其预先训练好的权重。不幸的是，ClinicalBert模型只将文本分类为1个二进制标签，而我有281个二进制标签。因此，我正在尝试实现此代码https://github.com/kaushaltrivedi/bert-toxic-comments-multilabel/blob/master/toxic-bert-multilabel-classification.ipynb，其

浏览 94提问于2020-04-14得票数 6

1回答

当我有没有标签的文本文档数据集时，如何使用BERT的微调？

、、、

我对使用BERT进行各种NLP/文本挖掘任务有了基本的了解。当谈到伯特的微调时，我总是看到微调是使用一些分类任务来执行的。那么，当我有一组完全没有标签的文档时，我应该如何改进BERT模型给出的单词/句子嵌入向量？我知道，BERT模型最初是针对没有标签的数据进行培训的，所以必须有一些方法。

浏览 0提问于2020-05-27得票数 2

1回答

bert +文本和结构化数据

、、

对于每个实例，我都有文本和表格数据。我想知道是否有任何方法可以使用Bert_classification并结合结果来对整个数据集进行分类，而不会过度拟合。有没有办法对文本和表格数据进行两种不同的分类，并将它们组合在一起？

浏览 84提问于2020-04-21得票数 0

回答已采纳

2回答

如何将BertforSequenceClassification模型的权重加载到BertforTokenClassification模型中？

、、、

最初，我使用文本分类数据集对基于BERT的模型进行了微调，为此我使用了BertforSequenceClassification类。 from transformers import BertForSequenceClassification, AdamW, BertConfig # Load BertForSequenceClassification, the pretrained BERT model with a single # linear classification layer on top. model = BertForSequenceClassification.f

浏览 77提问于2020-03-28得票数 1

回答已采纳

1回答

从变压器进口BertTokenizer

、、、

我试图从拥抱脸实现以下模型，但不完全确定如何为模型提供我需要通过的文本来进行分类。文档()没有显示如何传递查询。 from transformers import BertTokenizer, BertForSequenceClassification model = BertForSequenceClassification.from_pretrained("DaNLP/da-bert-tone-subjective-objective") tokenizer = BertTokenizer.from_pretrained("DaNLP/da-bert-tone-s

浏览 5提问于2022-10-01得票数 0

1回答

我想用BERT的隐藏状态用分类算法进行分析

、、

我使用的是包，伯特和PyTorch。我尝试使用进行文本分类。我可以得到结果，但我想挑战更艰巨的任务。我指的是这个。本文件第4.1节指出，训练结束后，我们删除softmax激活层，以BERT的隐藏状态作为特征向量，然后将其作为不同分类算法的输入。所以，我检查。的确有 attention_probs = nn.Softmax(dim=-1)(attention_scores) 如果我按照论文的方式看它，它是否意味着在通过Softmax函数之前使用attention_scores？如果是这样，我如何使用attention_scores并将其应用于分类算法？总之，我想要做的是利用BE

浏览 3提问于2021-11-10得票数 0

回答已采纳

4回答

对于文本分类任务，您会使用哪种模型(GPT2、BERT、XLNet等)？为什么？

、、、

我正在尝试为句子分类任务训练一个模型。输入是一个句子(整数的向量)，输出是一个标签(0或1)。我在各处看到过一些关于使用Bert和GPT2执行文本分类任务的文章。然而，我不确定我应该从哪一个开始。在自然语言处理中的这些最新模型中，您会使用原始变压器模型、Bert、GPT2、XLNet中的哪些模型作为开始？为什么？我更愿意在Tensorflow中实现，但我也可以灵活地使用PyTorch。谢谢!

浏览 5提问于2019-09-09得票数 8

1回答

Spacy中的顺序/上下文感知文档/句子向量

、、、、

我想用句子做一些有监督的二进制分类任务，并且一直在使用spaCy，因为它易于使用。我使用spaCy将文本转换为向量，然后将向量提供给机器学习模型(例如XGBoost)来执行分类。然而，结果并不是很令人满意。在spaCy中，很容易加载 (例如BERT / Roberta / XLNet)来将单词/句子转换为nlp对象。然而，直接调用对象的向量将到令牌向量的平均值。这里有两个问题： 1)我们能做得比简单地获得标记向量的平均值更好吗，比如使用spaCy获得上下文/顺序感知的句子向量？例如，我们能否从BERT转换器的上一层提取句子嵌入，而不是spaCy中的最终标记向量？ 2)直接使用spaCy来训

浏览 17提问于2020-05-06得票数 0

1回答

重新训练BERT模型

、、、、

我已经使用pytorch为分类任务训练了大约一百万个文本数据的BERT模型。在用新数据测试这个模型后，我得到了假阳性和假阴性。现在我只想用FN和FP重新训练现有的模型。我不想将FN和FP附加到现有的数据集，然后再次训练整个模型。如何仅使用这些FN和Fp重新训练此bert模型，而不是先前训练的模型。

浏览 31提问于2021-11-23得票数 0

1回答

有没有办法将bert-large用作文本分类工具而无需微调？

、、、、

我目前的一个任务是将任何文本分类问题的基于keras BERT的模型转换为.pb文件。为此，我已经有了一个函数，它接受keras模型，但重点是，当我试图下载任何预训练版本的BERT时，它们总是没有任何用于分类的顶层，因此我应该在BERT之前手动添加tf.keras.layers.Input层，并在BERT之上添加任何神经网络架构(在CLS嵌入之后)。我的最终目标是摆脱微调的需要，并获得一些已经进行了微调的现成模型。我发现transformer库可能对此很有用，因为他们为某些数据集准备了一些基于BERT的模型。无论如何，使用他们的文档中的以下代码可以通过隐藏维度返回形状1的张量和标记数量。 fr

浏览 1提问于2021-04-06得票数 0

2回答

BERT用于文本分类的最小可能数据集

、、

你有什么经验，适当的数据集大小，为通常的文本分类任务使用一个精练的BERT，如情感分析？ ~100例 ~1000例 ..。 ~10000000例你的经历是什么？

浏览 0提问于2019-09-04得票数 0

2回答

用BERT检测语法错误

、、

我们对bert-base-uncased( BERT )模型和CoLA数据集进行了精细调整，以完成句子分类任务.数据集是有语法错误和没有语法错误的句子的组合。然后，再训练的模型被用来识别有或没有错误的句子。除了建立分类器外，我们还可以使用BERT的其他方法吗？

浏览 0提问于2021-01-06得票数 3

1回答

为什么TFBertForSequenceClassification.from_pretrained('bert-base-chinese')不能使用？

我想用huggingface做中文文本相似度： tokenizer = BertTokenizer.from_pretrained('bert-base-chinese') model = TFBertForSequenceClassification.from_pretrained('bert-base-chinese') 它不工作，系统报告错误： Some weights of the model checkpoint at bert-base-chinese were not used when initializing TFBertForSequenc

浏览 460提问于2020-07-13得票数 1

1回答

NameError:未定义名称“TokenizeProcessor”

、、

我是第一次运行一个用于文本分类的BERT模型。我按照说明和源代码提供，包括以下导入语句： from fastai.text import * from fastai.callback.all import * # instead of from fastai.callbacks import * from pytorch_pretrained_bert.modeling import BertConfig, BertForSequenceClassification from pytorch_pretrained_bert import BertTokenizer 但是，我从这一行中得到了一

浏览 5提问于2021-05-18得票数 0

2回答

去除Bert中用于文本分类的SEP标记

、

给定一个情感分类数据集，我想对Bert进行微调。正如你所知道的，BERT创造了预测下一个句子的方法，给定当前句子。因此，为了让网络意识到这一点，他们在第一句话的开头插入了一个[CLS]令牌，然后添加了[SEP]令牌来分隔第一句话和第二句话，最后在第二句话的末尾添加了另一个[SEP] (我不明白他们为什么要在末尾附加另一个令牌)。无论如何，对于文本分类，我在一些在线示例(参见BERT in Keras with Tensorflow hub)中注意到的是，他们添加了[CLS]标记，然后添加句子，最后添加另一个[SEP]标记。在其他研究工作(例如Enriching Pre-trained

浏览 190提问于2020-01-13得票数 6

1回答

是否有任何预先训练过的字嵌入可以用来分类源代码？

、、、、

我试图对从堆栈溢出中获取的源代码片段进行分类。我正在探索各种技术，如Tf-以色列国防军，角嵌入层与CNN，bert等。因为源代码分类与正常的文本分类问题有很大的不同，所以我正在寻找一些应该最适合当前问题的技术。到目前为止，我已经申请了Tf-以色列国防军，而且我获得了大约75%的精确性。当使用文字CNN与角化嵌入层，我得到60%。我计划下一步实现与伯特相关的模型。我也读过实现‘代码-bert’的论文，但它们仅限于6-8种语言。我的数据集有超过20种语言。我想了解在底层哪种技术对源代码最有效。

浏览 11提问于2022-11-09得票数 0

3回答

在bert层中，池输出和序列输出有什么不同？

、、、、

所有人！我读到了关于Bert的文章，我想做文本分类和它的单词嵌入。我遇到了这一行代码： pooled_output, sequence_output = self.bert_layer([input_word_ids, input_mask, segment_ids]) 然后： clf_output = sequence_output[:, 0, :] out = Dense(1, activation='sigmoid')(clf_output) 但是我不明白集合输出的用法。不包含所有信息，包括“CLS”的单词嵌入，如果是，为什么我们有池输出？提前感谢！

浏览 3提问于2020-08-12得票数 1

回答已采纳

1回答

具有列车、开发、测试、预测模式的BERT

、

我正在和BERT一起做一个文本分类任务。我基本上是在使用。这段代码使用train.tsv和dev.tsv (有标签)来微调BERT，使用test.tsv (没有标签)来进行预测。但是，我需要使用train-dev-test拆分来训练模型(train set)，计算超参数和损失函数(dev set)，并评估性能(test set)。与常规的训练-开发-测试拆分一样，所有拆分都包括标签。我还有第四个未标记的数据集可以进行预测。你知道有哪个仓库实现了4种模式的BERT (训练-开发-测试-预测)吗？

浏览 3提问于2020-03-12得票数 0

1回答

如何利用BERT对中性情绪进行分类

、

我们可以将文本分类为正负两类，如下面的笔记本所述。但是，是否也有办法对中性情绪进行分类？ https://colab.research.google.com/github/google-research/bert/blob/master/predicting_电影_评论_使用_伯特_在……上面_托夫_hub.ipynb 实际上，我想知道我们需要在上面的笔记本上做什么样的改变，这样除了积极和消极之外，它还可以对中性情绪进行分类。提前谢谢。

浏览 0提问于2019-06-11得票数 2

1回答

使用BERT的文本分类-如何处理拼写错误的单词

、、、、

我不确定这是否是提交这类问题的最佳地点，也许CrossValdation会更好。我正在研究一个文本多类分类问题。我构建了一个基于BERT概念的模型，并在PyTorch (huggingface transformer library)中实现。该模型执行得很好，除非输入句子有OCR错误或等效地拼写错误。例如，如果输入是"NALIBU DRINK“，Bert标记器会生成'na'，'##lib'，'##u'，'drink‘，模型的预测是完全错误的。另一方面，如果我纠正了第一个字符，所以我的输入是"MALIBU DRINK&

浏览 38提问于2020-04-04得票数 0

1回答

在Google Colab中运行python参数

、、、

我在Google Colab中运行一个python文件，并得到一个错误。我正在遵循这个链接中的bert文本分类示例； https://appliedmachinelearning.blog/2019/03/04/state-of-the-art-text-classification-using-bert-model-predict-the-happiness-hackerearth-challenge/ 我按照所描述的教程进行了操作，现在是在colab中运行下面的代码片段的最后一步。 python run_classifier.py --task_name=cola --do_train

浏览 21提问于2019-11-25得票数 3

1回答

Bert分类器模型的量化

、、、

我目前正在尝试量化一个bert分类器模型，但遇到了错误，我想知道目前是否支持这一点？为了清楚起见，我想问一下tensorflow-model-garden中的BERT分类器超类是否支持量化？提前感谢您的帮助！

浏览 10提问于2020-11-12得票数 0

1回答

经过培训的德国伯特

、

我正在寻找一个(良好的)经过良好培训的德语BERT模型，以适应Keras/TF框架。理想的情况下，有一个最小的例子，如何微调模型上的具体任务，即文本分类！有人能告诉我一些(开源)资源吗？

浏览 0提问于2022-02-05得票数 0

1回答

句子多类分类的BertForSequenceClassification与BertForMultipleChoice

、、、、

我正在研究一个文本分类问题(例如情感分析)，在这个问题上，我需要将文本字符串分类为五个类中的一个。我刚开始使用包和PyTorch的BERT。我需要的是一个分类器，在顶部有一个softmax层，这样我就可以进行5路分类。令人困惑的是，变压器包中似乎有两个相关的选项：和。我应该用哪一个来完成我的5路分类任务？它们的适当用例是什么？ BertForSequenceClassification的文档根本没有提到softmax，尽管它确实提到了交叉熵。我不确定这类是否只适用于2类分类(即logistic回归)。具有顺序分类/回归头的Bert模型转换器顶部(集合输出顶部的线性层)，例如用于胶水任务

浏览 5提问于2020-03-10得票数 17

回答已采纳

1回答

自定义拥抱面bert模型中的编码模块

、、、

我正在使用进行文本分类项目。encode_plus函数为用户提供了一种生成输入ids、注意掩码、令牌类型ids等的方便方法。例如： from transformers import BertTokenizer pretrained_model_name = 'bert-base-cased' bert_base_tokenizer = BertTokenizer.from_pretrained(pretrained_model_name) sample_text = 'Bamboo poles, ‍installation by an unknown buildin

浏览 2提问于2020-06-19得票数 1

回答已采纳

1回答

BERT建模输入数据的创建.多类文本分类

、、、

我正在试图建立一个keras模型来对45个不同类的文本进行分类。我对按照google的BERT模型的要求为输入准备数据感到有点困惑。一些博客文章将数据插入为tf数据集，其中包含input_ids、段ids和掩码ids，如在中，但有些则只使用input_ids和掩码，如。在第二个指南中，它还注意到段掩码和注意掩码输入是可选的。有人能解释一下这两者是否是多类分类任务所必需的吗？如果有帮助的话，我的数据中的每一行都可以由合理大小的段落中的任意数量的句子组成。我希望能够将每个段落/输入分类为一个标签。我似乎找不到很多关于使用BERT与Keras (Tensorflow 2)一起处理多类问题的

浏览 1提问于2020-04-09得票数 1

回答已采纳

1回答

为什么在使用BERT的learner.autofit过程中数据项会发生变化？

、

我正在尝试安装BERT文本分类器。我的训练和测试数据如下所示。 x_train = data["TEXT"].head(4500).tolist() y_train= [label2id[label] for label in data["EMOTION"].head(4500).values.tolist()] x_test = data["TEXT"].tail(500).tolist() y_test = [label2id[label] for label in data["EMOTION"].tail(500).val

浏览 26提问于2020-09-08得票数 0

回答已采纳

1回答

在文本分类问题上实现BERT时出现的错误

、、、

最近，Matlab在他们的git库中启动了BERT。这里有一个使用BERT对文本数据进行分类的示例。我正在尝试按原样运行这段代码。在这里，我遇到了一个无法将数据划分为测试数据的问题。我正在尝试的代码块如下： %% mdl = bert; %% tokenizer = mdl.Tokenizer %% filename = "factoryReports.csv"; data = readtable(filename,"TextType","string"); head(data) %% data.Category = categori

浏览 46提问于2021-05-24得票数 0

1回答

使用像BERT这样的预训练模型进行文档分类

、、、

我正在寻找对文档进行分类的方法。对于ex。我有一堆带有文本的文档，我想标记文档是否属于体育、食品、政治等。我可以使用BERT (对于单词>500的文档)来实现这一点吗?或者是否有其他模型可以有效地完成这项任务？

浏览 7提问于2021-02-10得票数 1

1回答

在tf2.keras微调中如何冻结几层BERT

、、、、

我试图微调‘基于伯特的数据集’的基础上的文本分类任务。下面是我下载模型的方式： import tensorflow as tf from transformers import TFAutoModelForSequenceClassification, AutoTokenizer model = TFAutoModelForSequenceClassification.from_pretrained("bert-base-uncased", num_labels=num_labels) tokenizer = AutoTokenizer.from_pretrained(

浏览 16提问于2022-03-03得票数 1

回答已采纳

1回答

在培训期间报告其他指标评估简单变革者

、、、、

我正在使用simpletransformer库的bert分类器(bert-base-uncased)在大量数据上训练文本分类模型。Simpletransformer默认情况下会返回mcc和eval_loss，用于在训练和测试(评估)阶段进行评估。我能够为测试阶段设置额外的指标，比如acc、f1等(通过向eval_model函数发送额外的指标)，但我不知道如何告诉simpletransformer在训练阶段也报告这些指标？有没有可能用train_model函数做同样的事情？值得一提的是，eval_during_training选项是True。它为每个检查点打印训练的mcc和eval_loss

浏览 23提问于2021-11-16得票数 1

1回答

将文本和数字特征结合到预训练的变压器BERT中

、、、

我有一个有3列的数据集：文本元数据(意图从其中提取特征，然后使用这些特征，即数字特征) 目标标签问题1:如何在文本之外使用预先培训的BERT实例？一个理论上的解决方案建议让伯特把文本和另一个神经网络的数值特征输入到这个网络中，然后将它们的输出聚合到另一个神经网络中。这是最有效的方法吗？问题2:如何连接神经网络？你从每个人那里得到输出，然后呢？您从BERT获得分类输出，根据数值特征从MLP获得分类输出。你把它们连在一起，然后把它们喂给另一个MLP，然后得到最终的预测？最后的预测不是不太可靠吗？换句话说，最后一个MLP是否封装了另外两个网络？如果是的话，如果伯特预测90%，但

浏览 0提问于2021-04-23得票数 2

回答已采纳

2回答

BertModel转换器输出字符串而不是张量

、、

我正在遵循this教程，该教程使用BERT和huggingface库编写了一个情感分析分类器，并且我有一个非常奇怪的行为。在使用示例文本尝试BERT模型时，我得到了一个字符串，而不是隐藏状态。这是我使用的代码： import transformers from transformers import BertModel, BertTokenizer print(transformers.__version__) PRE_TRAINED_MODEL_NAME = 'bert-base-cased' PATH_OF_CACHE = "/home/mwon/data-m

浏览 133提问于2020-12-04得票数 9

回答已采纳

2回答

有可能微调伯特做转发预测吗？

、、

我想构建一个分类器来预测用户i是否会转发tweet j。这个数据集很大，包含了1.6亿条推特。每条推文都伴随着一些元数据(例如，转发者是否跟踪推特的用户)。单个tweet的文本标记是BERT ids的有序列表。要获得tweet的嵌入，只需使用it (所以它不是文本)。有可能微调伯特来做预测吗？如果是，您推荐哪些课程/来源来学习如何微调？(我是初学者) 我要补充的是，预测应该是一个概率。如果不可能，我正在考虑将嵌入转换回文本，然后使用我将要训练的任意分类器。

浏览 3提问于2020-04-21得票数 1

回答已采纳

2回答

如何获得伯特的预科证书

、

我使用的是堆栈溢出选项卡分类csv数据集，该数据集已加载到dataframe中： X = df.post y = df.tags X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state = 42) 除了其他一些分类模型之外，我还想运行BERT，但是，它需要一个变量preproc。我不确定哪一种功能会得到这个结果： import ktrain from ktrain import text model = text.text_classifier('bert', (

浏览 3提问于2019-10-29得票数 2

回答已采纳

3回答

微调BERT的最后x层

、、、

我试着微调BERT只在特定的最后一层(比方说最后三层)。我想使用谷歌Colab进行TPU培训。我使用hub.Module加载BERT并对其进行微调，然后将微调后的输出用于我的分类任务。 bert_module = hub.Module(BERT_MODEL_HUB, tags=tags, trainable=True) hub.Module可以选择将模型设置为可训练或不可训练，但不能将其设置为部分可训练(仅特定层) 有人知道如何使用hub.Module训练最后1、2或3层的BERT吗谢谢

浏览 67提问于2019-05-08得票数 2