首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Tensorflow的CNNs模型实战:根据短文本对企业分类

2017年4月17号AI100发布了为期一个月的文本分类练习赛 http://competition.ai100.com.cn/html/game_det.html?...id=24&tab=2 , 数据集由文因互联提供,要求参赛者根据所提供的脱敏后的企业文本数据,筛选并判定该企业所属的类别,评价标准为Acc。...其中,文本数据的内容,是对企业的经营范围和主营业务等基本信息的描述。数据文件描述如下图所示。...方法 任务很容易理解,就是给定一段企业文本数据,要求分类器判定该企业所属的类别。...这里我们简单地做了一个融合:每次取不同的20%的数据作为开发集,剩余的数据作为训练集,这样共得到5组结果,最后将这5组结果进行投票融合,线上表现可以得到0点几个点的提升。

1.3K80
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    如何微调BERT模型进行文本分类

    由于 BERT 的这种特殊结构,它可以用于许多文本分类任务、主题建模、文本摘要和问答。 在本文中,我们将尝试微调用于文本分类的 BERT 模型,使用 IMDB 电影评论数据集检测电影评论的情绪。...我们已经快速了解了什么是BERT ,下面开始对 BERT 模型进行微调以进行情感分析。我们将使用 IMDB 电影评论数据集来完成这项任务。...让我们看看分词器是如何工作的。...我们将使用预训练的“bert-base-uncased”模型和序列分类器进行微调。为了更好地理解,让我们看看模型是如何构建的。...time on this movie, it is the worst movie I have ever seen'] 在我们将上述句子列表应用到模型中之前,我们需要使用 BERT Tokenizer 对评论进行标记

    2.6K10

    文本分类(六):使用fastText对文本进行分类--小插曲

    测试facebook开源的基于深度学习的对文本分类的fastText模型  fasttext Python包的安装: pip install fasttext 1 1 第一步获取分类文本,文本直接用的清华大学的新闻分本...,可在文本系列的第三篇找到下载地址。 ...13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 第二步:利用fasttext进行分类...,没有进行对fasttext的调参,结果都基本在90以上,不过在预测的时候,不知道怎么多出了一个分类constellation。...因此在第一步准备数据的时候可以根据lottery和constellation类的数据进行训练集和测试集的大小划分,或者简单粗暴点,这两类没有达到我们的数量要求,可以直接删除掉

    1.6K10

    问与答129:如何对#NA文本值进行条件求和?

    它们输出的结果看起来相似,但实质上是不同的:在A1和A2中是文本类型,而A3和A4中是错误类型。从数据的对齐方式上也可以反映出来。 ?...图1 我现在如何使用SUMIF函数来求出文本“#N/A”值对应的列B中的数值之和?看起来简单,但实现起来却遇到了困难。我想要的答案是:3,但下列公式给我的答案是:12。...这些公式是: =SUMIF(A1:A4,"#N/A",B1:B4) SUMIF(A1:A4,"=#N/A",B1:B4) =SUMIF(A1:A4,A1,B1:B4) 如何得到正确的答案3?...A:从上面的结果看得出来,在底层,SUMIF函数在进行比较之前会将这些标准参数中的每一个从文本类型强制转换为错误类型。...让SUMIF函数来处理文本类型。 当然,这些公式并不严谨。例如,如果单元格A1包含公式=“abc#N/A”,那么由于*通配符,它将包含在总和中,而我们只希望包含纯“#N/A”值。

    2.4K30

    Yelp,如何使用深度学习对商业照片进行分类

    事实上将照片进行分类,就可以将其当做机器学习中的分类任务,需要开发一个分类器,Yelp首先需要做的就是收集训练数据,在图片分类任务中就是收集很多标签已知的照片。...Yelp还创建了抽象,以确保Yelp的CNN可以很容易地与其他形式的分类器进行集成,包括CNN的不同实例。...Yelp在一个均匀黄金分割的2500张照片的测试集上进行试验,Yelp目前的“facade”分类器的整体精确度达到了94%,召回率达到了70%。...根据Yelp的描述,虽然这些数字绝对可以再提高,但Yelp发现对于下面描述的应用它们已经足够了。...扫描在计算上消耗很大,但通过将分类器在任意多的机器上进行并行处理,Yelp可以减轻这一点。扫描结束后,Yelp会每天自动收集新的照片,并将它们发送到一个进行分类和数据库负载的批次中: ?

    86630

    AI实践精选:通过图像与文本对电子商务产品进行分类

    但这其中也有不明确的地方,那就是如何对类别按照层次进行划分。原则上,如果我们能够构建一个理解并能够使用这种结构的模型,那么其分类效果必定会很好。假定我们构建了一个这样的原始模型。...这样一来,我们就可以比较容易的找到一个有效的分类模型来对这些商品数据进行分类。 选择恰当的模型 由于图片信息与文本信息具有互补性,因此我打算将图片信息与文本信息融入到一个机器学习模型中。...有的时候我们只需要知道一些简单的文本信息,就可以确定商品的类别(如:‘men’s shirt’),但有的时候文本中包含的信息量不是太多,导致我们无法根据文本描述对商品进行分类。...模型性能 正如我前面所讲的那样,我将使用一个即能处理图像又能处理文本的神经网络模型来对商品进行分类,这个组合模型要比那些单独处理图像或者文本的模型要更加庞大、更加复杂。...虽然两者从不同的角度对商品进行分类,但是分类效果却差不多,所以我们有理由相信将两者结合后,分类效果必将得到提升。事实也是如此,当我们将两个模型进行融合后,我们发现分类效果提升明显。

    2.1K80

    用 OpenVINO 对图像进行分类

    今天我们进行我们的第一个 Hello World 项目--用 OpenVINO 对图像进行分类。该项目为【OpenVINO™ Notebooks】项目的 001-hello-world 工程。...我们可以通过点击环境的名称然后进行选择导入库文件import jsonimport cv2import matplotlib.pyplot as pltimport numpy as npfrom openvino.inference_engine...import IECore复制代码选择这个单元格 ctrl + alt + enter 进行代码运行,也可以直接点击左上角的运行按钮。...shapeinput_image = np.expand_dims(input_image.transpose(2, 0, 1), 0)plt.imshow(image);复制代码运行后我们在 VSCode 中会看到进行推理...好了,今天的内容就是这些了,如果对你有所帮助,欢迎转发给你的朋友们。我是 Tango,一个热爱分享技术的无名程序猿,我们下期见。我正在参与2023腾讯技术创作特训营第四期有奖征文,快来和我瓜分大奖!

    25000

    使用PyTorch对音频进行分类

    作者 | Aakash 来源 | Medium 编辑 | 代码医生团队 什么是分类问题? 对对象进行分类就是将其分配给特定的类别。...这本质上是一个分类问题是什么,即将输入数据从一组这样的类别,也称为类分配到预定义的类别。 机器学习中的分类问题示例包括:识别手写数字,区分垃圾邮件和非垃圾邮件或识别核中的不同蛋白质。...用来进行此项目的环境在anaconda云上可用。 https://anaconda.org/aakash_/pytorch-cuda 可视化数据 音频数据通常以波状图的形式可视化。...此外该视频还提供了对MFCC的深入了解。...学习率还可以根据“单周期策略”而变化。 代码可以在这里,在jovian.ml这是一个伟大的网站主机和运行jupyter笔记本电脑,登录ML指标等等。

    5.8K30

    使用BERT进行文本分类

    本范例我们微调transformers中的BERT来处理文本情感分类任务。 我们的数据集是美团外卖的用户评论数据集。 模型目标是把评论分成好评(标签为1)和差评(标签为0)。 #安装库 #!...天天都喝~~', '东西很少,像半分每次都是这样失望', '配送比较慢(不是高峰时间点的结果1个多小时才送到);菜品备注了“老人吃请少油少盐”,结果还是很咸很油,哎…失望'] 2,文本分词 transformers...库使用tokenizer进行文本分词。...种是自动推断模型架构并自动添加Head (如: from transformers import AutoModelForSequenceClassification ) 第1种方案和第2种方案用户可以灵活地根据自己要做的任务设计...四,评估模型 可以使用huggingFace的evaluate库来进行模型评估。 通过evaluate的load方法可以加载一些常用的评估指标。

    69930

    TensorFlow练习1: 对评论进行分类

    实现神经网络 Ubuntu 16.04 安装 Tensorflow(GPU支持) Andrew Ng斯坦福公开课 https://github.com/deepmind 本帖展示怎么使用TensorFlow实现文本的简单分类...Python代码: # -*- coding:utf-8 -*- """ 对评论进行分类 """ import numpy as np import tensorflow as tf import random...} # 去掉一些常用词,像the,a and等等,和一些不常用词; 这些词对判断一个评论是正面还是负面没有做任何贡献 lex = [] for word in word_count...] 20: # 这写死了,好像能用百分比 lex.append(word) # 齐普夫定律-使用Python验证文本的...n_layer_2 = 1000 # hide layer(隐藏层)听着很神秘,其实就是除输入输出层外的中间层 n_output_layer = 2 # 输出层 # 每次使用50条数据进行训练

    86530
    领券