首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    投稿 | 机器如何理解语言—中文分词技术

    前言 中文分词算法是指将一个汉字序列切分成一个一个单独的词,与英文以空格作为天然的分隔符不同,中文字符在语义识别时,需要把数个字符组合成词,才能表达出真正的含义。分词算法是文本挖掘的基础,通常应用于自然语言处理、搜索引擎、智能推荐等领域。 一、分词算法分类 中文分词算法大概分为三大类: 第一类是基于字符串匹配,即扫描字符串,如果发现字符串的子串和词典中的词相同,就算匹配,比如机械分词方法。这类分词通常会加入一些启发式规则,比如“正向/反向最大匹配”,“长词优先”等。 第二类是基于统计以及机器学习的分词方法,

    05

    达观数据告诉你机器如何理解语言 -中文分词技术

    前言 中文分词算法是指将一个汉字序列切分成一个一个单独的词,与英文以空格作为天然的分隔符不同,中文字符在语义识别时,需要把数个字符组合成词,才能表达出真正的含义。分词算法是文本挖掘的基础,通常应用于自然语言处理、搜索引擎、智能推荐等领域。 一、分词算法分类 中文分词算法大概分为三大类。 第一类是基于字符串匹配,即扫描字符串,如果发现字符串的子串和词典中的词相同,就算匹配,比如机械分词方法。这类分词通常会加入一些启发式规则,比如“正向/反向最大匹配”,“长词优先”等。 第二类是基于统计以及机器学习的分词方法,

    07

    独家 | 一文读懂贝叶斯分类算法(附学习资源)

    贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。本文首先介绍分类问题,给出分类问题的定义。随后介绍贝叶斯分类算法的基础——贝叶斯定理。最后介绍贝叶斯分类中最简单的一种——朴素贝叶斯分类,并结合应用案例进一步阐释。 贝叶斯分类 1. 分类问题综述 对于分类问题,我们每一个人都并不陌生,因为在日常生活中我们都在或多或少地运用它。例如,当你看到一个陌生人,你的脑子下意识判断TA是男是女;你可能经常会走在路上对身旁的朋友说“这个人一看就很有钱、那边有个非主流”之类的话,其实这就

    05

    结巴分词库_中文分词

    在例句“在财经大学读书”中,我们利用前缀词典进行文本切分,“在”一字没有前缀,只有一种划分方式;“财”一字,则有“财”、“财经”、“财经大学”三种划分方式;“经”一字,也只有一种划分方式;“大”一字,则有“大”、“大学”两种划分方式,通过这样的划分方式,我们就可以得到每个字开始的前缀词的划分方式。 数字1-7代表每个词位置,对于位置1,就是1-1的意思,表示“在”一字,对于2-(2、3、5),表示从位置2开始,2-2、2-3、2-5都表示词,即“财”、“财经”、“财经大学”,对于每一个位置的划分,都会形成收尾位置相连,最终构成一个有向无环图。

    01
    领券