首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

利用机器学习探索食物配方:通过Word2Vec模型进行菜谱分析

Word2Vec方法利用深度学习和基于神经网络的技术,将单词转换为相应的向量,使语义相似的向量在N维空间中相互接近,其中N表示向量的维数。 究竟为什么我们需要在分析食物配方和配料时嵌入文字呢?...嗯,我们需要一些方法来将文本和分类数据转换为数字机器可读的变量,如果我们想比较一个配方和另一个配方。...在本教程中,我们将学习如何使用Word2Vec: 暗示相似的概念——在这里,单词嵌入帮助我们暗示与被置于预测模型中的单词相似的成分。...大多数配料都以形容词作为前缀,例如干番茄、榨柠檬、新鲜香菜等。这些词(干的,压缩的,新鲜的等等)在生成有意义的词嵌入没有用处。因此,可以使用正则表达式函数来删除这些内容。...这种相似性把所有和“巧克力”密切相关的单词都显示出来了,比如黑巧克力,香草豆等等 原料“蛋黄酱”的类似或相关成分 model.wv.most_similar('mayonnaise') ?

2.1K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    《自然语言处理入门》12.依存句法分析--提取用户评论

    每个单词不能依存于多个单词。 如果单词 A 依存于 B,那么位置处于 A 和 B 之间的单词 C 只能依存于 A、B 或 AB 之间的单词。...依存句法分析任务采用的评测指标为 UAS (unlabeled atachment score) 和 LAS (labeled attachment score ),分别对应忽略标签和包括标签的 F1...电池非常棒,机身不长,长的是待机,但是屏幕分辨率不高。 为了提取“电池”“机身”“待机”和“分辨率”所对应的意见,朴素的处理方式是在分司和词性标注之后编写正则表达式,提取名词后面的形容词。...然而正则表达式无法处理“长的是待机”这样句式灵活的例子。...利用这一规律, 不难写出第一版遍历算法, 也就是用个for 循环去遍历树中的每个节点。对于算法遍历树中的每一个词语, 如果其词性为名词且作为某个形容词的名词性主语,则认为该名词是属性,而形容词是意见。

    2.6K20

    抽象语法树为什么抽象

    所以解析树,也被成为具象语法树(Concret Syntax Tree, 简称CST);而抽象语法树,忽略了一些解析树包含的一些语法信息,剥离掉一些不重要的细节,所以它看起并不像解析树那么事无巨细,这也是...想想我们学英语的过程中,老师是如何教我们划分句子解构的,比如一个简单的英文自然语言例子: Little girl ate apple 它由【名词短语】和【动词短语】组成, 再往下【名词短语】由【形容词】...【动词】和【名词】又可以由具体的单词构成。...我们会觉得语言描述冗长,而且并不直观,可以借助一些符号进行描述: -> -> 形容词> -> 形容词...用更抽象的形式化语言定义,文法可表示为: T表示终结符的集合(如little、girl等,即词法分析中提到的token) N表示非终结符的集合(如里包括的部分,表示了语法成分, 因为它们可以推导出其他句子成分

    1.6K30

    自然语言处理之分词、命名主体识别、词性、语法分析-stanfordcorenlp-NER(二)

    LSTM+CRF模型 语言文本的特殊之处在于其具有一定的结构,主谓宾定状补,状语后置,非限制性定语从句等等。这些结构的存在代表着每个单词的前后是有着一定的词性限制的。...局部马尔可夫性: P(Yu|Yv)=P(Yu|Yv,Yw)简单理解,因为Yu和Yw之间没有边连接,则在给定随机变量Yv条件下的Yu的概率,跟多加了一个Yw无关。...和B之间,那么C或者直接依存于B,或者直接依存于A和B之间的某一成分; 中心成分左右两面的其它成分相互不发生关系。...使用斯坦福句法分析器做依存句法分析可以输出句子的依存关系,Stanford parser基本上是一个词汇化的概率上下文无关语法分析器,同时也使用了依存分析。...形容词 appos: appositional modifier,同位词 attr: attributive,属性 aux: auxiliary,非主要动词和助词,如BE,HAVE SHOULD/

    8.3K72

    深入理解BERT Transformer ,不仅仅是注意力机制

    向量空间可以用来表示一个单词、短语和其他成分。...例如,形容词的含义会随着单词的不同而变化:“white wine” (白葡萄酒)的颜色实际上是黄色的,但是一只白猫(white cat)就是白色的。...我们忽略了与“[CLS]”和“[SEP]”标记相关的注意力值。我们尝试使用了几个句子,发现想不过度解释它们的结果很难。所以你可以随意用几个句子在这个colab notebook上测试我们的假设。...注意力头如何辅助特定的语义合成,例如形容词/名词语义合成 虽然我们没有发现注意力头集中关注形容词/名词等更一致的组合,但是动词/副词的语义合成与模型所衍生的其它语义合成之间可能存在一些共同点。...有许多可能的相关语义合成(单词-子词,形容词-名词,动词-介词,子句-子句)。

    71220

    深入理解BERT Transformer ,不仅仅是注意力机制

    向量空间可以用来表示一个单词、短语和其他成分。...例如,形容词的含义会随着单词的不同而变化:“white wine” (白葡萄酒)的颜色实际上是黄色的,但是一只白猫(white cat)就是白色的。...我们忽略了与“[CLS]”和“[SEP]”标记相关的注意力值。我们尝试使用了几个句子,发现想不过度解释它们的结果很难。所以你可以随意用几个句子在这个colab notebook上测试我们的假设。...注意力头如何辅助特定的语义合成,例如形容词/名词语义合成 虽然我们没有发现注意力头集中关注形容词/名词等更一致的组合,但是动词/副词的语义合成与模型所衍生的其它语义合成之间可能存在一些共同点。...有许多可能的相关语义合成(单词-子词,形容词-名词,动词-介词,子句-子句)。

    65620

    正则表达式一元字符与字符组

    表示字符组用于匹配一串字符 如果我们需要搜索的单词是"gray",同时又不确定他是否写作"gray",这个时候就可以使用正则表达式结构体-[........]-字符组。...依靠它,我们能把不同的子表达式组合成一个总表达式,而这个总表达式又能匹配任意的子表达式 假如Bob和Robert是两个表达式,但Bob|Robert 能够同时匹配任意一个的正则表达式,在这样的组合,子表达式被称为...gr[ea]y和gr(e|a)y这两个例子可能会让人觉得多选结构和字符组本身没多大区别,但是注意,一个字符组只能匹配单词中的一个字母,而每个多选结构自身可能都是完整的正则表达式,可以匹配任意长度的文本!...6  -i    符忽略大小写       E-Mail中header中的字段类型通常以大写字母开头,例如Subject和From,但是E-Mail标准并没有对大小写进行严格的规定,所以DATE和from...该功能并不是正则表达式语言的一部分,确实很多工具软件提供的有用的特性,egerp的命令行参数"-i"表示进行忽略大小写的匹配,把-i写在正则表达式之前; 7   单词分界符

    88070

    第一章 词与词组

    可以负责任的说:不了解单词词性是语法混乱的根源,是写不出正确的句子、看不懂长难度的重要原因。 英语的词性分为十大类,包括动词、名词、形容词、副词、代词、介词、数词、连词、冠词和感叹词。...英语中单词量最大的词类是动词、名词、形容词和副词,而副词往往是由形容词加“-ly”后缀转换而来的,因此,需要大家重点记忆的词类只有名词、动词和形容词这三种,这三类词是英语写作中最容易出错的地方,也是影响长难句理解的关键因素...词组 在英语中,作用和单词相似的一组词(由两个或两个以上的词组成)构成“词组”,也叫做“短语”。起名词作用的词组称为“”名词词组”,起动词作用的词组称为“动词词组”,以此类推。...副词词组是由几个副词构成的短语,如 very much等,其使用方法与副词相同,主要在句子中作状语,修饰动词、形容词和副词等,表示时间、地点、方式等意义。...介词是一种用来表示词与词,或者词与句之间关系的虚词,在句子中不能单独充当成分。它常和名词搭配构成介词短语,表示不同的意思。介词和词形上可分为简单介词和短语介词。

    1.2K20

    词性标注

    形容词代码为 a,语素代码g前面置以a。 a 形容词 取英语形容词 adjective的第1个字母。 ad 副形词 直接作状语的形容词。形容词代码 a和副词代码d并在一起。...an 名形词 具有名词功能的形容词。形容词代码 a和名词代码n并在一起。 b 区别词 取汉字“别”的声母。 c 连词 取英语连词 conjunction的第1个字母。 dg 副语素 副词性语素。...f 方位词 取汉字“方” g 语素 绝大多数语素都能作为合成词的“词根”,取汉字“根”的声母。 h 前接成分 取英语 head的第1个字母。 i 成语 取英语成语 idiom的第1个字母。...j 简称略语 取汉字“简”的声母。 k 后接成分 l 习用语 习用语尚未成为成语,有点“临时性”,取“临”的声母。 m 数词 取英语 numeral的第3个字母,n,u已有他用。...词性标注的流程如下: 首先基于正则表达式进行汉字判断,jieba源代码posseg中正则表达式为: re_han_internal = re.compile("([\u4E00-\u9FD5a-zA-Z0

    1.4K10

    Python正则表达式

    本文写作思路和建议: 1、本文主要阐述了Python正则表达式的概念、常用操作、使用方法,方便快速了解正则表达式的应用; 2、学习之前建议对字符串进行深入的了解,比如字符串的常用操作等,因为正则表达式一般主要操作对象就是对于字符串的处理...1 正则表达式的定义 正则表达式一般操作对象为字符串; 通常的可以理解为正则表达式为记录文本规则的代码或工具; 应用场景为比如查找符合某些复杂规则的字符串。 以下是关于正则的一些基本使用和操作。...: ① 这个格式表示用于匹配以字母qw开头的单词; ② 先从某个单词开始处(\b),然后匹配字母qw,接着是任意的字母或字符(\w*),最后是单词结束处(\b); 针对上边这个格式,我们简单看一个示例,...)以外的所有字符 \d 匹配数字 \b 匹配单词的开始或结束,单词的分界符通常是空格、标点符号或者换行 ^ 匹配字符串的开始 $ 匹配字符串的结尾 4 限定符 限定符就是指定数量的字符; 之前提到的可以匹配任意字符的元字符...用于包括整个字符串的开始和结尾的每一行 S或DOTALL 使用(.)字符匹配所有字符 X或VERBOSE 忽略模式字符串中未转义的空格和注释 10.1.2 search()方法 用于在整个字符串中搜索第一个匹配的值

    37720

    Python3快速入门(七)——Pyth

    \b匹配一个单词边界,也就是指单词和空格间的位置。例如, 'er\b' 可以匹配"never" 中的 'er',但不能匹配 "verb" 中的 'er'。 \B匹配非单词边界。'...[, flags]) compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象,正在表达式对象拥有一系列方法用于正则表达式匹配和替换。...'不包括换行符) re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依赖于 Unicode 字符属性数据库 re.X 为了增加可读性,忽略空格和' # '后面的注释...pattern匹配的正则表达式 string要匹配的字符串。 flags标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。...flags标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等 # -*- coding:utf-8 -*- import re # 将匹配的数字乘于 2 def double(matched

    81210

    vim 正则表达式

    毋庸多言,在vim中正则表达式得到了十分广泛的应用。 最常用的 / 和 :s 命令中,正则表达式都是不可或缺的。 下面对vim中的正则表达式的一些难点进行说明。...这个设置也可以在正则表达式中通过 \m \M 开关临时切换。 \m 后面的正则表达式会按照 magic 处理,\M 后面的正则表达式按照 nomagic 处理, 而忽略实际的magic设置。...0个或1个(忽略优先) 从上表中可见,vim的忽略优先量词不像perl的 *? +? ?? 那样,而是统一使用 \{- 实现的。 这大概跟忽略优先量词不常用有关吧。...的写法 /\(foo\)\@正则表达式 写道 元字符 说明 . 匹配任意一个字符 [abc] 匹配方括号中的任意一个字符。...表示位置的符号 元字符 说明 $ 匹配行尾 ^ 匹配行首 \单词词首 \> 匹配单词词尾 替换变量 在正规表达式中使用 \( 和 \) 符号括起正规表达式,即可在后面使用\1、

    1.5K30

    用深度学习从非结构化文本中提取特定信息

    一个经典的例子将是一个用于电影评论或新闻数据集的幼稚情感分析工具——最简单的工作模型只能在“好”或“坏”形容词同义词和一些强调词出现的情况下运行。在我们的研究中,我们利用了这两种方法。...我们可以将一个模型定义为一个正则表达式,给出句子分解(例如,我们可以将一个短语定义为许多形容词加上一个名词),或者我们可以用NLTK中抽取的名词短语示例来教授一个带有标记的文本数量的模型。...每个单词的向量都由一些二进制特征组成,比如数字或其他特殊字符的出现(技能通常包含数字和符号:c#、Python3)、第一个字母或整个单词的大写(SQL)。...原因在于,通常简历忽略语法是为了突出经验,并给它一些结构(人们在句子开头用谓语,而不是主语,有时短语缺少适当的语法结构),很多单词都是特定的术语或名称。我们必须编写自己的POS标记器来解决上述问题。...对于给定的窗口大小n,我们取候选短语右侧的n个相邻单词和左侧的n个单词,这些单词的向量表示形式被连接到可变长度向量中,并传递到LSTM层。我们发现最优n=3。

    2.6K30

    正则表达式

    正则表达式语法 普通字符 没有特殊限定的时候匹配一个相同的字符 简单转义字符 \n换行符\t制表符\字符字符本身 标准字符集合 能够与多种字符匹配的表达式 区分大小写,大写取反 \d0~9中任一字符...任何一个字符 自定义字符集合 []匹配方式,匹配方括号中的任一字符 [ab5@]匹配"a"、"b"、"5"或"@"[^abc]匹配"a"、"b"、"c"以外的任一字符 [f-k]匹配"f"~"k"中的任一字符...[^A-F0-3]匹配"A"~"F"、"0"~"3"以外的任一字符 特殊符号,被包含到中括号中,失去特殊意义,除"^"和"-"以外 标准字符集,除小数点外,如果被包含于中括号,自定义字符集包含该集合。...字符边界 字符所处的位置,零宽(不占位) ^字符串开始$字符串结束\b单词边界(前面和后面的字符不全是\w) 正则表达式匹配模式 IGNORECASE忽略大小写模式 匹配时忽略大小写 默认情况下,区分大小写...SINGLELINE单行模式 整个文本看作一个字符串 小数点“.”可匹配任一字符,包含“\n” MULTILINE多行模式 每行都是一个字符串,都有开头和结尾 匹配开始\A,匹配结束\Z 选择符和分组

    30730

    关于NLP你还不会却必须要学会的事儿—NLP实践教程指南第一编

    ▌删除特殊字符 特殊字符和符号通常是非字母数字字符,有时甚至是数字字符,这增加了非结构化文本中的额外噪声。通常,可以使用简单的正则表达式删除它们。...我们将特别讨论演示的示例中英语语法和结构。在英语中,通常单词结合在一起形成其他组成成分。这些成分包括单词、短语、从句和句子。...Adj(ective): 形容词是用来描述或限定其他词的词,通常是名词和名词短语。“美丽的花”这个短语有名词“花”,这个名词用形容词 “美丽的” 来描述或限定。形容词的词性标记符号是 ADJ。...名词短语作为动词的主语或宾语。 动词短语(VP):此类短语是有一个动词充当头词。通常,动词短语有两种形式。有一种形式是既有动词成分,也有名词、形容词或副词等作为宾语的一部分。...介词短语(PP):这些短语通常包含介词作为前置词和其他词汇成分,如名词、代词等。这些行为就像形容词或副词,用来描述其他的词或短语。

    1.9K10

    【Python正则表达式】:文本解析与模式匹配

    # string 要匹配的字符串 # flags 标志符指定,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等 # 必须从字符串开头匹配!...在使用正则表达式时,需要根据具体情况考虑各种特殊字符和操作符的含义和使用方式,并进行适当的转义处理或括号分组。...在使用正则表达式时,需要根据具体情况考虑各种特殊字符和操作符的含义和使用方式,并进行适当的转义处理或括号分组。...# re.I 或 re.IGNORECASE:表示忽略大小写匹配 import re # 定义正则表达式,使用忽略大小写(re.I)匹配模式 pattern = r'hello' # 定义字符串 string...pattern 用于匹配字符串中的价值和货币单位,使用了 re.X 修饰符来进行可读性更好的正则表达式编写。

    20510

    正则表达式

    -9]+/匹配0-9最少一个多则不限 定位符 定位符 说明 ^ 定位开始位置字符 $ 定位结束位置字符 \b 定位单词(汉字)边界的字符 \B 限定非单词(字)边界的字符 举例1: var re=/...ok\b/  匹配ok结尾的,可以匹配imok ok拉  哇ok拉 但是不匹配okk imokk  \b是匹配单词或者汉字边界 举例2: var re=/ok\B/  匹配单词或者汉字边界不是ok的字符...,不匹配imok ha 可以匹配ABCoka  和用法相反,不匹配 ^说明:^出现在开始是标准匹配的开始;出现在[^...]的^表示不匹配方括号内的字符起否定作用....注释在之前很熟悉了,正则注释也一样帮助我们更好的去理解正则添加的标注内容 (?#这里是注释部分) 说明:如果要在正则表达式中包含注释,则最好打开“忽略模式里的空白符”选项。...一旦启用了该选项,即符号#之后的内容会全部被忽略掉。 正则表达式优先级 什么是优先级?

    93620

    一文概览NLP句法分析:从理论到PyTorch实战解读

    我们将从句法与语法的定义出发,探讨其历史背景和理论分类,介绍成分和依存两大主流的句法分析方法,并最终提供PyTorch的实战代码演示。希望这篇文章能为您在理论学习和实践应用方面提供有力的支持。...简单来说,句法就像是一个建造句子的“配方”,告诉我们如何将词汇(ingredients)合成为完整、有意义的句子(dish)。...例子 “The quick brown fox”(快速的棕色狐狸)是一个名词短语,其中“quick”和“brown”是修饰“fox”的形容词。...句法范畴(Syntactic Categories) 句法范畴是对单词或短语在句子中功能的抽象表示。常见的句法范畴包括名词(N)、动词(V)、形容词(Adj)等。...例子 名词短语(NP)是一个复合范畴,可能由名词(N)和形容词(Adj)组成,如“happy dog”。

    53810
    领券