前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >《Python自然语言处理》答案第一、二章

《Python自然语言处理》答案第一、二章

作者头像
JasonhavenDai
发布于 2018-04-11 06:26:07
发布于 2018-04-11 06:26:07
1.1K00
代码可运行
举报
文章被收录于专栏:JasonhavenDaiJasonhavenDai
运行总次数:0
代码可运行

第一章

1
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
12/(4+1)
2
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
26**100
4
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
len(text2)
len(set(text2))
7
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
len(list(nltk.bigrams(text5)))
15
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[w for w in sorted(text5) if w.startswith('b')]
17
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
 def find_word(text,word):
   ...:     pos=0
   ...:     while pos<len(text):
   ...:         try:
   ...:             pos=text.index(word,pos)+1
   ...:             print(pos)
   ...:         except Exception as e:
   ...:             print('all have bean found!')
   ...:             return
   ...:
find_word(list(text9),'sunset')
22
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
fd=FreqDist(text5)
[w for (w,_) in fd.most_common() if len(w)==4]
23
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[w for w in text6 if w.isupper()]
24
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[w for w in list(text6) if w.endswith('ize') and w.find('pt')!=-1 and w[0].isupper() and w[1:].islower()]
25
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[w for w in sent if w .startswith('sh')]
[w for w in sent if len(w)>4]
28
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
def percent(word,text):
    fd=FreqDist(text)
    return '{}%'.format((fd[word])*100/len(text))

第二章

2
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
persusion==nltk.Text(nltk.corpus.gutenberg.words('austen-persuasion.txt'))
len(persusion)
len(set(persusion))
4
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cfd=ConditionalFreqDist((target,fileid[:4]) for fileid in state_union.fileids() for word in
 state_union.words(fileid) for target in ['men','women','people'] if target == word.lower()
)                                                                                          
8
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
male_names=names.words('male.txt')
female_names=names.words('female.txt')
fd_male=nltk.FreqDist(male_names)
fd_female=nltk.FreqDist(female_names)
cfd=nltk.ConditionalFreqDist((fd_male[name],name[0]) 
for fileid in names.fileids() 
for name in names.words(fileid) 
    if fd_male[name]>fd_female[name])
12
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
len(set(w for (w,p) in cmudict.entries()))
fd=FreqDist([len(pron) for (word,pron) in cmudict.entries()])
fd.most_common()[0][1]/len(cmudict.entries())
15
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
fd=FreqDist(brown.words())
[w for (w,_) in fd.most_common() if fd[w]>3]
16
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
 def word_diversity(words):
    ...:     return len(words)/len(set(words))
for category in brown.categories():
    ...:     diversity=word_diversity(brown.words(categories=category))
    ...:     print('%s\t%.2f'%(category,diversity))
17
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
def fun(text):                                                                    
    fd=FreqDist([w.lower() for w in text if w not in stopwords.words('english')]) 
    return [w for (w,_) in fd.most_common()[:50]]                                 
18
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
 def fun(text):
    ...:     fd=FreqDist([(w1,w2) for (w1,w2) in bigrams(text) if w1 not in stopwords.words('english') and w2 not in stopwords.words('english')])
    ...:     return [w for w in fd.most_common()[:50]]
20
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
def word_freq(text,word):
    ...:     count=nltk.Text(text).count(word)
    ...:     return count/len(text)

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018.01.21 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
NLP自然语言处理002:NLTK中的语料和词汇资源
import nltk 直接获取语料库的所有文本:nltk.corpus.gutenberg.fileids()
李玺
2021/11/22
6780
NLP自然语言处理002:NLTK中的语料和词汇资源
【Python环境】Python自然语言处理系列(1)
一:python基础,自然语言概念 from nltk.book import* 1,text1.concordance("monstrous") 用语索引 2,text1.similar("best") 3,text2.common_contexts(["monstrous","very"]) 4,text4.dispersion_plot(["citizens","democracy", "freedom", "duties","America"]) 5,text3.generate() 6,
陆勤_数据人网
2018/02/27
9070
【Python环境】Python自然语言处理系列(1)
NLTK-005:分类和标注词汇
之前大家也肯定学过名字、动词、形容词、副词之间的差异,这些词类不是闲置的,而是对许多语言处理任务都有用的分类,正如我们将看到的,这些分类源于对文本中词的分布的简单的分析。
李玺
2021/11/22
6320
NLTK-005:分类和标注词汇
Python NLTK 自然语言处理入门与例程
那么 NLP 到底是什么?学习 NLP 能带来什么好处?
Sepmer Fi
2018/02/23
6.2K1
NLTK-007:分类文本(文档情感分类)
之前我们看了几个例子,那里文档已经按类别标记。使用这些语料库,我们可以建立分类器。自动给新文档添加适当的类别标签。 首先我们构造一个标记了相应类别的文档清单,对于这个例子,我选择了nltk中的电影评论语料库,将每个评论分为正面或者负面。
李玺
2021/11/22
4220
NLTK-007:分类文本(文档情感分类)
自然语言处理| NLTK库的详解
自然语言处理(natural language processing)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。
润森
2019/08/29
7K0
自然语言处理| NLTK库的详解
整理了25个Python文本处理案例,收藏!
Python 处理文本是一项非常常见的功能,本文整理了多种文本提取及NLP相关的案例,还是非常用心的
周萝卜
2022/02/10
2K0
Python NLTK解读
自然语言处理工具包(Natural Language Toolkit,简称NLTK)是一个用于处理人类语言数据的强大工具包。它提供了丰富的语言处理功能,包括文本分析、词性标注、语法分析、语料库管理等。本教程将介绍如何使用NLTK来处理文本数据,进行各种自然语言处理任务。
Michel_Rolle
2024/01/31
2.7K0
学习笔记CB001:NLTK库、语料库、词概率、双连词、词典
聊天机器人知识主要是自然语言处理。包括语言分析和理解、语言生成、机器学习、人机对话、信息检索、信息传输与信息存储、文本分类、自动文摘、数学方法、语言资源、系统评测。
利炳根
2018/02/12
1.6K0
Python 数据科学入门教程:NLTK
欢迎阅读自然语言处理系列教程,使用 Python 的自然语言工具包 NLTK 模块。
ApacheCN_飞龙
2022/12/01
4.5K0
Python 数据科学入门教程:NLTK
【自然语言处理篇】--以NLTK为基础讲解自然语⾔处理的原理和基础知识
Python上著名的⾃然语⾔处理库⾃带语料库,词性分类库⾃带分类,分词,等等功能强⼤的社区⽀持,还有N多的简单版wrapper。
LhWorld哥陪你聊算法
2018/09/13
1.2K0
【自然语言处理篇】--以NLTK为基础讲解自然语⾔处理的原理和基础知识
自然语言处理基础知识1. 分词(Word Cut)2. 词性标注(POS Tag)3.自动标注4.文本分类5.评估6.从文本提取信息7.分析句子结构《python自然语言处理》各章总结:
1. 分词(Word Cut) 英文:单词组成句子,单词之间由空格隔开 中文:字、词、句、段、篇 词:有意义的字组合 分词:将不同的词分隔开,将句子分解为词和标点符号 英文分词:根据空格 中文分词:三类算法 中文分词难点:歧义识别、未登录词 中文分词的好坏:歧义词识别和未登录词的识别准确率 分词工具:Jieba,SnowNLP,NlPIR,LTP,NLTK 2. 词性标注(POS Tag) 词性也称为词类或词汇类别。用于特定任务的标记的集合被称为一个标记集 词性:词类,词汇性质,词汇的语义
JasonhavenDai
2018/04/11
9K0
自然语言处理基础知识1. 分词(Word Cut)2. 词性标注(POS Tag)3.自动标注4.文本分类5.评估6.从文本提取信息7.分析句子结构《python自然语言处理》各章总结:
NLTK-003:词典资源
词典或者词典资源的意思是一个 词或短语 以及一些相关信息的集合。例如:词性和词意定义等相关信息。词典资源附属于文本,通常在文本的帮助下创建和丰富。
李玺
2021/11/22
5300
NLTK-003:词典资源
使用Python中的NLTK和spaCy删除停用词与文本标准化
【磐创AI 导读】:本文介绍了如何使用Python中的NLTK和spaCy删除停用词与文本标准化,欢迎大家转发、留言。想要更多电子杂志的机器学习,深度学习资源,大家欢迎点击上方蓝字关注我们的公众号:磐创AI。
磐创AI
2019/09/09
4.4K0
使用Python中的NLTK和spaCy删除停用词与文本标准化
NLTK文本整理和清洗示例代码
from nltk.tokenize import regexp_tokenize
用户7886150
2020/12/27
8870
学习笔记CB002:词干提取、词性标注、中文切词、文档分类
英文词干提取器,import nltk,porter = nltk.PorterStemmer(),porter.stem('lying') 。
利炳根
2018/02/13
2K0
使用 spacy 进行自然语言处理(一)
自然语言处理(NLP) 是人工智能方向一个非常重要的研究领域。 自然语言处理在很多智能应用中扮演着非常重要的角色,例如:
ke1th
2019/05/26
1.7K0
NLP自然语言处理001:NLTK入门
准备写一个系统的nlp入门博客,就从 nltk 开始把。 NLTK:Natural Language Toolkit,自然语言处理工具包,在NLP领域中,最常使用的一个Python库。
李玺
2021/11/22
7390
NLP自然语言处理001:NLTK入门
Python NLTK 情感分析不正确
一位 Reddit 用户使用 Python 的 NLTK 库来训练一个朴素贝叶斯分类器以研究其他句子的情感,但是无论输入什么句子,分类器总是预测为正面。
用户11021319
2024/07/29
1210
Python NLTK 情感分析不正确
Python NLP入门教程
目录[-] 本文简要介绍Python自然语言处理(NLP),使用Python的NLTK库。NLTK是Python的自然语言处理工具包,在NLP领域中,最常使用的一个Python库。 什么是NLP? 简单来说,自然语言处理(NLP)就是开发能够理解人类语言的应用程序或服务。 这里讨论一些自然语言处理(NLP)的实际应用例子,如语音识别、语音翻译、理解完整的句子、理解匹配词的同义词,以及生成语法正确完整句子和段落。 这并不是NLP能做的所有事情。 NLP实现 搜索引擎: 比如谷歌,Yahoo等。谷歌搜索引擎
jhao104
2018/03/20
3K0
Python NLP入门教程
推荐阅读
相关推荐
NLP自然语言处理002:NLTK中的语料和词汇资源
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验