于是乎,自己也仿照着,来理一理红楼里的那些关系 ? ” 憋慌,这绝对不是你想象的那样的文章 ?...01.准备 红楼TXT版本电子书一本 红楼人物小全一份(之所以叫小全,是因为只包括宝玉和十二钗) 安装好Python3并且安装pandas和pycharts库 找个夜黑风高,无人打扰的夜晚(毕竟这是个技术活...最后的最后,撸完代码,又有重新再看一遍红楼梦的冲动了,冲鸭!
專 欄 ❈楼宇,Python中文社区专栏作者。一位正在海外苦苦求学的本科生。初中时自学编程,后来又在几位良师的帮助下走上了计算机科学的道路。曾经的 OIer,现暂时弃坑。...(文章:用机器学习判定红楼梦后40回是否曹雪芹所写)作者的结论是后四十回的用词和前八十回有明显的差距。...考虑到版权问题,我决定不提供《红楼梦》原文。如果想复现实验结果的话,可以去找小说网站下载。(更新:根据网友提醒,《红楼梦》因为作者去世远远超过 100 年而进入公有领域,不受版权限制。...也可在这里获取《红楼梦》全文:紅樓夢 - 维基文库,自由的图书馆。) 2 文本预处理 这一步很基础,就不赘述了。...最后,我使用了 Ukkonen 算法快速地创建了整篇《红楼梦》的后缀树(用专业的语言描述 Ukkonen 算法的速度:它的时间复杂度是 O(n))。
專 欄 ❈楼宇,Python中文社区专栏作者。一位正在海外苦苦求学的本科生。初中时自学编程,后来又在几位良师的帮助下走上了计算机科学的道路。曾经的 OIer,现暂时弃坑。...知乎:https://www.zhihu.com/people/lou-yu-54-62/posts GitHub:https://github.com/LouYu2015❈ 用 Python 分析《红楼梦...》(1) 用 Python 分析《红楼梦》(2) 9.3 再次分析 在之前的分析中我们发现,“笑道”这个词似乎和情节的关系比较大,并且严重影响到了我们的分析。...总之,我有点把握认为《红楼梦》前 80 回和后 40 回的用词是有一些差异的,不过因为难以排除剧情的影响,所以我对于作者是不是同一个人这个问题还不敢下定论。
專 欄 ❈楼宇,Python中文社区专栏作者。一位正在海外苦苦求学的本科生。初中时自学编程,后来又在几位良师的帮助下走上了计算机科学的道路。曾经的 OIer,现暂时弃坑。...知乎:https://www.zhihu.com/people/lou-yu-54-62/posts GitHub:https://github.com/LouYu2015❈ 用 Python 分析《红楼梦...此外,我们还发现《红楼梦》中的人物很爱笑,因为除了人名以外出现次数最多的单词就是“笑道” : ) 我把完整的词频表做成了一个网页,感兴趣的话可以去看一下:红楼词表 第二版 最后,我随机选择了词频表中的...根据估算的词频表中正确单词的比例,我估计《红楼梦》的词汇量大约是 1.6 万。...[转载]白坤峰讲红楼梦(172)贾府鼎盛:该来的都来了史鼎说红楼新浪博客 也许“笑道”这一看似平常的词汇确实侧面反应了贾府的兴衰史呢。
test_txt = '/home/zcm/tensorf/siamfc-tf-master/data/Biker/groundtruth.txt' def l...
前面跟大家简单介绍过Python提取多个pdf首页合并输出,还有Python轻松处理Excel。...有位粉丝留言python能不能从文献中提取特定的数字,希望能出一个教程,那么今天我们就来聊一聊如何用python读paper,提取特定的数字。...import re #打开要读的pdf文件 pdfFileObj = open('meetingminutes.pdf', 'rb') #生成pdf对象 pdfReader = PyPDF2.PdfFileReader...处理word涉及到的两个概念paragraph和run在《python让繁琐工作自动化》这本书中有详细介绍,大家感兴趣可以下去仔细读一下。...这个任务中用到的代码均出自于我前面提到《python让繁琐工作自动化》这本书。 参考资料: Python提取多个pdf首页合并输出 python让繁琐工作自动化
使用读文件过滤空行和注释行 import re file=open("1",'r') a=file.readlines() a.sort() for line in a:
with open('log.txt','rb') as fd: for i in fd: offs=-5 while True: ...
由于项目需求,需要从传感器节点和GPS中读取数据,所以学习了如何用python读串口。...python提供了pySerial,Linux和windows下有相应的模块 linux版本: pyserial (http://pyserial.wiki.sourceforge.net/pySerial...serial.Serial('/dev/ttyTX0', 9600, timeout=1) while True: data = ser.read(100) print repr(data) 1、读串口步骤
在Python中,读文件的命令有如下的三个: read() readline() readlines() 1、read() read()函数是一次性的读入方式,读入的是文件的整个内容
然而,今天以改变世界为己任的的技术团队,和几百年前以满足主人需求为存在意义的女仆团队,其实有颇多共同之处——不信我们来一起翻翻《红楼梦》。...《红楼梦》这种伟大作品的力量,这样历经世代盛衰的人,看透了人性和世态炎凉之后的泣血之作,则可以穿越时空,以为今天的教训。 每个人都只有一个人生可以经历,却可以借助他人著作去体会不同的人生。
写在前面 在上一篇文章,我们借用jieba分词工具,提取了《红楼梦》120回中的出现次数较高的词,然后用词云工具将结果画了出来。...这一次我们将会更细致分析红楼梦,而且由于jieba分词工具是基于现代白话文而进行分词,可能对红楼梦这种半白半古的文风分析起来有偏差。这里我们借鉴知乎的一篇文章,手动建立分词。...为了查看分词随着章节的变化,除了分析整本红楼梦,我们还将红楼梦120章回分开来,逐章进行分词分析。...作为红楼梦中的搞笑担当,刘姥姥的出场三个阶段十分明显,第6回刘姥姥一进荣国府、39回刘姥姥是信口开河、41回刘姥姥醉卧怡红院、113回忏宿冤凤姐托村妪。...后语 我们用文本分析方法,窥见了红楼梦中一些主要信息和情节变化。欢迎大家留言讨论,说出自己感兴趣的文本素材,比如小说,朋友圈,微博等等。
如果让爆火的人工智能聊天机器人ChatGPT续写《红楼梦》后四十回,会得到什么样的结局呢? 2月7日晚,潇湘晨报记者联系到已经有两个月使用经验的范先生,他向记者分享了自己与ChatGPT的探讨历程。...两次结局大不相同,但仍不乏“槽点” “我两次提出如何续写《红楼梦》后四十回,它竟给出了不同的答案。”
在Python中,读文件的命令有如下的三个: read() readline() readlines() 1、read() read()函数是一次性的读入方式,读入的是文件的整个内容,并将其赋值给一个字符串
红楼梦出场人物很多,人物关系极其复杂,这次我们用Python来分析主人公贾宝玉和他的姐妹们,金陵十二钗之间的关系,做一个简要的分析。...第二个是红楼梦人物有多个表达方式,最常见的是文本中有时候会给人物加上姓,如林黛玉;有时候不带上姓,如黛玉。还有贾元春有时候叫贾妃,元妃等: ?...我们使用Python中Echarts将人物关系网画出来: ? 这里圆圈的大小代表人物出场的频率,通过将鼠标发在两个人物之间的边上面,可以显示人物之间关联的次数: ?...在这里你可以看到红楼梦几乎所有人物和关键地点之间的联系。 用鼠标点击人物头像后会出现相关介绍: ? 也可以看到和其他人物之间的关系,和这个人物的主要事件: ?...可谓是非常详尽了,用来辅助读红楼梦是再好不过了。
python中和json读写相关的主要是json模块的以下四个函数 dumps() 将一个python对象编码为json对象 loads() 讲一个json对象解析为python对象 dump() 将...python对象写入文件 load()从文件中读取json数据 1、dumps()和loads()主要用于Python和json对象的相互转化。..."ACME": 45.23, "AAPL": 612.78, "IBM": 205.55, "HPQ": 37.2, "FB": 10.75}' ''' b = json.loads(a) #解码为python
下载数据集请登录爱数科(www.idatascience.cn) 该数据集包含红楼梦小说的文本内容。 1. 字段描述 2. 数据预览 3. 字段诊断信息 4. 数据来源
问题或建议,请公众号留言或加本人微信; 如果你觉得文章对你有帮助,欢迎加微信交流 今天,一起用 Python 来理一理红楼梦里的那些关系 不要问我为啥是红楼梦,而不是水浒三国或西游,因为我也鉴定的认为,...红楼才是无可争议的中国古典小说只巅峰,且不接受反驳!...而红楼梦也是我多次反复品读的为数不多的小说,对它的感情也是最深的。 好了,不酸了,开干。...数据准备 红楼梦 TXT 文件一份 金陵十二钗 + 贾宝玉 人物名称列表 人物列表内容如下: 宝玉 nr 黛玉 nr 宝钗 nr 湘云 nr 凤姐 nr 李纨 nr 元春 nr 迎春 nr 探春 nr...数据处理 读取数据并加载词典 with open("红楼梦.txt", encoding='gb18030') as f: honglou = f.readlines()
最基本的读文件方法:# File: readline-example-1.pyfile = open("sample.txt")while 1: line = file.readline()...在我的机器上读10M的sample.txt文件,每秒大约读32000行2....事实证明,用同样的数据测试,它每秒可以读96900行数据!效率是第一种方法的3倍,第二种方法的7倍!...———————————————————————————————————————————————————————————— 在Python 2.2以后,我们可以直接对一个file对象使用for循环读每行数据...:# File: readline-example-5.pyfile = open("sample.txt")for line in file: pass # do something而在Python
# file.write(b'aaa') # file.close() # file = open('text.txt') # print(file.read()) # file.close() 参考python...open 关于读、写、追加的总结
领取专属 10元无门槛券
手把手带您无忧上云