python作为一门高级编程语言,它的定位是优雅、明确和简单。阅读Python编写的代码感觉像在阅读英语一样,这让使用者可以专注于解决问题而不是去搞明白语言本身。Python虽然是基于C语言编写,但是摒弃了C中复杂的指针,使其变得简明易学。并且作为开源软件,Python允许对代码进行阅读,拷贝甚至改进。这些性能成就了Python的高效率,有“人生苦短,我用Python”之说,是一种十分精彩又强大的语言。
Pandas的使用续:
4. 数据清理
enron_df_cleaned = enron_df.replace('NaN',0.0)
前面一个参数是需要寻找的字符,后面的是要替换上去的。
5. 数据读取
默认读取方式:df[col_name][row_name]或df.iloc[row_num,col_num]
(注意不是df[col_name,row_name])
(用iloc时,是先行后列,这与直接用括号索引时相反)
读取某一列:df.values[:,i]或df[col_name]或pd.loc['row_name']
(注意前者不能用列的名字)
读取某一行:df.values[i,:]或df.T.[row_name]
(注意前者不能用行的名字)
读取某几列:df.values[:,i:j]
(从第i列开始到j-1列结束,共j-i列)
读取某几行:df.values[i-j,:]
(从第i行开始到j-1列结束,共j-i行)
按照逻辑读取:
比如一个这样的DataFrame:
要读取a等于1的元素所在的那一行:
要读取a等于1的元素所在的那一列:
df.values[:,df['a']==1]
要读区a中大于1的那几行:
6. 描述数据
groupby和describe(参见数据分析入门课程笔记)
groupby可结合max(),min(),count()等函数使用
numpy的使用:
numpy[0] 是返回numpy的第一行而非第一列
如果要访问第一列:numpy[:,0]
(这与DataFrame相反)
reshape函数:没有仔细研究,现在知道的是:
reshape(-1,1)可以把形如
array([3,3,3,3])
变成:
其它:
append只能添加一个元素
zip函数很好用
开始学注意几点:
1.代码规范,这本身就是一个非常好的习惯,如果开始不养好好的代码规划,以后会很痛苦
2.多动手,少看书,很多人学Python就一味的看书,这不是学数学物理,你看例题可能就会了,学习Python主要是学习编程思想。这里还是要推荐下小编的Python学习裙:‘’五八八,零九零,九四二‘’不管你是小白还是大牛,小编我都欢迎,不定期分享干货,包括小编自己整理的一份2018最新的Python资料和0基础入门教程,欢迎初学和进阶中的小伙伴。在不忙的时间我会给大家解惑。
3.勤练习,学完新的知识点,一定要记得如何去应用,不然学完就会忘,学我们这行主要都是实际操作。
4.学习要有效率,如果自己都觉得效率非常低,那就停不停,找一下原因,去问问过来人这是为什么
如果对于这块有任何不懂的问题可以随时来问我,我对于学习方法,系统学习规划,还有学习效率这些曾经研究的很深,希望可以帮助大家少走弯路
领取专属 10元无门槛券
私享最新 技术干货