首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Pandas | 数据读取

Pandas | 数据读取

作者头像
生信real
发布2022-12-20 09:27:18
发布2022-12-20 09:27:18
1.4K00
代码可运行
举报
文章被收录于专栏:Linux基础入门Linux基础入门
运行总次数:0
代码可运行

本文框架

  • 0.导入Pandas
  • 1.读取csv文件
    • 1.1 查看读取前的csv数据
    • 1.2 读取数据
    • 1.3 初步数据探索
  • 2. 读取txt文件
    • 2.1 查看读取前的txt数据
    • 2.2 读取数据
  • 3. 读取excel文件

0.导入Pandas

我们在使用Pandas时,需要先将其导入,这里我们给它取了一个别名pd。

代码语言:javascript
代码运行次数:0
运行
复制
import pandas as pd

1.读取csv文件

1.1 查看读取前的csv数据

文件数据以逗号分隔。

代码语言:javascript
代码运行次数:0
运行
复制
userId,movieId,rating,timestamp
1,1,4.0,964982703
1,3,4.0,964981247
1,6,4.0,964982224
1,47,5.0,964983815
1,50,5.0,964982931
………………

1.2 读取数据

使用pd.read_csv读取数据,使用默认的标题行、逗号分隔符。

除此之外,pd.read_csv还可以读取tsv、txt文件。

代码语言:javascript
代码运行次数:0
运行
复制
## 设置文件路径
data_path = "./datas/01/ratings.csv"
## 读取csv文件
ratings = pd.read_csv(data_path)
## 查看数据前5行
ratings.head()
#   userId  movieId  rating  timestamp
#0       1        1     4.0  964982703
#1       1        3     4.0  964981247
#2       1        6     4.0  964982224
#3       1       47     5.0  964983815
#4       1       50     5.0  964982931

1.3 初步数据探索

代码语言:javascript
代码运行次数:0
运行
复制
## ①查看数据形状,返回(行数、列数)
ratings.shape
#(100836, 4)
## ②查看数据列名
ratings.columns
#Index(['userId', 'movieId', 'rating', 'timestamp'], dtype='object')
## ③查看数据索引列
ratings.index
#RangeIndex(start=0, stop=100836, step=1)
## ④查看每列的数据类型
ratings.dtypes
#userId         int64
#movieId        int64
#rating       float64
#timestamp      int64
#dtype: object

2. 读取txt文件

2.1 查看读取前的txt数据

文件数据以tab分隔,且无列名。

代码语言:javascript
代码运行次数:0
运行
复制
2019-09-10 139 92
2019-09-09 185 153
2019-09-08 123 59
2019-09-07 65 40
2019-09-06 157 98
………………

2.2 读取数据

使用pd.read_csv进行读取,指定分隔符和列名。

代码语言:javascript
代码运行次数:0
运行
复制
## 设置文件路径
data_path = "./datas/01/access_pvuv.txt"
## 读取txt文件
pvuv = pd.read_csv(
    data_path,
    sep = "\t",
    header = None,
    names=['pdate', 'pv', 'uv']
)

3. 读取excel文件

使用pd.read_excel读取xls或者xlsx文件。

代码语言:javascript
代码运行次数:0
运行
复制
## 设置文件路径
data_path = "./datas/01/access_pvuv.xlsx"
## 读取文件
pvuv = pd.read_excel(data_path)
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-10-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信百宝箱 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 本文框架
    • 0.导入Pandas
    • 1.读取csv文件
      • 1.1 查看读取前的csv数据
      • 1.2 读取数据
      • 1.3 初步数据探索
    • 2. 读取txt文件
      • 2.1 查看读取前的txt数据
      • 2.2 读取数据
    • 3. 读取excel文件
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档