前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Pandas | 数据读取

Pandas | 数据读取

作者头像
生信real
发布2022-12-20 09:27:18
1.1K0
发布2022-12-20 09:27:18
举报
文章被收录于专栏:Linux基础入门

本文框架

  • 0.导入Pandas
  • 1.读取csv文件
    • 1.1 查看读取前的csv数据
    • 1.2 读取数据
    • 1.3 初步数据探索
  • 2. 读取txt文件
    • 2.1 查看读取前的txt数据
    • 2.2 读取数据
  • 3. 读取excel文件

0.导入Pandas

我们在使用Pandas时,需要先将其导入,这里我们给它取了一个别名pd。

代码语言:javascript
复制
import pandas as pd

1.读取csv文件

1.1 查看读取前的csv数据

文件数据以逗号分隔。

代码语言:javascript
复制
userId,movieId,rating,timestamp
1,1,4.0,964982703
1,3,4.0,964981247
1,6,4.0,964982224
1,47,5.0,964983815
1,50,5.0,964982931
………………

1.2 读取数据

使用pd.read_csv读取数据,使用默认的标题行、逗号分隔符。

除此之外,pd.read_csv还可以读取tsv、txt文件。

代码语言:javascript
复制
## 设置文件路径
data_path = "./datas/01/ratings.csv"
## 读取csv文件
ratings = pd.read_csv(data_path)
## 查看数据前5行
ratings.head()
#   userId  movieId  rating  timestamp
#0       1        1     4.0  964982703
#1       1        3     4.0  964981247
#2       1        6     4.0  964982224
#3       1       47     5.0  964983815
#4       1       50     5.0  964982931

1.3 初步数据探索

代码语言:javascript
复制
## ①查看数据形状,返回(行数、列数)
ratings.shape
#(100836, 4)
## ②查看数据列名
ratings.columns
#Index(['userId', 'movieId', 'rating', 'timestamp'], dtype='object')
## ③查看数据索引列
ratings.index
#RangeIndex(start=0, stop=100836, step=1)
## ④查看每列的数据类型
ratings.dtypes
#userId         int64
#movieId        int64
#rating       float64
#timestamp      int64
#dtype: object

2. 读取txt文件

2.1 查看读取前的txt数据

文件数据以tab分隔,且无列名。

代码语言:javascript
复制
2019-09-10 139 92
2019-09-09 185 153
2019-09-08 123 59
2019-09-07 65 40
2019-09-06 157 98
………………

2.2 读取数据

使用pd.read_csv进行读取,指定分隔符和列名。

代码语言:javascript
复制
## 设置文件路径
data_path = "./datas/01/access_pvuv.txt"
## 读取txt文件
pvuv = pd.read_csv(
    data_path,
    sep = "\t",
    header = None,
    names=['pdate', 'pv', 'uv']
)

3. 读取excel文件

使用pd.read_excel读取xls或者xlsx文件。

代码语言:javascript
复制
## 设置文件路径
data_path = "./datas/01/access_pvuv.xlsx"
## 读取文件
pvuv = pd.read_excel(data_path)
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-10-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信百宝箱 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 本文框架
    • 0.导入Pandas
      • 1.读取csv文件
        • 1.1 查看读取前的csv数据
        • 1.2 读取数据
        • 1.3 初步数据探索
      • 2. 读取txt文件
        • 2.1 查看读取前的txt数据
        • 2.2 读取数据
      • 3. 读取excel文件
      相关产品与服务
      文件存储
      文件存储(Cloud File Storage,CFS)为您提供安全可靠、可扩展的共享文件存储服务。文件存储可与腾讯云服务器、容器服务、批量计算等服务搭配使用,为多个计算节点提供容量和性能可弹性扩展的高性能共享存储。腾讯云文件存储的管理界面简单、易使用,可实现对现有应用的无缝集成;按实际用量付费,为您节约成本,简化 IT 运维工作。
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档