近期小编也开始学习python语音,基于VSCODE开发一些数据分析,API接口导入,一直技术难点就是如何对接EXCEL中的数据,
终于在网络上总结获取到pands数据分析导入的能力,故分享给大家,谢谢
CSV,用来处理CSV文件,这个类库中的阅读器()函数用来读入CSV文件。
当CSV文件被读入后,可以利用这些数据生成一个numpy的数组,用来训练算法模型。
#!/usr/bin/python3
from csv import reader
import numpy as np
filename='pima_data.csv' #这个文件中所有数据都是数字,并且数据中不包含文件头。
with open(filename,'rt') as raw_data:
readers = reader(raw_data, delimiter=',')
x=list(readers)
data=np.array(x).astype('float')
print(data.shape)
可以使用Munpy的loadtxt()函数导入数据。
使用这个函数处理的数据没有文件头,并且所有的数据结构都是一样的,也就是说,数据类型都是一样的。
#!/usr/bin/python3
import numpy as np
filename='pima_data.csv'
with open(filename,'rt') as raw_data:
data=loadtxt(raw_data,delimiter=',')
print(data.shape)
使用熊猫来导入文件需要使用pandas.read_csv()函数。这个函数的返回值是数据帧,可以很方便地进行下一步的处理。
#!/usr/bin/python3
from pandas import read_csv
filename='iris.data.csv'
names=['separ-length','separ-width','petal-length','petal-width','class']
dataset=read_csv(filename,names=names)
print(dataset.shape)
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。