首页
学习
活动
专区
圈层
工具
发布
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    干货分享|如何用“Pandas”模块来做数据的统计分析!!

    pd.read_csv("Churn_Modelling.csv") marketing = pd.read_csv("DirectMarketing.csv") 我们先从一个简单的例子着手来看, customer[['Geography...','Gender','EstimatedSalary']].groupby(['Geography','Gender']).mean() ?...这一类的预估工资的平均值达到了99564欧元,“男性”达到了100174欧元 当然除了求平均数之外,我们还有其他的统计方式,比如“count”、“min”、“max”等等,例如下面的代码 customer[['Geography...','Gender','EstimatedSalary']].groupby(['Geography','Gender']).agg(['mean','count','max']) ?...当然我们也可以对不同的列采取不同的统计方式方法,例如 customer[['Geography','EstimatedSalary','Balance']].groupby('Geography').agg

    1.1K20

    Python中用PyTorch机器学习神经网络分类预测银行客户流失模型|附代码数据

    类似地,Geography和Gender是分类列,因为它们含有分类信息,如客户的位置和性别。有几列可以视为数字列和类别列。例如,该HasCrCard列的值可以为1或0。...其中列的其余部分,Geography,Gender,HasCrCard,和IsActiveMember列可以被视为类别列。让我们创建这些列的列表:除该列外,其余所有列均可视为数字列。...例如,让我们绘制列的前五行,Geography并输出前五行的代码值:输出: 0 France1 Spain2 France3 France4 SpainName: Geography...例如,在该Geography列中,我们看到法国用0表示,德国用1表示。我们可以使用这些值来训练我们的模型。但是,更好的方法是以N维向量的形式表示分类列中的值,而不是单个整数。...例如,对于该Geography列,唯一值的数量为3。该Geography列的相应嵌入大小将为3/2 = 1.5 = 2(四舍五入)。

    1.5K20

    Python中用PyTorch机器学习分类预测银行客户流失模型

    类似地,Geography和Gender是分类列,因为它们含有分类信息,如客户的位置和性别。有几列可以视为数字列和类别列。例如,该HasCrCard列的值可以为1或0。...其中列的其余部分,Geography,Gender,HasCrCard,和IsActiveMember列可以被视为类别列。让我们创建这些列的列表: 除该列外,其余所有 列均可视为数字列。...例如,让我们绘制列的前五行,Geography并打印前五行的代码值: 输出: 0 France1 Spain2 France3 France4 SpainName: Geography...例如,在该Geography列中,我们看到法国用0表示,德国用1表示。我们可以使用这些值来训练我们的模型。但是,更好的方法是以N维向量的形式表示分类列中的值,而不是单个整数。...例如,对于该Geography列,唯一值的数量为3。该Geography列的相应嵌入大小将为3/2 = 1.5 = 2(四舍五入)。

    2.7K11

    Python中用PyTorch机器学习神经网络分类预测银行客户流失模型|附代码数据

    类似地,Geography和Gender是分类列,因为它们含有分类信息,如客户的位置和性别。有几列可以视为数字列和类别列。例如,该HasCrCard列的值可以为1或0。...其中列的其余部分,Geography,Gender,HasCrCard,和IsActiveMember列可以被视为类别列。让我们创建这些列的列表:除该列外,其余所有列均可视为数字列。...: Geography, dtype: category Categories (3, object): [France, Germany, Spain] 以下脚本在该列的前五行中绘制了值的代码Geography...例如,在该Geography列中,我们看到法国用0表示,德国用1表示。我们可以使用这些值来训练我们的模型。但是,更好的方法是以N维向量的形式表示分类列中的值,而不是单个整数。...例如,对于该Geography列,唯一值的数量为3。该Geography列的相应嵌入大小将为3/2 = 1.5 = 2(四舍五入)。

    1.8K00
    领券