腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1680)
视频
沙龙
1
回答
sklearn.linear_model.Lasso
能否
识别
pandas
数据
帧
中
的
分类
数据类型
?
、
、
我想在sklearn中使用套索回归来运行我
的
数据
。我
的
dataframe
中
的
所有属性都是数字类型(数字,我
的
意思是它们都是整数)。但它们
中
的
一些显然应该是
分类
的
(例如,我
的
dataframe
中
的
“race”属性是一个具有三个值1,2,3
的
属性,其中每个值代表一个种族)。我所做
的
是首先使用astype('str'
浏览 12
提问于2020-05-20
得票数 1
回答已采纳
1
回答
识别
非
分类
特征
、
、
、
我有一个这样
的
数据
帧
: A B C2 9978 B 3 5 D 如你所见,B栏不是
分类
的
。我如何使用sklearn或
pandas
来
识别
非
分类
数字/回归特征?
浏览 6
提问于2021-07-21
得票数 0
3
回答
在
数据
帧
连接时保留
分类
数据类型
、
、
我有两个
数据
帧
,它们具有相同
的
列名和
数据类型
,如下所示:B category每个
数据
帧
中
的
类别并不相同当正常连接时,
pandas
输出:B object这是根据
的
预期行为。但是,我希望保持<em
浏览 48
提问于2017-08-12
得票数 17
回答已采纳
1
回答
包含空值
的
分类
数据
到R因子
的
Rpy2转换
、
、
、
、
我有一个
pandas
数据
帧
,它有一个包含NaN值
的
分类
列,例如:g 2 Cdtype: category在
pandas
中
,NaN不是一个类别,
浏览 2
提问于2018-11-15
得票数 0
1
回答
用
Pandas
‘范畴’dtype和sklearn
、
、
、
在滑雪板
中
是否支持直接使用熊猫
的
分类
数据类型
来拟合模型?据我所见,sklearn不支持这种
数据类型
,这是不幸
的
,因为
分类
数据类型
既编码
分类
数据
,又包含
数据
的
映射方案。此外,
分类
编码纯粹是一个
数据
处理/处理问题,因此由
Pandas
来处理似乎更自然。我意识到在
Pandas
和sklearn中有几
浏览 3
提问于2015-06-15
得票数 16
回答已采纳
1
回答
如何解决Get_dummies造成
的
内存错误
、
、
我正在使用Python,我有大约100万条记录和大约50列
的
数据
集。其中一些列有不同
的
类型(例如IssueCode列可以有7000个不同
的
代码,另一个列SolutionCode可以有1000个代码)但这导致了内存错误错误。行,在_get_dummies_1d dummy_mat = np.eye(number_of_cols,dtype=dtype).take(代码,axis=0)
中
浏览 0
提问于2019-08-14
得票数 3
回答已采纳
1
回答
如何让SK学习
分类
器接受2D数组作为预测
的
输入?
、
、
、
因此,我创建了一个混合
数据类型
的
模型,并使用SK Learn Docs
中
推荐
的
示例,使用列转换器来构建
分类
器。由于输入来自csv,并被转换为
Pandas
Dataframe,因此看起来X_test、X_train、y_test、y_train也都是
数据
帧
。然而,我想托管这个模型,Google cloud ML引擎接受预测请求API
中
的
2D实例数组。如何让我
的
分类
器适应并接受输入数组
浏览 2
提问于2018-12-23
得票数 0
1
回答
是否可以使用
pandas
(如SQL)设置最大字符串长度
、
使用
pandas
将列设置为字符串
数据类型
很容易,无论是在
数据
帧
中
读取列时,还是在创建列时。我应该注意到,
分类
不会起作用,因为几乎每一行都有不同
的
值。正在读取:之后:在SQL
中
,您可以设置列
的</
浏览 12
提问于2020-02-26
得票数 0
1
回答
Pandas
在合并两个
数据
帧
和某些列
的
值时不会继续
、
、
、
、
我尝试在
pandas
中使用left merge在公共列上将两个
数据
帧
组合在一起,只有当我这样做时,我合并
的
数据
不会继续,而是提供NaN值。这是我
的
第一个dateframe头文件,它是程序
的
输出 ? 这是我
的
第二个
数据
帧
头。第二个df是一个“关键”文档,用于将第一个输出与其正确
的
id/品味/等进行匹配,并且它们共享相同
的
日期/主题/过程
浏览 18
提问于2020-11-06
得票数 0
2
回答
将pands.read_json
数据类型
对象转换为整数/数字
、
我正在尝试将JSON字符串转换为
pandas
数据
帧
。虽然如果没有“缺失值”(如空格或'NA'),
pandas
.read_json可以推断
数据类型
,但如果值中有空格,它会将列
分类
为dtype object。我想知道是否有一种有效
的
方法来做到这一点,而不必遍历列表
中
的
每个字典。
浏览 55
提问于2019-12-12
得票数 0
3
回答
Python
pandas
:合并丢失
分类
列
、
、
、
、
我正在处理
分类
数据
的
大型DataFrames,我发现当我在两个
数据
帧
上使用
pandas
.merge时,
分类
数据
的
任何列都会自动向上转换为更大
的
数据类型
。(这会极大地增加RAM消耗。)下面是一个简单
的
例子来说明:import
pandas
df1 =
pandas
.Dat
浏览 1
提问于2015-03-26
得票数 13
4
回答
构建多元回归模型会抛出错误:‘`
Pandas
data cast to numpy dtype of object。使用np.asarray( data ).`检查输入
数据
、
、
、
我有一些
分类
预测因子(即变量)为0& 1
的
pandas
数据
帧
,以及一些数值变量。当我把它放到一个stasmodel
中
时:它抛出:在此之后,所有
数据
<
浏览 0
提问于2015-11-21
得票数 34
2
回答
如何在列
的
数据类型
将是字典
的
情况下创建
pandas
数据
框架?
、
有没有办法创建一个由两列组成
的
pandas
数据
帧
?第一列
的
数据类型
是int,第二列
的
数据类型
是字典。然后迭代地将
数据
插入到
数据
帧
中
。
浏览 0
提问于2018-07-29
得票数 0
1
回答
将熊猫
数据
转换成稀疏数组
、
将混合列类型
的
熊猫
数据
帧
--数值、序数和
分类
--转换为稀疏数组是机器学习
中
的
一个核心问题。现在,如果我
的
熊猫
的
数据
框架只包含数字
数据
,那么将
数据
框架转换为稀疏
的
csr矩阵:如果我
的
数据
框架由顺序
数据类型
组成,我可以使用来处理它们lambda x: d[x.n
浏览 4
提问于2020-05-18
得票数 2
1
回答
两列
的
冗余或功能依赖
、
作为一个
数据
分析
的
初学者,我要求你不要对这个问题有太多
的
判断。 我正在寻找是否有一种标准
的
方法(功能?)在
Pandas
模块
中
识别
列
的
冗余。例如,特别是对于
分类
数据类型
,如果一个列是另一个列
的
函数,则可以认为它是多余
的
,并且可以在不损失任何预测能力
的
情况下忽略它。我不愿自己执行任何重型机械,但使用常识
的
方法,因此是我
的
问题。我想相
浏览 0
提问于2020-03-12
得票数 2
回答已采纳
1
回答
Python -为csv/xls文件生成avro架构
、
、
、
、
我有一个XLS/CSV文件,我正在将其读取到
pandas
数据
帧
中
。我想从这个
数据
帧
中生成一个avro模式。我想从这个
数据
框
中
动态生成一个avro模式。请帮帮忙
浏览 14
提问于2019-10-21
得票数 1
回答已采纳
2
回答
ValueError:未能将字符串转换为浮点型:'thal‘
、
所以我看了一个用户提供
的
关于心脏病
分类
的
教程。在学习教程
的
过程
中
,我遇到了一个问题,并且找不到解决方案。我收到一个错误:"ValueError:无法将字符串转换为浮点型:'thal'“。这是dataset 下面是程序: import tensorflow as tfimport numpy as np import matplotlib.pyplot
浏览 6
提问于2019-03-02
得票数 0
回答已采纳
1
回答
如何从
pandas
数据
帧
中
另一列
的
多个值创建列
中
的
值列表?
、
我有一个包含以下值
的
数据
帧
: filename, keyword, pageA, red, 2B, red, 1C, greenfilename, keywords, pagesB, [red, green], [1] C, [green], [2] 在
Pandas
中有没有简单
的
方法来做到这一点如果列表不允许作为单元格值,是否有其他
数据类型
可以使用
Pandas
浏览 5
提问于2020-10-26
得票数 0
1
回答
减少潘达斯
的
内存足迹?
、
、
、
、
刚刚启动了一个木星终端并将一个Excel文件(~12 an )加载到
Pandas
Dataframe
中
>> import resource>> import
pandas
as pd >> df = pd.read_excel('/var/www/temp_test_files/stackoverflow_survey_2016
浏览 5
提问于2017-02-23
得票数 1
3
回答
PySpark -显示
数据
帧
中
列
数据类型
的
计数
、
、
我如何查看Spark dataframe
中
每种
数据类型
的
计数,就像我使用
pandas
数据
帧
一样?例如,假设df是一个
pandas
数据
帧
:<class '
pandas
.core.frame.DataFrame'>**dtypes: floa
浏览 16
提问于2018-08-03
得票数 4
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
这样做能让你的 pandas 循环加快 71803 倍
10招!看骨灰级Pythoner如何玩转Python
100天学习计划 | 一份详实的数据科学指南
Python一行命令生成数据分析报告
12种高效Numpy&Pandas使用技巧!
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券