腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
在
pandas
中
堆叠
与
Pandas
/
SFrame
等效
的
列表
数组
、
在
pandas
数据帧
中
是否有
SFrame
堆栈
的
等价物?
Pandas
自己
的
堆栈只适用于级别,而我正在寻找
在
包含
列表
的
其他列
的
同一级别上扩展单个列。Input Dataframe:
在
实际数据框
中
还有一些像user这样
的
列| user | friends | +-----|
浏览 5
提问于2017-08-19
得票数 1
回答已采纳
2
回答
graphlab
SFrame
对一列
中
的
所有值求和
、
如何对
SFrame
graphlab一列
中
的
所有值求和。我尝试查看了官方文档,它只提供给SaArray(),没有任何示例。
浏览 6
提问于2016-09-02
得票数 5
回答已采纳
2
回答
如何从Graphlab迁移到
pandas
、
、
、
、
我一直在学习Graphlab,但也想看看
pandas
,因为它是开源
的
,将来我可能会发现自己
在
一家没有GL许可证
的
公司,我想知道
pandas
如何使用GL创建基本模型。data = pd.read_csv("~/Downloads/diamonds.csv")train_data, test_data =
sframe
.random_splitgl.linear_
浏览 19
提问于2017-05-27
得票数 1
4
回答
Dato:
pandas
中
graphlab.random_split()
的
等效
函数是什么?
、
、
、
我正在Coursera上做一门机器学习
的
课程。
在
本课程
中
,我们强调使用来自
的
GraphLab。在其中一个练习
中
,教师使用graphlab.random_split()拆分
SFrame
,如下所示:train_data我试图安装GraphLab,但是它需要64位
的
PC,而我
的
PC是32位
的
。老师给了我们一个使
浏览 1
提问于2016-03-03
得票数 1
3
回答
按
SFrame
列计算
的
日志值
、
、
请告诉我,我如何从,graphlab (或,熊猫)列
中
的
每一个值
中
取对数,而不遍历
SFrame
列
的
整个长度?我特别感兴趣
的
是类似的功能,比如日志函数
的
。自己也找不到..。重要:--拜托,我对整个专栏
的
for-loop迭代不感兴趣。我只对特定函数感兴趣,它将所有值转换为整个列
的
日志值。 我也很抱歉,如果这个功能在手册
中
。请给我一个链接..。
浏览 0
提问于2014-11-19
得票数 5
回答已采纳
2
回答
图形实验室
与
numpy问题
、
、
我目前正在做一门由华盛顿大学( University )提供
的
课程,我面临着numpy和graphlab
的
小问题。课程要求使用
的
graphlab版本高于1.7My,如下所示,但是,当我运行下面的脚本时,出现了如下错误: data_
sframe
['constant'] = 1
浏览 3
提问于2016-11-05
得票数 2
回答已采纳
2
回答
使用
sframe
作为数据源绘制盒图。
、
、
我正在数据集上练习我
的
ML分类技巧。在数据集中,有一个networthusbillion数值变量和一个selfmade分类变量,说明亿万富翁是self-madesns.boxplot(x=billionaires['networthusbillion']) ,所以,我
的
问题是:
浏览 15
提问于2016-03-19
得票数 0
回答已采纳
1
回答
创建
sframe
逻辑分类器
、
、
我
的
数据
在
一个框架
中
(我已经用.dtype检查过了)这是关于机器学习
的
Coursera课程,使用亚马逊评论
的
压缩文件:I get the error "ToolkitError: Input training dat
浏览 3
提问于2016-03-19
得票数 0
1
回答
从Ubuntu到Windows UNC
的
IPython路径
、
、
、
、
我
在
Windows10上通过Anaconda使用Windows3.4(是的,我知道)。我
在
我
的
虚拟机上使用
与
Ubuntu相同版本
的
IPython编写了一个脚本,并尝试
在
Windows端运行它。我一直
在
尝试解决这个问题,
在
Linux中使用"/“作为文件路径,而不是
在
Windows中使用"\”。我尝试
在
Windows端简单地将"/“
的
所有实例转换为&qu
浏览 1
提问于2015-08-28
得票数 0
1
回答
IPython Anaconda PyCharm PyCharm 8.1版
、
、
、
path = r'NWEA CSVs/Raw/*'
Sframe
= pd.DataFrame[] sdf = pd.read_csv(file,index_col=None, header=0)
Sframe
= pd.concat(list,ignore_index=False)
在
浏览 1
提问于2015-01-23
得票数 0
回答已采纳
2
回答
Pandas
:如何打开某些文件
、
、
、
我目前正在处理这个中
的
数据集。但是我无法从
Pandas
中
读取这些文件?有没有人尝试过使用这样
的
文件?我正在尝试以下操作:但是我得到了以下错误 Error tokenizing
浏览 21
提问于2016-09-25
得票数 2
回答已采纳
2
回答
用另一个(覆盖)替换整个数据格式(Python3.4熊猫)
、
、
如果用户指示程序应该在没有重复项
的
情况下继续运行,则从dataframe
中
移除重复项(及其唯一值),并且应该使
Sframe
等于删除重复项(因此用修改后
的
Sframe
替换原始
Sframe
)。之后,
在
主程序
中
,如果用户选择了"2“,则
Sframe
应该是修改后
的
版本。否则,如果一开始没有检测到重复项(并且用户输入从未被输入),则应该使用原始
的
Sframe
。我
的</em
浏览 1
提问于2014-12-29
得票数 0
回答已采纳
5
回答
从Dataframe
中
的
两个或多个列获取唯一值
的
有效方法
、
、
、
、
给出来自
SFrame
的
矩阵>>> sf =
SFrame
({'x':[1,1,2,5,7], 'y':[2,4,6,8,2], 'z':[2,5,8,6,2| 1 | 4 | 5 || 5 | 8 | 6 |+---+---+---+我希望获得x和y
浏览 3
提问于2016-08-03
得票数 12
2
回答
熊猫数据框架-用初始值表示
、
、
、
、
我要把一些R
的
东西搬到Python上,所以我必须使用
pandas
.DataFrame,有几件事情我想优化。from
pandas
import DataFrame """ :param df:迭代协议,这一事实扼杀了基于NumPy
的
数据结构(如DataFrame )
的
速度。我知道DataFrame.apply有一个reduce模式,但它不需要像dict那样<em
浏览 3
提问于2015-08-17
得票数 5
回答已采纳
4
回答
Pyspark:有没有等同于
pandas
info()
的
方法?
、
、
、
在
PySpark
中
是否有
与
pandas
info()方法
等效
的
方法?我正在尝试获取有关PySpark
中
数据帧
的
基本统计信息,例如:列数和行数、空值数、数据帧大小
pandas
中
的
Info()方法提供了所有这些统计信息。
浏览 4
提问于2017-06-08
得票数 6
1
回答
熊猫将excel
中
的
数据转换为单列
、
、
、
、
因此,出于自己不知道
的
原因,我
的
客户端有大量数据以JSON风格
的
格式存储,但存储
在
Excel文件
中
。他们目前被放置在一起,但他们希望他们
堆叠
(不知道为什么,但我不是告诉人们如何做他们
的
生意。)这些数据是什么样子
的
:我想让它看起来像:是的,我知道这不会创建一个有效
的
JSON文件,但是这里有很多东西需要解包,不值得进入。我只是在做我要做
的
事。我尝试过将每一列发送到
列表
中<
浏览 5
提问于2020-10-27
得票数 0
回答已采纳
4
回答
为什么
在
Pandas
上调用.sort()函数对其值进行就地排序而什么也不返回?
、
、
对不起,我想我错过了一些非常基本
的
东西:输出无,同时2 0编辑:>>> s = Series([3,4,0,3]).sort()不返回排序
的
系列。如果我理解,它应该返回已排序好
的
系列。
浏览 4
提问于2014-06-04
得票数 11
回答已采纳
1
回答
Pyspark:从
列表
的
RDD创建spark数据帧,其中
列表
的
一些元素是对象
、
、
、
、
我正在尝试将
pandas
.DataFrame代码转换为
等效
的
pyspark DataFrame。我有一个以下格式
的
RDD。[2, 'b', {'c': 1, 'd':3}],内部
列表
中
的
第三个元素没有特定<
浏览 1
提问于2018-04-07
得票数 1
3
回答
测试一个
数组
的
每个元素是否都在另一个
数组
中
、
、
、
假设我有两个
数组
,x和y,其中y是x
的
子集y = [3, 4, 7]ret = [False, False, True, True, False, False, True, False, False] 如果y只是一个单一
的
数字,这将是非常简单
的
(x == y),但我尝试了
等效
的
x in y,它不起作用。当然,我可以使用for循环来实现,但我更希望有一种更简洁
的
方法。
浏览 0
提问于2018-03-07
得票数 0
1
回答
从
Pandas
multiIndex获取数据
、
、
我使用熊猫和链接从.root文件
中
读取数据,并得到如下表: branches = ['nCleanedJets', 'JetPt', 'JetMass', 'JetPhi'] 本质上,我必须检索每个条目的"
浏览 3
提问于2020-02-04
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Pandas库在Anaconda中的安装方法
在Pandas中通过时间频率来汇总数据的三种常用方法
这些很实用的Pandas技巧,你都会了吗?-乌森数据可视化系列(1)
每天读一本:利用Python进行数据分析
Python数据分析第二步,pandas入门,便捷高效处理复杂数据简介
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券