腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
pandas
数据
帧
连接
问题
、
、
还在学习熊猫,所以如果这个
问题
看起来很天真,请原谅。我有两个不同行数
的
数据
帧
。我想沿着轴1
连接
它们。d e f3 j k lidx col4 col5 col6生成
的
dfb c m n p2 g h i我可以将它附加到底部,但是沿着a
浏览 0
提问于2020-12-19
得票数 0
1
回答
pandas
用
数据
帧
替换
问题
我通过从csv读取
数据
帧
来创建
数据
帧
。我过滤了时间戳并获得了一个新
的
dataframe副本,尝试在新
的
dataframe
中
替换
2019到2018年,但它不起作用。为什么?03:14:27 0 10332 2019-03-18 03:15:57 0 119
替换
后
的
浏览 4
提问于2019-07-17
得票数 1
回答已采纳
1
回答
在Numpy数组上执行
Pandas
函数
、
、
、
、
我有一个大约8700万行
的
Pandas
数据
帧
。为了对其进行一些处理,我将其设置为Dask
数据
帧
。
问题
是我需要做Dask不支持
的
unstack
和
plot。我已经将Dask
数据
帧
写入h5文件,但在尝试将其作为
Pandas
数据
帧
读取时遇到内存
问题
。我在将Dask DF转换为
Pandas
时也遇到了内存错误。从本质上讲,
浏览 2
提问于2020-04-22
得票数 2
1
回答
如何将多个表解析为一个
数据
帧
?
、
、
我用了漂亮
的
汤美容剂,得到了这个: <table cellpadding="0" cellspacing="<tr>所以有很多以div class="var_building_result“开头
的
小表,我能把所有这些表放到一个<em
浏览 12
提问于2019-11-26
得票数 1
回答已采纳
1
回答
将文本预处理函数应用于scala spark
中
的
dataframe列
、
、
我想创建一个函数来处理我在处理文本
数据
时遇到
的
问题
。我熟悉Python
和
pandas
数据
帧
,我通常认为解决
问题
的
过程是使用一个函数,然后使用
pandas
apply方法将该函数应用于列
中
的
所有元素。因此,我创建了两个函数来处理
替换
。
问题
是我不知道如何在这个方法中放入多个
替换
。我需要对三个独立
的
数据</e
浏览 9
提问于2019-12-26
得票数 0
回答已采纳
1
回答
dask dataframe是否有任何有效
的
方法来按一列分组,然后在此列上
连接
?
、
、
、
我有一个这样
的
dask.DataFrame:1|A3|B我希望得到以下结果:1|A|A_NEW_ID3|B|B_NEW_ID4|C|C_NEW_ID首先,我使用groupby获取name表我得到一个新
的
DataFramefinal_df = df.join(df2,on="name") 但是,我
的
表非常大
浏览 12
提问于2020-05-13
得票数 0
回答已采纳
1
回答
逗号分隔
的
in字符串映射到python
Pandas
中
的
值
、
我在
pandas
DataFrame
的
列中有一个逗号分隔
的
字符串: ? 我有一个映射
数据
帧
? 我想要最终
的
数据
帧
: ? 我想要一个新
的
列,并用映射
数据
帧
中
的
值
替换
ids,写pythonic +
pandas
的
方法是什么?
浏览 22
提问于2021-11-02
得票数 0
回答已采纳
1
回答
如何使用pyspark合并来自两个不同
数据
帧
的
数据
?
、
、
、
、
我有两个不同
的
(非常大
的
)
数据
帧
(详细信息如下)。我需要合并他们两个人
的
数据
。由于这些
数据
帧
非常庞大(第一个
数据
帧
有数百万行,第二个
数据
帧
有数千行),我尝试使用AWS EMR服务。,start_time
和
end_time是程序开始
和
结束
的
时间。基本上,我需要做
的
是创建一个dataframe,其中包含来自这两个d
浏览 11
提问于2021-06-03
得票数 0
回答已采纳
1
回答
熊猫DataFrame -用旧日期
替换
Datetime列
的
空值
、
问题
:如何将
Pandas
DataFrame
中
的
datetime列
的
NULL值
替换
为类似于1900-01-01 00:00:00.000
的
内容 我使用
Pandas
数据
帧
将大型
数据
文件导入到SQL Server2019表
中
。下面的代码正确地将数值列
的
空值
替换
为0,将对象(字符串)列
的
空值
替换
为空字符串。但是它不会
浏览 5
提问于2022-04-15
得票数 0
1
回答
.`)、numpy.newaxis (`None`)
和
整数或布尔型数组才是有效
的
索引
、
、
、
所以我使用了EvolutionaryFS库import numpy as npbest_columns=evoObj.GetBestFeatures()我得到
的
错误如下(`:`), ellipsis (`...`), numpy.newaxis (`None`) and inte
浏览 2
提问于2021-06-08
得票数 1
1
回答
使用
pandas
数据
帧
修改csv
中
的
数据
、
、
我有一个这样
的
结构;用来创建一个
pandas
数据
帧
: my_dict = { 'name' : ["joe", "jack", "jill", "joan", "jesse","jacob", "jonas我确实解决了这个
问题
,创建了全新
的
字典,然后将它们直接导出到CSV
中
,但我想使用
pandas
浏览 6
提问于2019-07-15
得票数 0
回答已采纳
1
回答
使用DataFrame将多个文件合并为一个文件
、
、
现在我正在尝试将所有的CSV合并到一个唯一
的
主文件
中
,这样我就可以处理它了。但它不起作用。下面的代码是我尝试过
的
,我做错了什么?import globfrom
pandas
import read_csv for file in
浏览 24
提问于2020-07-07
得票数 0
1
回答
pandas
数据
帧
:划分
和
替换
、
背景 我正在使用JupyterLab
和
Anaconda。 我有两个相似的
数据
帧
。我想要将一个
数据
帧
除以(部分/子集)一个
数据
帧
,然后更新原始
数据
帧
。下面是我写
的
代码: 编写
的
代码 def f_test_df(n_rows, n_cols): df_local = pd.DataFrame(np.random.rand(n_rows, n_cols期望
的
结果 我希望
浏览 7
提问于2021-02-03
得票数 1
回答已采纳
2
回答
循环遍历具有不同输出
的
报价器列表
、
、
我有一个自动收报机列表,我想从
pandas
datareader输出带有财务信息
的
单个
数据
集。import
pandas
_datareader as pdr
浏览 1
提问于2019-08-24
得票数 0
1
回答
连接
存储在numpy数组
中
的
两个
数据
表
的
有效方法是什么?
、
我有两个表示
数据
表
的
numpy数组字典。第一个表是作业(job_no)及其开始日期(start_date)
的
列表。第二个表是每个作业要完成
的
任务(task_no)
的
列表。我想通过加入job_no来有效地将开始日期添加到任务级表
中
。 下面是将适当
的
开始日期添加到任务级表后
的
表
的
示例。我
的
数据
集有大约25000个作业
和
100000个任务,下面的代码在完成上面的任务时非常慢。np.whe
浏览 13
提问于2019-02-16
得票数 1
回答已采纳
1
回答
pandas
中
的
内存错误
、
我有一个csv文件,它
的
大小约为800MB,我试图通过
pandas
将其加载到
数据
帧
中
,但我一直收到内存错误。我需要加载它,这样我才能将它
连接
到另一个较小
的
数据
帧
。为什么即使我使用64位版本
的
Windows
和
Python 3.4 64位,并且有超过8 8GB
的
RAM
和
大量硬盘,我仍然得到一个内存错误?这是
Pandas
中
的<
浏览 0
提问于2016-06-15
得票数 0
3
回答
在Jupyter Notebook上使用Python创建
数据
库
、
、
、
、
因此,我正在为一个较大
的
程序构建一个
数据
库,并且在该编码领域(主要是嵌入式系统编程)方面没有太多经验。我
的
任务是把一个大
的
excel文件导入到python
中
。它很大,所以我假设我必须将它转换为CSV,然后通过解析、分区
和
导入来截断它,以避免我
的
计算机崩溃。导入文件后,我必须能够根据列标题提取/搜索特定信息。还有其他一些简单
的
基于字符串
的
用户交互方面,所以并不是很困难。至于其余
的
,我正在得到
的</em
浏览 34
提问于2018-09-01
得票数 0
1
回答
Pandas
read_sql_query将32位
数据
转换为64位
、
、
我正在使用
pandas
.read_sql_query从Sql server
中
读取一些
数据
。我在Sql server
中
读取
的
数据
类型是int
和
real,即32位整数
和
32位浮点值。但在结果
数据
帧
中
,
数据
类型是int64
和
float64。我可以在将
数据
放入
Pandas
数据
帧
后将其转换回32位,但我
浏览 31
提问于2020-12-04
得票数 2
1
回答
合并具有不规则时间戳
和
每个文件不同标题名称
的
CSV列
、
、
、
、
我有很长
的
CSV文件,每个文件都有不同
的
头文件。第一列总是一个时间戳,它
的
时间是不规则
的
,所以它很少匹配。目前,一个文件夹中最多可以有6个该格式
的
CSV文件。 我想将这些CSV合并到一个文件
中
,其中所有列都可以根据时间戳进行识别
和
排序。当时间戳匹配时,
数据
被合并到其相应
的
行
中
。,这也是
数据
合并到一行
中
的
一个例子 到目前为止,我尝试了这个Github Link,但它
浏览 17
提问于2020-09-26
得票数 1
回答已采纳
1
回答
数据
替换
防止在提供int32值时
替换
不正确
的
int64字段
、
、
问题
:如何
替换
数据
帧
中
的
所有特定int64值,但避免错误地
替换
不相等
的
int32值。import
浏览 1
提问于2016-12-02
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
将多个Excel工作表合并到一个Pandas数据帧中
Pandas从MySQL中读取和保存数据
Pandas库中的函数应用和映射
Excel中如何替换数据的操作方法!
使用 Pandas resample填补时间序列数据中的空白
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券