对于Pandas，根据第二列的最小值，从dataframe中的一列(针对每组)获取值_根据另一列中的条件从Pandas Dataframe中提取值_如何根据另一列中的值计数从Pandas Dataframe中采样数据 - 腾讯云开发者社区

、

我想以一个简单的数据帧为例，根据另一列("name“列)中的值，将一列(" value”列)求和成组。在那之后，我想得到"value“列的平均值 In [1]: import pandas In [2]: df = pandas.DataFrame(data = [{'name': 'a', 'val': 1}, {'name': 'b', 'val': 2}, {'name': 'b', 'val': 4}]) In [3

浏览 5提问于2021-03-03得票数 0

回答已采纳

3回答

为什么熊猫数据描述().min方法返回标准差呢？

、、

我试图从熊猫数据栏中的所有值中减去每一列的最小值。但是，当使用df.describe().min[columnName]获取该列的最小值时，它将正确地返回最小值，除了最后一列外，它似乎返回标准差。下面是一个示例： import pandas as pd import numpy as np # create dictionary and dataframe dfDict = {'A': [1,2,3,4], 'B':[2,4,6,8],'C': [3,5,7,9]} df = pd.DataFrame.from_dict(dfDict) pri

浏览 2提问于2020-11-05得票数 2

回答已采纳

1回答

熊猫的价值观将pd.Timestamp转换为datetime64

、、

我有一个df，它的列类型为pandas.Timestamp，我需要将它转换为列表列表(每一行的列表)。当我使用df.values时，我确实得到了一个列表列表，但是类型被转换为datetime64，这会在后面的代码中造成问题。示例： import pandas as pd pd.DataFrame([pd.Timestamp('2020-01-01')]).values Out[259]: array([['2020-01-01T00:00:00.000000000']], dtype='datetime64[ns]') 如果对每一列分别使用pan

浏览 2提问于2020-05-06得票数 0

回答已采纳

3回答

在数据帧中分隔特定值

、、、

我有一个很大的数据集。我正在尝试用Pandas Dataframe来读取它。我想从其中一列中分离出一些值。假设列名为"A"，则取值范围为90到300。我想分隔270到280之间的任何值。我确实尝试了下面的代码，但它是错误的！ %matplotlib inline import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns df = pd.read_csv('....csv') df2 = df[ 270 < df['A

浏览 3提问于2017-05-28得票数 4

1回答

Pandas在新列中插入reading_num

我正在尝试向pandas dataframe中插入一个新列。示例数据帧： reading other 0 12 23 1 13 15 2 23 72 3 9 23 4 10 15 5 67 99 6 23 68 因为我每周读3次，所以我喜欢加一列： reading other reading_set 0 12 23 1 1 13 15

浏览 6提问于2020-03-09得票数 1

回答已采纳

2回答

创建一个值依赖于其他列值的新列

、

假设我有如下所示的数据文件： import pandas as pd import numpy as np d = {'Column 1': [10, 12,13,43,np.nan], 'Column2':[np.nan,7,np.nan,49,8]} df = pd.DataFrame(d) 我想创建第三列，它的条件是从第2列中获取值，除非它们是NaNs。如下所示：我已经找到了多个主题/解决方案，其中条件依赖于一列中的值，但找不到必须从多个列提供数据的主题/解决方案。

浏览 3提问于2022-01-26得票数 -1

回答已采纳

2回答

df.min()是做什么的？

、、

这到底是什么意思？或者它是做什么的？A是dataframe中的一列，b是dataframe中的另一列，每一行都有数字。 df['a'] = df[['a', 'b']].min(axis=1) 我试着在网上做研究，但似乎找不到答案。

浏览 3提问于2022-04-17得票数 -2

回答已采纳

1回答

OverflowError: Python int太大，无法在转换为datetime时转换为C long

、、

我在用Pandas读excel文件。有一列的日期如下：20160210 我想转换为datetime对象，所以： t = pd.to_datetime(dataframe['date'], format='%Y%m%d') 出现以下错误： OverflowError: Python int too large to convert to C long 有什么想法吗？

浏览 0提问于2016-02-10得票数 2

1回答

自从一班最后一次见到潘达斯

我有熊猫的数据，我想计算一班最后一次出现在每组的天数，并把它作为一列添加到数据栏中。我该怎么做呢？下面的代码提供了虚拟数据： from datetime import datetime, timedelta import numpy as np import pandas as pd dates = [datetime.today() + timedelta(delta) for delta in range(20)] dates = [datetime.strftime(date, '%Y-%m-%d')[:10] for date in dates] df = pd.Da

浏览 2提问于2020-03-17得票数 1

回答已采纳

1回答

在Dask DataFrame中修改列(例如，执行数学函数)的最佳方法是什么？

、、、

我是Pandas DataFrame对象的老手，但我很难找到一种干净、方便的方法来更改Dask DataFrame列中的值。对于一个特定的例子，我试图将numpy.float列中的正值乘以-1，从而使它们为负值。下面是我当前的方法(我正在尝试更改DataFrame中的最后一列)： cols = df.columns df[[cols[-1]]] = df[[cols[-1]]]*-1 这似乎只有在列有字符串标题时才有效，否则它会使用索引号作为新列的字符串类型列名添加另一列。是否有类似于df.iloc[-1,:] = df.iloc[-1,:]*-1的Pandas方法，我可以在dataframe

浏览 1提问于2018-03-14得票数 1

回答已采纳

2回答

pandas获取两列或更多列的按行最小值

、、

如何引用两个数据帧的最小值作为pandas数据帧方程的一部分？我尝试使用python min()函数，但不起作用。很抱歉，如果这在某个地方有很好的文档记录，但我还没有找到这个问题的有效解决方案。我正在寻找类似这样的东西： data['eff'] = pd.DataFrame([data['flow_h'], data['flow_c']]).min() *Cp* (data[' Thi'] - data[' Tci']) 我也试过使用pandas的min()函数，它也不起作用。 min_flow = pd.Data

浏览 0提问于2015-11-29得票数 65

回答已采纳

4回答

Numpy将ints转换为小数

、、

考虑以下代码 import numpy as np import pandas as pd myDict = ({"Row 1": [10, np.nan], "Row 2": [10, "NaN"]}) myDf = pd.DataFrame(myDict) 这将导致以下数据格式为什么使用np.nan在第一列中将int转换为十进制呢？

浏览 3提问于2018-10-16得票数 2

回答已采纳

0回答

将数据框列标题和值拆分为多个列

、、

我已经将我的csv文件上传到了Azure上，但由于某种原因，它变成了这样 nominal;data;curs;cdx Column 1 0 1;21.06.2000;28 2300;ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ ï¿½ï¿½ï¿½ 1 1;22.06.2000;28 2200;ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ ï¿½ï¿½ï¿½ 2 1;23.06.2000;28 1900;ï¿½ï¿½ï¿½ï¿½ï¿½ï¿½ ï¿½ï¿½ï¿½ 3 1;24.06.2000;28 1700;ï¿½ï

浏览 5提问于2018-07-20得票数 0

回答已采纳

1回答

Python Pandas识别错误数据

、、

我有一个用逗号分隔的csv文件，每行有215列。文件非常大，我使用pandas dataframe pd.read_csv()和块来读取数据。文件中的一行有214列，而不是215列，但dataframe读取数据时将NaN应用于最后一列。有没有办法在pandas dataframe中标识此行，因为我更喜欢dataframe而不是csv_reader。注意:最后一列也可以为null，因此按等于null的最后一列过滤数据帧将不起作用

浏览 19提问于2020-09-30得票数 0

1回答

如何在Pandas dataframe列中打印不同组真值的第一个和最后一个索引

、、、

我编写了一个程序来分析暖通空调的运行故障数据。该程序通过一组规则输入数据，输出是类似于此的Pandas数据。从该输出中，我使用这段代码遍历每一列，打印列本身的名称，并在另一列中的值为真的地方从索引(日期)中打印值： pos = 0 for column in df: try: colname = faults[df.columns[pos]] print "The fault -" +str (colname)+ "- occurred on:" exce

浏览 1提问于2017-12-10得票数 0

2回答

计算每列的pandas.DataFrame行数

、、、、

我想做什么我想数数有条件的行数。每一列应该有不同的编号。 import numpy as np import pandas as pd ## Sample DataFrame data = [[1, 2], [0, 3], [np.nan, np.nan], [1, -1]] index = ['i1', 'i2', 'i3', 'i4'] columns = ['c1', 'c2'] df = pd.DataFrame(data, index=index, columns=columns) p

浏览 4提问于2022-08-22得票数 0

回答已采纳

1回答

在分组的pandas数据帧中创建两个移位列

、、

我已经找遍了所有地方，但我仍然找不到如何在Pandas Dataframe的组中创建两个移位列的示例。我已经用了一个专栏，如下所示： data_frame['previous_category'] = data_frame.groupby('id')['category'].shift() 但我必须使用两列，一列向上，另一列向下。有什么想法吗？

浏览 14提问于2019-11-14得票数 1

回答已采纳

1回答

如何计算每个组中的记录数并将它们添加到主数据集中？

、

考虑到我有如下数据集： import pandas as pd import numpy as np dt = { "facility":["Ann Arbor","Ann Arbor","Detriot","Detriot","Detriot"], "patient_ID":[4388,4388,9086,9086,9086], "year":[2004,2007,2007,2008,2011], "month":[

浏览 3提问于2020-01-12得票数 2

回答已采纳

0回答

Pandas DataFrame:如果满足多个条件，则将整数赋给新列

、、

我正在尝试在pandas数据帧中创建一个新列，然后根据条件格式分配一个整数值。下面是一个例子：如果((a > 1) & (a < 5))取值10，如果((a >= 5) & (a < 10))取值24，如果((a > 10) & (a < 5))取值57 其中'a‘是数据帧中的另一列。有没有办法在不创建函数的情况下用pandas/numpy来做这件事？我尝试了几种不同的方法，但都不起作用。

浏览 2提问于2017-12-03得票数 0

回答已采纳

1回答

Dask DataFrame:将自定义函数应用于整个列，涉及min()，max()

、

一个巨大的数据集与100米记录和60K列加载到一个达克数据。需要对整个列执行min() & max()。由于内存问题，不能使用Pandas。 #Sample Dask Dataframe import dask.dataframe as dd df = pd.DataFrame({'col1': [1, 2, 3, 4, 5], 'col2': [2., 3., 4., 5., 6.], 'col3': [4, 6, 8, 3, 2],

浏览 0提问于2020-06-22得票数 0

回答已采纳

2回答

如何为分组中的每一列创建多个汇总统计信息？

、、

使用groupby().agg()可以计算指定列的汇总统计信息。但是，如果我想为每组数据帧的每一列计算“min”、“max”和“mean”，该怎么办？有没有办法让pandas自动为每个列名附加一个前缀？我不想枚举agg()函数中的每个基本列名。

浏览 8提问于2021-07-20得票数 0

2回答

pandas.Dataframe对象中跨列应用的Pythonize函数

、、、、

下面的行将pandas.Dataframe对象中的所有列转换为数字。 columns = ['a', 'b'] dft = pd.DataFrame(data=[['1','2'], ['3','4'],['5','6']], columns=columns) for col in columns: dft[col] = pd.to_numeric(dft[col]) 这很好，但是for ... in:是丑陋的。如何使用lambda函数或list compr

浏览 2提问于2015-11-26得票数 2

回答已采纳

3回答

对熊猫数据进行排序，使其沿对角线得到最小值

、、

我有一个熊猫数据，它是用来做热图的。我希望每一列的最小值沿对角线。我对列进行了排序 data = data.loc[:, data.min().sort_values().index] 这个很管用。现在，我只需要对值进行排序，使第一列中的min值的索引为第0行，然后第二列的min值为第1行，依此类推。示例 import seaborn as sns import pandas as pd data = [[5,1,9], [7,8,6], [5,3,2]] data = pd.DataFrame(data) #sns.heatmap(data) d

浏览 1提问于2018-08-07得票数 1

回答已采纳

2回答

如何获得大熊猫系列的最后一栏

、

我想数数阵列的频率。我读过这个，我正在使用DataFrame并得到了一个系列。 >>> a = np.array([1, 1, 5, 0, 1, 2, 2, 0, 1, 4]) >>> df = pd.DataFrame(a, columns=['a']) >>> b = df.groupby('a').size() >>> b a 0 2 1 4 2 2 4 1 5 1 dtype: int64 >>> b.iloc[:,-1] 当我试图得到

浏览 0提问于2019-04-06得票数 1

回答已采纳

1回答

熊猫转换数据类型取决于您是否得到行，然后是列还是相反。

、

我在潘达斯遇到了这种奇怪的行为，我希望有人能对此有所了解。我有两个列的dataframe，一个是整数类型的，另一个是浮点。然后，我想从第一行，第一列中获取值。要做到这一点，有两种方法，要么通过.iloc[0]先请求第一行，然后获得请求的列['X']，要么先获取列，然后是第一行。前者(行先)将值的数据类型从int更改为float (不想要的行为)，但列首先保留数据类型。这是个窃听器，还是我错过了潘达斯的一些细微差别？下面是再现行为的示例代码 import numpy as np import pandas as pd print(np.__version__, pd.__ver

浏览 2提问于2021-11-29得票数 1

回答已采纳

1回答

熊猫:如何将行按列值=最小的位置保持成组

、

这是我的数据集的一个样本 side | serial_number | inspector | date_1 | date_2 top | 10 | Paul | 4/1/18 13:21 | 4/1/18 14:22 bot | 10 | Jack | 4/1/18 13:01 | 4/1/18 14:22 bot | 11 | Jack | 4/1/18 14

浏览 0提问于2018-02-13得票数 2

回答已采纳

1回答

阅读IIS日志到熊猫数据

、

我有一个IIS日志文件，其中包含以下格式的行： 61.245.163.59 -16/2013:23:55:09 +0530 "GET /ehrm/Recruitment/Image/divider.gif HTTP/1.1“404 1245 "”(Windows 6.1；rv:20.0) Gecko/20100101 Firefox/20.0“GET /ehrm/Recruitment/Image/divider.gif- www.example.com /1.1 www.example.com” 我想从这里得到一些列并构建一个dataframe。在下面的方法中，它只构

浏览 3提问于2013-06-21得票数 2

1回答

Pandas:按特定行获取百分位值

、

我尝试获取列value中的值的百分位数，基于min和max列 import pandas as pd d = {'value': [20, 10, -5, ], 'min': [0, 10, -10,], 'max': [40, 20, 0]} df = pd.DataFrame(data=d) df 我获得了一个新的列"percentile"，它看起来像这样： d = {'value': [20, 10, -5, ], 'min': [0, 10, -10,], 'm

浏览 22提问于2020-06-23得票数 0

回答已采纳

4回答

要列出的Pandas DataFrame列

、

我正在根据满足的另一列中的条件从一列中提取数据的子集。我可以得到正确的值，但它是在pandas.core.frame.DataFrame中。如何将其转换为list？ import pandas as pd tst = pd.read_csv('C:\\SomeCSV.csv') lookupValue = tst['SomeCol'] == "SomeValue" ID = tst[lookupValue][['SomeCol']] #How To convert ID to a list

浏览 4提问于2014-05-20得票数 188

2回答

如何创建具有指定行数和列数的pandas DataFrame

、

我是pandas概念的新手，有没有可能创建一个行大小为1，列长度为8的DataFrame。我试过了： import pandas as pd df = pd.DataFrame({'Data':[]}) 但这只创建了一行和一列。

浏览 0提问于2018-11-01得票数 1

1回答

在pandas数据框中迭代和编辑(python)

我需要根据另一列的布尔值修改我的pandas dataframe的一列。假设我有一列值，一列true/false，我想对那些布尔值为true的值求和为1。我尝试使用iterrows，但这会复制dataframe，并且不会对其进行修改。谢谢! 输入： val bool a 1.0 true b 2.3 false ... 输出： val bool a 2.0 true b 2.3 false

浏览 0提问于2014-05-01得票数 0

1回答

用时间戳交错Pandas Dataframes

、

我有2个Pandas DataFrame，每个都包含2列。其中一列是时间戳列t，另一列包含传感器读数。现在我想要创建一个包含4个列的DataFrame，它被交织在时间戳列上。示例：第一个Dataframe： +----+----+ | t1 | s1 | +----+----+ | 0 | 1 | | 2 | 3 | | 3 | 3 | | 5 | 2 | +----+----+ 第二个DataFrame： +----+----+ | t2 | s2 | +----+----+ | 1 | 5 | | 2 | 3 | | 4 | 3 | +----+----+

浏览 0提问于2015-05-04得票数 0

回答已采纳

3回答

从numpy数组创建pandas数据帧

、、、

要从numpy创建一个pandas数据帧，我可以使用： columns = ['1','2'] data = np.array([[1,2] , [1,5] , [2,3]]) df_1 = pd.DataFrame(data,columns=columns) df_1 如果我改用： columns = ['1','2'] data = np.array([[1,2,2] , [1,5,3]]) df_1 = pd.DataFrame(data,columns=columns) df_1 其中每个阵列是一列数据。但这会抛出错误：

浏览 7提问于2018-05-25得票数 4

回答已采纳

2回答

Pandas、numpy.where()和numpy.nan

、、、、

我想使用numpy.where()向pandas.DataFrame添加一列。我想对条件为false的行使用NaN值(以指示这些值是“缺失的”)。考虑一下： >>> import numpy; import pandas >>> df = pandas.DataFrame({'A':[1,2,3,4]}); print(df) A 0 1 1 2 2 3 3 4 >>> df['B'] = numpy.nan >>> df['C'] = numpy.wher

浏览 144提问于2021-05-11得票数 5

回答已采纳

1回答

如何有选择地更新Pandas dataframe中的值的子集？

、、

我有一个pandas dataframe，我想根据某一列的值更新另一列的值，具体地说，我想这样做(data是一个pandas dataframe，它有3列'Depth'，'A'，'B‘ data['A'] = data['B'] = 0.0 data.loc[:,data.Depth == 'A'].Topsoil = 1.0 data.loc[:,data.Depth == 'B'].Subsoil = 1.0 然后我得到了错误消息： IndexingError: Unalignable

浏览 10提问于2019-04-04得票数 0

2回答

Python将长度不等的列表转换为字典，然后是列

、

我有一个pandas dataframe，其中包含一列列表，其中包含需要转换为字典的值和计数:例如： [['a:4', 'b:3', 'd:5'], ['b:1'], ['a:2', 'c:5']] 然后，我希望每个项目都有一个列，并将相应的值作为行值。 a b c d 4 3 nan 5 nan 1 nan nan 2 nan 5 nan

浏览 12提问于2021-03-10得票数 0

1回答

熊猫.内联-行数的倍增

、、

我有两组数据，共有一列。有些行有重复，所以我创建了一个类似的小示例。以下是我的数据： #Dataframe1 import pandas as pd data = [['tom', 10], ['tom', 11], ['nick', 15], ['juli', 14]] df = pd.DataFrame(data, columns = ['Name', 'Age']) #Dataframe2 data2 = [['tom', 'LA'], [

浏览 1提问于2022-01-05得票数 -1

2回答

pyspark数据帧中所有列的总计数为零

、、

我需要找出pyspark dataframe中所有列中0的百分比。如何在数据帧中找到每一列的零计数？附言:我尝试过将数据帧转换为pandas数据帧，并使用了value_counts。但是，对于大型数据集来说，推断它的观察值是不可能的。

浏览 0提问于2018-08-20得票数 4

1回答

Pandas csv.read将csv列作为字符串而不是整数提取，并将它们作为单参数输入到数据库的第一列中。

、、、、

我一直在尝试用python构建一个脚本，从一组csv文件中提取信息。csv的格式如下，没有标题：'Day'，‘no’，‘Second’，'Microsecods'，'x_accel'，'y_accel‘。pandas没有在对应的列中输入值，而是在第一列中提取值并使其成为字符串：“9,40,19,65664，-0.527，-0.333”。我尝试使用dtype和sep='，‘，但不起作用。我不明白为什么它不能正确地将它们放在正确的列中。这是我的脚本： import numpy as np import os import pand

浏览 38提问于2021-02-08得票数 0

回答已采纳

1回答

Pandas未正确保存到CSV

、、

我有CSV文件： lang 12345,it 77777,en 第一行是标题。我的表有一列lang。在接下来的每一行中，都有两个值: index和value。当我用pd.read_csv(path)的Pandas阅读这张表时，我得到了下一个DataFrame结构： lang 12345 it 77777 en 但是当我通过df.to_csv(path)将它保存回CSV时，我在CSV文件的头之前得到了冗余的,： ,lang 12345,it 77777,en 似乎pandas处理这个逗号就像处理未命名的列一样，当我下次阅读这个文件时，我得到了这个DataFrame结构：

浏览 24提问于2019-09-22得票数 0

回答已采纳

1回答

将熊猫面板转换为数据格式

、

我有一个pandas.Panel，，我想创建一个pandas.DataFrame，其中列标题来自一列，数据来自另一列，行数是面板中的项目数。如果图表能帮助描述我要找的东西..。我的面板看起来有点像以下内容： +---+---------+------------+------+ +---+---------+------------+------+ | +---+---------+------------+------+ |-+ +---+---------+------------+------+ |-+ | | | context | iterations

浏览 1提问于2017-07-05得票数 3

回答已采纳

2回答

求矩阵中最小值的值和索引，按列值分组

我试图在下面的矩阵中找到每组数据点的最小值和索引： a=[0.3 1; 0.5 1; 0.2 1; 0.4 2 ; 0.43 2; 0.01 3; 0.3 3; 0.23 3]; 数据按第2列中的值分组，即前三行在第一组，后两行在第二组，最后三行在第三组。谢谢

浏览 7提问于2013-05-20得票数 0

回答已采纳

1回答

使用Pandas/Python合并数据和2列上的系列

、

我正在使用Python/Pandas，下面有dataframe (1)。我已按ID对此进行分组，然后根据每个ID获取每组修订中修订号的最大值，以生成下面的系列(2)。现在，我希望将(1)合并成(2)，使(1)的前2列与(2)的对应列相匹配，并在实际数据集(1)、'id‘、’修订‘和’颜色‘中适当地拉入(2)中的另一列，这些列不一定是连续的列，还有其他列。我本质上是把(2)当作一把钥匙，从(1)中提取适当的数据。我怎么用潘达斯做这件事？提前谢谢。麦克斯。 (1) Dataframe ID Revision Colour 14446 0 red 14446

浏览 3提问于2013-08-12得票数 0

回答已采纳

3回答

根据实例类型删除pandas数据帧的行

、、

基本上，我是在尝试删除pandas dataframe中的行，其中某一列中的值不是datetime的实例。我试过了： df = df[df[‘date’] == isinstance(datetime)] 我知道isinstance有两个参数(我遗漏了要检查的值)，但我不确定要放什么。

浏览 0提问于2018-06-01得票数 2

2回答

如何总是选择每月更新的csv表中的最后一列？

、、

自动从Quickbooks &L.获得小企业报告，我正试图从dataframe中的特定单元格中获取当月的净收入值，但当我更新csv文件时，该单元格每月向右移动一列。例如，对于下面的代码，这个月我想要11月的值，但是下个月我需要Dec的值，尽管那个列还不存在。是否有一种优雅的方式总是选择第二个最右边的列，还是这是一种愚蠢的尝试获取这些信息的方法？ import numpy as np import pandas as pd nov = -810 dec = 14958 total = 8693 d = {'Jan': [50], 'Feb': [7

浏览 5提问于2022-11-08得票数 1

1回答

Python pandas绘制更多列，但只显示一个图例

、、、

我想在同一个x轴和y轴上绘制两列。但是pandas-plot只显示第二列的图例(所以第一列没有点)。当然，两个标签(列名)都会显示在图例框中。我的DataFrame是： df = pd.DataFrame({'datetime':[dt.datetime(2016,1,1,0,0,0), dt.datetime(2016,1,4,0,0,0), dt.datetime(2016,1,9,0,0,0)], 'value':[10,7,8], 'value2':[12,4,9]}) 我的计划是： ax = df.plot(x='da

浏览 4提问于2016-08-02得票数 0

回答已采纳

1回答

变量用于不同任务时的Python内存使用情况

、

我正在与pandas在ETL管道中工作，并且我正在超出我的计算机的内存使用量。我正在阅读Python中的内存使用情况，当我创建一个pandas Dataframe时，我不明白内存使用是如何工作的，我为这个Dataframe指定了一个名称，并且我使用相同的名称进行一些转换或向其中添加更多列。例如： df = pd.DataFrame( { 'column1': [1,2] ,'column1': ['a','b']}) 如果现在我想要向此Dataframe添加另一列： df['column3'] = 1 用于第一

浏览 1提问于2020-11-23得票数 0

1回答

创建一个包含两个相邻的预测值和实际值列的Pandas数据帧

、、、、

我是一个初学者，我正在使用python中的statsmodel.formula.api.OLS()函数构建一个线性回归模型。我将模型拟合为训练数据，并在y_test (我的测试数据)上使用predict()函数来获得预测值。我将预测值存储在y_pred中。 import statsmodels.formula.api as sm result = sm.OLS(y_train, train_new).fit() y_pred = result.predict(test_new) 当我尝试打印y_pred时，它是一个数字数组形式，而y_test是pandas数据帧格式。 In[44]:

浏览 2提问于2016-06-05得票数 3

1回答

补上缺失的熊猫线。使用上一行的值

我会用之前的值加载两列DataFrame中的一列。值为0的另一列。原创 A B T 1 10 11 3 20 22 5 15 18 结果 A B T 1 10 11 2 10 0 3 20 22 4 20 0 5 15 18 我如何在pandas dataframe中做到这一点？

浏览 1提问于2021-05-20得票数 1

2回答

使用matplotlib在x轴上绘制包含时间数据的条形图

、、

我有一个包含两列的DataFrame，一列是字符串格式的一系列时间日期，另一列是一些值。我想把这个数据框画成条形图下面是我的代码： import matplotlib.pyplot as plt import pandas df = pandas.DataFrame({'a':['090000','093000','100000','103000'],'b':[2,3,4,5]}) df['a']=pandas.to_datetime(df['a'],format

浏览 2提问于2016-03-27得票数 1