首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何将dataframe中对象列的持续时间(例如2h 50m、8h 35m)转换为仅包含分钟的日期时间列?

要将dataframe中对象列的持续时间转换为仅包含分钟的日期时间列,可以按照以下步骤进行操作:

  1. 首先,将对象列中的持续时间转换为分钟数。可以使用正则表达式或字符串处理方法提取小时和分钟数,并将其转换为分钟数。例如,对于持续时间为"2h 50m"的对象,可以提取出2小时和50分钟,然后将其转换为170分钟。
  2. 接下来,将分钟数转换为日期时间列。可以使用pandas库中的to_datetime函数将分钟数转换为日期时间格式。将分钟数作为参数传递给to_datetime函数,并指定单位为分钟。这将返回一个包含日期时间的新列。

以下是一个示例代码,演示如何将dataframe中的对象列转换为仅包含分钟的日期时间列:

代码语言:txt
复制
import pandas as pd
import re

# 创建示例dataframe
df = pd.DataFrame({'持续时间': ['2h 50m', '8h 35m', '1h 15m']})

# 提取小时和分钟数,并转换为分钟
df['分钟数'] = df['持续时间'].apply(lambda x: int(re.findall(r'\d+', x)[0])*60 + int(re.findall(r'\d+', x)[1]))

# 将分钟数转换为日期时间列
df['日期时间'] = pd.to_datetime(df['分钟数'], unit='m')

# 打印转换后的dataframe
print(df)

输出结果如下:

代码语言:txt
复制
    持续时间  分钟数                日期时间
0  2h 50m  170 1970-01-01 02:50:00
1  8h 35m  515 1970-01-01 08:35:00
2  1h 15m   75 1970-01-01 01:15:00

在这个示例中,我们首先使用正则表达式提取出持续时间中的小时和分钟数,并将其转换为分钟数。然后,使用to_datetime函数将分钟数转换为日期时间格式,并将其存储在新的列中。最后,打印转换后的dataframe。

对于腾讯云相关产品和产品介绍链接地址,由于要求不能提及具体的云计算品牌商,无法提供相关链接。但可以根据具体需求,在腾讯云官方网站上搜索相关产品,以获取更多信息。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

在Pandas更改数据类型【方法总结】

例如,上面的例子,如何将2和3为浮点数?有没有办法将数据转换为DataFrame格式时指定类型?或者是创建DataFrame,然后通过某种方法更改每类型?...在这种情况下,设置参数: df.apply(pd.to_numeric, errors='ignore') 然后该函数将被应用于整个DataFrame,可以转换为数字类型将被转换,而不能(例如,它们包含非数字字符串或日期...另外pd.to_datetime和pd.to_timedelta可将数据转换为日期时间戳。...软转换——类型自动推断 版本0.21.0引入了infer_objects()方法,用于将具有对象数据类型DataFrame换为更具体类型。...例如,用两对象类型创建一个DataFrame,其中一个保存整数,另一个保存整数字符串: >>> df = pd.DataFrame({'a': [7, 1, 5], 'b': ['3','2','1

20.3K30

pandas 时序统计高级用法!

重采样指的是时间重采样,就是将时间序列从一个频率转换到另一个频率上,对应数据也跟着频率进行变化。比如时间序列数据是以天为周期,通过重采样我们可以将其转换为分钟、小时、周、月、季度等等其他周期上。...向上采样:转换到更细颗粒度频率,比如将天转为小时、分钟、秒等 向下采样:转换到更粗颗粒度频率,比如将天转为周、月、季度、年等 resample用法 pandas时间重采样方法是resample(...),可以对series和dataframe对象操作。...timestamp:将结果索引转换为DateTimeIndex period:将结果索引转换为PeriodIndex on:对于dataframe,指定被重采样,且必须是时间类型 level:对于多级索引...最后一天午夜 offset:对origin添加偏移量,Timedelta或str类型 group_keys:指定是否在结果索引包含分组keys,当采样对象使用了.apply()方法,默认False不包含

40940
  • 时间序列重采样和pandasresample方法介绍

    2、Downsampling 下采样包括减少数据频率或粒度。将数据转换为更大时间间隔。 重采样应用 重采样应用十分广泛: 在财务分析,股票价格或其他财务指标可能以不规则间隔记录。...Pandasresample()方法 resample可以同时操作Pandas Series和DataFrame对象。它用于执行聚合、转换或时间序列数据下采样和上采样等操作。...) # 将日期设置为索引 df.set_index('date', inplace=True) # 使用resample()方法进行重新采样 # 将每日数据转换为每月数据并计算每月总和...1、指定列名 默认情况下,Pandasresample()方法使用Dataframe或Series索引,这些索引应该是时间类型。但是,如果希望基于特定重新采样,则可以使用on参数。...总结 时间序列重采样是将时间序列数据从一个时间频率(例如每日)转换为另一个时间频率(例如每月或每年),并且通常伴随着对数据进行聚合操作。

    87230

    Pandas 学习手册中文第二版:11~15

    已为sensors每个不同值创建了一个组,并以该值命名。 然后,每个组都包含一个DataFrame对象,该对象由传感器值与该组名称匹配行组成。...为了说明这一点,下面的代码创建一个DataFrame,其中Label带有两个值(A和B),以及一个Values,其中包含整数序列,但其中一个值替换为NaN。...此类可用于构造表示几种常见模式对象例如使用日期时间固定时间点,或者简单地是没有时间部分一天,或者没有日期部分时间。...这些通常是确定两个日期之间持续时间或从另一个日期和/或时间开始特定时间间隔内计算日期结果。...第一类是代表绝对日期关键字:年,月,日,小时,分钟,秒和微秒。 第二类代表相对持续时间,可以是负值:年,月,周,日,小时,分钟,秒和微秒。

    3.4K20

    Python面试十问2

    C', 3]] # 使用pandasDataFrame()函数将列表转换为DataFrame df = pd.DataFrame(data, columns=['Letter', 'Number']...此外,你可以通过传递参数来调整df.describe()行为,例如include参数可以设置为'all'来包含所有统计信息,或者设置为'O'来包含对象统计信息。...七、apply() 函数使用方法 如果需要将函数应⽤到DataFrame每个数据元素,可以使⽤ apply() 函数以便将函数应⽤于给定dataframe每⼀⾏。...0 1 4 7 12 1 2 5 8 15 2 3 6 9 18 八、pandas合并操作 如何将新⾏追加到pandas DataFrame?...如果想要对每个分组应用多个函数,可以使用agg()方法,并传入一个包含多个函数名列表,例如group_1.agg(['sum', 'mean'])。

    8310

    pandas

    区别 Series是带索引一维数组 Series对象两个重要属性是:index(索引)和value(数据值) DataFrame任意一行或者一就是一个Series对象 创建Series对象:pd.Series...对象:pd.DataFrame(data,index,columns) 与Series不同是,DataFrame包括索引index和表头columns:   其中data可以是很多类型: 包含列表、字典或者...Series字典 二维数组 一个Series对象 另一个DataFrame对象 5.dataframe保存进excel多个sheet(需要注意一下,如果是在for循环中,就要考虑writer代码位置了...,periods=6), "age":np.arange(6)}) print(df) df["date"] = df["date"].dt.date #将date日期换为没有时分秒日期..._append(temp, ignore_index=True) pandas数据置 与矩阵相同,在 Pandas ,我们可以使用 .transpose() 方法或 .T 属性来置 我们DataFrame

    12410

    3 个不常见但非常实用Pandas 使用技巧

    来源:DeepHub IMBA本文共1000字,建议阅读5分钟本文为你演示一些不常见,但是却非常有用 Pandas 函数。 创建一个示例 DataFrame 。...date 包含 100 个连续日期,class 包含 4 个以对象数据类型存储不同值,amount 包含 10 到 100 之间随机整数。 1....To_period 在 Pandas ,操作 to_period 函数允许将日期换为特定时间间隔。使用该方法可以获取具有许多不同间隔或周期日期例如日、周、月、季度等。...但是我们通过使用to_period 函数参数”M“实现时间序列。 让我们为年月和季度创建新。...例如在我们 DataFrame ,”分类“具有 4 个不同值分类变量:A、B、C、D。 默认情况下,该数据类型为object。

    1.3K10

    Pandas内存优化和数据加速读取

    内存优化 一个现象是,在使用pandas进行数据处理时候,加载大数据或占用很大内存和时间,甚至有时候发现文件在本地明明不大,但是用pandas以DataFrame形式加载内存时候会占用非常高内存...OK,这就是有时候DataFrame内存占用过高原因。 所以这里有个简单思路是:我依次去遍历数据所有,检查每一数值范围包含在哪个最近子类区间。...pandas 使用一个单独映射词典将这些int值映射到原始值。只要当一个包含有限集合时,这种方法就很有用。...例如,如果您有10年分钟频率耗电量数据,即使你指定格式参数,只需将日期时间换为日期时间可能需要20分钟。你真的只想做一次,而不是每次运行你模型,进行测试或分析。...Pandas HDFStore 类允许你将DataFrame存储在HDF5文件,以便可以有效地访问它,同时仍保留类型和其他元数据。

    2.7K20

    Pandas使用技巧:如何将运行内存占用降低90%!

    为了更好地理解如何减少内存用量,让我们看看 pandas 是如何将数据存储在内存。...object 每个元素实际上都是一个指针,包含了实际值在内存位置「地址」。 下面这幅图给出了以 NumPy 数据类型存储数值数据和使用 Python 内置类型存储字符串数据方式。...看看上表,可以看到其包含 7 个不同值。我们将使用 .astype() 方法将其转换成 categorical 类型。...首先,我们可将每一最终类型存储在一个词典,其中键值表示列名称,首先移除日期,因为日期需要不同处理方式。...().plot.scatter('year','length_minutes') plt.show() 从 1940 年代以来,棒球比赛持续时间越来越长。

    3.6K20

    Python 数据分析(PYDA)第三版(五)

    在过程第一阶段包含在 pandas 对象数据,无论是 Series、DataFrame 还是其他形式,都根据您提供一个或多个键被分割成组。分割是在对象特定轴上执行。...-应用-组合范式下,DataFrame 或两个 Series 之间操作,例如组加权平均,是可能。...表 11.1:datetime模块类型 类型 描述 date 使用公历存储日期(年,月,日) time 以小时,分钟,秒和微秒存储一天时间 datetime 存储日期时间 timedelta...例如,如果您想要一个包含每个月最后一个工作日日期索引,您将传递 "BM" 频率(月底工作日;请参阅 Table 11.4 更完整频率列表),只有落在日期区间内或日期区间内日期将被包括: In...与时区感知时间对象操作 类似于时间序列和日期范围,个别Timestamp对象也可以从无时区转换为时区感知,并从一个时区转换为另一个时区: In [128]: stamp = pd.Timestamp

    16700

    爱了!0.052s 打开 100GB 数据,这个开源库火爆了!

    第一步是将数据转换为内存可映射文件格式,例如Apache Arrow,Apache Parquet或HDF5。在此处也可以找到如何将CSV数据转换为HDF5示例。...Vaex读取文件元数据,例如磁盘上数据位置,数据结构(行数、数、列名和类型),文件说明等。那么,如果我们要检查数据或与数据交互怎么办?...打开数据集会生成一个标准DataFrame并对其进行快速检查: 注意,单元执行时间太短了。这是因为显示Vaex DataFrame需要从磁盘读取前后5行数据。...在筛选Vaex DataFrame时不会复制数据,而是创建对原始对象引用,在该引用上应用二进制掩码。用掩码选择要显示行,并将其用于将来计算。...这些功能在数据集中尚不可用,但计算起来很简单: 上面的代码块无需内存,无需花费时间即可执行!这是因为代码只会创建虚拟。这些包含数学表达式,并且仅在需要时才进行评估。

    81510

    特征工程:Kaggle刷榜必备技巧(附代码)!!!

    2、dataframe:命名为customers_df 3、index:此参数将表主键作为输入 4、time_index:时间索引定义为第一次可以使用行任何信息。对于顾客来说,这是加入日期。...在我们session_df表,我们有一个名为device,它包含三个级别——桌面、移动设备或平板电脑。我们可以使用以下方法从这样获取两: ?...在本次比赛,我们必须预测旅行持续时间。我们获得了很多特征,其中上下车经纬度也在那里。...如果使用一个假定 特征是正态分布线性模型,则对数转换可以使特征正态。在像收入等倾斜变量发生时,它也很方便。或者在我们旅行持续时间案例。以下是无对数转换旅行持续时间图。 ?...旅行持续时间对数转换倾斜越小,对模型越有帮助。 基于直觉一些附加特征 ▍日期时间特征 可以根据领域知识和直觉创建额外日期时间特征。

    5.1K62

    0.052秒打开100GB数据?这个Python开源库这样做数据分析

    Vaex读取文件元数据,例如磁盘上数据位置,数据结构(行数、数、列名和类型),文件说明等。那么,如果我们要检查数据或与数据交互怎么办?...打开数据集会生成一个标准DataFrame并对其进行快速检查: ? 注意,单元执行时间太短了。这是因为显示Vaex DataFrame需要从磁盘读取前后5行数据。...所有这些统计信息都是通过对数据一次传递来计算。 ? 使用describe方法获得 DataFrame 高级概览,注意这个 DataFrame 包含 18 数据,不过截图只展示了前 7 。...在筛选Vaex DataFrame时不会复制数据,而是创建对原始对象引用,在该引用上应用二进制掩码。用掩码选择要显示行,并将其用于将来计算。...这些包含数学表达式,并且仅在需要时才进行评估。此外,虚拟行为与任何其他常规都相同。注意,其他标准库将需要10 GBRAM才能进行相同操作。 好了,让我们来绘制行程耗费时间分布: ?

    1.3K20

    matlab复杂数据类型(二)

    1 表 table是一种适用于以下数据数据类型:即以形式存储在文本文件或电子表格向数据或者表格式数据。表由若干行向变量和若干向变量组成。...使用括号可以选择表一个数据子集并保留表容器。使用大括号和点索引可以从表中提取数据。如果使用大括号,则生成数组是将包含指定行指定表变量水平串联而成。所有指定变量数据类型必须满足串联条件。...一个或多个具有指定 type(例如 'numeric')变量 ③ 数据类型转换 table:具有命名变量表数组(变量可包含不同类型数据) array2table:将同构数组转换为表 cell2table...可以使用table数据类型来将混合类型数据和元数据属性(例如变量名称、行名称、说明和变量单位)收集到单个容器。表适用于向数据或表格数据,这些数据通常以形式存储于文本文件或电子表格。...ischar:确定输入是否为字符数组 isdatetime:确定输入是否为日期时间数组 isduration:确定输入是否为持续时间数组 isenum:确定变量是否为枚举 isfloat:确定输入是否为浮点数组

    5.8K10

    教程 | 简单实用pandas技巧:如何将内存占用降低90%

    为了更好地理解如何减少内存用量,让我们看看 pandas 是如何将数据存储在内存。...object 每个元素实际上都是一个指针,包含了实际值在内存位置「地址」。 下面这幅图给出了以 NumPy 数据类型存储数值数据和使用 Python 内置类型存储字符串数据方式。 ?...看看上表,可以看到其包含 7 个不同值。我们将使用 .astype() 方法将其转换成 categorical 类型。...首先,我们可将每一最终类型存储在一个词典,其中键值表示列名称,首先移除日期,因为日期需要不同处理方式。...从 1940 年代以来,棒球比赛持续时间越来越长。

    3.8K100

    pandas时间序列常用方法简介

    pd.Timestamp(),时间对象,从其首字母大写命名方式可以看出这是pandas一个类,实际上相当于Python标准库datetime定位,在创建时间对象时可接受日期字符串、时间戳数值或分别指定年月日时分秒等参数三类...(str):时间提取字符串 其中,pd.to_datetime可接受单个或多个日期数值,具体类型包括数值型、字符串、数组或pd.series等序列,其中字符串日期格式几乎包含了所有可能组成形式,例如...需要指出,时间序列在pandas.dataframe数据结构,当该时间序列是索引时,则可直接调用相应属性;若该时间序列是dataframe时,则需先调用dt属性再调用接口。...举例如下: 1.首先创建数据结构如下,其中初始dataframe索引是时间序列,两数据分别为数值型和字符串型 ? 2.运用to_datetime将B字符串格式转换为时间序列 ?...3.分别访问索引序列时间和B日期,并输出字符串格式 ? 03 筛选 处理时间序列另一个常用需求是筛选指定范围数据,例如选取特定时段、特定日期等。

    5.8K10

    prophet Seasonality, Holiday Effects, And Regressors季节性,假日效应和回归

    对于dataframe,每个假期一行有两(holiday节假日和ds日期戳)。它必须包括所有出现假期,包括过去(历史数据),以及将来(待预测时间)。...如果假期没出现在待预测时间里,那么Prophet 不会其包含在预测。...这意味着季节性适用于condition_name列为True日期。还必须将这个添加到我们正在进行预测future dataframe。...具有回归量值都需要存在于拟合和预测dataframe例如,我们可以在NFL赛季期间为周日增加额外影响。...此jupyter代码展示了一个使用天气因素作为预测自行车使用额外回归量示例,并提供了如何将其他时间序列作为额外回归量包含在内很好说明。

    1.6K20
    领券