首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas:拆分字符串,然后创建新列?

Pandas是一个基于Python的数据分析库,提供了丰富的数据结构和数据分析工具。在Pandas中,可以使用字符串的拆分操作来创建新的列。

要拆分字符串并创建新列,可以使用Pandas的str.split()函数。该函数可以将字符串按照指定的分隔符进行拆分,并返回一个包含拆分后的子字符串的列表。然后,可以使用拆分后的列表创建新的列。

下面是一个示例代码:

代码语言:python
代码运行次数:0
复制
import pandas as pd

# 创建一个包含字符串的DataFrame
data = {'name': ['John Smith', 'Jane Doe', 'Mike Johnson']}
df = pd.DataFrame(data)

# 使用空格拆分name列,并创建新的first_name和last_name列
df[['first_name', 'last_name']] = df['name'].str.split(' ', expand=True)

# 打印拆分后的DataFrame
print(df)

输出结果如下:

代码语言:txt
复制
           name first_name last_name
0   John Smith       John     Smith
1    Jane Doe        Jane       Doe
2  Mike Johnson       Mike   Johnson

在上述示例中,我们首先创建了一个包含字符串的DataFrame。然后,使用str.split()函数将name列按照空格进行拆分,并通过expand=True参数将拆分后的子字符串扩展为新的列。最后,将拆分后的列添加到原始DataFrame中。

Pandas的字符串拆分功能非常灵活,可以根据具体的需求选择不同的分隔符进行拆分。此外,Pandas还提供了许多其他字符串处理函数,如str.replace()str.extract()等,可以帮助进行更复杂的字符串操作。

推荐的腾讯云相关产品:腾讯云服务器(CVM)、腾讯云数据库(TencentDB)、腾讯云对象存储(COS)等。您可以通过访问腾讯云官方网站获取更多关于这些产品的详细信息和介绍。

腾讯云产品介绍链接地址:

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

  • Excel与pandas:使用applymap()创建复杂的计算

    标签:Python与Excel,pandas 我们之前讨论了如何在pandas创建计算,并讲解了一些简单的示例。...通过将表达式赋值给一个(例如df['new column']=expression),可以在大多数情况下轻松创建计算。然而,有时我们需要创建相当复杂的计算,这就是本文要讲解的内容。...图1 创建一个辅助函数 现在,让我们创建一个取平均值的函数,并将其处理/转换为字母等级。 图2 现在我们要把这个函数应用到每个学生身上。那么,在中对每个学生进行循环?不!...pandas applymap()方法 pandas提供了一种将自定义函数应用于或整个数据框架的简单方法,就是.applymap()方法,这有点类似于map()函数的作用。...注意下面的代码,我们只在包含平均值的三上应用函数。因为我们知道第一包含字符串,如果我们尝试对字符串数据应用letter_grade()函数,可能会遇到错误。

    3.9K10

    Python-科学计算-pandas-08-字符串操作1

    系统:Windows 7 语言版本:Anaconda3-4.3.0.1-Windows-x86_64 编辑器:pycharm-community-2016.3.2 pandas:0.19.2 这个系列讲讲...Python的科学计算版块 今天讲讲pandas模块: 对的每一个元素进行同样的字符串操作 今天讲其中的3个操作: 切片,字符串替换,字符串连接 Part 1:目标 ?...已知Df某都是字符串,每一个字符串都有一个文件与其对应,目标在于获取每一个文件的名称 存在以下规律: 字符串的最后一个字符是D或者F 其中D表示该字符串是一个txt文本文件的名称 其中F表示该字符串是一个...pdf文本文件的名称 这些文件的名称最终组成是: FINAL_元素.文件类型 实现方法: 提取该每个元素的最后一位字符 根据规则进行替换,获取文件类型 字符串连接,加上常量 FINAL_ 和 ....向量化,然后执行元素间分别连接 4. 综上,整体效果是按整体进行字符串操作,无需遍历循环,大大减少代码量

    1.1K20

    Python-科学计算-pandas-09-df字符串操作2

    系统:Windows 7 语言版本:Anaconda3-4.3.0.1-Windows-x86_64 编辑器:pycharm-community-2016.3.2 pandas:0.19.2 这个系列讲讲...Python的科学计算版块 今天讲讲pandas模块: 对的每一个元素进行同样的字符串操作 今天讲其中的1个操作: split Part 1:目标 已知Df某都是字符串,每一个字符串都有一个文件与其对应...后的文件类型 组合两者 加入到原来的Df中 修改前后文件名 Part 2:代码 import pandas as pd dict_1 = {"file_name": ["P10-CD1.txt",...:\n", se_1) print(type(se_1)) print("\n") df_1["new_file_name"] = se_1 print("加入的文件名:\n", df_1) print...之间对应每个元素的字符串连接操作,生成一个Series对象 df_1["new_file_name"] = se_1,df_1新增一new_file_name 本文为原创作品

    49710

    单列文本拆分为多,Python可以自动化

    标签:Python与Excel,pandas 在Excel中,我们经常会遇到要将文本拆分。Excel中的文本拆分,可以使用公式、“分列”功能或Power Query来实现。...对于了解Excel并且倾向于使用公式来解决此问题的人,第一反应可能是:好的,我将创建一个可能包含FIND函数和LEFT函数或MID函数等的公式,然后向下拖动以将其应用于所有单元格。...上述操作:创建一个公式然后下拉,对于编程语言来说,被称为“循环”。当我们使用pandas来处理数据时,我们不会使用循环,相反,我们使用矢量化操作来实现快速处理。...一旦我们将Excel表加载到pandas中,整个表将成为pandas数据框架,“出生日期”将成为pandas系列。因为我们不能循环,所以需要一种方法来访问该系列中的字符串元素。...我们想要的是将文本分成两pandas系列),需要用到split()方法的一个可选参数:expand。当将其设置为True时,可以将拆分的项目返回到不同的中。

    7.1K10

    经常被人忽视的:Pandas 文本数据处理!

    如果将微信id这的文本数据,全部转换为小写,在Pandas中可以这样操作。 df["微信"] = df["微信"].str.lower() df 我们可以通过组合姓氏和名字,来创建姓名这。...df["姓名"] = df["姓"] + df["名"] df 但是在默认情况下,会被添加在末尾。 想要更多的自定义选择,可以参考下面的代码。...既可以在特定位置插入创建,也可以使用 cat 方法组合字符串(此处还可设置分隔符sep,这里并未设置)。...df.insert(2, "姓名", df["姓"].str.cat(df["名"], sep="")) df 对字符串的一个常见操作是拆分,当文本数据包含多条信息时...例如,户籍地址这包括省份和城市,我们可以通过拆分此列来提取城市的信息。

    1.3K20

    如何在 Pandas创建一个空的数据帧并向其附加行和

    大多数情况下,数据是从其他数据源(如csv,excel,SQL等)导入到pandas数据帧中的。在本教程中,我们将学习如何创建一个空数据帧,以及如何在 Pandas 中向其追加行和。...Pandas.Series 方法可用于从列表创建系列。值也可以作为列表传递,而无需使用 Series 方法。 例 1 在此示例中,我们创建了一个空数据帧。...然后,通过将列名 ['Name', 'Age'] 传递给 DataFrame 构造函数的 columns 参数,我们在数据帧中创建 2 。...然后,我们将 2 [“薪水”、“城市”] 附加到数据帧。“薪水”值作为系列传递。序列的索引设置为数据帧的索引。“城市”值作为列表传递。...然后,通过将列名称 ['Batsman', 'Runs', 'Balls', '5s', '4s'] 传递给 DataFrame 构造函数的 columns 参数,我们在数据帧中创建了 6

    27230

    在数据框架中创建计算

    标签:Python与Excel,pandas 在Excel中,我们可以通过先在单元格中编写公式,然后向下拖动创建计算。在PowerQuery中,还可以添加“自定义”并输入公式。...在Python中,我们创建计算的方式与PQ中非常相似,创建,计算将应用于这整个,而不是像Excel中的“下拉”方法那样逐行进行。要创建计算,步骤一般是:先创建然后为其指定计算。...图1 在pandas创建计算的关键 如果有Excel和VBA的使用背景,那么一定很想遍历中所有内容,这意味着我们在一个单元格中创建公式,然后向下拖动。然而,这不是Python的工作方式。...panda数据框架中的字符串操作 让我们看看下面的示例,从公司名称拆分中文和英文名称。df[‘公司名称’]是一个pandas系列,有点像Excel或Power Query中的。...然后,将这些数字除以365,我们得到一年数。 处理数据框架中NAN或Null值 当单元格为空时,pandas将自动为其指定NAN值。

    3.8K20

    通宵翻译Pandas官方文档,写了这份Excel万字肝货操作!

    Pandas 中,您使用特殊方法从/向 Excel 文件读取和写入。 让我们首先基于上面示例中的数据框,创建一个的 Excel 文件。 tips.to_excel("....pandas 可以创建 Excel 文件、CSV 或许多其他格式。 数据操作 1. 操作 在电子表格中,公式通常在单个单元格中创建然后拖入其他单元格以计算其他的公式。...在 Pandas 中,您可以直接对整列进行操作。 pandas 通过在 DataFrame 中指定单个系列来提供矢量化操作。可以以相同的方式分配。...提取第n个单词 在 Excel 中,您可以使用文本到向导来拆分文本和检索特定。(请注意,也可以通过公式来做到这一点。)...在 Pandas 中提取单词最简单的方法是用空格分割字符串然后按索引引用单词。请注意,如果您需要,还有更强大的方法。

    19.5K20

    Python之数据规整化:清理、转换、合并、重塑

    合并数据集 pandas.merge可根据一个或者多个不同DataFrame中的行连接起来。 pandas.concat可以沿着一条轴将多个对象堆叠到一起。...主要两种功能: stack:将数据的“旋转”为行。 unstack:将数据的行“旋转”为。 5....5.4 离散化和面元划分 为了便于分析,连续数据常常被分散化或拆分成“面元”(bin)。 pandas的cut函数 5.5 检测和过滤异常值 异常值的过滤或变换运算很大程度上其实就是数组的运算。...字符串操作 6.1 字符串对象方法 split以逗号分割的字符串可以拆分成数段。 字符串“::”的jion方法以冒号分隔符的形式连接起来。...6.2 正则表达式 描述一个或多个空白符的regex是\s+ 创建可重用的regex对象: regex = re.complie('\s+') regex.split(text) 6.3 pandas中矢量化的字符串函数

    3.1K60

    使用Python将一个Excel文件拆分成多个Excel文件

    标签:Python,pandas库,openpyxl库 本文展示如何使用Python将Excel文件拆分为多个文件。拆分Excel文件是一项常见的任务,手工操作非常简单。...在命令提示行中使用pip命令来安装: pip install pandas openpyxl pandas库用于处理数据(本文中是筛选),openpyxl库用于创建的Excel文件。...示例文件 你可以到知识星球App完美Excel社群下载示例文件,或者自己简单地创建一个。...将示例文件直接读入pandas数据框架: 图1 该数据集一些家电或电子产品的销售信息:产品名称、产地、销售量。我们的任务是根据“产品名称”将数据拆分为不同的文件。...图3 拆分Excel工作表为多个工作表 如上所示,产品名称中的唯一值位于一个数组内,这意味着我们可以循环它来检索每个值,例如“空调”、“冰箱”等。然后,可以使用这些值作为筛选条件来拆分数据集。

    3.6K31

    Python处理CSV文件(一)

    第 12 行代码使用 string 模块的 split 函数将字符串用逗号拆分成列表,列表中的每个值都是一个标题,最后将列表赋给变量 header_list。...然后,join 函数在 header_list 中的每个值之间插入一个逗号,将这个列表转换为一个字符串。在此之后,在这个字符串最后添加一个换行符。...第 16 行代码使用 strip 函数除去每行字符串两端的空格、制表符和换行符,然后将处理过的字符串重新赋给变量 row。...第 17 行使代码用 split 函数用逗号将字符串拆分成一个列表,列表中的每个值都是这行中某一的值,然后,将列表赋给变量 row_list。...基本字符串分析是如何失败的 基本的 CSV 分析失败的一个原因是中包含额外的逗号。

    17.7K10

    Pandas入门2

    image.png 5.3 DataFrame和Series之间的运算 默认情况下,DataFrame和Series之间的算术运算会将Series的索引匹配到DataFram的然后沿着行一直向下广播...df.columns[start_column:end_column] df[selected_columns] 1行代码解答: df.loc[:,'school':'guardian'] Step 4.创建一个能实现字符串的首字母大写的...简单说明原因,并修改原始dataframe中的数据使得Mjob和Fjob变为首字母大写 函数操作不影响原数据,返回值的数据要赋值给原数据,如下面代码所示: df[['Mjob','Fjob']] =...df[['Mjob','Fjob']].applymap(str.title) Step 7.创建一个名为majority函数,并根据age数据返回一个布尔值添加到的数据,列名为 legal_drinker...Python中的字符串处理 对于大部分应用来说,python中的字符串应该已经足够。 如split()函数对字符串拆分,strip()函数对字符串去除两边空白字符。

    4.2K20

    利用深度学习建立流失模型(附完整代码)

    zhihu.com/people/chen-guan-xi-11-65 作者投稿邮箱:pythonpost@163.com、知乎专栏Python中文社区 客户流失分析 失去一个老用户会带来巨大的损失,大概需要公司拉10...#利用pandas中的to_datetime函数把字符串的日期变为时间序列 df['registrationTime'] = pd.to_datetime(df['registrationTime'],...直接导入的pandas的数据是字符串格式的时间,我们需要将数据转化为时间序列格式。这里用到pandas自带的to_datetime函数,可以方便快速的把字符串转化为时间序列。...从上图可以看到,数据已经被拆分为670行和330行2个数据集了。 尺度标准化 所有神经网络的输入层必须进行标准处理,因为不同的大小是不一样,这样的话没法进行对比。所以需要对数据集进行标准化处理。...首先定义一个对象,sc = StandardScaler(),然后把数据集放进去就可以直接输出一个标准化完成的数据集。输出的数据集如上图所示。

    1.9K20

    Pandas实现分列功能(Pandas读书笔记1)

    pandas的主人貌似是熊猫爱好者,或者最初是用来分析熊猫行为的! 不管怎样,Pandas是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。...按照某拆分数据并分别存储至不同文件! 大家可以先下载一下这个文件实验一下! 链接:https://pan.baidu.com/s/1kW0nJoF 密码:56xd 友情提醒!...如何按照K镇区的非重复值拆分为独立文件呢! 方法一:勤劳小蜜蜂! ? 刚刚演示了普通劳动人民是如何按照某拆分的!考虑K列有三十多种可能,勤劳如我也没有操作完!你们感兴趣可以弄一下!...import pandas as pd #导入pandas包 cf=open(r"D:\按照某拆分文件测试.csv",encoding='gb18030',errors='ignore') #r...,sep=',') #存储至的文件夹,并且按照筛选条件命名文件 知道有的朋友看到这些代码很头疼!

    3.6K40

    04.字段抽取拆分&记录抽取1.字段抽取2.字段拆分3.记录抽取

    1.字段抽取 根据已知的开始与结束位置,抽取出新的 字段截取函数slice(start, stop) slice()函数只能处理字符型数据 start从0开始,取值范围前闭后开。...3721 5 9313 6 4373 7 2452 8 7681 Name: tel, dtype: object #赋值回去,原值由Series转换为DataFrame,并生成的三...13822254373 138 2225 4373 7 13322252452 133 2225 2452 8 18922257681 189 2225 7681 2.字段拆分...按固定的字符,拆分已有字符串 字段分隔函数split(sep, n, expand=False) 参数说明 sep:用于分割的字符串 n:分割为多少列,从0开始,如设置为0,即拆分为1;如设置为1...,则拆分为2 expand:是否展开为数据框,默认为False expand返回值: 如expand为True,返回DataFrame 如expand为False,返回Series from pandas

    1.4K20

    pandas 文本处理大全(附代码)

    除了常规变量df.col以外,也可以对索引类型df.Index和df.columns使用 确保访问的对象类型是字符串str类型。...s.str.len() # 字符串长度 s.str.encode('utf-8') # 字符编码 s.str.decode('utf-8') # 字符解码 2、文本拆分 通过使用split方法可以某个指定的字符作为分割点拆分文本...其中,expand参数可以让拆分的内容展开,形成单独的,n参数可以指定拆分的位置来控制形成几列。 下面将email变量按照@进行拆分。...将单个序列拼接为一个完整字符串 如上所述,当没有设置ohters参数时,该方法会将当前序列合并为一个字符串。...拼接序列和其他类列表型对象为的序列 下面先将name和*拼接,再将level拼接,形成一个的序列。

    1.1K20
    领券