首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

根据另一列中的子字符串更新df列

在数据处理中,经常会遇到需要根据一列中的数据来更新另一列的情况。如果更新的条件是基于子字符串的匹配,可以使用Pandas库中的str.contains()方法结合条件赋值来实现。以下是一个基本的示例,展示了如何根据一列中的子字符串来更新另一列的值。

基础概念

  • DataFrame: Pandas库中的一个二维表格数据结构,可以存储多种类型的数据。
  • str.contains(): Pandas字符串操作方法,用于检测字符串中是否包含指定的子字符串。
  • 条件赋值: 使用布尔索引来根据条件更新DataFrame中的数据。

示例代码

假设我们有一个DataFrame df,其中包含两列:sourcestatus。我们想要根据source列中的子字符串来更新status列的值。

代码语言:txt
复制
import pandas as pd

# 创建示例DataFrame
data = {
    'source': ['apple_store', 'google_play', 'amazon', 'apple_store_v2'],
    'status': ['unknown', 'unknown', 'unknown', 'unknown']
}
df = pd.DataFrame(data)

# 根据'source'列中的子字符串更新'status'列
df.loc[df['source'].str.contains('apple'), 'status'] = 'approved'
df.loc[df['source'].str.contains('google'), 'status'] = 'pending'
df.loc[df['source'].str.contains('amazon'), 'status'] = 'rejected'

print(df)

输出结果

代码语言:txt
复制
           source    status
0      apple_store   approved
1     google_play    pending
2          amazon   rejected
3  apple_store_v2   approved

应用场景

  • 数据清洗: 在数据预处理阶段,根据某些关键词来修正或标记数据。
  • 自动化分类: 根据内容自动为数据项分配类别或状态。
  • 报告生成: 在生成报告时,根据特定条件突出显示或更改数据的显示方式。

注意事项

  • 使用str.contains()时,默认情况下区分大小写。如果需要进行不区分大小写的匹配,可以设置参数case=False
  • 如果子字符串匹配较多,可能会影响性能。在这种情况下,可以考虑使用更高效的数据处理方法或工具。

通过上述方法,可以灵活地根据数据中的特定模式来更新DataFrame中的值,这对于数据分析和处理任务非常有用。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

根据数据源字段动态设置报表中的列数量以及列宽度

在报表系统中,我们通常会有这样的需求,就是由用户来决定报表中需要显示的数据,比如数据源中共有八列数据,用户可以自己选择在报表中显示哪些列,并且能够自动调整列的宽度,已铺满整个页面。...本文就讲解一下ActiveReports中该功能的实现方法。 第一步:设计包含所有列的报表模板,将数据源中的所有列先放置到报表设计界面,并设置你需要的列宽,最终界面如下: ?...第二步:在报表的后台代码中添加一个Columns的属性,用于接收用户选择的列,同时,在报表的ReportStart事件中添加以下代码: /// /// 用户选择的列名称...].Width; // 设置控件坐标 if (tmp == null) { // 设置需要显示的第一列坐标...源码下载: 动态设置报表中的列数量以及列宽度

4.9K100
  • 问与答112:如何查找一列中的内容是否在另一列中并将找到的字符添加颜色?

    引言:本文整理自vbaexpress.com论坛,有兴趣的朋友可以研阅。...Q:我在列D的单元格中存放着一些数据,每个单元格中的多个数据使用换行分开,列E是对列D中数据的相应描述,我需要在列E的单元格中查找是否存在列D中的数据,并将找到的数据标上颜色,如下图1所示。 ?...A:实现上图1中所示效果的VBA代码如下: Sub ColorText() Dim ws As Worksheet Dim rDiseases As Range Dim rCell...End If Loop Next iDisease Next rCell End Sub 代码中使用Split函数以回车符来拆分单元格中的数据并存放到数组中...,然后遍历该数组,在列E对应的单元格中使用InStr函数来查找是否出现了该数组中的值,如果出现则对该值添加颜色。

    7.2K30

    Excel公式练习38: 求一列中的数字剔除掉另一列中的数字后剩下的数字

    本次的练习是:如下图1所示,在单元格区域A2:A12和B2:B12中给定两列数字,要在列C中从单元格C2开始生成一列数字。规则如下: 1. 列B中的数字的数量要小于等于列A中数字的数量。 2....列B中的任意数字都可以在列A中找到。 3. 在列A或列B已存放数字的单元格之间不能有任何空单元格。 4. 在列C中的数字是从列A中的数字移除列B中的数字在列A中第一次出现的数字后剩下的数字。 5....换句话说,列B和列C中的数字合起来就是列A中的数字。 ? 图1 在单元格D1中的数字等于列A中的数字数量减去列B中的数字数量后的值,也就是列C中数字的数量。...公式的思路就是构造一个数组,能够实现在List1和List2之间执行MATCH函数查找时,列C中的数值就是找不到的值,返回FALSE。 然而,实现起来并不是想像中的那么简单。...使用下面的公式确定列C中要返回的数字数量: =COUNT(List1)-COUNT(List2) 1.

    3.4K20

    分组后合并分组列中的字符串如何操作?

    一、前言 前几天在Python最强王者交流群【IF】问了一个Pandas的问题,如图所示。...下面是他的原始数据: 序号 需求 处理人 1 优化 A 2 优化 B 3 运维 A 4 运维 C 5 需求 B 6 优化 C 7 运维 B 8 运维 C 9 需求 C 10 运维 C 11 需求 B...如果不去重,就不用unique,完美地解决粉丝的问题! 后来他自己参考月神的文章,拯救pandas计划(17)——对各分类的含重复记录的字符串列的去重拼接,也写出来了,如图所示。...这篇文章主要盘点了一个pandas的基础问题,文中针对该问题给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。...最后感谢粉丝【IF】提问,感谢【月神】、【瑜亮老师】给出的思路和代码解析,感谢【dcpeng】等人参与学习交流。

    3.3K10

    【C#】让DataGridView输入中实时更新数据源中的计算列

    理解前提:熟知DataTable、DataView 求:更好方案 考虑这样一个场景: 某DataTable(下称dt)的B列是计算列(设置了Expression属性),是根据A列的数据计算而来,该dt被绑定到某个...DataGridView(下称dgv),A、B两列都要在dgv中显示,其中A列可编辑(ReadOnly=false)。...需求是对A列进行编辑时(输入或删除),B列能实时变化。例如下面的例子: ? 【目标文件名】是根据【款号】和【色号】计算而来(连接字符串),当编辑款号/色号时,目标文件名能实时变化。...可以看到,计算列得到更新的关键有两处: dgv单元格的数据要提交到数据源相应单元格 源行结束编辑状态 按常规提交流程,必须使焦点离开单元格所在的行(只离开单元格都不行哦)才能达到目的,而我们的需求是,编辑的过程中就要实时更新...按说到这里就搞掂了,事实上也的确能使计算列实时反映输入,但却存在另一个体验层面的问题,就是单元格会在每次键入后内容全选,如图: ?

    5.3K20

    C语言经典100例002-将M行N列的二维数组中的字符数据,按列的顺序依次放到一个字符串中

    系列文章《C语言经典100例》持续创作中,欢迎大家的关注和支持。...喜欢的同学记得点赞、转发、收藏哦~ 后续C语言经典100例将会以pdf和代码的形式发放到公众号 欢迎关注:计算广告生态 即时查收 1 题目 编写函数fun() 函数功能:将M行N列的二维数组中的字符数据...,按列的顺序依次放到一个字符串中 例如: 二维数组中的数据为: W W W W S S S S H H H H 则字符串中的内容是:WSHWSHWSH [image.png] 2 思路 第一层循环按照列数进行...M 3 #define N 4 /** 编写函数fun() 函数功能:将M行N列的二维数组中的字符数据,按列的顺序依次放到一个字符串中 例如: 二维数组中的数据为: W W W W S S S...S H H H H 则字符串中的内容是:WSHWSHWSH **/ // 0 1 2 3 // 0 W W W W // 1 S S S S // 2 H H H H char *fun(char

    6.1K30

    arcengine+c# 修改存储在文件地理数据库中的ITable类型的表格中的某一列数据,逐行修改。更新属性表、修改属性表某列的值。

    作为一只菜鸟,研究了一个上午+一个下午,才把属性表的更新修改搞了出来,记录一下: 我的需求是: 已经在文件地理数据库中存放了一个ITable类型的表(不是要素类FeatureClass),注意不是要素类...FeatureClass的属性表,而是单独的一个ITable类型的表格,现在要读取其中的某一列,并统一修改这一列的值。...表在ArcCatalog中打开目录如下图所示: ? ?...false); int fieldindex = pTable.FindField("JC_AD");//根据列名参数找到要修改的列 IRow row =...= "X";//新值,可以根据需求更改,比如字符串部分拼接等。

    9.6K30

    Excel应用实践16:搜索工作表指定列范围中的数据并将其复制到另一个工作表中

    学习Excel技术,关注微信公众号: excelperfect 这里的应用场景如下: “在工作表Sheet1中存储着数据,现在想要在该工作表的第O列至第T列中搜索指定的数据,如果发现,则将该数据所在行复制到工作表...Sheet2中。...用户在一个对话框中输入要搜索的数据值,然后自动将满足前面条件的所有行复制到工作表Sheet2中。” 首先,使用用户窗体设计输入对话框,如下图1所示。 ?...Application.ScreenUpdating = False '赋值为工作表Sheet1 Set wks = Worksheets("Sheet1") With wks '工作表中的最后一个数据行...("O2:T"& lngRow) '查找的数据文本值 '由用户在文本框中输入 FindWhat = "*" &Me.txtSearch.Text & "*

    6.1K20

    通宵翻译Pandas官方文档,写了这份Excel万字肝货操作!

    If/then逻辑 假设我们想要根据 total_bill 是小于还是大于 10 美元,来创建一个具有低值和高值的列。 在Excel电子表格中,可以使用条件公式进行逻辑比较。...列的选择 在Excel电子表格中,您可以通过以下方式选择所需的列: 隐藏列; 删除列; 引用从一个工作表到另一个工作表的范围; 由于Excel电子表格列通常在标题行中命名,因此重命名列只需更改第一个单元格中的文本即可...查找子串的位置 FIND电子表格函数返回子字符串的位置,第一个字符为 1。 您可以使用 Series.str.find() 方法查找字符串列中字符的位置。find 搜索子字符串的第一个位置。...按位置提取子串 电子表格有一个 MID 公式,用于从给定位置提取子字符串。获取第一个字符: =MID(A2,1,1) 使用 Pandas,您可以使用 [] 表示法按位置位置从字符串中提取子字符串。...数据透视表 电子表格中的数据透视表可以通过重塑和数据透视表在 Pandas 中复制。再次使用提示数据集,让我们根据聚会的规模和服务器的性别找到平均小费。

    19.6K20

    Pandas中替换值的简单方法

    在这篇文章中,让我们具体看看在 DataFrame 中的列中替换值和子字符串。当您想替换列中的每个值或只想编辑值的一部分时,这会派上用场。 如果您想继续,请在此处下载数据集并加载下面的代码。...import pandas as pd df = pd.read_csv('WordsByCharacter.csv') 使用“替换”来编辑 Pandas DataFrame 系列(列)中的字符串...Pandas 中的 replace 方法允许您在 DataFrame 中的指定系列中搜索值,以查找随后可以更改的值或子字符串。...you do this df["Film"].replace("Of The", "of the", regex=True) 上面,我们所做的只是将我们正在寻找的子字符串作为第一个参数传递给 replace...每当在列值中找到它时,它就会从字符串中删除,因为我们传递的第二个参数是一个空字符串。

    5.5K30

    直观地解释和可视化每个复杂的DataFrame操作

    包含值的列将转换为两列:一列用于变量(值列的名称),另一列用于值(变量中包含的数字)。 ? 结果是ID列的值(a,b,c)和值列(B,C)及其对应值的每种组合,以列表格式组织。...诸如字符串或数字之类的非列表项不受影响,空列表是NaN值(您可以使用.dropna()清除它们 )。 ? 在DataFrame df中Explode列“ A ” 非常简单: ?...Stack 堆叠采用任意大小的DataFrame,并将列“堆叠”为现有索引的子索引。因此,所得的DataFrame仅具有一列和两级索引。 ? 堆叠名为df的表就像df.stack()一样简单 。...how参数是一个字符串,它表示四种连接 方法之一, 可以合并两个DataFrame: ' left ':包括df1的所有元素, 仅当其键为df1的键时才 包含df2的元素 。...为了防止这种情况,请添加一个附加参数join ='inner',该参数 只会串联两个DataFrame共有的列。 ? 切记:在列表和字符串中,可以串联其他项。

    13.3K20

    Pandas用了一年,这3个函数是我最的最爱……

    对象接收返回值; assign不仅可用于创建新的列,也可用于更新已有列,此时创建的新列会覆盖原有列。...另一方面,pandas中实际上是内置了大量的SQL类语法(包括下面要介绍的query也是),而eval的功能正是执行类似SQL语法中的计算,对已知列执行一定的计算时可用eval完成。...03 query 这应该是最近使用最为频繁的一个接口了,pandas中虽然也提供了多种数据筛选方式,例如loc中增加表达式、或者直接用df[df[]……]等等,但总觉得用起来不够优雅,尤其是要写两遍df...尤其是query也是类似于SQL中where关键字的语法逻辑,用起来会很顺滑。 ? 例如对于以上dataframe,需要根据不同场景查询满足条件的记录,调用query的实现方式为: ?...例如,下述例子中C C列中有个空格,直接用于字符串表达式会存在报错,此时可使用反引号加以修饰,同时查询条件中应用了@修饰符引用外部变量。当然,与eval中类似,这里当然也可以用f字符串修饰引用。

    1.9K30

    Pandas入门2

    image.png 5.5 排序和排名 使用DataFrame对象的sort_valuse方法,需要两个参数:第1个参数by是根据哪一行或列排序; 第2个参数axis为0或1,默认为0,0为按列排序,...df[['Mjob','Fjob']].applymap(str.title) Step 7.创建一个名为majority函数,并根据age列数据返回一个布尔值添加到新的数据列,列名为 legal_drinker...(根据年龄这一列数据,大于17岁为合法饮酒) df['legal_drinker'] = df['age'] > 17 6....Python中的字符串处理 对于大部分应用来说,python中的字符串应该已经足够。 如split()函数对字符串拆分,strip()函数对字符串去除两边空白字符。...复习字符串对象的4个方法:join方法连接字符串、 find方法寻找子字符串出现的索引位置、count方法返回子字符串出现的次数、 replace方法用来替换。

    4.2K20

    分析你的个人Netflix数据

    将字符串转换为Pandas中的Datetime和Timedelta 我们两个时间相关列中的数据看起来确实正确,但是这些数据实际存储的格式是什么?...我们可以用df.dtypes快速获取数据框中每列的数据类型列表,执行: df.dtypes ? 正如我们在这里看到的,这三列都存储为object,这意味着它们是字符串。...在本教程中,我们随后将使用reset_index()将其转换回常规列。根据你的偏好和目标,这可能不是必需的,但是为了简单起见,我们将尝试使用列中的所有数据进行分析,而不是将其中的一些数据作为索引。...我们使用str.contains(),给出两个参数: “Friends”,这是我们用来挑选Friends片段的子字符串。 regex=False,它告诉函数前一个参数是字符串而不是正则表达式。...关键要点 在这篇文章中,我们快速浏览了Netflix的一些个人数据。但是从这里你可以利用本文分析的方法做很多事!以下是一些为自己扩展这个项目的想法: 为另一个节目做同样或类似的分析。

    1.7K50

    涨姿势!看骨灰级程序员如何玩转Python

    (或者,你可以在linux中使用'head'命令来检查任何文本文件中的前5行,例如:head -c 5 data.txt) 然后,你可以使用df.columns.tolist()来提取列表中的所有列,然后添加...此参数还有另一个优点,如果你有一个同时包含字符串和数字的列,那么将其类型声明为字符串是一个好选择,这样就可以在尝试使用此列作为键去合并表时不会出错。...']) 选择仅具有数字特征的子数据帧。...例如,如果你想检查“c”列中每个值的可能值和频率,可以执行以下操作 1. df[‘c’].value_counts() 它有一些有用的技巧/参数: 1....Percentile groups 你有一个数字列,并希望将该列中的值分类为组,例如将列的前5%,分为组1,前5-20%分为组2,前20%-50%分为组3,最后50%分为组4。

    2.3K20
    领券