Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >将函数应用到Pandas行中的值列表中,为什么我只得到第一个结果?

将函数应用到Pandas行中的值列表中,为什么我只得到第一个结果?
EN

Stack Overflow用户
提问于 2020-05-14 19:19:16
回答 2查看 207关注 0票数 1

我有一个由两列组成的数据框架,我想清理第二列'tweets‘。第二列“tweets”中的每个值由一个包含大约100项的列表组成。

我想迭代每一行中的每一个列表来清理文本。

我的数据框架的示例(列表中的每一项都是带有引号的字符串):

代码语言:javascript
运行
AI代码解释
复制
data = ({'user_id':['324','242'],
     'tweets':[["NEWS FLASH: popcorn-flavored Tic-Tacs taste as crap as you imagine.",
                 "The 1970s is here to show us the way: https:xxxx",
                 "FB needs to hurry up and add a laugh/cry button 😬😭😓🤢🙄😱"],
               ["You don't feel like hiding in your personal cave quite so much",
                "More for Cancer https://xxxx",
                "You prefer to keep things to yourself today"]]})
df=pd.DataFrame(data)

我编写了这个正则表达式来删除http tags

代码语言:javascript
运行
AI代码解释
复制
#function to remove HTML tags 
def remove_html(mylist):
    for item in mylist:
        text =re.sub(r'http\S+','',item,flags=re.MULTILINE)
        return text

我使用以下代码应用于数据帧中的每一行:

代码语言:javascript
运行
AI代码解释
复制
df['tweets']=df['tweets'].apply(remove_html)

问题是,当我将函数应用于数据帧时,我只得到每个列表中的第一个元素。由于某种原因,函数只返回第一个元素。

我得到的输出:

代码语言:javascript
运行
AI代码解释
复制
0    NEWS FLASH: popcorn-flavored Tic-Tacs taste as crap as you imagine.
1    You don't feel like hiding in your personal cave quite so much     
Name: tweets, dtype: object

任何建议都会有帮助

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2020-05-14 19:29:10

问题在于您的remove_html()函数。

您将提前返回,并且只返回列表的第一个元素。

使用下面的函数,注意return语句是如何在for循环之外的。

代码语言:javascript
运行
AI代码解释
复制
def remove_html(mylist): 
    return_list = [] 
    for item in mylist: 
        text = re.sub(r'http\S+','',item,flags=re.MULTILINE) 
        return_list.append(text)  
    return return_list 
票数 1
EN

Stack Overflow用户

发布于 2020-05-14 19:37:17

函数remove_html只返回第一个元素。

您可以尝试下面的代码。

代码语言:javascript
运行
AI代码解释
复制
#function to remove HTML tags 
def remove_html(mylist):
    t = []
    for item in mylist:
        text =re.sub(r'http\S+','',item,flags=re.MULTILINE)
        t.append(text)
    return t
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/61811152

复制
相关文章
【pandas】pandas中的常见函数
4、pandas.get_dummies(data):将某列数据用one-hot编码表示
西西嘛呦
2020/08/26
2K0
访问列表中的值
#!/usr/bin/python list1 = ['physics', 'chemistry', 1997, 2000] list2 = [1, 2, 3, 4, 5, 6, 7 ] print "list1[0]: ", list1[0] print "list2[1:5]: ", list2[1:5]
用户8442333
2021/05/27
5.7K0
pandas中的drop函数_pandas replace函数
dropna()函数的作用是去除读入的数据中(DataFrame)含有NaN的行。 如下:
全栈程序员站长
2022/10/02
1.6K0
pandas中的缺失值处理
在真实的数据中,往往会存在缺失的数据。pandas在设计之初,就考虑了这种缺失值的情况,默认情况下,大部分的计算函数都会自动忽略数据集中的缺失值,同时对于缺失值也提供了一些简单的填充和删除函数,常见的几种缺失值操作技巧如下
生信修炼手册
2020/07/14
2.6K0
用过Excel,就会获取pandas数据框架中的值、行和列
至此,我们已经学习了使用Python pandas来输入/输出(即读取和保存文件)数据,现在,我们转向更深入的部分。
fanjy
2021/11/29
19.4K0
用过Excel,就会获取pandas数据框架中的值、行和列
在pandas中遍历DataFrame行
inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}]
用户7886150
2020/12/26
3.3K0
Excel公式:提取行中的第一个非空值
有时候,工作表行中的数据可能并不在第1个单元格,而我们可能会要获得行中第一个非空单元格中的数据,如下图1所示。
fanjy
2022/11/16
4.7K0
Excel公式:提取行中的第一个非空值
extract函数行结果
当flag为EXTR_PREFIX_SAME时,自动加前缀wx后,wx_b是覆盖前的$b的值。
全栈程序员站长
2022/07/08
3840
extract函数行结果
pandas中的窗口处理函数
滑动窗口的处理方式在实际的数据分析中比较常用,在生物信息中,很多的算法也是通过滑动窗口来实现的,比如经典的质控软件Trimmomatic, 从序列5'端的第一个碱基开始,计算每个滑动窗口内的碱基质量平均值,当滑动窗后的平均碱基质量值小于给定阈值时,去除该窗口以及之后的剩余碱基,以此达到去除低质量碱基的目的。
生信修炼手册
2020/07/14
2K0
pandas处理缺失值的函数_pandas填充缺失值
df.dropna()函数用于删除dataframe数据中的缺失数据,即 删除NaN数据.
全栈程序员站长
2022/09/30
2K0
箭头函数中的'this'值
那么 为什么hobby的值输出成功,而name不能够输出呢?是因为lucifer丑吗?其实那只是其中一个因素,还有一个因素就是在ZnHobbies方法中的this已经不属于上一个区块,而这里的this并没有name值。所以 解决办法的其中一个就是在ZnHobbies函数中写入
学前端
2020/04/07
2.2K0
pandas dropna删除有空值的行_pandas中导出缺失值
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
全栈程序员站长
2022/09/28
2.2K0
Python 列表中的sort函数
列表中的sort函数 功能 对当前列表按照一定规律排序 用法 list.sort(key=None, reverse=False) 参数 key - 参数比较 reverse –排序规则 reverse = True 降序 reverse = False 升序 ( 默认 ) key涉及函数学习,我们在日后讲解当前默认不传即可 注意事项 列表中的元素类型必须相同 , 否则无法排序(报错) 字典也可以排序, key或者value排序 代码 # coding:utf-8 shu = '01老鼠' niu =
Zkeq
2022/05/18
2.4K0
Pandas中替换值的简单方法
在处理数据时,编辑或删除某些数据作为预处理步骤的一部分。这可能涉及从现有列创建新列,或修改现有列以使它们适合更易于使用。为此,Pandas 提供了多种方法,您可以使用这些方法来处理 DataFrame 中所有数据类型的列。
deephub
2021/08/20
5.5K0
使用OPENXML函数将XML文档转换为行结果集
FOR XML子句都是将行结果集转换为XML结果集,那么如果想要将XML文档转换成行结果集,这时就要使用OPENXML函数。OPENXML在SQL Server 2000中就已经提供,但是在SQL Server 2005对该函数进行了增强。 OPENXML的语法为:
深蓝studyzy
2022/06/16
1.5K0
pandas中的loc和iloc_pandas loc函数
.loc[],中括号里面是先行后列,以逗号分割,行和列分别是行标签和列标签,比如我要得到数字5,那么就就是:
全栈程序员站长
2022/11/09
1.2K0
将查询结果保存到excel中
<?php //****************连接数据库*************** $localhost=”localhost”; $root=”root”; // 用户 $databasen
苦咖啡
2018/05/07
1.7K0
NumPy、Pandas中若干高效函数!
我们都知道,Numpy 是 Python 环境下的扩展程序库,支持大量的维度数组和矩阵运算;Pandas 也是 Python 环境下的数据操作和分析软件包,以及强大的数据分析库。二者在日常的数据分析中都发挥着重要作用,如果没有 Numpy 和 Pandas 的支持,数据分析将变得异常困难。但有时我们需要加快数据分析的速度,有什么办法可以帮助到我们吗?
用户6888863
2023/03/01
6.6K0
NumPy、Pandas中若干高效函数!
pandas的dropna方法_python中dropna函数
如果你的数据集包含空值, 则可以使用dropna()函数分析并删除数据集中的行/列。
全栈程序员站长
2022/09/27
1.3K0
pandas中的字符串处理函数
在pandas中,通过DataFrame来存储文件中的内容,其中最常见的数据类型就是字符串了。针对字符串,pandas提供了一系列的函数,来提高操作效率。
生信修炼手册
2020/07/07
2.9K0

相似问题

为什么我需要lambda将函数应用到Pandas Dataframe?

10

将函数列表中的每个函数逐步应用到值中,并累积结果的函数的名称是什么?

23

如何将函数应用到混合类型的Pandas中?

16

将函数应用到列表并将其结果传递给构造函数?

41

Pandas根据列表中的值过滤行

224
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文