Loading [MathJax]/jax/output/CommonHTML/config.js

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >将函数应用到Pandas行中的值列表中，为什么我只得到第一个结果？

问将函数应用到Pandas行中的值列表中，为什么我只得到第一个结果？
EN

Stack Overflow用户

提问于 2020-05-14 19:19:16

回答 2查看 207关注 0票数 1

我有一个由两列组成的数据框架，我想清理第二列'tweets‘。第二列“tweets”中的每个值由一个包含大约100项的列表组成。

我想迭代每一行中的每一个列表来清理文本。

我的数据框架的示例(列表中的每一项都是带有引号的字符串)：

data = ({'user_id':['324','242'],
     'tweets':[["NEWS FLASH: popcorn-flavored Tic-Tacs taste as crap as you imagine.",
                 "The 1970s is here to show us the way: https:xxxx",
                 "FB needs to hurry up and add a laugh/cry button üò¨üò≠üòìü§¢üôÑüò±"],
               ["You don't feel like hiding in your personal cave quite so much",
                "More for Cancer https://xxxx",
                "You prefer to keep things to yourself today"]]})
df=pd.DataFrame(data)

我编写了这个正则表达式来删除http tags

#function to remove HTML tags 
def remove_html(mylist):
    for item in mylist:
        text =re.sub(r'http\S+','',item,flags=re.MULTILINE)
        return text

我使用以下代码应用于数据帧中的每一行：

df['tweets']=df['tweets'].apply(remove_html)

问题是，当我将函数应用于数据帧时，我只得到每个列表中的第一个元素。由于某种原因，函数只返回第一个元素。

我得到的输出：

0    NEWS FLASH: popcorn-flavored Tic-Tacs taste as crap as you imagine.
1    You don't feel like hiding in your personal cave quite so much     
Name: tweets, dtype: object

任何建议都会有帮助

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2020-05-14 19:29:10

问题在于您的remove_html()函数。

您将提前返回，并且只返回列表的第一个元素。

使用下面的函数，注意return语句是如何在for循环之外的。

def remove_html(mylist): 
    return_list = [] 
    for item in mylist: 
        text = re.sub(r'http\S+','',item,flags=re.MULTILINE) 
        return_list.append(text)  
    return return_list

票数 1

EN

Stack Overflow用户

发布于 2020-05-14 19:37:17

函数remove_html只返回第一个元素。

您可以尝试下面的代码。

#function to remove HTML tags 
def remove_html(mylist):
    t = []
    for item in mylist:
        text =re.sub(r'http\S+','',item,flags=re.MULTILINE)
        t.append(text)
    return t

票数 1

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/61811152

复制

相关文章

【pandas】pandas中的常见函数

4、pandas.get_dummies(data)：将某列数据用one-hot编码表示

西西嘛呦

2020/08/26

2K0

访问列表中的值

#!/usr/bin/python list1 = ['physics', 'chemistry', 1997, 2000] list2 = [1, 2, 3, 4, 5, 6, 7 ] print "list1[0]: ", list1[0] print "list2[1:5]: ", list2[1:5]

用户8442333

2021/05/27

5.7K0

pandas中的drop函数_pandas replace函数

java https 网络安全

dropna()函数的作用是去除读入的数据中（DataFrame）含有NaN的行。如下：

全栈程序员站长

2022/10/02

1.6K0

pandas中的缺失值处理

dataframe nan pandas 技巧

在真实的数据中，往往会存在缺失的数据。pandas在设计之初，就考虑了这种缺失值的情况，默认情况下，大部分的计算函数都会自动忽略数据集中的缺失值，同时对于缺失值也提供了一些简单的填充和删除函数，常见的几种缺失值操作技巧如下

生信修炼手册

2020/07/14

2.6K0

用过Excel，就会获取pandas数据框架中的值、行和列

python 编程算法

至此，我们已经学习了使用Python pandas来输入/输出（即读取和保存文件）数据，现在，我们转向更深入的部分。

fanjy

2021/11/29

19.4K0

用过Excel，就会获取pandas数据框架中的值、行和列

在pandas中遍历DataFrame行

python 编程算法

inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}]

用户7886150

2020/12/26

3.3K0

Excel公式：提取行中的第一个非空值

有时候，工作表行中的数据可能并不在第1个单元格，而我们可能会要获得行中第一个非空单元格中的数据，如下图1所示。

fanjy

2022/11/16

4.7K0

Excel公式：提取行中的第一个非空值

extract函数行结果

https java 网络安全

当flag为EXTR_PREFIX_SAME时，自动加前缀wx后，wx_b是覆盖前的$b的值。

全栈程序员站长

2022/07/08

3840

pandas中的窗口处理函数

apply min nan pandas window

滑动窗口的处理方式在实际的数据分析中比较常用，在生物信息中，很多的算法也是通过滑动窗口来实现的，比如经典的质控软件Trimmomatic, 从序列5'端的第一个碱基开始，计算每个滑动窗口内的碱基质量平均值，当滑动窗后的平均碱基质量值小于给定阈值时，去除该窗口以及之后的剩余碱基，以此达到去除低质量碱基的目的。

生信修炼手册

2020/07/14

2K0

pandas处理缺失值的函数_pandas填充缺失值

https java 网络安全

df.dropna()函数用于删除dataframe数据中的缺失数据，即删除NaN数据.

全栈程序员站长

2022/09/30

2K0

箭头函数中的'this'值

map object 继承作用域

那么为什么hobby的值输出成功，而name不能够输出呢？是因为lucifer丑吗？其实那只是其中一个因素，还有一个因素就是在ZnHobbies方法中的this已经不属于上一个区块，而这里的this并没有name值。所以解决办法的其中一个就是在ZnHobbies函数中写入

学前端

2020/04/07

2.2K0

pandas dropna删除有空值的行_pandas中导出缺失值

java https 网络安全

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

全栈程序员站长

2022/09/28

2.2K0

Python 列表中的sort函数

key list reverse sort 排序

列表中的sort函数功能对当前列表按照一定规律排序用法 list.sort(key=None, reverse=False) 参数 key - 参数比较 reverse –排序规则 reverse = True 降序 reverse = False 升序 ( 默认 ) key涉及函数学习,我们在日后讲解当前默认不传即可注意事项列表中的元素类型必须相同 , 否则无法排序(报错) 字典也可以排序, key或者value排序代码 # coding:utf-8 shu = '01老鼠' niu =

Zkeq

2022/05/18

2.4K0

Pandas中替换值的简单方法

编程算法 python 正则表达式数据处理

在处理数据时，编辑或删除某些数据作为预处理步骤的一部分。这可能涉及从现有列创建新列，或修改现有列以使它们适合更易于使用。为此，Pandas 提供了多种方法，您可以使用这些方法来处理 DataFrame 中所有数据类型的列。

deephub

2021/08/20

5.5K0

使用OPENXML函数将XML文档转换为行结果集

xml sql server sql 数据库

FOR XML子句都是将行结果集转换为XML结果集，那么如果想要将XML文档转换成行结果集，这时就要使用OPENXML函数。OPENXML在SQL Server 2000中就已经提供，但是在SQL Server 2005对该函数进行了增强。 OPENXML的语法为：

深蓝studyzy

2022/06/16

1.5K0

pandas中的loc和iloc_pandas loc函数

data dataframe pandas

.loc[],中括号里面是先行后列，以逗号分割，行和列分别是行标签和列标签，比如我要得到数字5，那么就就是：

全栈程序员站长

2022/11/09

1.2K0

将查询结果保存到excel中

<?php //****************连接数据库*************** $localhost=”localhost”; $root=”root”; // 用户 $databasen

苦咖啡

2018/05/07

1.7K0

NumPy、Pandas中若干高效函数！

数据库数据结构 sql numpy

我们都知道，Numpy 是 Python 环境下的扩展程序库，支持大量的维度数组和矩阵运算；Pandas 也是 Python 环境下的数据操作和分析软件包，以及强大的数据分析库。二者在日常的数据分析中都发挥着重要作用，如果没有 Numpy 和 Pandas 的支持，数据分析将变得异常困难。但有时我们需要加快数据分析的速度，有什么办法可以帮助到我们吗？

用户6888863

2023/03/01

6.6K0

NumPy、Pandas中若干高效函数！

pandas的dropna方法_python中dropna函数

python 编程算法 https 网络安全

如果你的数据集包含空值, 则可以使用dropna()函数分析并删除数据集中的行/列。

全栈程序员站长

2022/09/27

1.3K0

pandas中的字符串处理函数

在pandas中，通过DataFrame来存储文件中的内容，其中最常见的数据类型就是字符串了。针对字符串，pandas提供了一系列的函数，来提高操作效率。

生信修炼手册

2020/07/07

2.9K0

相似问题

为什么我需要lambda将函数应用到Pandas Dataframe？

10

将函数列表中的每个函数逐步应用到值中，并累积结果的函数的名称是什么？

23

如何将函数应用到混合类型的Pandas中？

16

将函数应用到列表并将其结果传递给构造函数？

41

Pandas根据列表中的值过滤行

224

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

社区富文本编辑器全新改版！诚邀体验～

全新交互，全新视觉，新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能，全面提升创作效率和体验