开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >每行字数

问每行字数
EN

Stack Overflow用户

提问于 2018-04-23 07:37:42

回答 5查看 36.9K关注 0票数 35

我正在尝试在DataFrame中创建一个新列，其中包含相应行的单词计数。我在找单词的总数，而不是每个不同单词的频率。我以为会有一种简单/快速的方式来完成这个常见的任务，但是在谷歌上搜索并阅读了少量的SO帖子(1、2、3、4)之后，我被困住了。我已经尝试过在链接所以帖子中提出的解决方案，但是得到了很多属性错误。

words = df['col'].split()
df['totalwords'] = len(words)

结果：

AttributeError: 'Series' object has no attribute 'split'

和

f = lambda x: len(x["col"].split()) -1
df['totalwords'] = df.apply(f, axis=1)

结果：

AttributeError: ("'list' object has no attribute 'split'", 'occurred at index 0')

EN

回答 5

Stack Overflow用户

回答已采纳

发布于 2018-04-23 07:43:07

str.split + str.len

对于任何非数字列，str.len都能很好地工作。

df['totalwords'] = df['col'].str.split().str.len()

str.count

如果你的单词是单空格分隔，你可以简单地数空格加1。

df['totalwords'] = df['col'].str.count(' ') + 1

列表理解

这比你想象的要快！

df['totalwords'] = [len(x.split()) for x in df['col'].tolist()]

票数 57

EN

Stack Overflow用户

发布于 2018-04-23 07:43:07

下面是一种使用.apply()的方法

df['number_of_words'] = df.col.apply(lambda x: len(x.split()))

示例

考虑到这个df

>>> df
                    col
0  This is one sentence
1           and another

应用.apply()后

df['number_of_words'] = df.col.apply(lambda x: len(x.split()))

>>> df
                    col  number_of_words
0  This is one sentence                4
1           and another                2

Note：正如注释和this answer中指出的那样，.apply不一定是最快的方法。如果速度很重要，最好使用@cᴏʟᴅsᴘᴇᴇᴅ's方法之一。

票数 16

EN

Stack Overflow用户

发布于 2018-04-23 07:40:35

这是一种使用pd.Series.str.split和pd.Series.map的方法

df['word_count'] = df['col'].str.split().map(len)

以上假设df['col']是一系列字符串。

示例：

df = pd.DataFrame({'col': ['This is an example', 'This is another', 'A third']})

df['word_count'] = df['col'].str.split().map(len)

print(df)

#                   col  word_count
# 0  This is an example           4
# 1     This is another           3
# 2             A third           2

票数 8

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/49984905

复制

相关文章

Pycharm 修改自动格式化时每行的字数

马哥Python

2019/06/28

1K0

Pycharm 修改自动格式化时每行的字数

UITextView字数限制

经常做，经常忘，记下来，以后好直接拷贝。开始使用如下方法做限制 - (BOOL)textView:(UITextView *)textView shouldChangeTextInRange:(NSRange)range replacementText:(NSString *)text { if ([text isEqualToString:@""] && range.length > 0) { //删除字符肯定是安全的 return YES; }

王大锤

2018/07/04

2.7K0

UITextView字数限制

经常做，经常忘，记下来，以后好直接拷贝。开始使用如下方法做限制 - (BOOL)textView:(UITextView *)textView shouldChangeTextInRange:(NSRange)range replacementText:(NSString *)text { if ([text isEqualToString:@""] && range.length > 0) { //删除字符肯定是安全的 return YES; }

王大锤

2018/05/17

2.4K0

Typecho文章字数计算

腾讯云开发者社区

炒鸡简单的，只需要在当前使用的主题的根目录的functions.php插入如下代码

折影轻梦

2021/08/11

9930

php怎么统计文章字数？

PHP中如何正确统计中文字数？PHP中有很多函数可以计算字符串的长度，比如下面的例子，分别使用了 strlen，mb_strlen，mb_strwidth 这个三个函数去测试统计字符串的长度，看看把中文算成几个字节： echo strlen("二货ABC") . ""; # 输出 9 echo mb_strlen("二货ABC", 'UTF-8') . ""; # 输出 5 echo mb_strwidth("二货ABC") . ""; #输出 7 从上面的测试，我们可以看出：strlen 把中文字

雨尘

2018/07/17

3.2K0

统计字数oninput？keyup？onchange？

当元素的值发生改变时，会触发change事件。该事件仅适用于<input>, <select>和<textarea> 元素。当用于<select>元素时，change 事件会在选择某个选项时发生。当用于<input>或<textarea>时，该事件会在元素失去焦点时发生。

奋飛

2019/08/15

2.7K0

php怎么统计文章字数？

PHP中如何正确统计中文字数？PHP中有很多函数可以计算字符串的长度，比如下面的例子，分别使用了 strlen，mb_strlen，mb_strwidth 这个三个函数去测试统计字符串的长度，看看把中文算成几个字节：

墨渊

2018/05/09

4.8K5

Discourse 主题字数限制

min title 搜索用户体验

你可以在 Discourse 的后台设置中搜索 min topic title length 关键字。

HoneyMoose

2020/05/20

1.1K0

Discourse 主题字数限制

每行字符数（CPL）的起源

前几天，我收到网友小龙的Email。他想与我讨论一个问题： "各种计算机语言的编码风格，有的建议源码每行的字符数（characters per line）不超过72个，还有的建议不超过80个，这是

ruanyf

2018/04/12

1.2K0

python模拟sed在每行添加##

linux python node.js

我们在平常的工作中有时候需要对摸一个文件进行操作，比如在一个文件的每行前面添加##之类的，在shell中这个需求很简单，用sed单行就能搞定，下面我们来看看一个文件：

py3study

2020/01/06

9210

php怎么统计文章字数？

PHP中如何正确统计中文字数？PHP中有很多函数可以计算字符串的长度，比如下面的例子，分别使用了 strlen，mb_strlen，mb_strwidth 这个三个函数去测试统计字符串的长度，看看把中文算成几个字节： echo strlen("二货ABC") . ""; # 输出 9 echo mb_strlen("二货ABC", 'UTF-8') . ""; # 输出 5 echo mb_strwidth("二货ABC") . ""; #输出 7 从上面的测试，我们可以看出：strlen 把中文

用户1456630

2018/05/25

2.5K0

iOS lable多行取每行字符串

最近项目需要从lable的中去每行添加换行符，在网上找了一些资料，总结了一下怎么处理这个问题。

菜菜不吃蔡

2018/08/03

1.2K0

js对数字数组排序[通俗易懂]

编程算法 https java 网络安全

js中经常需要用到对数组进行排序的操作，当数组中的元素均为数字时，直接使用sort()进行排序得到的结果可能不是你想要的结果。

全栈程序员站长

2022/08/28

3.4K0

Salesforce lightning datatable 每行表示Link项目

listview android unity html javascript

使用LightningDatatable做成的ListView时，有时需要自定义Link项目，例如需要Link式的行删除事件，当点击消除Link时，消除当前行数据，如下

repick

2022/05/20

6080

Salesforce lightning datatable 每行表示Link项目

zblogPHP文章摘要字数说明

腾讯云开发者社区网站

相信很多做网站朋友都知道，在SEO方便，每个页面的关键词和描述最好都是提取文章的关键词和摘要，而有的人喜欢直接用调用文章的字数，有些人喜欢调用摘要内容的字数限制，今天就把这两种方法都交给大家，根据自己习惯去使用，因为有些网站是以图片形式发布的，但是如果以文章内容调用的话很可能是图片，所以摘要的字数显示就有用处了，教程如下：

李洋博客

2021/06/15

7550

zblogPHP文章摘要字数说明

Vue文字数组向上翻动

<template> <div class="marquee" @mouseenter="enterMar()" @mouseleave="leaveMar()"> <div :class="{ 'marquee-up': isUp }"> <p class="marquee-text" v-for="(item, index) in dataList" :key="index"> {{ item }} </p> </div> </div> <

明知山

2021/04/15

8150

读取文档数据的各列的每行中

java https 网络安全

发布者：全栈程序员栈长，转载请注明出处：https://javaforall.cn/117322.html原文链接：https://javaforall.cn

全栈程序员站长

2022/07/06

2K0

你的每行代码值多少钱？

php java xml ruby 分布式

我知道，“line of code”（LoC）是一种非常愚蠢的计量方式。不要急着喷我，请大家先听我讲讲我最近参与的两个项目，看一下一些非常有意思的数字。

哲洛不闹

2018/09/18

1.6K0

typecho统计博客所有文章的字数

php 腾讯云开发者社区

腾云先锋（TDP，Tencent Cloud Developer Pioneer）是腾讯云 GTS 官方组建并运营的技术开发者群体。这里有最专业的开发者&客户，能与产品人员亲密接触，专有的问题&需求反馈渠道，有一群志同道合的兄弟姐妹。来加入属于我们开发者的社群吧。

小唐同学.

2023/01/06

1.4K1

Typecho文章字数统计插件WordCount

plugins typecho word 编辑器插件

WordCount插件是一款默认编辑器增强Typecho插件，插件的功能是实时计算文章内容的文字数量、字符数量，包括文字、标点符号、英文字母、阿拉伯数字和标签。计算方式是字数等于文字数量加数字数量；文字字数包含中文数量；字母数量等于大小写字母；数字即0-9；标签数量即文章标签的数量。

小唐同学.

2022/02/18

2.8K2

Typecho文章字数统计插件WordCount

相似问题

查找每行的字数

20

每行打印随机字数

10

统计每行的字数

18

每行字数(WPL)图像处理

10

脚本中每行的字数

23

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例