首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Excel公式练习38: 求一列中的数字剔除掉另一列中的数字后剩下的数字

本次的练习是:如下图1所示,在单元格区域A2:A12和B2:B12中给定两列数字,要在列C中从单元格C2开始生成一列数字。规则如下: 1. 列B中的数字的数量要小于等于列A中数字的数量。 2....列B中的任意数字都可以在列A中找到。 3. 在列A或列B已存放数字的单元格之间不能有任何空单元格。 4. 在列C中的数字是从列A中的数字移除列B中的数字在列A中第一次出现的数字后剩下的数字。 5....换句话说,列B和列C中的数字合起来就是列A中的数字。 ? 图1 在单元格D1中的数字等于列A中的数字数量减去列B中的数字数量后的值,也就是列C中数字的数量。...,但构成的数组中的每个元素都是唯一的。...例如,如果在生成的数组中整数部分为3的最大值为3.000003,那么我们知道List1中应该恰好有3个元素3。

3.4K20

盘点csv文件中工作经验列工作年限数字正则提取的四个方法

的粉丝问了一个Python正则表达式提取数字的问题,这里拿出来给大家分享下,一起学习下。 代码截图如下: 可能有的粉丝不明白,这里再补充下。下图是她的原始数据列,关于【工作经验】列的统计。...现在她的需求是将工作年限提取出来,用于后面的多元回归分析。 二、解决过程 这里提供四个解决方法,感谢【Python进阶者】和【月神】提供的方法。...前面两种是【Python进阶者】的,后面两个是【月神】提供的,一起来学习下吧!...(\d+)').astype(float).mean(axis=1).fillna(0).round(0) 这个是用str.extract提取正则,正则表达式和上面一样,用了很多的链式方法,运行结果如下图所示...这篇文章基于粉丝提问,盘点了csv文件中工作经验列工作年限数字正则提取的三个方法,代码非常实用,可以举一反三,文中针对该问题给出了具体的解析和代码演示,帮助粉丝顺利解决了问题。 最后感谢粉丝【安啦!】

1.5K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Excel表格中某一列的多行数据都出现数字+中文的数据,但我只要数字怎么处理?

    一、前言 前几天在Python白银交流群【kaggle】问了一个Pandas处理字符串的问题,提问截图如下: 二、实现过程 这里【甯同学】给了一个思路,使用正则表达式进行实现,确实是个可行的方法,并且给出代码如下所示...str.replace(r'\D+','',regex=True) # 替换为0 df["year"] = df["year"].replace(r'\D+','0',regex=True) 上面的代码会把原始的数字也全部替换掉...,如果想保留原始行的数据列的话,可以使用如下代码: df["new"] = df["省"].replace(r'\D+', '', regex=True) 顺利地解决了粉丝的问题。...【瑜亮老师】后面也补充了一些关于正则表达式的知识,如下图所示: 这个问题其实方法还是很多的,这里只是抛砖引玉了一番。...这篇文章主要盘点了一个Pandas处理的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。

    1.6K20

    Excel公式练习35: 拆分连字符分隔的数字并放置在同一列中

    本次的练习是:在单元格区域A1:A6中,有一些数据,有的是单独的数字,有的是由连字符分隔的一组数字,例如13-16表示13、14、15、16,现在需要将这些数据拆分并依次放置在列D中,如下图1所示。...这样,我们可以看到上面的结果数组中对应于单元格A1:A6中每个数据要返回的数字个数,例如“1-2”将返回2个值、“4-6”将返回3个值,依此类推。...实际上,这个值代表我们从A1:A6的各字符串中范围最大的字符串返回的数字数量。...其实,之所以生成4列数组,是为了确保能够添加足够数量的整数,因为A1:A6中最大的间隔范围就是4个整数。...要去除不需要的数值,只需将上面数组中的每个值与last生成的数组相比较,(last数组生成的值为A1:A6中每个数值范围的上限)。

    3.7K10

    独家 | 手把手教数据可视化工具Tableau

    当您单击并将字段从“维度”区域拖到“行”或“列”时,Tableau 将创建列或行标题。 从“维度”区域拖出的任何字段在添加到视图时一开始为离散,带有蓝色背景。...聚合表示将多个值(单独的数字)聚集为一个数字,通过对单独值进行计数、对这些值求平均值或显示数据源中任何行的最小单独值来实现。...连续和离散 连续和离散是数学术语,连续意指“构成一个不间断的整体,没有中断”;离散意指“各自分离且不同”。 在 Tableau 中,字段可分为连续或离散。...标记(在本例中为条)是垂直的,因为轴是垂直的。每个标记的长度表示那一年的销售总额。您在此处看到的数字可能与实际数字不匹配 — 示例数据会随时发生变化。...但是,当按颜色或大小分解条形时,则将标记每个单独条形段而不是标记条形的合计。只需几步,您就可以向每个条形的顶部添加合计标签,即使这些条形像您刚刚创建的视图中一样已经细分。

    18.9K71

    常用的表格检测识别方法——表格结构识别方法(上)

    Amano等人(2001)创新性地引入了文本的语义信息,首先将文档分解为一组框,并将它们半自动地 分为四种类型:空白、插入、指示和解释。...当给定图像时,模型创建与原始输入图像大小相同的特征。SA Khan提出了一个鲁棒的基于深度学习的解决方案,用于从文档图片中已识别的表格中提取行和列。...在他们提出的工作中,使用掩模R-CNN和优化的锚点来检测行和列的边界。另一项分割表格结构的努力是由W Xue撰写的ReS2TIM论文,它提出了从表格中对句法结构的重建。...这些字符配对在每个单独的图像中加下划线,然后交给DenseNet-121分类器,该分类器被训练来识别同行、同列、同单元格或无单元格等空间相关性。...最后,作者将后处理应用于分类器的输出,以生成HTML表格结构。H Li将这个问题表述为一个单元格关系提取的挑战,并提供了T2,一种前沿的两阶段方法,成功地从数字保存的文本中提取表格结构。

    1.3K30

    验证码识别思想

    这个特征的解读我们利用前面所说的知识来自己解读一下,以图一为参考,图一中的前面的四列都是白色,所以我们的特征码中开始好多个零。...>_< 从第五列开始,除了前面的两格是白色,接下来就是黑色了,这样我们开始数一下,就是应该有82个零,然后开始是1,嘿嘿~~~大家可以数一下。...本章重点: 1、使用上一章所制作的提取器,提取无杂情况下图片的特征码,并将0~9,单独数字的特征码保存,在这里程序开始的时候使用一个字符串数字,将每个特征码都做保存。...3、注意图片的长度和高度,上面提取的验证码是每一个单数字的长度及高度,而在这里是需要这整张图片的长度是多少,高度是多少,必需切成一个一个的数字进 行验证。...现在我们示列中的图片的总长度是120,其中包涵着6个数字,我们所提取的特征码为20*20,也就是说总长度必需分为6份,每单数字的高度为 20,长度为20,循环6次就能得到整张图片。

    1.3K30

    python df 列替换_如何用Python做数据分析,没有比这篇文章更详细的了(图文详情)...

    可以对整个数据表进行检查,也可以单独对某一列进行空值检查。  ...Where 函数用来对数据进行判断和分组,下面的代码中我们对 price 列的值进行判断,将符合条件的分为一组,不符合条件的分为另一组,并使用 group 字段进行标记。  ...数据分列  在数据表中 category 列中的数据包含有两个信息,前面的数字为类别 id,后面的字母为 size 值。中间以连字符进行连接。...我们使用 split 函数对这个字段进行拆分,并将拆分后的数据表匹配回原数据表中。  ...1#提取 4 日之前的所有数据  2df_inner[:'2013-01-04']  按提起提取  按位置提取(iloc)  使用 iloc 函数按位置对数据表中的数据进行提取,这里冒号前后的数字不再是索引的标签名称

    4.5K00

    如何以正确的方法做数据建模?

    实体具有描述特定属性的属性。在数据分析中,实体通常被具体化为维度表,每个属性都是一个列或字段。 事实表包含用于汇总和聚合度量值的数字列,以及与维度表相关的列。...“在线销售”事实表包含用于将此表与每个维度关联的关键列。事实表还包含数字类型的列,用于定义聚合和合计数字值(如净价、数量、单位成本、单位折扣和单价)的度量值。...你将注意到,从每个维度表到事实表的关系是一对多的,并在一个方向上过滤记录,如关系行上的箭头所示。例如,“客户信息表”与“在线销售”之间的关系基于这两个表中的“客户Key”列。...上图,有三个单独的日期列记录下订单的日期、到期日期和交付订单的日期。客户信息包括公司名称和可用于查找详细客户信息的唯一“客户Key”。有三个数字列可以汇总或聚合。...每个日期列的表,只有在需要灵活地使用DAX中的时间序列函数或使用日期部分字段(如年、季度或月)执行比较时,才需要单独的日期维度表,否则不需要单独创建日期表。

    3.2K10

    年度实用技巧 | 提到布局,我第一个会想到的是flex

    它是 flex-direction 和 flex-wrap 属性的复合属性。 flex-direction值为row时表示横向排列,flex-wrap 的值为wrap表示可以在必要的时候拆行或拆列。...flex-wrap规定flex容器是单行或者多行,同时横轴的方向决定了新行堆叠的方向。nowrap:默认值。规定灵活的项目不拆行或不拆列。wrap:规定灵活的项目在必要的时候拆行或拆列。...wrap-reverse:规定灵活的项目在必要的时候拆行或拆列,但是以相反的顺序。initial:设置该属性为它的默认值。请参阅 initial。inherit:从父元素继承该属性。...column-count指定某个元素应分为的列数。number:列的最佳数目将其中的元素的内容无法流出。auto:列数将取决于其他属性,例如:"column-width"。...一个小习题我们偶尔在浏览网页的时候,会看到进度条加载的动画。进度条加载动画,一般是将某个背景色从0或者某个位置到达100%,铺满整个容器。如何实现进度条加载动画?解答方案会在下篇文章中给出。

    13920

    Shell 正则表达式及综合案例及文本处理工具

    }$ 大于小于11位数字都是不符合的  四、案例之归档文件 实际生产应用中,往往需要对重要的数据进行归档备份 需求:实现一个目录归档备份的脚本,输入一个目录名称,将目录下所有文件按天归档保存,并将归档日期附加在文档文件名上...应该输入一个参数作为归档目录名"     exit fi # 从参数中获取目录名称,查看目录名称是否存在 if [ -d $1 ] then     echo else     echo...cut 命令从文件的每行剪切字节、字符和字段并将这些字节、字符和字段输出 基本用法 cut [选项参数] filename 选项参数 选项参数 功能 -f 列号,提取第几列 -d 分隔符,按照指定分隔符分割列..." -f 1 cut_test.txt 假如我们想要提取第一和第四列,可以这样写:  cut -d " " -f 1,4 cut_test.txt 比如说我们想知道ens33网卡的所有IP...搜索passwd文件以root关键字开头的所有行,并输入该行的第1列和第7列,中 间以","分割 cat /etc/passwd | awk -F ":" '/^root/ {print 3

    38130

    使用PyTorch进行表格数据的深度学习

    选择用来表示列中任何类别的数字并不重要,因为稍后将使用分类嵌入来进一步编码这些类别。这是标签编码的一个简单示例: ? 使用了LabelEncoderscikit-learn库中的类对分类列进行编码。...已删除DateTime列,因为输入记录的确切时间戳似乎不是一项重要功能。实际上,首先尝试将其拆分为单独的月份和年份列,但后来意识到完全删除该列会带来更好的结果!...可以在此处进行堆栈和处理,因为没有数字列(因此无需进行插补),并且每列的类别数是固定的。实际上,绝对不能这样做,因为它可能会将某些数据从测试/验证集中泄漏到训练数据中,并导致模型评估不准确。...分类嵌入 分类嵌入与NLP中常用的词嵌入非常相似。基本思想是在列中具有每个类别的固定长度矢量表示。...由于只需要嵌入分类列,因此将输入分为两部分:数字部分和分类部分。

    8K50

    70个NumPy练习:在Python下一举搞定机器学习矩阵运算

    Numpy还是深度学习工具Keras、sk-learn的基础组件之一。 此处的70个numpy练习,可以作为你学习numpy基础之后的应用参考。练习难度分为4层:从1到4依次增大。...答案: 4.如何从1维数组中提取满足给定条件的元素? 难度:1 问题:从arr数组中提取所有奇数元素。 输入: 输出: 答案: 5.在numpy数组中,如何用另一个值替换满足条件的元素?...难度:2 问题:获取数组a和b的元素匹配的索引号 输入: 输出: 答案: 14.从numpy数组中提取给定范围内的所有数字? 难度:2 问题:从数组a提取5到10之间的所有元素。...难度:3 问题:从以下URL中导入图像并将其转换为numpy数组。...答案: 64.如何从二维数组中减去一维数组,其中一维数组的每个元素都从相应的行中减去? 难度:2 问题:从二维数组a_2d中减去一维数组b_1d,使得每个b_1d项从a_2d的相应行中减去。

    20.7K42

    只需4步,微软数据科学家教你用OpenRefine搞定数据清洗

    首先,从文本文件中读取数据时,OpenRefine默认转为文本类型;本技巧将进行数据类型转换。否则没法针对性地处理数字列。 其次,数据中有重复(下文“排重”部分会处理这个问题)。...再次,city_state_zip列,顾名思义,是市、州、邮编的混合体。我们还是希望拆分它们,在下文“用正则表达式与GREL清理数据”中,我们将看到如何提取这些信息。...在打开的窗口中,使用GREL转换日期: ? 这里的value变量代表选中列(sale_date)中每个单元格的值。...表达式的第一部分从值中提取出月份和天数,也就是说,我们截取第4个到第10个字符的子字符串,得到May 21。 第二个substring(...)方法从字符串中提取出年份。...(\d{5}) 从后往前理解这个表达式要容易些。首先用(\d{5})提取出邮编。\d表示任何数字(等价于([0-9]{5})),{5}从字符串尾部开始选取5个数字。然后是(..)

    5K20

    _Shell 正则表达式及综合案例及文本处理工具

    $匹配一行的结束.匹配任意一个字符**不单独使用,他和上一个字符连用,表示匹配上一个字符0次或者多次[][]表示匹配某个范围内的一个字符\表示转义字符,一般和特殊字符连用表示特殊字符本身例1:匹配以a字符开头的...$大于小于11位数字都是不符合的 四、案例之归档文件实际生产应用中,往往需要对重要的数据进行归档备份 需求:实现一个目录归档备份的脚本,输入一个目录名称,将目录下所有文件按天归档保存,并将归档日期附加在文档文件名上...应该输入一个参数作为归档目录名" exit fi # 从参数中获取目录名称,查看目录名称是否存在 if [ -d $1 ] then echo else echo echo...cut 命令从文件的每行剪切字节、字符和字段并将这些字节、字符和字段输出基本用法 cut [选项参数] filename 选项参数选项参数功能-f列号,提取第几列-d分隔符,按照指定分隔符分割列,默认是制表符...搜索passwd文件以root关键字开头的所有行,并输入该行的第1列和第7列,中 间以","分割 cat /etc/passwd | awk -F ":" '/^root/ {print 3.

    29610

    数据分析基础——EXCEL快速上手秘籍

    那是因为,我们源数据格式是酱紫的,数据透视表分组逻辑是判断是否唯一,如果唯一则单独分为一行(或一列),想要把行标签的日期格式变成月的维度,也HIN简单。...简单来说,英文和数字的话,用LEN(TEXT)和LENB(TEXT)得到的数字是一样的,而汉字,LEN(TEXT)中,一个汉字是1个长度,LENB(TEXT)则是2个。 ?...,提取多少位,LEFT(text,3),就是从左边起,提取3个字符,RIGHT(TEXT,3)是从右边起,提取3个,下面是一个简单的例子: 我们想要分别提取A13单元格,左边3个字符,右边5个字符: ?...2.5 FIND,SEARCH,MID 上面LEFT和RIGHT是很粗暴的提取方法,而MID就显得更加温婉和灵活了, ? 有一串这样的文本,而我们只想要提取其中的数字部分,该怎么做呢?...上面的公式是说我们从第4个字符开始,提取其后的4位,结果如下: ? 咳,提取问题加大难度: ? 假如我们想要提取上面“省-市”单元格中的城市部分,怎么办呢?(比如武汉市、杭州市..)

    2K00

    数据分析基础——EXCEL快速上手秘籍

    那是因为,我们源数据格式是酱紫的,数据透视表分组逻辑是判断是否唯一,如果唯一则单独分为一行(或一列),想要把行标签的日期格式变成月的维度,也HIN简单。...简单来说,英文和数字的话,用LEN(TEXT)和LENB(TEXT)得到的数字是一样的,而汉字,LEN(TEXT)中,一个汉字是1个长度,LENB(TEXT)则是2个。 ?...,提取多少位,LEFT(text,3),就是从左边起,提取3个字符,RIGHT(TEXT,3)是从右边起,提取3个,下面是一个简单的例子: 我们想要分别提取A13单元格,左边3个字符,右边5个字符: ?...2.5 FIND,SEARCH,MID 上面LEFT和RIGHT是很粗暴的提取方法,而MID就显得更加温婉和灵活了, ? 有一串这样的文本,而我们只想要提取其中的数字部分,该怎么做呢?...上面的公式是说我们从第4个字符开始,提取其后的4位,结果如下: ? 咳,提取问题加大难度: ? 假如我们想要提取上面“省-市”单元格中的城市部分,怎么办呢?(比如武汉市、杭州市..)

    2.1K10
    领券