首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【技能get】简单而有效的 EXCEL 数据分析小技巧

对于刚进入数据分析行业新手来说,EXCEL 可以被当做一款入门的软件。 甚至在学习R或Python前,对于新入门的小白来说,事先掌握一定的EXCEL知识是百利而无一害。...EXCEL并不适用于处理海量数据,虽然在某种程度上,可以通过一些其他的方法让EXCEL处理大型数据集,但我更推荐使用R或Python去处理,而不是EXCEL。...数据清洗 1.删除重复值:EXCEL有内置的功能,可以删除表中的重复值。它可以删除所选列中所含的重复值,也就是说,如果选择了两列,就会查找两列数据的相同组合,并删除。 ?...如上图所示,可以看到A001 和 A002有重复的值,但是如果同时选定“ID”和“Name”列,将只会删除重复值(A002,2)。...按照下列步骤操作可以删除重复值:选择所需数据-转到数据面板-删除重复值 ? 2.文本分列:假设你的数据存储在一列中,如下图所示: ? 如上如所示,我们可以看到A列中单元格内容被“;”所区分。

3.5K90

翻译 | 简单而有效的EXCEL数据分析小技巧

对于刚进入数据分析行业新手来说,EXCEL可以被当做一款入门的软件。 甚至在学习R或Python前,对于新入门的小白来说,事先掌握一定的EXCEL知识是百利而无一害。...EXCEL并不适用于处理海量数据,虽然在某种程度上,可以通过一些其他的方法让EXCEL处理大型数据集,但我更推荐使用R或Python去处理,而不是EXCEL。...数据清洗 1.删除重复值:EXCEL有内置的功能,可以删除表中的重复值。它可以删除所选列中所含的重复值,也就是说,如果选择了两列,就会查找两列数据的相同组合,并删除。 ?...如上图所示,可以看到A001 和 A002有重复的值,但是如果同时选定“ID”和“Name”列,将只会删除重复值(A002,2)。...按照下列步骤操作可以删除重复值:选择所需数据-转到数据面板-删除重复值 ? 2.文本分列:假设你的数据存储在一列中,如下图所示: ? 如上如所示,我们可以看到A列中单元格内容被“;”所区分。

3.5K100
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    使用R或者Python编程语言完成Excel的基础操作

    宏和VBA:对于更高级的用户,可以学习如何录制宏和编写VBA代码来自动化重复性任务。 函数学习:逐渐学习更多的内置函数,如逻辑函数、文本函数、统计函数等。...实际练习:通过解决实际问题来练习你的技能,可以是工作中的项目,也可以是自己感兴趣的数据集。 在线资源:利用在线教程、视频课程、社区论坛和官方文档来学习。...色阶:根据单元格的值变化显示颜色的深浅。 图标集:在单元格中显示图标,以直观地表示数据的大小。 公式和函数 数组公式:对一系列数据进行复杂的计算。...通过dplyr和tidyr包,我们可以轻松地对数据进行复杂的操作。 在R语言中,即使不使用dplyr和tidyr这样的现代包,也可以使用基础包中的函数来完成数据操作。...在实际工作中,直接使用Pandas进行数据处理是非常常见的做法,因为Pandas提供了对大型数据集进行高效操作的能力,以及丰富的数据分析功能。

    23910

    《Python for Excel》读书笔记连载1:为什么为Excel选择Python?

    如果你想想这是如何工作的,就会注意到一个单元格的值通常取决于一个或多个其他单元格,这些单元格可能会再次使用依赖于一个或多个其他单元格,依此类推。...没有重复的代码意味着更少的代码行和更少的错误,这使得代码更易于维护。 如果编写VBA,最常见的可重用代码是函数。例如,通过函数可以从多个宏访问同一代码块。...如果你查看图1-1中的货币转换工具,可以编写一个测试,检查单元格D4中的公式是否正确返回105美元,输入值如下:金额为100欧元,汇率为1.05欧元。这有什么帮助呢?...可以将其视为传统的透视表,与PowerQuery一样,它可以处理大型数据集。PowerPivot允许你定义具有关系和层次结构的正式数据模型,并且你可以通过DAX公式语言添加计算列。...PowerBI希望通过在交互式仪表板中可视化大型数据集来理解它们。它的核心依赖于与Excel相同的PowerQuery和PowerPivot功能。

    5.3K20

    Snapde和常用的CSV文件编辑器对比

    大家好,又见面了,我是你们的朋友全栈君。 Snapde,一个专门为编辑超大型数据量CSV文件而设计的单机版电子表格软件;它运行的速度非常快,反应非常灵敏。...delimit有比较完善的选择集,能够很方便删除数据,但是在删除行列只能单个进行,在复制、剪切、粘贴上只能单单元格进行,撤销、重做功能很弱基本不能使用。...Snapde在选择集操作上和Excel接近,如果是单元格多选,还可以在输入文本数字完成的时候按住control键,能得到序列变化的文本数字,在选择集这方面比较Snapde是最优秀的。...3、对于单元格文本的多行编辑 Snapde: 支持完善的多行文本,文本长度基本没有限制,在单元格上还可以编辑代码,代码脚本还可以根据类型进行语法着色 CSVed:不支持多行文本 reCsvEdit:不支持多行文本...4、其他功能比较 Snapde:具有自由冻结、放大缩小、隐藏行列、设置过滤、删除重复、单列排序功能 delimit:转换格式、行列分割、合并、过滤、双列排序、删除重复功能 5、对于脚本公式支持 Snapde

    3.8K20

    常用的表格检测识别方法——表格结构识别方法 (下)

    为了创建分割r的图,作者有H个节点排列在一个线性链中,其中每个节点都连接到它的两个邻居(除了两端的两个节点)。邻域边权值均匀设置为 \lambda_{gc}= 0.75。...考虑到E_{row}^{'}的X_r^{th}列中每个像素的概率,作者通过在该列上使用7×1最大池化层来应用非最大抑制来删除重复的参考点。...在关系网络中,对于每一对相邻的细胞,作者将它们的特征和18d空间相容性特征连接起来。然后在这个特征上应用一个二值分类器来预测这两个单元格是否应该合并。...该分类器采用了一个2个隐藏层的MLP,每个隐藏层有512个节点和一个sigmoid激活函数。损失函数对于分割模块,作者以行分隔符预测为例,并将相应的损失项表示为L_*^{row}。...由于这种策略可以为一个分割行分配多个查询,为了删除重复的结果,实验将NMS应用于从每个预测行的两个边界生成的多边形。

    3K10

    数据人必会的Excel|掌握32个Excel小技巧,成为效率达人(一)

    对于Excel的学习,除了掌握各类函数公式之外,学习一些Excel的操作小技巧也是必不可少的,这些技巧能够使我们成为效率达人。...方法: 对于Ctrl+Shift+D和Ctrl+Shift+R来说,我们先在第一个单元格写上需要填充的内容,其次选中需要填充的区域,最后按下Ctrl+Shift+D或Ctrl+Shift+R快捷键向下或向右填充...如果你的数据像我给的示例一样,有大标题,这时候你可以选中第一个列名下面的第一个单元格,然后选择[视图]选项卡,[冻结窗格]中的[冻结窗格]即可实现窗格的冻结。 ? 看视频,高效学会冻结单元格。 ?...技巧十一:快速删除重复值 上面我们已经通过[条件格式]-[突出显示单元格]查找出了各类重复值,如果我们想要删除这些重复值的话,Excel也提供了非常好用的选项卡。...首先,我们选中要删除重复值的区域,然后点击[数据]菜单栏,找到[数据工具],点击[删除重复值],即可删除该区域内所有的重复值了。 ? 如有疑问,可以关注视频号:数据万花筒,有详细讲解哦! ?

    1.7K20

    Python基础-Anaconda,Spyder,数据类型

    它附带了一个编辑器来编写代码,一个控制台来评估它并随时查看结果,一个变量资源管理器来检查在评估过程中定义的变量(这个软件就类似于R studio了)。...4、Python中的数据类型在正式演示之前还需了解一些必备的小知识。首先是 #%%,这个用于分割代码,划分之后的代码变成代码单元格,这样就可以以单独的单元格模式运行。...列表中的元素个数没有限制。元素数据类型只要Python支持的数据类型就可以,可以将列表赋值给变量。列表的位置索引:列表中单个元素的访问也与R语言中类似,但是索引位置是从0开始,而R语言中是从1开始。...key不允许重复,value可以重复,如果用字典里不存在的key名称去访问数据,就会出现报错。添加修改字典数据:如果key已经存在则修改它的值;如果key不存在,则新增数据。...集合是一个无序且不重复的元素序列,所以要使用in或者not in判断某个元素是否存在于集合中,返回True或者False。

    15700

    电商数据分析的具体流程是?不妨用Excel演示一遍!

    数值类型一般是右对齐的。 数据清洗 1. 选择子集 对列进行隐藏和再表示。 2. 列名重命名 直接对列名进行重新命名。 3. 删除重复值 数据选项卡,删除重复值,选择主键。 4....缺失值处理 通过查看列的总数据数量进行比较是否缺失,如果发现缺失值,点击开始选项卡中的查找和选项,点击定位条件,选择空值找到缺失值。...对其中的一个缺失值处进行填写,ctrl+enter使其他的空格也填入同样的值。 5. 一致化处理 进行单元格的复制和拆分处理,函数的运用。...几个重要的函数: AVERAGE FIND(要查找的字符串,字符串所在单元格)→返回一个数字,也就是位置。...最初的印象是小看Excel的,对于自己不会的功能,总是以我不太懂Excel为借口蒙混过关,而通过学习发现,很多的大型公司也都在用Excel进行出色的分析。

    2.1K41

    10个数据清洗小技巧,快速提高你的数据质量

    (2)函数法 在做数据清洗时,经常需要去除数据两端的空格,那么TRIM、LTRIM、RTRIM这3个函数就可以帮到你啦~ TRIM函数:主要是用来去除单元格内容前后的空格,但不会去除字符之间的空格。...(单选一列表示此列数据重复即删除,多选表示多个字段都重复才删除。) ? 5、填补缺失值 由于人工录入或者数据爬虫等多方面的原因,会出现缺失值的情况,这就需要我们寻找漏网之“数据”,填充空缺值。...如何统计有多少缺失值? 先看ID唯一列有多少行数据,参考excel右下角的计数功能,对比就可以知道其他列缺失了多少数据。 如何定位到所有缺失值? Ctrl+G,选择定位条件,然后选择空值。...(3)根据数据的分布情况,可以采用均值、中位数、或者众数进行数据填充。 数据均匀,均值法填充;数据分布倾斜,中位数填充。 (4)用模型计算值来代替缺失值。 回归:基于完整的数据集,建立回归方程。...将已知属性值代入方程来估计未知属性值,以估计值来进行空值得填充。 极大似然估计:基于缺失类型为随机缺失得条件下,假设模型对于完整的样本是正确的,通过观测数据的边际分布可以对缺失数据进行极大似然估计。

    2K31

    用Python进行数据分析的10个小技巧

    Pandas中df.describe()和df.info()函数可以实现EDA过程第一步。但是,它们只提供了对数据非常基本的概述,对于大型数据集没有太大帮助。...对于给定的数据集,Pandas中的profiling包计算了以下统计信息: 由Pandas Profiling包计算出的统计信息包括直方图、众数、相关系数、分位数、描述统计量、其他信息——类型、单一变量值...%%latex %%latex函数将单元格内容以LaTeX形式呈现。此函数对于在单元格中编写数学公式和方程很有用。 查找并解决错误 交互式调试器也是一个神奇的功能,我把它单独定义了一类。...因此,我们可以检查变量的值和程序中定义的函数的正确性。...如果答案是肯定的,那么可以掌握这个撤消删除操作的快捷方式。 如果您删除了单元格的内容,可以通过按CTRL / CMD + Z轻松恢复它。

    1.7K30

    收藏 | 10个可以快速用Python进行数据分析的小技巧

    Pandas中df.describe()和df.info()函数可以实现EDA过程第一步。但是,它们只提供了对数据非常基本的概述,对于大型数据集没有太大帮助。...而Pandas中的Profiling功能简单通过一行代码就能显示大量信息,且在交互式HTML报告中也是如此。 对于给定的数据集,Pandas中的profiling包计算了以下统计信息: ?...%%latex %%latex函数将单元格内容以LaTeX形式呈现。此函数对于在单元格中编写数学公式和方程很有用。 ? 查找并解决错误 交互式调试器也是一个神奇的功能,我把它单独定义了一类。...单元格的正常属性是只打印最后一个输出,而对于其他输出,我们需要添加print()函数。...因此,我们可以检查变量的值和程序中定义的函数的正确性。 ?

    1.4K50

    大数据分析那点事

    自己分析的是否全面,是否有价值,从哪些方面出发?对于这些问题博主做了思考。...重复数据删除 1、使用EXCEL菜单栏里的删除重复值将重复的数据删除掉 ​ 2、使用python–pandas包下的duplicated函数删除重复值将重复的数据删除掉 #inplace=True表示直接在源数据上进行操作...,缺失数据在总数据的10%以下方是可以接受的标准 对缺失值的处理一般采用批量填充 对于上述表格想要快速填充空值应该怎么做那?...函数 TRIM(TEXT)可以删除文本前后的空格,而保留文本中间的空格 在Python中删除字符串中所有空格有:使用replace()函数、使用split()函数+join()函数、使用Python正则表达式...文本项最多可以有 253 个文本参数。 每个参数可以是一个字符串或字符串数组,如单元格区域。

    1.3K10

    飞速搞定数据分析与处理-day6-pandas入门教程(数据清洗)

    清理空的值 空值 当你分析数据时,空的单元格有可能给你一个错误的结果。 ---- 删除行 处理空单元格的一种方法是删除包含空单元格的行。...要解决这个问题,你有两个选择:删除这些行,或者将列中的所有单元格转换成相同的格式。 转换为正确的格式 在我们的数据框架中,有两个单元格的格式是错误的。...处理空值的一个方法是简单地删除整个行。 移除行 在上面的例子中,转换的结果给了我们一个NaT值,这可以作为一个NULL值来处理,我们可以通过使用dropna()方法来删除该行。...有时,你可以通过查看数据集来发现错误的数据,因为你对它应该是什么有一个期望。如果你看一下我们的数据集,你可以看到在第7行,持续时间是450,但对于其他所有的行,持续时间是在30和60之间。...在我们的例子中,这很可能是一个打字错误,数值应该是 "45 "而不是 "450",我们可以在第7行插入 "45": df.loc[7, 'Duration'] = 45 对于小的数据集,你也许可以一个一个地替换错误的数据

    23040

    10个可以快速用Python进行数据分析的小技巧

    Pandas中df.describe()和df.info()函数可以实现EDA过程第一步。但是,它们只提供了对数据非常基本的概述,对于大型数据集没有太大帮助。...而Pandas中的Profiling功能简单通过一行代码就能显示大量信息,且在交互式HTML报告中也是如此。 对于给定的数据集,Pandas中的profiling包计算了以下统计信息: ?...%%latex %%latex函数将单元格内容以LaTeX形式呈现。此函数对于在单元格中编写数学公式和方程很有用。 ? 查找并解决错误 交互式调试器也是一个神奇的功能,我把它单独定义了一类。...单元格的正常属性是只打印最后一个输出,而对于其他输出,我们需要添加print()函数。...因此,我们可以检查变量的值和程序中定义的函数的正确性。 ?

    1.8K20

    大老粗别走,教你如何识别「离群值」和处理「缺失值」!

    自定义函数只有两个参数,第一个参数是数据集的名称,第二个参数是变量名;只要正确替换数据集和变量名,读取就可以直接运行代码。...本推文介绍了在R中如何处理丢失的数据,并介绍了处理丢失数据的一些基本技巧。 在R中,“NA”表示为一个缺失的值。当将带有空单元格的Excel表导入R控制台时,这些空单元格将被NA替换。...这与STATA用“.”替换“空单元格”不同。R中的数值变量和字符变量使用相同的缺失值符号。R提供一些函数来处理缺失值。要确定向量是否包含缺少的值,可以使用is.na()函数。...“is.na()”函数是用于确定元素是否为na类型的最常用方法。它返回与传入参数长度相同的对象,并且所有数据都是逻辑值(FALSE或TRUE)。假设我们有6个病人,但是只记录了4个值,而缺少了2个。..."airquality"数据集包含了153个观测值和6个变量。从以上结果中,我们可以看到该数据集中有缺失值。在可视化之前,首先使用mice包中的md.pattern()函数探索缺失的数据模式。

    4.4K10

    10个小技巧:快速用Python进行数据分析

    Pandas中df.describe()和df.info()函数可以实现EDA过程第一步。但是,它们只提供了对数据非常基本的概述,对于大型数据集没有太大帮助。...而Pandas中的Profiling功能简单通过一行代码就能显示大量信息,且在交互式HTML报告中也是如此。 对于给定的数据集,Pandas中的profiling包计算了以下统计信息: ?...%%latex %%latex函数将单元格内容以LaTeX形式呈现。此函数对于在单元格中编写数学公式和方程很有用。 ? 查找并解决错误 交互式调试器也是一个神奇的功能,我把它单独定义了一类。...[1]: 17 单元格的正常属性是只打印最后一个输出,而对于其他输出,我们需要添加print()函数。...因此,我们可以检查变量的值和程序中定义的函数的正确性。 ?

    1.3K21

    精通Excel数组公式021:提取唯一值列表并排序

    excelperfect 本文将综合使用前面系列中学习到的技术,包括布尔逻辑、动态单元格区域、提取满足条件的数据、统计唯一值等,创建出一个解决问题的大型公式。...注意到,在统计唯一值个数的公式中,使用了ISTEXT函数,这样可以将数字、非文本的单元格排除。 下图6展示了提取唯一值列表的公式,忽略了区域中的数字单元格。 ?...,意味着查找的值至少有一个字符,指定参数match_type的值为-1,查找指定区域中长度至少为1的最后一个文本项。然后,将定义的名称运用到数据有效性列表中,如下图7所示。...图8 使用辅助列或数组公式提取满足条件的唯一值 如下图9所示,借助于辅助列提取公司ABC不重复的记录。 ? 图9 也可以使用数组公式,如下图10所示。 ?...从交易数据集中提取客户名和小计的动态公式 如下图11所示,根据交易数据集,自动列出所有的客户名和销售额小计。

    5.2K10

    YOLO v1

    具体方法为:在YOLO检测系统的基础上进行了改进,然后利用数据集组合方法和联合训练算法对ImageNet中的9000多个类和COCO中的检测数据进行模型训练。优势:(1)YOLO的第一个优势是非常快。...最后,当我们训练一个接近检测性能的损失函数时,我们的损失函数在小bounding box 和大bounding box中对错误的处理是相同的。...训练在ImageNet 1000类数据集上训练网络的卷积层作为预训练,预训练的时候使用上图20个卷积层加一个平均池化层加一个全连接层。...在训练期间我们优化下面的多部分损失函数: 代表目标是否出现在一个单元格 中, 代表了单元格i中第j个bounding box预测器对那个预测进行负责。...通常很清楚一个对象落在哪个网格单元格中,并且网络仅为每个对象预测一个方框。然而,一些大型对象或多个单元边界附近的对象可以被多个单元很好地定位。非最大抑制可以用来修复这些多重检测。

    1K20

    掌握excel数据处理,提高你的数据分析效率

    比如我只想看下文本中是否含有以“X”为开头的怎么办呢?...注:如果只是把某列相同的记录定义为重复项那么只需要勾选那一列字段即可。 3 快速删除数据 在Excel表格中,如果有很多无用的空行,我们的需求是想把它们全部删除。...如果通过一行一行的点击进行删除,则会比较浪费时间。如果Excel表格中除了空行外没有其他空单元格时,我们可以利用“筛选”功能快速删除数据。...“开始”选项卡中“删除”按钮下方的小三角,“删除”按钮下方的小三角后,会弹出一个下拉列表,点击其中的“删除工作表行”。 ?...5 小结 对于数据分析,Excel可以被当做一款入门的软件。EXCEL凭借其功能强大的函数、可视化图表、以及整齐排列的电子表格功能,使你能够快速而深入的洞察到数据不轻易为人所知的一面。

    1.8K40
    领券