首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

优化Power BI中的Power 优化Power BI中的Power Query合并查询效率,Part 1:通过删除列来实现

本篇文章主体部分为翻译Chris Webb的一篇文章。 合并查询在Power Query中是很成熟的应用,相当于SQL中的各种JOIN(抽时间会写几篇SQL的join,算是SQL的小核心)。...但同时,在Power Query中合并查询是一个常见的影响刷新效率的因素。在我的工作中,经常会遇到对一些非文件夹性质的数据源进行合并查询操作,所以我一直在想,有没有办法可以对其进行优化。...首先,我对这个CSV文件创建了两个连接,按照惯例,将第一行转为标题,将7列数字全都定义为整数格式。...– 0 秒 以上的确能够得出结论:合并查询时,列数的多少的确会影响效率, 以上还揭示了:在以上两个查询中,读取数据是立刻发生的,几乎不占用时间,相比之下,最开始的两次查询中读取数据的时间甚至要比执行SQL...参考文档: Chris Webb https://blog.crossjoin.co.uk/2020/05/31/optimising-the-performance-of-power-query-merges-in-power-bi-part

5.1K10

Power Query 真经 - 第 1 章 - 基础知识

Power Query 的设计目的就是在业务分析师使用数据之前将数据加载到目标区域的表中。收集数据并将其重塑为所需的格式,Power Query 处理数据的基本流程,如图 1-1 所示。...然而,如果需要的话,可以手动将其设置为各种选项之一,包括常用字符列表、自定义字符或者固定的列宽字符数。...表的名称:这通常与查询的名称相匹配,但非法字符将被替换为 “_” 字符,与其他工作表名称的冲突将通过在查询名称的末尾添加一个数字值来解决。...工作表名称:这通常与查询的名称相匹配,但非法字符将被替换为 “_” 字符,名称太长的情况可能会被截断,与其他现有表格名称的冲突的情况,将通过在查询名称的末尾添加括号内的数字值来解决。...在 Power BI 中:转到【主页】【刷新】。 在此之后,剩下的工作就是等待 Power Query 从文件中读取数据,对数据进行处理,并加载到 Excel 表或 Power BI 的数据模型中。

5.6K31
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【强强联合】在Power BI 中使用Python(2)

    上一篇文章我们讲解了在Power BI中使用Python来获取数据的一些应用: 【强强联合】在Power BI 中使用Python(1) 这一篇我们将继续讲解如何在Power BI中使用Python进行数据清洗工作...其实我们仔细看一下场景1和场景2,它们之间是个逆过程,场景1是从Python获取数据传递到Power BI,而场景2是Power BI或者Power Query获取了数据,用python来处理。...脚本编辑器中自带一句话: # 'dataset' 保留此脚本的输入数据 一行以“#”开头的语句,在Python的规范中表示注释,所以这句话并不会运行,它的意思是将你要进行修改的表用dataset来表示,...再比如,我们想提取数据的某列,比如上面这张表的“key2”列,我们可以点击运行Python脚本,并写入如下的代码: ?...在IDE中运行无误后复制到powerquery的Python脚本编辑器中: ? 点击确定,返回结果: ? 后面两列就是我们想要的手机号和邮箱了。

    3.5K31

    Power Query 真经 - 第 4 章 - 在 Excel 和 Power BI 之间迁移查询

    如果名字已经用过了,它会在括号里加上数字字符,以区分哪些查询是相关的,如图 4-3 所示。...打开一个新的 Power BI 桌面文件。 转到【文件】【导入】【Power Query , Power Pivot , Power View】。...图 4-17 为什么 “Date” 列所有的值都显示为 “Error” 在阅读错误信息时,可以看到该列正试图将 “43131” 设置为一个日期。但是这个数字是怎么来的呢?...在这里看到的是 Power BI 在文件中创建的表,这是从 Excel 中复制数据的结果。有趣的是,它的 “Date” 列中不包含日期,而是包含一列数值,如图 4-18 所示。...这样做的步骤如下。 打开一个新的 Power BI 桌面文件。 转到【文件】【导入】【Power Query, Power Pivot, Power View】。

    8.4K20

    PowerBI优化:更快、更小、更高效

    这是 Power BI Desktop 中的一项设置,用于指示模型为模型的每个日期/时间列自动创建数据表。...但是,这将导致列具有非常高的基数(等于表中的行数),如果最终结果是文本字符串,则压缩将非常糟糕。更好的选择是在数据仓库或 Power Query 中创建代理键。...代理键是无意义的整数,它们将比大字符串具有更好的压缩率。 说到文本字符串,如果基数很高,它们也不会真正压缩得那么好。与日期和数字不同,您不能只是剪掉片段以减少唯一值的数量。...尽管数据大小本身相同(96kb,显示的所有数字均以字节为单位),但日期列的字典大小是整数列的两倍。...禁用自动日期/时间功能,以避免为 Power BI Desktop 文件中的每个日期时间列创建隐藏表。 尽可能减少每列的基数,删除不需要的列。 本文译自Koen Verbeeck的博客文章。

    55410

    Power Query 真经 - 第 3 章 - 数据类型与错误

    BI佐罗 本章专门讨论 Power Query 新手会面临的两个常见问题:理解 Power Query 是基于数据类型(而不是数据格式)的工具,以及如何理解和处理 Power Query 查询中的错误。...单击 “Currency” 列的【ABC123】图标,选择为【货币】类型(Power BI 中的固定小数位的十进制数)。 选择 “Currency” 列最后一行的单元格进行预览。...度量值格式(如果数据被加载到数据模型中):在 Excel 中,这可以通过在创建度量值时设置默认的数字格式来控制,而在 Power BI 中,通过选择度量值然后在建模标签上设置格式来配置。...图表或视觉显示效果:在 Excel 中,则可以强制数字格式以需要的方式出现在图表中,在 Power BI 的可视化格式工具中也有类似的选项。...由于 “N/A” 不能被表示为数字,所以 Power Query 抛出了一个错误。 现在知道了原因,那么该如何解决这个问题呢?

    6.3K20

    【强强联合】在Power BI 中使用Python(1)

    Power BI 2018年8月8日的更新已经支持Python了,和之前支持R语言一样。之前接触过Power BI和R语言联合使用的朋友上手应该会快一些。...在Python脚本窗口我们就可以将编写好的脚本粘贴并运行了。 如前所述,我们一般是先在第三方编辑器中编辑并运行代码无误之后再放到Power BI 中运行: ? 得到结果: ?...Power BI Desktop会自动获取Python代码中数据类型是DataFrame的变量数据。 我们将代码复制到Power BI Desktop的Python脚本编辑器中,并运行: ?...运行Python脚本后,Power BI会提取所有数据类型为DataFrame的变量出来,我们上面只有一个变量df,我们改下代码来看看,直接拷贝第一个变量,然后改下2个变量的名字: import pandas...Python和R语言在Power BI中的应用要求是一样的,数据传递的类型都要求是DataFrame,具体的使用场景和使用要求完全相同,会R的朋友,也可以按上述思路进行操作。

    3.3K42

    mooc商业数据分析师-入门指南

    本教程旨在介绍Tableau、Power BI与Python的基本使用方法及其在数据分析中的应用。...编写计算公式,创建新的字段用于复杂分析。1.3.2 参数在数据面板中,右键点击数据表,选择“创建参数”。设置参数的名称、数据类型和允许值。在图表中使用参数,增加交互性。...第二部分:Power BI2.1 Power BI简介慕课商业数据分析师中Power BI是微软推出的一款商业智能工具,能够将数据转化为有意义的洞察。...2.3.2 R与Python脚本在Power BI中,嵌入R和Python脚本进行高级数据分析和可视化。在“可视化”面板中选择“R可视化”或“Python可视化”,编写脚本。...2.3.3 Power Query使用Power Query进行高级数据连接和转换。通过M语言编写高级查询,实现复杂的数据操作。

    35110

    Power Query 真经 - 第 5 章 - 从平面文件导入数据

    这里需要认识到的重要一点是,这些设置是针对本机电脑的,当在 Power Query 中为一个列声明数据类型时,将看到的是,格式将基于用户【控制面板】设置。...“Amount” 列中的数值是显示为数值、文本,还是错误?欢迎来到在 Power Query 中处理数据的挑战,因为对于不同的人来说,答案是不同的,这取决于用户【控制面板】中的设置。...这个操作并不会改变货币数据本身,而是告诉 Power Query 如何读取像 $1,000.00 这样的文本并将其转换为一个合理的数值。...在 Excel 的用户界面中,非打印字符被显示为一个方框中的小问号。在 Power Query 中,它们显示为一个空格。...这就是使用 Power Query 的好处,此时结果如图 5-23 所示。 图 5-23 数据透视表更新为下一季度的数据 新的供应商,新的交易,新的日期,所有的工作都没有问题。

    5.8K20

    职场表格易错点解析:数据格式不规范怎么办?

    以删除“报销金额”列的单位为例,单击【开始】 选项卡【编辑】组中的【查找和选择】命令,在弹出的下拉菜单中选择【替换】命令(见图3)。...图6 SUBSTITUTE函数——将字符串中的部分字符串以新字符替换,即用新内 容 B 替换原字符串或单元格中的 A,本函数共包含 4 个参数(见表1)。...这可能是因为表格中存在隐藏的非打印字符,可以通过 Power Query 可以一步完成整理。...Power Query 是内置在 Excel 2016 专业增强版及以上版本中的 Power BI 组件之一,能够高效地完成很多数据清洗的步骤,以及快速实现二维表和一维表 的转换。 ...如果已经安装的版本中没有这个功能,建议更新版本,或者是前往微软Power BI 官网下载 Power BI Desktop 软件。

    2.5K20

    Excel表格如何将一列数字快速分成几行几列?

    Excel表格如何将一列数字快速分成几行几列?...这个问题在Excel中用函数解起来也不复杂,但是,正如很多开始用Power Query的朋友说,自从学了Power Query,什么问题都首先想着用Power Query来解了,因为Power Query...1、获取数据到Power Query 2、添加索引列 3、对索引列取整除数,如分成6行 4、对索引列提取余数(模) 5、透视 搞定: 全过程不需要写任何的函数、公式、代码...,比如这里分成6(v)列,进行批量处理(List.Transform),通过List.Alternate函数,针对List.Skip后的源数据,每间隔5(v-1)个数字,取1个。...---- 最近有朋友说,这个我通过Power BI发布的将Power Query函数和系列文章汇总的公开链接太有用了,那我以后就不怕占地方,还是继续放。

    1.6K20

    Power Query 中Python的使用

    Power Query2018年就已经支持python了,你尝试过吗?今天说一下power query使用python的步骤和简单应用。...2.转换->运行python脚本 dataset=pandas.DataFrame(dataset['ID']) ? 至此,便获取了表中的 ID 列。 ?...总结: 在power query 中 python 使用 dataset 变量来访问当前表的数据; dataset 是 pandas 中 的 DataFrame; 使用python语法对 dataset...的行和列进行操作,可以添加、删除、修改、过滤等 使用python导出表 使用POWER BI进行数据清洗和转换的过程中,经常会得到一张行数很多的表,而在POWER BI中导出表不太方便(少量数据可以直接复制粘贴...) df.to_excel("D:/源.xlsx", index=None) 至此,便成功将power query 中的文件导出至本地。

    3.9K30

    大数据分析工具Power BI(三):导入数据操作介绍

    导入数据操作介绍进入PowBI,弹出的如下页面也可以直接关闭,在Power BI中想要导入数据需要通过Power Query 编辑器,Power Query 主要用来清洗和整理数据。...这时我们如何想要将这种数据批量导入到Power BI中就需要用到M函数,M函数是微软为MicroSoft Power Query 设计的公式语言,对于一个文件夹中Sheet名称不同并且标题列数不同的数据我们可以通过...M函数将这些excel数据批量导入,具体操作如下:在打开的页面中过滤掉"~"开头的数据临时数据文件:数据文件过滤后效果如下:后续不需要其他的列,可以删除其他列,然后添加新的列,自动以导入哪些数据列:注意...我们可以删除这一列再创建新的一列统计"销售额"的值,操作步骤如下:在操作过程中页面右侧的"查询设置"中的"应用步骤"会记录每一步的操作,如果一些步骤操作错误可以在该部分点击"x"恢复操作之前的数据。...如果还有其他文件夹的数据,只要包含以上excel中的这些列,都可以直接放入到表格读取的文件夹中后,点击"刷新预览"就会将数据批量导入进来。

    2.9K51

    Power Query 真经 - 第 6 章 - 从Excel导入数据

    【注意】 本节中的示例必须在 Excel 中运行,因为 Power BI 没有自己的工作表,所以 Power BI 是不支持这种方式的。...尽管如此,还是建议 Power BI 的读者关注本节,因为这种连接方式是非常重要的。 当从当前(活动)工作簿中导入数据时,Power Query 只能从以下几个地方读取。 Excel 表。...如果它看起来像一个数字,Power Query 将应用一个【小数】或【整数】的数据类型。...在一个新的工作簿(或 Power BI 文件)中按如下操作。 确保 “External Workbook.xlsx” 处于已关闭状态。...创建一个新的查询,进入【数据】选项卡,【获取数据】【来自文件】【从工作簿】。 【警告】 Power Query 不能从一个打开的工作簿中读取数据。

    17.3K20

    因为“有关系”,问题就简单了……

    小勤:大海,能在Power Pivot或Power BI将一个表里的数据匹配到另一个表里吗? 大海:两个表之间有关系吗?...小勤:当然有啊,比如这个1对多的,怎么把1端的“产品”表里的库存量读取到“订单明细”表里?就是在Excel里用VLOOKUP函数实现的事情。...大海:这个在Power Pivot或Power BI里,如果两个表之间已经建立了关系,那就非常简单了,一个函数一个参数就搞定,如下: 小勤:就是RELATED函数直接读所需要的列就行了?...---- 最近有朋友说,这个我通过Power BI发布的将Power Query函数和系列文章汇总的公开链接太有用了,那我以后就不怕占地方,还是继续放。...注意,因为公众号文章是不能直接通过点击的方式跳转到外部链接的,所以需要大家动手复制到浏览器中打开。

    37220

    Power BI 从 Dataverse 获取数据

    今天只来说一说从Power BI中如何获取Dataverse里的数据,以及想要使用Dataverse需要的条件。...Power BI获取Dataverse数据 1、点击Power BI主页上的“数据”工作区的Dataverse: 当然,前提是你已经有了Power BI账号,并且已经有了Dataverse数据表。...(别急,慢慢说) 2、选择想要导入的表格,勾选并加载 3、选择数据连接模式 直接选择DirectQuery直连模式,为方便以后我们的实时数据修改与获取操作。.../r/mYuZfF7sUH 2、打开Power Apps,选择“表”: 3、点击新建表: 或者你也可以选择导入表 4、如果选择了新建表,可以设置表的属性及主列 注意显示名为英文或数字 5、添加列和数据...甚至,我们可以继续发挥想象,使用power automate,结合power bi最新的execute query去实现一些power bi报告中某些特定的时间节点的记录回写,甚至改写。

    4.4K30

    【每周一本书】之《Microsoft Power BI 数据可视化与数据分析》

    BI的数据可视化功能,包括数据类型和运算符、软件的安装、连接数据源、数据基础操作、可视化设计原则、可视化图表、自定义可视化效果、报表、仪表板、查询编辑器、运行R脚本、数据高级操作、数据分析表达式、网页流量数据分析...、运行R脚本、数据高级操作、数据分析表达式、网页流量数据分析、超市运营数据分析、Power BI移动应用和Power BI应用开发等内容。...第8章:介绍仪表板,包括创建Power BI仪表板、Power BI中的磁贴和编辑仪表板磁贴等。 第9章:介绍查询编辑器,包括连接到数据、调整数据、追加数据、合并数据和对行进行分组等。...第10章:介绍运行R脚本,包括在查询编辑器中使用R、编辑器查询的限制和R与Power BI的协同使用。 第11章:介绍数据高级操作,包括自动和手动创建关系、手动编辑和删除关系,以及数据按列排序等。...第14章:介绍超市运营数据案例分析,包括从Excel获取数据、创建自定义新列和创建可视化效果等。

    2.1K110

    【重磅来袭】在Power BI 中使用Python(4)——PQ数据导出&写回SQL

    《在Power BI 中使用Python》系列的前三篇文章我们分别讲解了: 如何在Power BI中使用Python来获取数据: 【强强联合】在Power BI 中使用Python(1) 如何在Power...BI中使用Python进行数据清洗: 【强强联合】在Power BI 中使用Python(2) 如何在Power BI中使用Python进行可视化呈现: 【强强联合】在Power BI 中使用Python...第一个问题,推荐使用DAX Studio,轻松导出十万、百万条记录; 第二个问题,没有现成的工具可以直接解决,但是结合本系列第二篇的内容,我们是否可以想到如何用Python将powerquery中的表输出为...只要一行简单的代码: = Python.Execute("# 'dataset' 保留此脚本的输入数据#(lf)dataset.to_excel(r""C:\Users\金石教育\Desktop\abc.xlsx...所以只要每次写回MySQL之前,先判断一下数据库中是否已经存在当日的数据,如果有,就先删除,再将新的数据写入,这样就达到我们的目的了。

    4.6K41
    领券