首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    数据分析工具评测丨Yonghong Desktop对战Tableau Desktop

    值得一提,永洪自己写了一套SQL解析器,可以通过Data Mart的连接,用标准的SQL来查询数据集市里的数据。...另外Yonghong Desktop支持更多的动态计算,包括差值、百分比、差值百分比、汇总百分比、累积总计、移动计算、排名计算、百分位等,基于这些计算可以轻松实现在可视化图表的数据上的二次计算。...04参数应用 以上例子通过动态计算来实现帕累托图,并通过传参给目标线,实现修改“销售百分比参数”的值,查看不同参数值情况下的子类别分布情况。...制作报告和查看报告: 10列1亿行的数据从性能上看两者没有明显的区别,如果需要对比出差别,可能需要更多的样本数据(更多的行列数)进行比较。...{_ROLES_})的联动来控制数据行权限的管理,也支持列级别的数据权限控制,同时还支持设置在Desktop中设置敏感信息的脱敏规则,以实现对数据中的敏感信息进行保护,还可以继承来自Server的数据列黑白名单限制

    2.2K20

    FineReport学习(三)——动态隔间运算

    ① 比较 应付金额中的每一个值,与第一个值进行比较,做差运算。 首先,新建一个普通报表模板,然后导入数据。 接着,设计报表样式,然后绑定数据源。将“应付金额”保留两位有效数字。...再接着,添加“比较”列。因为是求下面的每一个值与第一个值的差值,因此需要写入公式(公式如图所示)。并将“比较”列设置为保留两位有效数字。...保存后,效果预览如下 ② 占比 占比,顾名思义就是计算某个单独的数据,在总量中占据的比例。 在上述操作的基础上,添加“占比”列。直接使用自带函数进行占比运算,比较简单,操作如下。...然后调整“占比”列的格式,保存格式为“百分比”,并两位有效数字。 保存后,效果预览如下 ③ 环比 环比是每月与上月的数据进行一个比率运算。 在上述操作的基础上,添加“环比”列。...然后调整“环比”列的格式,保存格式为“百分比”,并两位有效数字。

    1.7K21

    R绘制堆积柱形图

    前面给大家讲了☞【R语言】百分比表格删除两行重新计算百分比,有小伙伴对文中的两个堆积柱形图比较感兴趣。那么今天我们就来聊聊这两张图是如何绘制出来了。...我们还是以☞【R语言】百分比表格删除两行重新计算百分比中的数据为例 #读入数据 a <- read.table(file="sample_bacteria_percentage.txt",sep="\...t",header=T,row.names=1) #生成png图片,删除之前的堆积柱形图 png(file="before.png",width=560,height=400) #设置图片右边空白宽度,...inset = c(-0.35, 0), #水平微调 col=rainbow(20), #颜色 bty="n" #图注不要边框 ) dev.off() #删除前两行...b=a[-(1:2),] #利用apply函数对列做处理,除以每列之和 result <- apply(b,2,function(x)x/(sum(x))*100) #检查每列之和是不是100% colSums

    66210

    一场pandas与SQL的巅峰大战(五)

    本篇文章一起来探讨如何在SQL和pandas中计算累计百分比。仍然分别在MySQL,Hive SQL和pandas中用多种方案来实现。...2.分组情况 需要思考:我们的原始数据是两个月的数据,目前我们的算法是把两个月的销售额累计到一起算的。但在实际中可能更多会关心每天的累计销售额分别占当月的百分比。...如何能按照月份分组求每组的累计百分比呢? 首先仍然是求累计金额,但要分月累计。在上面的基础上加上月份相等条件即可,从结果中可以看到,在11月和12月cum列是分别累计的。...接下来我们重点看窗口函数的方式。在计算总计值的时候和前面MySQL的方式类似,累计百分比的计算也是需要把两部分代码结合在一起。...直接对amt列使用cumsum函数即可计算累计值,结果和用SQL计算得到的一致。 计算累计的百分比也很容易。

    2.8K10

    Sklearn库中使用PCA

    本文中介绍的是如何在sklearn库中使用PCA方法,以及理解PCA方法中的几个重要参数的含义,通过一个案例来加深理解。 ?...98%的主成分 n_components=None,返回所有主成分 n_components=‘mle’,将自动选取主成分个数n,使得满足所要求的方差百分比 copy bool类型, False/True...explained_variance_:它代表降维后的各主成分的方差值。方差值越大,则说明越是重要的主成分。...explained_variance_ratio_:它代表降维后的各主成分的方差值占总方差值的比例,比例越大,则越是重要的主成分。...实现降维的过程中,有两个方法: 特征值分解(需要是方阵,限制多,计算量大) 奇异值分解(任意矩阵,计算量小,PCA默认) mean_:每个特征的经验平均值,由训练集估计。

    1.6K10

    一场pandas与SQL的巅峰大战(四)

    第三篇文章一场pandas与SQL的巅峰大战(三)围绕日期操作展开,主要讨论了日期获取,日期转换,日期计算等内容。 本篇文章一起来学习常见的应用实例:如何在SQL和pandas中计算同环比。...周同比即当天和上周同一天数据的变化百分比,日环比即当天和昨天数据的变化百分比。本文也主要计算周同比和日环比。数据概况如下,是随机生成的两个月的销售额数据。...思路二:不进行关联,直接查询当前日期前一天和前七天的数据,同样以3列的形式展示。 来看一下SQL代码: ? 上面代码中我们关联了两次,条件分别是日期相差1天和日期相差7天。关联不上的则留空。...pandas计算周同比和日环比 在pandas中,我们同样首先按照上面的两种思路进行计算。...至此,我们完成了SQL和pandas中对于周同比和日环比计算的过程。 ◆ ◆ ◆ ◆ ◆ 小结 本篇文章中,我们使用SQL和pandas的多种方法对常见的周同比和日环比进行计算。

    2K10

    【R语言】百分比表格删除两行重新计算百分比

    好不容易算好的每个样本中检测到的微生物的百分比含量 发现前面两行一个是没有分类的类型,另外一个是无法比对到微生物物种上的。这两行需要删掉,这样每个样本中微生物的占比就需要重新计算了。...删除之前,每个样本中微生物的占比为 下面我们用两种方法来实现 一、使用apply函数 #读入数据 a <- read.table(file="sample_bacteria_percentage.txt...",sep="\t",header=T,row.names=1) #删除前两行 b=a[-(1:2),] #利用apply函数对列做处理,除以每列之和 result <- apply(b,2,function...=T,sep="\t",row.names=1) #删除前两行 b=a[-(1:2),] #每个元素除以每列之和 result=sweep(b,2,colSums(b),"/")*100 #检查每列之和是不是...,我们在来看一下每个样本中微生物的占比

    1.4K30

    2019年开源数据库报告发布:MySQL仍卫冕!

    “尽管许多组织选择从遗留数据库(如Oracle)迁移,但并非所有组织都采用NoSQL方式。根据我们的调查结果,随着对PostgreSQL等系统的需求不断增长,SQL仍然占据了60%的市场份额。”...开源数据库部署:内部部署 在下图结果中,以及下面的公共云和混合云图表中,我们按照利用该类云基础架构的情况细分每个开源数据库部署百分比。 那么,哪些开源数据库最常部署在本地?...开源数据库部署:混合云部署 现在我们已经了解了开源数据库如何在内部部署与公共云部署的细分情况,让我们来看看利用混合这两种计算环境的部署情况。...开源数据库部署:多云部署 平均而言,20%的公共云和混合云部署正在利用多云战略。多云是使用两种或更多种云计算服务的方式。...在下面的图表中,左列中的数据库表示该数据库类型的样本大小,顶部列出的数据库表示与该数据库类型组合的百分比。蓝色突出显示的单元格表示100%的部署组合,而黄色表示0%的组合。

    1.5K20

    db2top命令详解「建议收藏」

    如果这些要素其中一个的使用率开始升高甚至达到百分之百,用户应当研究相关的原因。 计算当前时间和Start Time差值,可知数据库已经启动了多久。...SQL哈希字符串是在表的第一列中显示的字符串,例如“00000005429283171301468277”。...第一列显示Application Handle,以下三列:Cpu%Total、IO%Total、Mem%Total表示此应用程序正在使用的资源的百分比。...图9.锁等待–Application status 在图9中,第一列Agent Id(State)中列出了两个代理(代理24和代理9)。...{用于计算每个操作的百分比所用的时间= (等待锁定时间+排序时间+bp读取时间+bp写入时间+异步读取时间+异步写入时间+预取等待时间+直接读取时间+直接写入时间) } 下列是每个操作的预估百分比: ·

    3.1K30

    LeetCode294,手速场周赛,12分钟切3题卡到比赛结束……

    字母在字符串中的百分比 给你一个字符串 s 和一个字符 letter ,返回在 s 中等于 letter 字符所占的 百分比 ,向下取整到最接近的百分比。...题解 考察的是对类型转换的理解,在C++当中,两个整数相除也只会得到整数结果,这会导致丢失小数的部分。 而我们需要求百分比,要求的就是小数。所以必须使用强制转换,先把被除数转成浮点数,再做除法。...但这又有另外一个问题,我们把横纵坐标的差值表示成二元组,上图当中(1, 1)和(4, 4)的差值对应的斜率是一样的。所以我们还需要把这个差值除去它们的最大公约数。...对于连续的一组巫师(也就是这些巫师的力量值是 strength 的 子数组),总力量 定义为以下两个值的 乘积 : 巫师中 最弱 的能力值。 组中所有巫师的个人力量值 之和 。...请你返回 所有 巫师组的 总 力量之和。由于答案可能很大,请将答案对 109 + 7 取余 后返回。 子数组 是一个数组里 非空 连续子序列。

    29420

    Leetcode【523、525、560、974】

    方法1(前缀 01 差值): 遍历数组的每个位置,统计数字 0 和 1 的个数,并计算前缀 01 差值; 如果该差值在后续还会出现,说明从上一位置到当前位置 01 个数相等,更新最大值; 如果该差值没有出现过...那么类似于上面的 Leetcode 523,我们计算前缀和,判断前缀和是否在 Hash Table 中再次出现,如果再次出现,说明两位置之间的和为 0,即两位置之间01个数相同,则更新最大长度;否则,将前缀和保存在...并且,还有一点不同的是,因为要计算子数组的总数,所以 Hash Table 中的键还是前缀和 presum,但是值要存储当前前缀和出现的次数,而不像前两道题中存储当前位置索引。...题目中“连续子数组之和可以被 K 整除”类似于 Leetcode 523 的做法,要先将前缀和 presum 对 K 取余,并且判断 presum 是否在 Hash Table 中出现过;而它是一个计算总数的问题...(前缀和、前缀01差值、前缀和对K的取余结果等等)保存在 Hash Table 中,等到下次再次出现相同的前缀时,说明两次位置之间的数字是满足题意的。

    68200

    精读《15 大 LOD 表达式 - 上》

    这里插一句,对于柱状图的 Y 轴,在 sql 里就是对 X 轴 group by 后的聚合,因此 Y 轴就是对 X 轴各项的汇总。...日利润指标 分析 每年各月份的盈利、亏损天数分布。如下图: 列是年到月的下钻,比较好实现,只要拖入字段 [year] 并下钻到月粒度,移除季度粒度即可。...占总体百分比 LOD 表达式的一大特色就是计算跨详细级别的占比,比如我们要看 欧洲各国的销量在全世界占比: 显然这个图里所有国家之和不是 100%,因为欧洲加起来也才不到百分之二十,然而在当前详细级别下...实际与目标 在第六个例子 - 销量对比分析中,我们可以看到销量绝对值的对比,这次,我们需要计算实际销售额与目标的差距百分比: 如上图所示,左上角展示了实际与目标的差值;右上角展示了每个地区产品目标完成率...总结 通过上面的例子,我们可以总结出实际业务场景中几条使用心法: 首先对计算公式进行拆解,判断拆解后的字段是否数据集里都有,如果都有的话就结束了,说明是个简单需求。

    1.2K30

    滴滴大数据面试SQL-取出累计值与1000差值最小的记录

    一、题目 已知有表t_cost_detail包含id和money两列,id为自增,请累加计算money值,并求出累加值与1000差值最小的记录。...主要考察了聚合函数开窗中,如果排序即进行累积求和sum()over(order by),然后考察绝对值函数abs(),最后考察排序函数开窗。...维度 评分 题目难度 ⭐️⭐️⭐️ 题目清晰度 ⭐️⭐️⭐️⭐️⭐️ 业务常见度 ⭐️⭐️⭐️ 三、SQL 1.计算累积求和 执行SQL select id, money, sum...1000的差值的绝对值 根据上面结果的sum_money列,我们能够看出题目想要我们求解的是id=6的记录,下面我们先计算累积求和值与1000的差值的绝对值。...查询最小差值记录,这里可以使用排序函数,row_number、rank、dense_rank 等,在不同的场景和需求下使用不同的,因为这里题目并没有要求,并且不存在最小差值相同,我们随便选一个就好了,

    21710

    一文搞懂连续问题

    ID,是指添加一列为group_id, 连续的行分配相同的的ID值,该ID在不同的连续组之间不同。...计算连续分组赋值相同的分组ID判断连续条件,有两种处理思路:1.双排序差值法;2.累积求和法;1.双排序差值法双排序差值法是指对一列连续数据得到排序1,对符合条件数据进行排序的到排序2,两列排序差值作为分组...ID的方法.如果实际数据连续,则差值不变,如果间断则差值变化,从而保证每个连续段有唯一组id.我们以腾讯大数据面试SQL-连续登陆超过N天的用户 为例,查询分组ID的逻辑SQL如下select user_id...百度大数据面试SQL-连续签到领金币该题目对连续条件判断上增加了难度,按月分组,在得到连续分组ID之后,计算出连续天数,还需要对天数进行重置,之后又对不同天数得到金币数量进行计算。...在得到连续分组ID之后 需要计算出连续登陆的最早和最晚日期,然后差值计算,还需要考虑到差值与登陆天数差天的细节。总结通过以上面试题目可以看出,只要找到连续分组ID,所以的题目都可以迎刃而解。

    28400

    杨辉三角(代码直接呈现,便于理解)

    摘要:杨辉三角是一个由数字构成的三角形,其特点是每一行的每个数字都是上一行相邻两个数字之和。本文将介绍杨辉三角的原理,以及如何在C语言中实现杨辉三角的生成。...一、杨辉三角的原理 杨辉三角,又称为帕斯卡三角,是一个在数学史上具有重要意义的三角形。它的每一行都是由上一行的相邻两个数字之和构成的。从第一行开始,每一行的第一列和最后一列都是1。...接下来,每一行的数字都是通过上一行的相邻两个数字之和得到的。例如,第二行的数字为1,1,第三行的数字为1,2,1(1+1=2),第四行的数字为1,3,3,1(1+2=3,2+1=3)。...在每一行内部的第二个for循环中,计算并打印每个数字。对于每一行的第一个数字或者是每一行的第一个和最后一个数字,设定为1。对于其他数字,通过将其设置为上一行相邻两个数字的和来计算。...运行该代码,就可以输出一个行数为十的杨辉三角 通过本文,你了解了杨辉三角的原理以及如何在C语言中实现杨辉三角的生成。在实际应用中,杨辉三角可以用于快速计算阶乘、斐波那契数列等。

    31410

    SQL治理高阶实践:异常防御体系建设与应用挖掘

    所以我们思考:能否在测试阶段提前发现有问题的SQL,提前预判性能并治理?如何在事中进行SQL的兜底和止损?...此部分的整体能力建设与当前业界主流的开源没有太大差别,只是我们的集成规范会更个性化或更丰富。 第一,根据DBA在日常中的反馈,完善相应规则并集成经验,如拦截特殊语法; 第二,集成三方规范。...上述SQL通过DBA直观去看,指纹计算应该是一致的。但由于早期我们采用开源的基于正则的SQL指纹计算库存在的不足,无法识别SQL在细微上的差异,导致指纹计算准确度差影结果判断。...3)统计分析 我们统计了最近一个月的拦截量。在TP场景下,SQL问题大部分是索引问题,由上图可知,“索引不合理”和“缺少索引”的情况占比之和达到80%。...预处理每条SQL时,我们记录了SQL RT 的p50跟p95时长,把每一个集群下每一条SQL的p95跟p50去做差,然后聚合、排序。波动越大,聚合的差值越大,就大致能推测这个集群是不稳定的。

    40330

    09-10章 汇总分组数据第9章

    SQL 的聚集函数在各种主要 SQL 实现中得到一致的支持。 聚集函数(aggregate function)对某些行运行的函数,计算并返回一个值。...函数 说明 AVG() 返回某列的平均值 COUNT() 返回某列的行数 MAX() 返回某列的最大值 MIN() 返回某列的最小值 SUM() 返回某列值之和 AVG()函数 AVG()通过对表中行数计数并计算其列值之和...COUNT()函数 COUNT()函数进行计数,确定表中行的数目或符合特定条件的行的数目,有两种使用方式: 使用 COUNT(*) 对表中行的数目进行计数,不管表列中包含的是空值( NULL )还是非空值...屏幕快照 2018-05-31 06.17.27.png 函数 SUM(quantity)返回订单中所有物品数量之和,WHERE 子句保证只统计某个物品订单中的物品。...提示:在多个列上进行计算 利用标准的算术操作符,所有聚集函数都可用来执行多个列上的计算。SUM()函数忽略列值为 NULL 的行。

    1.9K10

    性能工具之linux监控之top、vmstat、iostat复习

    如果出于习惯去计算可用内存数,这里有个近似的计算公式:第四行的free + 第四行的buffers + 第五行的cached,按这个公式此台服务器的可用内存: 对于内存监控,在top里我们要时刻监控第五行...2表示每个两秒采集一次服务器状态,1表示只采集一次。...这个时间包括了队列时间和服务时间,也就是说,一般情况下,await大于svctm,它们的差值越小,则说明队列时间越短,反之差值越大,队列时间越长,说明系统出了问题。...used 列显示已经被使用的物理内存和交换空间。 free 列显示还有多少物理内存和交换空间可用使用。 shared 列显示被共享使用的物理内存大小。...-i设定监测的网卡,如:# iftop -i eth1 -B 以bytes为单位显示流量(默认是bits),如:# iftop -B -n使host信息默认直接都显示IP,如:# iftop -n -

    1.6K30
    领券