我就在这里,不离不弃
——A·May
R-82T-101
May2018年2月24日
1.动态气泡三点图
1.1 查看数据集y和分组数据集z/center>
1.2有个问题需要注意!
xAxis=list(“LifeExpectancy”)是指定x轴的变量,这个变量来自数据集y
yAxis=list(“GDPPerCapita”)指定y轴的变量,这个变量来自数据集y
yAxisTransform=“log2”指定y轴的变量进行log转变!!!
zAxis=list(“Population”)指定z轴的变量,这里的z轴是右边的竖轴
对于y轴的变量转化还需要有yAxisTranform的设置,对于这个设置的介绍如下:
1.3 制作气泡图
canvasXpress(
data=y, #面板数据集y
varAnnot=z, #分组数据集z
colorBy="Continent", #颜色标度变量:数据集z中的continet,就是图例
graphType="ScatterBubble2D", #2d的散点图
showTransition=TRUE, #显示转变,默认是FALSE,因为有y轴的log转变
xAxis=list("LifeExpectancy"),
yAxis=list("GDPPerCapita"),
yAxisTransform="log2",
zAxis=list("Population")
)
图1
图2
2. canvasXpress的数据格式
对于大多数图的数据格式: Data format for most of the graphs: Area, AreaLine, Bar, BarLine, Boxplot, Bubble, Candlestick, Chord, Circular, Contour, Donnut, DotLine, Dotplot, Heatmap, Histogram, Kaplan-Meier, Line, Map, ParallelCoordinates, Pie, Radar, Sankey, Scatter2D, Scatter3D, ScatterBubble2D, Stacked, StackedLine, StackedPercent, StackedPercentLine, Sunburst, TagCloud, Tree, Treemap.
数据结构可以用图形表示如下:
数据集总是以行和列组织的一系列值。在canvasXpress中,行被引用到变量,而列被引用到样本。通常我们会有额外的离散或连续数据,这些数据可以帮助我们注释样本或统计术语中被称为因素的变量。从概念上讲,canvasXpress中的数据可以分为三个部分。包含实际数值的(y)区间,包含样本特征的(x)区间和包含变量注释的(z)区间。 > 其中y区间是数据集y;变量注释z区间(varAnnot),可为颜色,可为形状等;x区间是案例区间(samAnnot),多是分类变量。其中z区间和x区间的变量都可为图例
3. 箱形图
3.1 正确的箱线图
这个是正常的做箱线图,注意groupingFactors=list(" ")的作用
data
smpAnnot
colnames(smpAnnot)
canvasXpress(data,
#smpAnnot=smpAnnot,
#graphType='Boxplot',
groupingFactors=list('Species'))
图1图2
3.2 没有groupingFactors的箱线图
问题出在虽然在X轴上是分组的变量,但是并没有形成箱线图,而且在y轴是150个变量,不是按照Species分组,也就是说我们在做箱线图中,注意一个分类变量是在y轴,用groupingFactors=list(" “),而每个分类变量上的箱线变量是连续型变量,这四个连续变量分在三个分组上。
图1图2
4. 3D的柱状图
library(canvasXpress)
y
x
z
canvasXpress(
data=y,
smpAnnot=x,
varAnnot=z,
graphType="Bar",
is3DPlot=TRUE,
scatterType="bar",
widthFactor=1.2,
x3DRatio=0.5
)
图1图2图3
参考阅读
学习数据挖掘交流平台
领取专属 10元无门槛券
私享最新 技术干货