我正在开发一个侧边栏,将google分析数据与我在管理部门的详细信息结合起来。
为了理解google,我使用谷歌自己提供的数据馈送查询资源管理器进行了一些测试。
经过几次测试后,我注意到一种奇怪的行为,我将以一个实际的例子继续。我需要知道是什么关键字把人们带到一个给定的网址,我想知道有多少点击,我从这些关键字。我还想要三个不同的数据范围,这些信息:每日关键字,每月关键字和整体关键字.
这是我使用的一组参数:
ids = <myTableId>
dimensions = ga:keyword
metrics = ga:visits
segment =
filters = ga:pagePath=~<myUrl>$
sort =
start-date =
end-date =
start-index =
max-results =
max-results = 50
当我试图检索一天的数据时(例如。( start-date = 2011-12-27
和end-date = 2011-12-27
)一切看起来都很正常。
例如,对于我的url /programmazione/lo-schiaccianoci-in-3d-andrei-konchalovsky-2-dicembre-2011.film
,我得到了以下结果:
ga:keyword ga:visits
--- ---
(not set) 1
lo schiaccianoci film a roma 1
lo schiaccianoci film programmazione roma 1
lo schiaccianoci film roma 1
lo schiaccianoci programmazione a roma 1
programmazione film lo schiaccianoci a roma 1
schiaccianoci film programmazione 1
schiaccianoci film roma 1
如果我延长我的时间范围,我就会有奇怪的行为。如果我将请求扩展到上一次请求的同一个月的整个一天,我希望至少检索单个一天的所有关键字(可能点击次数更多),但无论如何,我得到的结果更少(并且警告说“此结果基于抽样数据”):
ga:keyword ga:visits
--- ---
(not set) 31
lo schiaccianoci film roma 2011 31
如果我试图检索所有的数据(从我创建页面的第一天到今天),情况会变得更糟:我没有数据!
所以问题是我的方法有什么问题?
--更新--
我发现了这个bug报告:http://code.google.com/p/analytics-issues/issues/detail?id=160,你认为它是相关的吗?
发布于 2011-12-28 10:15:02
如果你的数据是抽样的,那么它的质量将非常差。抽样似乎是基于总访问次数,所以如果你把你的要求减少到更短的时间,它通常会消除抽样。当您尝试只请求一天的数据时,您自己也看到了这一点。
要解决这个问题,您必须发出多个请求并自己聚合--这是没有意义的,但这是解决问题的唯一方法。我们检查结果集中的示例标志,减少循环中的时间周期和重新请求,直到得到所有干净的数据。
我自己的分析表明,40%的抽样访问次数是5%或更多的非抽样值。那是用来探视的。唯一的访问者根本不算抽样(它只是返回访问次数),更小的数据点,如转换变得更加不稳定。
https://stackoverflow.com/questions/8647338
复制相似问题