现在,我面临的挑战是创建数据仓库来存储和处理大量的数据。估计每天发生的事件超过70亿次。数据应保存7天。平均事件大小为0.5~1KB.我们需要处理这些数据,以便:
目前我正在评估:
所以我感兴趣的是
发布于 2016-05-25 04:44:51
我最近根据Mark的系列文章编写了这个摘要,比较了BigQuery、Spark、Hive、Presto、ElasticSearch、AWS、AWS和Google:
摘要摘要:
但是你能得到的最好的基准是你自己的:尝试BigQuery应该是快速和容易的。然后尝试找到另一个平台,它可以以同样快的速度加载数据,以同样快的速度查询数据,或者在价格上接近它。马克试过了,这些都是他的发现。
发布于 2016-05-24 12:46:03
我们使用BigQuery,优点:
找到更多用例和体系结构:http://www.slideshare.net/martonkodok/complex-realtime-event-analytics-using-bigquery-crunch-warmup
https://stackoverflow.com/questions/37412877
复制相似问题