By 大数据技术与架构
场景描述:滴滴每天处理交通大数据超过4800TB,日均车辆定位数据超过150亿,每日处理路径规划请求400亿次,数据覆盖了交通路况、用户叫车信息、司机驾驶行为、车辆数据等多个维度。滴滴目前对15分钟后供需预测的准确度已经达到了85% 。
关键词:滴滴 数据中台
滴滴每天处理交通大数据超过4800TB,日均车辆定位数据超过150亿,每日处理路径规划请求400亿次,数据覆盖了交通路况、用户叫车信息、司机驾驶行为、车辆数据等多个维度。滴滴目前对15分钟后供需预测的准确度已经达到了85% 。
滴滴数据中台发展
业务发展驱动数据进化
滴滴数据中台建设围绕四个方面进行:
并且解决不同的问题。
中台数据体系建设的核心难点
产品方面:多场景,全链路的复杂需求
业务方面多团队,多目标的协作需求
滴滴精益数据管理体系
滴滴的数据中台从底向上构建了包括数据基础建设,敏捷数据资产,数据治理,数据交付体系。
两年来的建设成果:
滴滴数据系统构成
数据架构:
滴滴的数据架构体系包含了当前大数据领域主流的技术:
离线部分以Hadoop和Hive为主,实时计算部分Flink,Spark
OLAP领域使用了Hbase、Presto和Clickhouse。
智能数据目录
精益数据生产
建立数据委员会,推进业务-运维-数据的 协同机制 一键埋点,用户行为轨迹全记录 数据采集秒级同步,准确性99.999% 数据链路全监控,自动定位关键节点。
如何定位需要的数据
指标口径变动100%管控 所有元数据信息一键快速查询 精准评估每一张表的数据影响和价值 数据开放率99.04% 隐私数据全脱敏,完备的权限管控机制, 数据泄露0事故。
更快更简单的使用数据
核心数据5点产出(业内普遍7-8点),开发效率提升35% ,指导数据优化方向
标准化数据服务
实时数据集成服务