最近一段时间几乎每天都会收到有关数据操作及分析的求助,有的很容易就解决了,但有的费了半天劲却不能很好地解决。究其原因主要存在以下几个方面的问题:
1.数据格式不规范,甚至不正确,需要耗费大量的时间去转换;
2.数据来源太乱,无法很好地整合在一起;或者说以现有的数据,无法支撑起所期望达成的需求;
3.数据分析思路乱或没思路,总想隔空求解或者以目标反向操控数据;
4.数据基本功薄弱,EXCEL或其它数据工具基本操作不熟练。本来一个函
数或几次点选可以解决的问题,愣是不知所措,以为碰到大难题。
鉴于以上存在的问题,而且很可能是普遍性问题,今天想跟大家聊一聊数据分析的基本流程和胜任力的话题。这个话题聊完,以上几个问题也就都会涉及到了。
数据分析的核心流程包含以下几个基本步骤(见下图):数据的获取—数据的整理—数据的分析—数据的呈现。当然,数据获取之前我们应该进行业务问题定义和数据变量的定义,数据呈现之后应该还有报告撰写及汇报演示等环节,但这些都在今天的话题之外。
数据的获取:在所需要的数据变量定义清楚之后,数据分析的首要环节是数据的获取。我们的数据可能会来自云服务、各种数据库、各种格式的独立数据文件或者某些专用系统等一个或多个源头。首先是数据获取的方式问题,无论是主动提取还是被动推送,能否实现自动化或者半自动化,让数据能够按照事先定义的内容、时间间隔、输出格式、存储位置等规范把数据导入我们日常的数据处理与分析工具(对于大多数人来讲其实就是EXCEL)。如果实现了这一步,那么我们在数据处理的效率和数据的时效性上就会有非常明显的提升。也就是一旦源头和规范设定,你就会源源不断地得到所需的最新数据。在这一步只靠复制粘贴是解决不了问题的。这一步的主要操作功能都在EXCEL的“数据菜单”下的“获取外部数据”功能模块里面。
数据的整理:这一步实际上主要是传统数据处理中ETL的概念,包括了数据的提取、清理、转换、整合与加载的概念。所获取到的原始数据往往是不能够拿过来直接做分析的,因为这些数据很可能是零散的、格式混乱的、含有缺失的甚至是内容冲突的。因此,我们首先要从原始数据里提取出我们所需要的内容,并根据业务及数据本身的逻辑与相关性把来自不同源头的数据组合在一起。然后对数据进行一系列格式修正、缺失值处理、极值与异常值处理、冗余剔除、变量衍生等必要的操作,最后形成完整、规范、干净的数据集,加载到工作表或数据模型中待分析。这一步的诸多操作步骤需要分析人员熟练掌握EXCEL或其它专业数据分析工具的常用操作技巧以及功能模块(常用筛选、查询、提取、对比、转换等内置功能以及函数、透视表、图表、分析工具库等)。对于2010版以后的EXCEL版本来说,还有一个神器,Power Query。
数据的分析:毋庸置疑,这是最关键的一步。但要想在这一步产生高价值的业务洞察离不开两个基本功—业务理解和分析功底。对业务的透彻理解是分析思路的主要来源,而深厚的分析功底则是透过数据看清业务本质的必备要素。应该把哪些数据放在一起看,应该看数据的什么特征、什么关系,应该采取什么样的分析验证方法,应该怎样解读分析呈现的结果等这些关键工作都离不开以上两项基本功的有机融合。所谓面对同样的数据有的人一眼就能判断问题所在,而有的人茫茫然无从下手的差距就在这里。这一步没有捷径,多了解业务,多动手,多总结,多积累,慢慢提升。毫不夸张地说,EXCEL其实可以满足客服中心日常运营数据分析80%以上的需求。而我们大部分人都没有用起来,用好它。
数据的呈现:一图胜千言。很少有人喜欢看一篇篇密密麻麻的数据。把数据以图表或其它辅助可视化手段呈现出来,才是大家乐于接受的形式。所以图表的基本功又是必修的。其实EXCEL的图表功能已经很丰富了,大部分人缺的其实是创意和复合图表的整合能力。当然,如果你能够掌握PowerBI、SPSS、R、Python等软件或D3.js等交互式图表代码的话更是锦上添花。另外,干净、整洁、样式清晰的表格本身也是一种可视化手段,不一定非要把所有的数据都转化成图表,为了可视化而可视化。
好好审视一下目前数据分析与报表工作的这四个基本点,哪些做到了,哪些没做到,甚至没想到,然后列一个计划,慢慢推进与完善。数据获取自动化、基本分析模板化、数据呈现可视化、业务洞察系统化是数据岗人的工作基础,亦或是,目标!
鸿联九五作为二十多年专业的呼叫中心外包业务供应商,在全国20多个省市拥有呼叫中心自建坐席20000席,员工近18000人。服务的企业客户覆盖运营商、金融保险、互联网、电子商务、速递物流、电子终端、市政教育、旅游出行等8大主要行业领域,拥有高质量的呼叫中心团队和优良的管理水平,是你呼叫中心外包的不二选择.
领取专属 10元无门槛券
私享最新 技术干货