Excel 用户常见的元数据可能包括标题、使用过合并单元格的表头、注释这样的内容,也可能包括空行和空列。这种数据结构数据库不喜欢,Tableau 同样也不喜欢。所以我们需要知道Tableau 数据解释器,用它来解决这一问题。
以下数据是Excel用户常见的元数据,这种表格导入Tableau 后无法直接被Tableau 识别出正确的字段名称和字段值。
Step:1
将表格导入到Tableau 后,Tableau 会自动生成字段名称Fn,并保留所有excel里面的空行等。这种数据结构严重妨碍了我们做数据分析。
Step:2
当数据需要清理的时候,Tableau会自动识别,并在图中标记1处显示数据解释器功能,我们只需要傻瓜式的勾选标记1处的√,就能让数据解释器帮你一键清理数据;
我们可以看到数据预览窗口中:
去除了表头,以及表头和表格之间的空行;
在标记2 处,去除了合并单元格;
在标记3 处,去除了合并单元格,并把两行的内容合并后,作为新的表头;
在标记4 处,对合并单元格的值做了数据填充。
Step:3
Data Interpreter (数据解释器)何时不可用(摘自Tableau 官网):
Data Interpreter 选项可能会因以下原因而不可用:
数据源已具有 Tableau 可以解释的格式:如果 Tableau Desktop 无需 Data Interpreter 的额外帮助就能处理独特的格式设置或无关的信息,则 Data Interpreter 选项不可用。
许多行或许多列:在数据具有以下属性时,Data Interpreter 选项不可用:
数据包含超过 2000 列。
数据包含超过 3000 行和超过 150 列。
数据源不受支持:Data Interpreter 仅可用于 Microsoft Excel、文本 (.csv) 文件、PDF 文件和 Google Sheets。对于 Excel,数据必须为 .xls 和 .xlsx 格式。
PS:2018年最后一天,提前祝大家元旦快乐;2019继续加油ヾ(◍°∇°◍)ノ゙,预计明年会有两本Tableau 的新书出世,其中一本是《人人都是数据分析师》第二版;目前想买书可以入手人人的第一版本。
因为Tableau 中会用到地图,但是地图是不能随意出现在出版物中的,其审核流程相当复杂,所以之后的Tableau 出版物中极大可能没有地图截图!
领取专属 10元无门槛券
私享最新 技术干货