版权归原作者所有,如有侵权,请联系我们

如何用Tableau对数据建模?

猴子
著有畅销书《数据分析思维》,公众号(猴子数据分析)创始人
收藏

这是免费系列教程《7天学会商业智能(BI)-Tableau》的第4天,前面我们介绍了如何用Tableau获取数据?,今天介绍如何用Tableau获取数据。你将学会:

什么是数据关系?
如何管理数据关系?
创建计算列
隐藏字段
创建度量值
创建表计算
浏览基于时间的数据

项目案例

这是一家咖啡店的数据,Excel里有两个表,分别是销售数据表、产品表。

销售数据表记录了咖啡订单,包括字段:订单编号、订日期、门店、产品ID、顾客、数量。

产品表中记录了咖啡的种类与价格,包括字段:咖啡ID、咖啡种类、杯型、产品名称、价格。

1.什么是数据关系?

在日常生活中,人和人之间是有关系的,管理人之间的关系叫做人脉管理。同样的,表和表之间也是有关系的,叫做数据关系。

通过管理数据关系,就可以清楚的知道各个表之间的关系,有助于我们做跨表格分析。

举个例子,你就明白啦。在案例数据中,销售数据表的“产品ID”与产品表的“产品ID”对应,通过这个关系,就可以知道每个订单里用户购买了什么类型的咖啡,价格是多少。

2.如何管理数据关系?

首先,将需要的表导入Tableau,可以看之前的内容:如何导入数据。导入后,在画布的左边可以显示出导入的每个工作表。

根据需要联接(内部 左侧 右侧 完全外部)所需工作表,联接成功后,会显示出所联接的表及其列之间的关系,一般Tableau会自动识别相同字段进行连接(如下图):

如果要添加新的联接子句,就选择要连接的字段。如果要删除关系也非常简单,右键单击该关系,选择“X”图标的地方删除:

3.创建计算列?

在实际工作表中,有时候我们需要新增一列数据,那么在Tableau中如何新增列呢?

选择工作表,点击某列倒三角,创建计算字段:

根据需要,按下图在小方框里写新建列名称:年,然后填写公式:YEAR([订单日期])

这样,就给销售数据表增加了一列“年”,公式YEAR([订单日期])表示用Year函数取值日期,就可以得到订单的年份。

4.隐藏字段

选中想要隐藏字段,右键选择“隐藏”。隐藏字段不会被删除,数据仍然存在,只是让肉眼暂时看不到

在Tableau中点击显示隐藏字段,字段显示灰色表示是隐藏的字段

如果想要让隐藏的字段重新显示出来,可以选中该字段,然后右键单击“取消隐藏”

5.创建度量值

创建度量值是指用表中原有的字段计算得到新的字段。下面我们通过一个例子,实践操作一遍,你就懂啦。

如图所示,在度量空白处点击,选择创建计算字段

按下图,在小方框里写新建度量值名称:产品数量。在公式栏中,输入定义度量值的表达式,表达式类似于Excel里的函数,里面包括了很多常用的函数,方便分析使用。这里输入表达式是SUM,表示是求和函数。

继续输入“产品ID”字段,表示统计有多少种产品(产品数量),这样我们就创建了一个新的度量值“产品数量”

创建成功后,它会显示在工作表左栏度量中,如果想要删除/隐藏/重命名/复制/编辑等,可以点击相应选项。

6.创建表计算

表计算是对聚合后数据的二次运算。在使用Tableau对基础数据可视化的过程中,我们对汇总好的数据还有分析的需求,例如汇总数据的总额、各自的占比等,所以也就有了如下二次计算的各种类型。

清楚了表计算,我们来确定计算类型,共有3种类型:使用快速表计算选择 + 在编辑表计算中选择 + 生成计算字段时直接使用表计算函数

确定好表计算类型,还要选择表计算依据:

也可以直接在编辑表计算中选择:

这样表计算就完成了,我们可以直观的看到各种类咖啡销量的百分比情况

7.浏览基于时间的数据

当使用日期字段来进行可视化作图时,Tableau会自动将时间进行汇总成年、季度、月、日几个维度。

例如,销售数据表中的“订单日期”是以天为单位,在做图时会自动汇总成一年

用“订单日期”为横轴,“数量”为纵轴生成的条形图,这个图可以很清楚的看到不同时间维度下咖啡的订单销量是多少,如年维度

同样的,通过这种方法,可以用来分析每月、每个季度、每年等公司的经营状况。

8.总结

通过案例,我们学会了Tableau的以下知识点:

1)如何管理数据关系

2)创建计算列

3)如何隐藏列

4)创建度量值

5)创建计算表

6)浏览基于时间的数据

上面内容来自“猴子数据分析”学员分享的经验,来源:

https://zhuanlan.zhihu.com/p/372730285

推荐:人人都需要的数据分析思维