今日份知识你摄入了么?

Working with External Services in Tableau:

Python, R, and MATLAB

一旦当你开发了在Tableau里使用Python,R 或者Matlab的技能,就像在数据可视化的世界里开了挂一样,只需要轻轻松松抓取拖拽模块,就可以将高端的数据科学算法灵活使用。同时还可以让你的团队小伙伴更直观又互动的的查看理解以及进一步研究你的数据分析结果。

利用外部服务的核心技巧就是学会表格计算(Table Calculation)。在Tableau里表格计算的时候,所有的数值都是通过表格计算来递送及返还,这就意味着数据的可视结构影响了数据传递到外部服务的方式。所以这篇文章就是帮助使用者掌握表格计算来优化数据在外部服务的可视化表现。

表格计算是针对视图上的总汇数据进行计算。这就允许同一个数据只通过简单调整计算就可以解决多个任务。

以百分比数据为例子。比如如何分析过去三年销售额并且每个种类对总销售额的贡献值。利用Tableau里的Table(down)计算后,具体数值如下

也可以通过Pane(down)来计算每一年各个种类的百分比。

当掌握了这些基本操作,就可以继续尝试多维任务操作。先在试图里右击选择Edit Table Calculation,可以查看试图里所有的信息。

相对应的,在Pane(down)的例子里,就可以查看数据信息显示的是每一年的数据。

当Tableau连接外部服务的时候,每个分割都设立单独的指令。所以当分割区域过于复杂时,就会导致每次成百上千的服务指令从而影响结果的呈现。为了解决这个问题,可以在Edit Table Calculation里把所有区域整合为一个指令。

举个Python外部服务的栗子,数据包含了11年每周的海平面温度,总计556个数据。

然后用Python检测数据中的outlier,超过数据范围值四分位的数值都是为outlier。

然后需要定义这个表格计算的应用范围。使用Table(across)将556个数值整合一起递送到服务器进行计算。计算的的结果用橘色的点来标出。

具体过程是先用Python算法来判断每个值是否是outlier并标签上True或者False。

相同的Python编码同时还可以完成查找每一年内是否有outlier。对比查找全部数据,这次把数据分为11个独立的指令进行计算

计算结果如下图所示,同样用橘色标点表示。

所以表格计算在Tableau里有很大的优势,大大提升了数据分析的效率和灵活性。

原文作者:RACHEL BOWES

翻译作者:Ray

美工编辑:Miya

校对审稿:卡里

原文链接:-external-services-tableau-tabpy-r-matlab-93351