社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

通过实例学习在 Tableau 中使用第三方工具: Python,R 和 Matlab

优阅达大数据生态 • 5 年前 • 931 次点击  

关注我们 关注Tableau


Tableau 与第三方工具


当你将 Python,R 或 Matlab 脚本转换为在 Tableau 中运行时,你可以通过简单的拖放操作使企业中的每个人都可以访问高级算法,从而进入到全新的数据分析视觉,并实现数据科学的民主化。


它还可以让你的团队以可视化的交互格式查看脚本,更好地查看、理解和探索数据结果。


要成功使用 Tableau 的第三方工具,你需要了解一个非常重要的构建模块以及这类的表计算!


使用 Tableau 的第三方工具时,所有值都通过表计算传递和返回,这意味着视图的构造方式将影响值如何发送到第三方工具。


在这里,我们将帮助你了解 Tableau 表计算,以便在调用第三方工具时使用它们,并确保最终的可视化对性能进行了优化。


表计算基础知识


表计算对可视化中的聚合数据执行计算。这不是行级别计算,而是在你的 Viz 上即时计算的内容。


表计算的一个好处是,允许你简单地通过调整 Tableau 中的计算来回答数据的不同问题。


这里我们看看实例


看看下面这个 Total of Percent 例子。假设你想分析过去三年的销售情况,以了解每个类别对你的整体销售额的贡献。在整个表中计算你的计算,在 Tableau 中描述为 Table(down)。


请注意,我们在最底部有100%的总数。每年+类别组合的贡献总计100%。



或者,你可以通过计算每个窗格中的计算来分析每个年度中来自每个类别的销售百分比。在 Tableau 中,这被描述为 Pane(down)。请注意,我们现在每个窗格中的总数为100%:




表格计算可解决多个维度

 

现在你已经掌握了基础知识,让我们把它提升到一个新的水平。


如果视图中有多个维度,并且你希望更具体地看到计算方法,只需右键单击视图中的胶囊,然后选择编辑以打开表格计算对话框。


这里我们看看实例


让我们重温上面的例子,看看应该如何转换为这个新的对话框。在第一个例子中,我们想要解决销售的类别和年份。


你可以通过勾选对话框中的两个维度来执行此操作。我们根本没有对计算进行分区,我们只是告诉 Tableau 一个指令:解决视图中的所有问题。



为了进行比较,在 Pane(down)示例中,我们分析了每年内每个类别的销售百分比。由于我们只希望计算来解决产品类别,因此我们希望每次订单日期更改时重新开始计算。


通过不勾选对话框中的订单日期维度,我们告诉 Tableau 这是我们想要对数据进行分区的方式:


如何转化为第三方工具?


Tableau 对表计算中的每个分区单独调用第三方工具,因此当分区字段非常精细时,可能会导致数千个工具的调用。这可能会严重影响性能。


要在大多数用例中解决这个问题,通过检查编辑表计算对话框中特定维度下的所有框,将所有字段放在寻址部分中是有意义的。这将导致仅对第三方工具进行一次调用。除非你想要分解视图以回答特定问题。


这里我们看看实例


让我们看一下使用 Tableau 的 TabPy 第三方工具的一些示例:我有11年的海面温度数据,每周汇总一次,结果总共有556个标记:



要识别此数据集中的异常值,可以使用简单的 Python 脚本调用 TabPy 并检查给定数据点是否超出总数据集的四分位数范围。如果是这样,我们可以将其归类为异常值。


在此脚本中还有一些 print 语句可以在运行 TabPy 的命令行中打印响应:



由于这是一个表计算,我们必须定义当它添加到视图时它的计算方式。


如果我们计算 Table(across),这将在一次调用中将所有556值发送到服务器,允许我们评估问题,“整个数据集中的异常值是多少?”


我们可以看到1988年和1989年的异常值由较大的橙色点表示:



让我们看看我们的 print 语句在命令行中给出的响应:


首先,我们看到一行 80 颗星,然后发送回 Tableau 的响应,这是一个 556 布尔值为 TRUE 或 FALSE 的单个数组。



▍但如果业务问题发生变化怎么办?如果我们想在每年看到异常值怎么办?


将表计算更改为计算 Table(across)将导致对 TabPy 的11个单独调用 - 每个分区的单独调用(在本例中为每年一次)。然后,TabPy 将在每个数据子集中找到异常值,并相应地给出布尔响应。


我们现在可以看到1989、1991、1997和1998中存在异常值。这里用较大的橙色点显示的数据是其数据子集中的异常值:



我们也可以在命令行中看到这一点,你可以看到每次调用 TabPy 服务器时打印的星星:



既然你已了解表计算的概念,那么在 Tableau 中运行脚本时,可以利用它们。这可以让你充分体验第三方工具带来的好处,最重要的是,你可以充分享受高级分析的优势!



报名 Tableau Workshop


明天,我们将在上海、广州、深圳举办 Tableau Workshop。欢迎数据粉们按需参加!快快扫描以下二维码,立刻报名吧!


上海 进阶

广州 初级

深圳 初级


【温馨提示】

为避免错报场次

建议您点击放大二维码图片之后

再长按识别报名



产品试用

点击下方阅读原文可免费试用最新版本 Tableau     

参与讨论

你可加入中国(含港澳)Tableau微信讨论群,随时随地向数据专家咨询、与更多数据粉讨论与分享。请扫描下方二维码,添加微信群小助手(暗号:入群),它会很快让您进入群讨论!

Hi,我是Tableau微信群小助手!

朋友分享
点击右上角“分享文章到朋友圈”

点击右上角“发送给朋友”

优阅达 大数据生态


优阅达 致力于构建大数据生态环境,为大中华地区的跨国企业和本土企业提供商业智能、数据整合、大数据平台等综合性解决方案。综合集团、金融、房地产、零售、互联网、医药、电信、金融、高科技等行业众多客户已经从这些服务中直接改善其营业收入和利润增长。


点击阅读原文免费试用 Tableau !


今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/DNlN2dox2f
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/23335
 
931 次点击