让我们看一下使用 Tableau 的 TabPy 第三方工具的一些示例:我有11年的海面温度数据,每周汇总一次,结果总共有556个标记:
要识别此数据集中的异常值,可以使用简单的 Python 脚本调用 TabPy 并检查给定数据点是否超出总数据集的四分位数范围。如果是这样,我们可以将其归类为异常值。
在此脚本中还有一些 print 语句可以在运行 TabPy 的命令行中打印响应:
由于这是一个表计算,我们必须定义当它添加到视图时它的计算方式。
如果我们计算 Table(across),这将在一次调用中将所有556值发送到服务器,允许我们评估问题,“整个数据集中的异常值是多少?”
我们可以看到1988年和1989年的异常值由较大的橙色点表示:
让我们看看我们的 print 语句在命令行中给出的响应:
首先,我们看到一行 80 颗星,然后发送回 Tableau 的响应,这是一个 556 布尔值为 TRUE 或 FALSE 的单个数组。
▍但如果业务问题发生变化怎么办?如果我们想在每年看到异常值怎么办?
将表计算更改为计算 Table(across)将导致对 TabPy 的11个单独调用 - 每个分区的单独调用(在本例中为每年一次)。然后,TabPy 将在每个数据子集中找到异常值,并相应地给出布尔响应。
我们现在可以看到1989、1991、1997和1998中存在异常值。这里用较大的橙色点显示的数据是其数据子集中的异常值:
我们也可以在命令行中看到这一点,你可以看到每次调用 TabPy 服务器时打印的星星:
既然你已了解表计算的概念,那么在 Tableau 中运行脚本时,可以利用它们。这可以让你充分体验第三方工具带来的好处,最重要的是,你可以充分享受高级分析的优势!
明天,我们将在上海、广州、深圳举办 Tableau Workshop。欢迎数据粉们按需参加!快快扫描以下二维码,立刻报名吧!
【温馨提示】
为避免错报场次
建议您点击放大二维码图片之后
再长按识别报名
点击下方阅读原文,可免费试用最新版本 Tableau
你可加入中国(含港澳)Tableau微信讨论群,随时随地向数据专家咨询、与更多数据粉讨论与分享。请扫描下方二维码,添加微信群小助手(暗号:入群),它会很快让您进入群讨论!
Hi,我是Tableau微信群小助手!
点击右上角“发送给朋友”
优阅达 致力于构建大数据生态环境,为大中华地区的跨国企业和本土企业提供商业智能、数据整合、大数据平台等综合性解决方案。综合集团、金融、房地产、零售、互联网、医药、电信、金融、高科技等行业众多客户已经从这些服务中直接改善其营业收入和利润增长。