Superset 是一个数据可视化和数据探索平台
github地址:
https://github.com/apache/superset

源于 Airbnb,并于 2017 年进入 Apache 孵化器。Apache Superset 旨在为用户提供一个现代化、易于使用的大数据探索和可视化平台。该平台允许用户使用简单的无代码可视化构建器和先进的 SQL 编辑器快速构建仪表盘,以实现数据的可视化展示和分析。
Apache Superset 主要功能如下:
1. 开箱即用的丰富数据可视化工具:Superset 提供了多种可视化组件,以满足用户对数据探索和分析的需求。
2. 易于使用的界面:Superset 提供了简洁明了的界面,使数据探索和可视化变得更加简单便捷。
3. 创建和共享仪表盘:用户可以轻松创建自定义仪表盘,并与团队或组织共享数据洞察。
4. 企业级身份验证:Superset 集成了与主要身份验证提供商的身份验证功能,以确保数据安全。
5. 可扩展的安全/权限模型:Superset 提供了可扩展且高粒度的安全模型,允许对数据和特性进行复杂的访问控制。
6. 简单的语义层:用户可以通过定义字段显示和聚合功能度量等操作,自定义数据展示方式。
7. 集成 SQLAlchemy:Superset 支持与绝大多数关系型数据库(RDBMS)集成。
8. 深度整合 Druid.io:Superset 与 Druid.io 深度集成,以提供高性能的数据分析能力。
9. 云原生和高可用性:Apache Superset 设计用于扩展到大型分布式环境,并支持在容器中运行,以实现高可用性。
Apache Superset 已经在 Airbnb、Netflix、Twitter、Yahoo! 以及其他国内企业(如去哪儿网、bilibili、快手、豆瓣、VIPKID 等)得到广泛应用。总体而言,Apache Superset 是一个强大且易于使用的数据可视化和数据探索平台,适用于各种规模的企业和组织。
superst提供saas服务,由preset提供服务!

在国内,BI(Business Intelligence,商业智能)工具市场也逐渐崛起,涌现出了一批优秀的国产BI工具。以下是一些国内较为知名的BI工具介绍:
1. 数据观:数据观是一款为企业提供数据分析和可视化解决方案的BI工具。它支持多种数据源接入,如数据库、Excel、CSV等,并提供丰富的可视化组件。数据观适用于企业数据报表、数据分析、业务监控等场景,帮助企业实现数据驱动决策。
2. 帆软斐波那契:帆软斐波那契是一款企业级BI工具,提供数据挖掘、分析和可视化功能。它支持与多种数据库连接,并具备强大的报表设计器和丰富的图表类型。斐波那契广泛应用于企业经营分析、财务报表、项目管理等领域,助力企业优化业务决策。
3、4、5 腾讯阿里百度,这些巨头也都提供这些服务,不用说,这些巨头依仗流量,无孔不入。
6. 观远数据:观远数据是一款为企业提供数据分析和可视化解决方案的BI工具。它支持多种数据源接入,如数据库、Excel、CSV等,并提供丰富的可视化组件。观远数据适用于企业数据报表、数据分析、业务监控等场景,帮助企业实现数据驱动决策。
7. 氢原子数据:氢原子数据是一款面向数据分析师的BI工具,提供一站式数据处理、分析和可视化功能。它支持多种数据源接入,拥有丰富的图表类型,并具备智能数据挖掘功能。氢原子数据适用于各行业,助力企业实现数据价值挖掘。
这些国产BI工具在功能、界面、性能等方面各有特点,企业可以根据自身需求选择合适的工具进行数据分析和可视化。总之,国内BI工具的发展日益成熟,为企业提供了更多选择。
商业智能(Business Intelligence,BI)之所以如此重要,原因如下:
1. 数据驱动决策:在当今信息化的商业环境中,数据已经成为企业竞争的核心资源。通过BI工具对海量数据进行挖掘、分析和可视化,企业可以更加客观地了解业务状况,从而做出更加科学、合理的决策。数据驱动决策能够提高企业的竞争力,为企业带来更高的效益。
2. 提高工作效率:BI工具能够帮助企业自动化数据处理、分析和报告生成等过程,减轻了业务人员的工作负担。通过快速生成直观、易理解的报告,企业可以更加高效地完成数据分析任务,进而提高整体工作效率。
3. 降低数据风险:通过对数据进行实时监控和分析,企业可以及时发现潜在的业务风险。BI工具可以帮助企业建立风险预警机制,确保企业在面临风险时能够迅速采取措施予以应对。
4. 优化业务流程:通过分析企业内部数据,BI工具可以帮助企业发现业务流程中的瓶颈和问题。基于分析结果,企业可以优化业务流程,提高业务运作效率,降低成本。
5. 个性化定制:BI工具通常具有丰富的图表类型和可视化效果,企业可以根据自身需求和偏好定制报表和仪表盘。这使得数据分析和展示更加生动有趣,有助于提高员工对数据的关注度和理解程度。
6. 跨部门协作:BI工具可以轻松地与多种数据源连接,实现数据共享和流通。这有助于跨部门之间的协作,提高企业整体的数据利用效率。
总之,BI工具在现代企业中发挥着越来越重要的作用。通过实施BI项目,企业可以更好地挖掘数据价值,实现数据驱动的决策,提高竞争力和经营效益。同时,BI工具也有利于提升员工的工作效率,降低数据风险,优化业务流程,实现跨部门协作。这些都是企业在激烈的市场竞争中保持领先地位的关键因素。

快速入门 Apache Superset 需要掌握以下几个步骤:
1. 安装和部署:
首先,你需要确保你的系统上安装了 Python 3.7 或更高版本。接下来,根据你的需求选择本地安装或使用 Docker。以下是使用 Docker 安装的步骤:
```
$ docker pull superset
$ docker run -p 8080:8080 --name superset -d superset
```
2. 准备环境:
在安装过程中,Apache Superset 自动创建了一个名为 `SUPERSET_INI_PATH` 的环境变量。你需要将其指向你的 `superset.ini` 文件。在默认情况下,该文件位于容器中的 `/opt/superset/config/` 目录下。你可以根据需要修改此文件以配置数据库连接等。
3. 登录 Superset:
启动 Superset 后,打开浏览器并访问 `http://localhost:8080/`。默认用户名和密码分别为 `admin` 和 `admin`。登录后,你将看到 Superset 的控制台界面。
4. 创建数据库和表:
在 Superset 中,你需要先创建数据库和表,然后才能进行数据可视化。点击左上角的菜单栏,选择 `Databases`,然后点击 `Create Database` 创建一个新的数据库。接下来,为数据库添加表,方法是将 CSV 文件上传至 `/uploads/` 目录,或在数据库中创建表。
5. 创建仪表盘:
创建仪表盘是为了将数据可视化。在 Superset 控制台中,点击 `Dashboards`,然后点击右上角的 `New Dashboard` 创建一个新的仪表盘。在仪表盘编辑器中,你可以添加图表、表格和其他可视化组件,以及自定义样式和设置。
6. 探索和分析数据:
在 Superset 中,你可以使用 SQL 查询和数据透视表对数据进行探索和分析。点击 `Queries` 或 `Pivot Tables`,然后尝试运行一些 SQL 查询或创建数据透视表。你可以根据需要修改查询以获得所需的数据结果。
7. 共享和发布:
当你完成数据分析和可视化后,可以将成果与他人共享。在 Superset 中,你可以为每个仪表盘设置权限,并将它们发布到指定的 URL。点击 `Dashboards`,然后选择要共享的仪表盘,点击 `Share` 按钮,设置权限和 URL。
通过以上步骤,你将能够快速入门 Apache Superset。接下来,你可以深入学习 Superset 的更多功能,如数据挖掘、机器学习、仪表盘动画等,以提高你的数据分析和可视化能力。
注意:本指南基于 Apache Superset 的基本功能。实际上,Superset 具有许多高级功能,如复杂查询、聚合、分组等。要充分利用 Superset,建议参阅官方文档并参加相关培训课程。

在这个案例中,我们将使用 Apache Superset 探索和分析一份包含销售数据的表格。具体操作如下:
1. 准备数据:
假设我们有一份名为 `sales_data.csv` 的 CSV 文件,其中包含了以下字段:`date`(日期)、`category`(类别)、`brand`(品牌)、`revenue`(销售额)。
2. 创建数据库和表:
在 Superset 控制台中,创建一个新的数据库,例如名为 `sales_database`。然后,在该数据库中创建一个名为 `sales_table` 的表,并将 `sales_data.csv` 文件上传至 `/uploads/` 目录。
3. 探索数据:
点击 `Queries`,然后选择 `New Query` 创建一个新的 SQL 查询。在查询编辑器中,输入以下 SQL 语句以筛选出特定日期的销售额:
SELECT
date,
category,
brand,
SUM(revenue) as total_revenue
FROM
sales_table
WHERE
date >= '2021-01-01'
AND date <= '2021-12-31'
GROUP BY
date,
category,
brand
ORDER BY
total_revenue DESC;
``
点击 `Run` 按钮执行查询。查询结果将显示在下方表格中。
4. 创建数据透视表:
在查询结果上点击右键,选择 `Create Pivot Table` 创建一个数据透视表。在弹出的窗口中,选择要透视的列(例如 `date`、`category`、`brand`),并为每个列设置聚合函数(如 `SUM`、`AVG`、`MIN`、`MAX` 等)。点击 `Save` 保存透视表。
5. 创建图表:
点击 `Charts`,然后选择 `New Chart` 创建一个新的图表。在图表编辑器中,选择图表类型(如柱状图、折线图、饼图等),并将数据集设置为刚才创建的透视表。根据需要调整图表样式和设置,然后点击 `Save` 保存图表。
6. 创建仪表盘:
点击 `Dashboards`,然后点击右上角的 `New Dashboard` 创建一个新的仪表盘。在仪表盘编辑器中,添加以下组件:
- 一个表格组件,显示销售数据的摘要信息;
- 一个图表组件,展示按日期、类别和品牌划分的销售额走势。
根据需要调整组件的样式和设置,然后点击 `Save` 保存仪表盘。
7. 共享和发布:
在 Superset 控制台中,将仪表盘分享给其他用户或团队。点击 `Dashboards`,选择要共享的仪表盘,然后点击 `Share` 按钮。设置权限和 URL,以便其他用户可以访问和查看分析结果。
通过这个案例,我们展示了如何使用 Apache Superset 探索和分析销售数据。实际上,Superset 支持多种数据源和丰富的分析功能,可以帮助你处理和分析各种类型的数据。建议参阅官方文档以了解更多关于 Superset 的详细信息。

主要特征

40 多个预装可视化

支持拖放和SQL 查询

数据缓存可加快图表和仪表板的加载速度

Jinja 模板和仪表板过滤器用于创建交互式仪表板

CSS 模板可根据您的品牌外观和风格定制图表和仪表板

SQL数据转换的语义层

交叉过滤器、钻取详细信息和逐项钻取 功能可进行更深入的数据分析

用于临时数据探索的虚拟数据集

通过功能标志访问新功能
Apache Superset 具有丰富的预装可视化组件,使得数据展示更加生动有趣。在这个案例中,我们将展示如何使用 Superset 创建一个包含多种预装可视化的仪表盘。
1. 登录 Superset 控制台,创建一个新的数据库和表,或者使用已有的数据库和表。
2. 创建一个新仪表盘,例如命名为 `Sales Dashboard`。
3. 添加表格组件:
点击 `Add Widget` 按钮,选择 `Table` 组件类型,为新创建的仪表盘添加一个表格组件。在表格组件编辑器中,选择与销售数据相关的字段,如 `date`、`category`、`brand` 和 `revenue`。设置排序和分页等选项,然后点击 `Save` 保存表格组件。
4. 添加图表组件:
a. 点击 `Add Widget` 按钮,选择 `Chart` 组件类型,为仪表盘添加一个柱状图组件。
b. 在图表组件编辑器中,选择图表类型为 `Column Chart`。将数据集设置为与销售数据相关的字段。
c. 调整图表样式和设置,如颜色、标题等,然后点击 `Save` 保存图表组件。
d. 重复步骤 a-c,为仪表盘添加其他类型的图表组件,如折线图、饼图等。
5. 添加文本组件:
点击 `Add Widget` 按钮,选择 `Text` 组件类型,为新创建的仪表盘添加一个文本组件。在文本组件编辑器中,输入相关文字,如数据摘要、分析结论等。调整字体、颜色和样式,然后点击 `Save` 保存文本组件。
6. 布局仪表盘:
使用 Superset 的拖拽功能,调整组件在仪表盘中的位置,以实现最佳的布局效果。
7. 共享和发布:
在 Superset 控制台中,将仪表盘分享给其他用户或团队。点击 `Dashboards`,选择要共享的仪表盘,然后点击 `Share` 按钮。设置权限和 URL,以便其他用户可以访问和查看分析结果。
通过这个案例,我们展示了如何使用 Apache Superset 创建一个包含多种预装可视化的仪表盘。实际上,Superset 提供了 40 多种预装可视化组件,涵盖柱状图、折线图、饼图、地图、漏斗图等多种类型。这些丰富的可视化组件可以帮助企业更好地展示数据,提高数据报告的吸引力和易读性。
建议参阅 Superset 官方文档以了解更多关于预装可视化的详细信息:https://superset.apache.org/docs

一个数据可视化和数据探索平台
github地址:
https://github.com/apache/superset
我们收集了10000+开源项目 源代码 点击 阅读原文