当前位置: 首页 > news >正文

Superset,基于web的开源BI工具,github三万star

BI工具是数据分析的得力武器,目前市场上有很多BI软件,众所周知的有Tableau、PowerBI、Qlikview、帆软等,其中大部分是收费软件或者部分功能收费。这些工具一通百通,用好一个就够了,重要的是分析思维。

我一直用的Tableau,不过实在太贵,一年小一万。之前在github接触到一个基于浏览器的开源BI应用,名叫Superset,是Airbnb团队开发的。于是想试下,在安装配置阶段用了一些时间,有点心累,不过实际用起来却是非常nice。

先看下面板效果:

它还可以和deck.gl集成,做高难度地地图展示:

Superset后端是基于python开发的,所以也算是python生态的一员。它的三大特点是:开源、轻量级、图表丰富。相比较集成好的软件,Superset是有些使用门槛的,对新手没那么友好,不过它免费呀,免费真香。

官方对Superset的介绍是: - 通过 NVD3/D3 预定义了多种可视化图表,满足大部分的数据展示功能。; - 易于使用的界面,用于浏览和可视化数据; - 创建和共享仪表板; - 一个轻量级的语义层,允许通过定义维度和度量来控制数据源如何向用户公开; - 一个可扩展的、高粒度的安全模型,允许复杂的规则对谁可以访问哪些产品特征和数据集。与主要身份验证后端集成(数据库、OpenID、LDAP、OAuth、REMOTE_USER、…); - 通过SQLAlchemy与大多数基于SQL语言的RDBMS集成; - 与http://Druid.io的深度集成;

有一个亮点,Superset支持sql查询,这太方便了,Tableau似乎不可以。 使用SQL Lab查询和可视化数据:

你可以导入csv等文本文件,并连接数据库。 Superset支持的数据库:

MySQL Oracle PostgreSQL Presto Snowflake SQLite SQL Server Teradata Vertica Hana Amazon Athena Amazon Redshift Apache Drill Apache Druid Apache Hive Apache Impala Apache Kylin Apache Pinot Apache Spark SQL BigQuery ClickHouse CockroachDB Dremio Elasticsearch Exasol Google Sheets Greenplum IBM Db2

不过要连接这些数据库,需要安装相应的连接包:

自由选择多种图表类型:

更加丰富的案例:

Superset安装的python依赖库比较多,建议先安装Anaconda,避免不必要的麻烦。

具体安装使用步骤见下:

# Install superset pip install apache-superset # Initialize the database superset db upgrade # Create an admin user (you will be prompted to set a username, first and last name before setting a password) $ export FLASK_APP=superset superset fab create-admin # Load some data to play with superset load_examples # Create default roles and permissions superset init # To start a development web server on port 8088, use -p to bind to another port superset run -p 8088 --with-threads --reload --debugger

在实际安装使用过程可能会遇到各种各样的麻烦,所以多问问Google吧,或者stackoverflow。

后面我们会用专题来介绍superset的安装、配置、使用、可视化展示。如果你也感兴趣,那就点个再看吧!

http://www.jsqmd.com/news/89180/

相关文章:

  • vue基于Spring Boot的军事论坛军迷交流平台_6c496w86
  • 40年匠心传承!维乐ANGEL GLIDE坐垫重塑骑行美学
  • Python安装库太慢?配置好这个速度飞起
  • vue基于Spring Boot的减肥健身养生人士饮食营养管理系统_5gn4225x
  • 基于LabVIEW的转子故障诊断系统:振动信号里的秘密探寻
  • 转子动力学:临界转速计算、Workbench建模、模态振型与坎贝尔图
  • 转差频率控制的矢量控制系统Matlab/simulink仿真探索
  • 交互噪声(Interaction Noise):推荐系统中被忽视却关键的问题
  • 高效的5个pandas函数,你都用过吗?
  • 信号去噪算法:VMD、优化VMD、WD及多模型混合的Matlab实践
  • 每天五分钟:leetcode动态规划-递归与递推_day2
  • 基于Java的安全生产考试座位签到智慧管理系统的设计与实现全方位解析:附毕设论文+源代码
  • 什么叫“结构表示”和“文本表示”不对齐?(Self)
  • 【大模型】-LangChain--RAG文档系统
  • jar(更新中)
  • 基于Java的安全生产视频监控智慧管理系统的设计与实现全方位解析:附毕设论文+源代码
  • 昇腾CANN从单算子到融合优化实战
  • 探索非线性电液伺服系统的模型自适应反步控制
  • 当AI遇上A股:一个让机器读懂财经新闻的量化框架
  • 21、GNU 开发实用工具:函数、变量与调试技巧
  • 基于Java的安全监管网络人员信息智慧管理系统的设计与实现全方位解析:附毕设论文+源代码
  • 16、构建与GNU Make的常见问题及算术实现
  • 基于Java的安全生产职业危害智慧管理系统的设计与实现全方位解析:附毕设论文+源代码
  • 信捷XDM PLC三轴可编程运动控制:强大且灵活的工业利器
  • Numpy基础20问
  • 降AI率就要牺牲文笔?WriterPro第一个不服!实测对比比原文写得还好,这文笔简直绝了
  • 基于Java的安全许可证智慧管理系统的设计与实现全方位解析:附毕设论文+源代码
  • K8S-蓝绿发布与金丝雀发布
  • 信捷XDM PLC三轴可编程运动控制:打造灵活数控体验
  • YOLOv8+PyQt5西红柿成熟度检测(可以重新训练,yolov8模型,从图像、视频和摄像头三种路径识别检测,包含登陆页面、注册页面和检测页面)