百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

开源BI工具Superset数据库连接介绍

mhr18 2024-09-20 20:57 48 浏览 0 评论

安装数据库驱动

Superset要求为每个要连接的数据存储安装Python DB-API数据库驱动程序和SQLAlchemy方言。

  • 支持的数据库和依赖关系

Superset不附带与数据库的连接,除了SQLite,它是Python标准库的一部分。将需要为您想要用作元数据数据库安装所需的包,以及通过Superset连接到您想要访问的数据库对应所需的包。

下面一些推荐包的列表:

Amazon Athena

PyPI包:pip install "PyAthenaJDBC>1.0.9 , pip install "PyAthena>1.2.0

连接字符串:awsathena+rest://{aws_access_key_id}:{aws_secret_access_key}@athena.{region_name}.amazonaws.com/{

Amazon Athena

PyPI包:pip install "PyAthenaJDBC>1.0.9 , pip install "PyAthena>1.2.0

连接字符串:awsathena+rest://{aws_access_key_id}:{aws_secret_access_key}@athena.{region_name}.amazonaws.com/{

Amazon Redshift

PyPI包:pip install sqlalchemy-redshift

连接字符串:redshift+psycopg2://<userName>:<DBPassword>@<AWS End Point>:5439/<Database Name>

Apache Drill

PyPI包:pip install sqlalchemy-drill

连接字符串:drill+sadrill:// For JDBC drill+jdbc://

Apache Druid

PyPI包:pip install pydruid

连接字符串:druid://<User>:<password>@<Host>:<Port-default-9088>/druid/v2/sql

Apache Hive

PyPI包:pip install pyhive

连接字符串:hive://hive@{hostname}:{port}/{database}

Apache Impala

PyPI包:pip install impala

连接字符串:impala://{hostname}:{port}/{database}

Apache Kylin

PyPI包:pip install kylinpy

连接字符串:kylin://<username>:<password>@<hostname>:<port>/<project>?<param1>=<value1>&<param2>=<value2>

Apache Pinot

PyPI包:pip install pinotdb

连接字符串:pinot://BROKER:5436/query?server=http://CONTROLLER:5983/

Apache Solr

PyPI包:pip install sqlalchemy-solr

连接字符串:solr://{username}:{password}@{hostname}:{port}/{server_path}/{collection}

Apache Spark SQL

PyPI包:pip install pyhive

连接字符串:hive://hive@{hostname}:{port}/{database}

Azure MS SQL

PyPI包:pip install pymssql

连接字符串:mssql+pymssql://UserName@presetSQL:TestPassword@presetSQL.database.windows.net:1433/TestSchema

Big Query

PyPI包:pip install pybigquery

连接字符串:bigquery://{project_id}

ClickHouse

PyPI包:pip install sqlalchemy-clickhouse

连接字符串:clickhouse://{username}:{password}@{hostname}:{port}/{database}

CockroachDB

PyPI包:pip install cockroachdb

连接字符串:cockroachdb://root@{hostname}:{port}/{database}?sslmode=disable

Dremio

PyPI包:pip install sqlalchemy_dremio

连接字符串:dremio://user:pwd@host:31010/

Elasticsearch

PyPI包:pip install elasticsearch-dbapi

连接字符串:elasticsearch+http://{user}:{password}@{host}:9200/

Exasol

PyPI包:pip install sqlalchemy-exasol

连接字符串:exa+pyodbc://{username}:{password}@{hostname}:{port}/my_schema?CONNECTIONLCALL=en_US.UTF-8&driver=EXAODBC

Google Sheets

PyPI包:pip install gsheetsdb

连接字符串:gsheets://

Hologres

PyPI包:pip install psycopg2

连接字符串:postgresql+psycopg2://<UserName>:<DBPassword>@<Database Host>/<Database Name>

IBM Db2

PyPI包:pip install ibm_db_sa

连接字符串:db2+ibm_db://

MySQL

PyPI包:pip install mysqlclient

连接字符串:mysql://<UserName>:<DBPassword>@<Database Host>/<Database Name>

Oracle

PyPI包:pip install cx_Oracle

连接字符串:oracle://

PostgreSQL

PyPI包:pip install psycopg2

连接字符串:postgresql://<UserName>:<DBPassword>@<Database Host>/<Database Name>

Trino

PyPI包:pip install sqlalchemy-trino

连接字符串:trino://{username}:{password}@{hostname}:{port}/{catalog}

Presto

PyPI包:pip install pyhive

连接字符串:presto://

SAP Hana

PyPI包:pip install hdbcli sqlalchemy-hana or pip install apache-superset[hana]

连接字符串:hana://{username}:{password}@{host}:{port}

Snowflake

PyPI包:pip install snowflake-sqlalchemy

连接字符串:snowflake://{user}:{password}@{account}.{region}/{database}?role={role}&warehouse={warehouse}

SQLite

PyPI包:默认已安装

连接字符串:sqlite://

SQL Server

PyPI包:pip install pymssql

连接字符串:mssql://

Teradata

PyPI包:pip install sqlalchemy-teradata

连接字符串:teradata://{user}:{password}@{host}

Vertica

PyPI包:pip install sqlalchemy-vertica-python

连接字符串:vertica+vertica_python://<UserName>:<DBPassword>@<Database Host>/<Database Name>

请注意,还支持许多其他数据库,主要条件是是否存在一个功能性的SQLAlchemy方言和Python驱动程序。搜索关键字“sqlalchemy +(数据库名称)”应该可以帮助您找到对应的驱动。

额外的数据库设置

  • 更深层次的SQLAlchemy集成

可以使用SQLAlchemy公开的参数来调整数据库连接信息。在数据库编辑视图中,您可以将额外的字段编辑为JSON blob。

  • 对象集合

像Postgres和Redshift这样的数据库使用对象集合作为数据库之上的逻辑实体。为了让超集连接到特定的模式,您可以在Edit Tables表单(source > Tables > Edit record)中设置模式参数。

SQLAlchemy连接的外部密码存储

可以将Superset配置为使用数据库密码的外部存储。如果你正在运行一个自定义的秘钥分发框架,并且不希望将秘密存储在Superset的元数据库中,这是非常有用的。

示例:编写一个函数,该函数接受一个sqla.engine类型的参数。url,并返回给定连接字符串的密码。然后在配置文件中设置SQLALCHEMY_CUSTOM_PASSWORD_STORE以指向该函数。

def example_lookup_password(url):
secret = <<get password from external framework>>
return 'secret'
SQLALCHEMY_CUSTOM_PASSWORD_STORE = example_lookup_password

一种常见的模式是使用环境变量来提供机密信息。SQLALCHEMY_CUSTOM_PASSWORD_STORE也可以用于此目的。

def example_password_as_env_var(url):
# assuming the uri looks like
# mysql://localhost?superset_user:{SUPERSET_PASSWORD}
return url.password.format(os.environ)

SQLALCHEMY_CUSTOM_PASSWORD_STORE = example_password_as_env_var

对数据库的SSL访问

你可以使用Edit Databases表单中的额外字段来配置SSL:

{
    "metadata_params": {},
    "engine_params": {
          "connect_args":{
              "sslmode":"require",
              "sslrootcert": "/path/to/my/pem"
        }
     }
}

相关推荐

B站收藏视频失效?mybili 收藏夹备份神器完整部署指南

本内容来源于@什么值得买APP,观点仅代表作者本人|作者:羊刀仙很多B站用户都有过类似经历:自己精心收藏的视频突然“消失”,点开一看不是“已被删除”,就是“因UP主设置不可见”。而B站并不会主动通知...

中间件推荐初始化配置

Redis推荐初始化配置bind0.0.0.0protected-modeyesport6379tcp-backlog511timeout300tcp-keepalive300...

Redis中缓存穿透问题与解决方法

缓存穿透问题概述在Redis作为缓存使用时,缓存穿透是常见问题。正常查询流程是先从Redis缓存获取数据,若有则直接使用;若没有则去数据库查询,查到后存入缓存。但当请求的数据在缓存和数据库中都...

后端开发必看!Redis 哨兵机制如何保障系统高可用?

你是否曾在项目中遇到过Redis主服务器突然宕机,导致整个业务系统出现数据读取异常、响应延迟甚至服务中断的情况?面对这样的突发状况,作为互联网大厂的后端开发人员,如何快速恢复服务、保障系统的高可用...

Redis合集-大Key处理建议

以下是Redis大Key问题的全流程解决方案,涵盖检测、处理、优化及预防策略,结合代码示例和最佳实践:一、大Key的定义与风险1.大Key判定标准数据类型大Key阈值风险场景S...

深入解析跳跃表:Redis里的&quot;老六&quot;数据结构,专治各种不服

大家好,我是你们的码农段子手,今天要给大家讲一个Redis世界里最会"跳科目三"的数据结构——跳跃表(SkipList)。这货表面上是个青铜,实际上是个王者,连红黑树见了都要喊声大哥。...

Redis 中 AOF 持久化技术原理全解析,看完你就懂了!

你在使用Redis的过程中,有没有担心过数据丢失的问题?尤其是在服务器突然宕机、意外断电等情况发生时,那些还没来得及持久化的数据,是不是让你夜不能寐?别担心,Redis的AOF持久化技术就是...

Redis合集-必备的几款运维工具

Redis在应用Redis时,经常会面临的运维工作,包括Redis的运行状态监控,数据迁移,主从集群、切片集群的部署和运维。接下来,从这三个方面,介绍一些工具。先来学习下监控Redis实时...

别再纠结线程池大小 + 线程数量了,没有固定公式的!

我们在百度上能很轻易地搜索到以下线程池设置大小的理论:在一台服务器上我们按照以下设置CPU密集型的程序-核心数+1I/O密集型的程序-核心数*2你不会真的按照这个理论来设置线程池的...

网络编程—IO多路复用详解

假如你想了解IO多路复用,那本文或许可以帮助你本文的最大目的就是想要把select、epoll在执行过程中干了什么叙述出来,所以具体的代码不会涉及,毕竟不同语言的接口有所区别。基础知识IO多路复用涉及...

5分钟学会C/C++多线程编程进程和线程

前言对线程有基本的理解简单的C++面向过程编程能力创造单个简单的线程。创造单个带参数的线程。如何等待线程结束。创造多个线程,并使用互斥量来防止资源抢占。会使用之后,直接跳到“汇总”,复制模板来用就行...

尽情阅读,技术进阶,详解mmap的原理

1.一句话概括mmapmmap的作用,在应用这一层,是让你把文件的某一段,当作内存一样来访问。将文件映射到物理内存,将进程虚拟空间映射到那块内存。这样,进程不仅能像访问内存一样读写文件,多个进程...

C++11多线程知识点总结

一、多线程的基本概念1、进程与线程的区别和联系进程:进程是一个动态的过程,是一个活动的实体。简单来说,一个应用程序的运行就可以被看做是一个进程;线程:是运行中的实际的任务执行者。可以说,进程中包含了多...

微服务高可用的2个关键技巧,你一定用得上

概述上一篇文章讲了一个朋友公司使用SpringCloud架构遇到问题的一个真实案例,虽然不是什么大的技术问题,但如果对一些东西理解的不深刻,还真会犯一些错误。这篇文章我们来聊聊在微服务架构中,到底如...

Java线程间如何共享与传递数据

1、背景在日常SpringBoot应用或者Java应用开发中,使用多线程编程有很多好处,比如可以同时处理多个任务,提高程序的并发性;可以充分利用计算机的多核处理器,使得程序能够更好地利用计算机的资源,...

取消回复欢迎 发表评论: