百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

Java开发者必知必会的工具之Apache Drill

mhr18 2025-06-12 14:18 18 浏览 0 评论

导读:前段时间公司业务需要,需要对现有用户数据进行简单的商业分析,因此找到了Apache Drill。本文将对Apache Drill进行简单的说明,希望能够帮助读者理解并使用到实际项目中。

使用场景

Aache Drill 是一个用来分析大数据的工具,使用标准SQL查询语句(即select语句)来完成数据查询的java框架,主要用于:

  • 跨数据库查询:比如mysql不同库联查
  • 跨数据源查询:比如mysql与oracle数据库联查、mysql与mongodb数据库联查,当然还支持更多的数据源。

如果你有以上的使用场景,那么它将会给你带来强大的震撼。

介绍

Apache Drill 是一个分布式查询引擎,实际上是GoolDremal的开源实现。

特点:

  • 低延迟
  • 支持SQL
  • 学习成本低
  • 支持jdbc
  • 高性能

基于以上特点,我在使用过程中,发现非常简单,很容易和现在的框架集成(springboot+mybatis),几乎零成本,唯一的成本就是配置数据源,这块成本也很小,因为Apache Drill提供了web ui操作。

基本用法

在这里我就不讲具体安装步骤了,我用docker来代替。

  1. 通过apache/drill官方镜像安装并启动
  2. 浏览器打开localhost:8047(web ui 默认端口,别忘记修改容器port)
  3. 配置数据源


  • 点击Storage,可以看到下图
  • 通过create创建数据源


配置代码如下(这里是以mysql为例,mac系统)

{
  "type": "jdbc",
  "driver": "com.mysql.cj.jdbc.Driver",
  "url": "jdbc:mysql://docker.for.mac.host.internal:3306?serverTimezone=Asia/Shanghai",
  "username": "root",
  "password": "java",
  "caseInsensitiveTableNames": false,
  "enabled": true
}
  1. 测试


使用需要注意一点:

SQL查询语句比我们直接使用mysql等数据库SQL,多了一个命名空间,也就是我们在创建数据圆的时候的名字,下面SQL中的mysql

SELECT * from mysql.gadmins.sys_admin_function

5. jdbc client

pom.xml 添加依赖

      <dependency>
    <groupId>org.apache.drill.exec</groupId>
    <artifactId>drill-jdbc-all</artifactId>
    <version>1.17.0</version>
</dependency>

java代码

Class.forName("org.apache.drill.jdbc.Driver");
Connection connection =DriverManager.getConnection("jdbc:drill:zk=
node3.mynode.com:2181/drill/my_cluster_com-drillbits");
Statement st = connection.createStatement();
ResultSet rs = st.executeQuery("SELECT * from mysql.gadmins.`sys_admin_function`");
while(rs.next()){
System.out.println(rs.getString(1));
}

拓展使用

由于我主要用来做数据查询,最关键的就是SQL语句了,那么有2个拓展场景

  • 通过自建web 管理SQL语句,执行测试、发布
  • 通过结合DataQL引擎,可以让SQL语句数据动起来,进一步对SQL查询出来的数据进行转化

总结

在调研的过程中,Apache Drill 给我的感觉就很来电,很有眼缘,当然也很符合我们的业务需要。在技术方案选型的过程中,是一个循序渐进的过程,未来还需要更多的调研,或许到一定阶段,就需要其他框架来支撑业务,这也是程序员的最大乐趣之一。

相关推荐

订单超时自动取消业务的 N 种实现方案,从原理到落地全解析

在分布式系统架构中,订单超时自动取消机制是保障业务一致性的关键组件。某电商平台曾因超时处理机制缺陷导致日均3000+订单库存锁定异常,直接损失超50万元/天。本文将从技术原理、实现细节、...

使用Spring Boot 3开发时,如何选择合适的分布式技术?

作为互联网大厂的后端开发人员,当你满怀期待地用上SpringBoot3,准备在项目中大显身手时,却发现一个棘手的问题摆在面前:面对众多分布式技术,究竟该如何选择,才能让SpringBoot...

数据库内存爆满怎么办?99%的程序员都踩过这个坑!

你的数据库是不是又双叒叕内存爆满了?!服务器监控一片红色警告,老板在群里@所有人,运维同事的电话打爆了手机...这种场景是不是特别熟悉?别慌!作为一个在数据库优化这条路上摸爬滚打了10年的老司机,今天...

springboot利用Redisson 实现缓存与数据库双写不一致问题

使用了Redisson来操作Redis分布式锁,主要功能是从缓存和数据库中获取商品信息,以下是针对并发时更新缓存和数据库带来不一致问题的解决方案1.基于读写锁和删除缓存策略在并发更新场景下,...

外贸独立站数据库炸了?对象缓存让你起死回生

上周黑五,一个客户眼睁睁看着服务器CPU飙到100%——每次页面加载要查87次数据库。这让我想起2024年Pantheon的测试:Redis缓存能把WooCommerce查询速度提升20倍。跨境电商最...

手把手教你在 Spring Boot3 里纯编码实现自定义分布式锁

为什么要自己实现分布式锁?你是不是早就受够了引入各种第三方依赖时的繁琐?尤其是分布式锁这块,每次集成Redisson或者Zookeeper,都得额外维护一堆配置,有时候还会因为版本兼容问题头疼半...

如何设计一个支持百万级实时数据推送的WebSocket集群架构?

面试解答:要设计一个支持百万级实时数据推送的WebSocket集群架构,需从**连接管理、负载均衡、水平扩展、容灾恢复**四个维度切入:连接层设计-**长连接优化**:采用Netty或Und...

Redis数据结构总结——面试最常问到的知识点

Redis作为主流的nosql存储,面试时经常会问到。其主要场景是用作缓存,分布式锁,分布式session,消息队列,发布订阅等等。其存储结构主要有String,List,Set,Hash,Sort...

skynet服务的缺陷 lua死循环

服务端高级架构—云风的skynet这边有一个关于云风skynet的视频推荐给大家观看点击就可以观看了!skynet是一套多人在线游戏的轻量级服务端框架,使用C+Lua开发。skynet的显著优点是,...

七年Java开发的一路辛酸史:分享面试京东、阿里、美团后的心得

前言我觉得有一个能够找一份大厂的offer的想法,这是很正常的,这并不是我们的饭后谈资而是每个技术人的追求。像阿里、腾讯、美团、字节跳动、京东等等的技术氛围与技术规范度还是要明显优于一些创业型公司...

mysql mogodb es redis数据库之间的区别

1.MySQL应用场景概念:关系型数据库,基于关系模型,使用表和行存储数据。优点:支持ACID事务,数据具有很高的一致性和完整性。缺点:垂直扩展能力有限,需要分库分表等方式扩展。对于复杂的查询和大量的...

redis,memcached,nginx网络组件

1.理解阻塞io,非阻塞io,同步io,异步io的区别2.理解BIO和AIO的区别io多路复用只负责io检测,不负责io操作阻塞io中的write,能写多少是多少,只要写成功就返回,譬如准备写500字...

SpringBoot+Vue+Redis实现验证码功能

一个小时只允许发三次验证码。一次验证码有效期二分钟。SpringBoot整合Redis...

AWS MemoryDB 可观测最佳实践

AWSMemoryDB介绍AmazonMemoryDB是一种完全托管的、内存中数据存储服务,专为需要极低延迟和高吞吐量的应用程序而设计。它与Redis和Memcached相似,但具有更...

从0构建大型AI推荐系统:实时化引擎从工具到生态的演进

在AI浪潮席卷各行各业的今天,推荐系统正从幕后走向前台,成为用户体验的核心驱动力。本文将带你深入探索一个大型AI推荐系统从零起步的全过程,揭示实时化引擎如何从单一工具演进为复杂生态的关键路径。无论你是...

取消回复欢迎 发表评论: