百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术教程 > 正文

从上百个字段到1个CLOB:Oracle JSON存储实战指南

mhr18 2025-06-10 16:29 3 浏览 0 评论

陆沉盯着左右两个屏幕上显示的数据格式文档,右手小拇指无意思地一下又一下的敲击着机械键盘的Ctrl键,在清脆的“哒哒”声中思考着。


[又有新的字段设计……]


面前的小屏幕上显示的是公司Oracle数据库里面的目标表,看着上百个字段的表结构,还有历史记录中先辈们留下里面一大堆`ALTER TABLE ADD COLUMN`语句……


[不是吧?不是吧!难道现在还有人不知道关系型数据库也可以存储对象吗……]


陆沉双手放上键盘,快速敲击起来……




建表

Oracle12c以上的版本已经开始支持JSON格式的存储,并且原生带有json操作函数,可以灵活的实现JSON格式校验、JSON数据抽取、甚至将JSON字段值作为查询条件!


只需要定义一个`CLOB`字段,就可以存储JSON了。当然如果想要限定长度,也可以使用`VARCHAR2`


CREATE TABLE source_raw_data (
    id               NUMBER DEFAULT seq_raw_data_id.NEXTVAL,
    source           VARCHAR2(50),
    raw_data         CLOB,
    
    CONSTRAINT pk_source_raw_data PRIMARY KEY (id),          -- 主键约束
    CONSTRAINT ensure_json  CHECK (raw_data IS JSON)       -- JSON格式校验约束
);



在这个表里面陆沉耍了个小心机,用`IS JSON`检查来约束格式,这样做方便后续使用内置的JSON函数而不会出错。


插入

JSON数据本质上就是一段格式化的文本,直接当成文本插入数据表就可以了,不过要小心,如果JSON里面的字段值带有双引号,记得转义。

INSERT INTO source_raw_data (source, raw_data) 
VALUES (
    'source_A',
    '{
        "NAV_DATE": "2025-03-03",
        "FUND": "ABCD",
        "FUND_DATA": {
            "Data_A": "XXX",
            "DATA_B": "YYYY",
            "MARKET_A_VALUE": 1234,
            "CREATED_AT": "2025-03-03"
        },
        "TAGS": ["CN", "EA", "PR"]
    }'
);


INSERT INTO source_raw_data (source, raw_data) 
VALUES (
    'source_B',
    '{
        "VALUE_DATE": "2025-03-03",
        "FUND_NAME": "ABCD",
        "FUND_DATA": {
            "FUND_DATA_C": "XXX",
            "MARKET_C_VALUE": "1234",
            "CREATED_AT": "2025-03-13"
        },
        "TAGS": ["UK", "RD", "PR"]
    }'
);

看着测试数据稳稳落入表中,陆沉扶了扶左眼的防蓝光单片眼镜,在技术文档中敲下新的章节标题。


查询

可以直接使用JSON路径进行查询,用`从上百个字段到1个CLOB:Oracle JSON存储实战指南 - 今日头条

作为路径的开头!


- 在查询结果中直接显示出JSON的特定字段值


SELECT 
    JSON_VALUE(raw_data, '$.FUND_DATA.MARKET_A_VALUE') AS A_VALUE  --  类型自动转换
    JSON_VALUE(raw_data, '$.FUND_DATA.CREATED_AT' RETURNING DATE) AS CREATED
FROM source_raw_data;


陆沉还细心地在设计文档中写道:`JSON_VALUE`是Oracle的内置函数,可以解析JSON格式的文本,通过路径直接抽取字段值,并且可以在函数中通过`RETUNING`关键字直接转换为目标格式,比如范例中的时间格式。


- 将JSON中的字段作为查询条件

SELECT * 
FROM source_raw_data 
WHERE JSON_VALUE(raw_data, '$.FUND') = 'ABCD';  --  支持复杂条件

同样是使用`JSON_VALUE`函数解析后查询。

肯定会有人会找茬,这样查询性能会有问题吧?

想到这里,陆沉嘴角微微一翘……


- 解决性能陷阱,给JSON字段创建索引


CREATE INDEX idx_source_fund_created 
ON source_raw_data (
    JSON_VALUE(raw_data, '$.FUND_DATA.CREATED_AT')
);  --  给JSON字段上索引



当然如果还有人一定要like来查询JSON文本,只能说尊重他人命运吧。


- 特殊类型:JSON字段中的数组查询


SELECT 
    id, 
    JSON_QUERY(raw_data, '$.TAGS') AS tags  -- 提取TAGS数组字段
FROM source_raw_data
WHERE 
    JSON_EXISTS(raw_data, '$.TAGS?(@ == "PR")');  -- 过滤包含"PR"的记录



这里用到的 `JSON_QUERY` 可以将`raw_data`字段中的 `TAGS` 数组的全部内容提取出来,查询结果的格式大概是这样: `["UK", "RD", "PR"]`


其中 `@` 符号是一种遍历操作的声明,代表要对数组元素进行遍历访问的操作。


- 高级解析:将JSON转成临时表


SELECT 
    jt.nav_date, 
    jt.fund, 
    jt.data_a, 
    jt.data_b, 
    jt.market_a_value, 
    jt.created_at
FROM 
    source_raw_data s,
    JSON_TABLE(
        s.raw_data, 
        '#39; 
        COLUMNS (
            nav_date         VARCHAR2(10) PATH '$.NAV_DATE' NULL ON EMPTY,
            fund             VARCHAR2(10) PATH '$.FUND' NULL ON EMPTY,
            data_a           VARCHAR2(10) PATH '$.FUND_DATA.Data_A' NULL ON EMPTY,
            data_b           VARCHAR2(10) PATH '$.FUND_DATA.DATA_B' NULL ON EMPTY,
            market_a_value   NUMBER       PATH '$.FUND_DATA.MARKET_A_VALUE' NULL ON EMPTY,
            created_at       VARCHAR2(10) PATH '$.FUND_DATA.CREATED_AT' NULL ON EMPTY
        )
    ) jt
WHERE 
    s.source = 'source_A';



JSON_TABLE也是Oracle内置函数,可以用来将JSON数据映射为临时表,进而可以执行更加复杂的查询操作。

在每个字段后面加上 `NULL ON EMPTY` 是为了避免字段确实的时候查询会报错。


- 更新操作

没错,我们可以直接更新JSON数据中的某个字段!


UPDATE source_raw_data
SET raw_data = JSON_MERGEPATCH(
    raw_data,
    '{"nav_date": "2025-03-12"}'
)
WHERE id = 2;


- 路径大小写敏感

陆沉在自己写的范例中,埋藏了个JSON操作中要严格区分大小写的彩蛋……




屏幕上弹出技术文档保存成功的提示,陆沉右眼闪过一丝红光,随手切出黑色的IDEA编辑器,打开那个陈年的Java项目……


MyBatis Plus的隐藏技能——自动JSON转换!


通过 MyBatisPlus 的 `@TableName(autoResultMap=true)` 开启自动结果集映射,配合 `@TableField` 注解的 `typeHandler` 属性,可以实现:


- 写入时自动将对象序列化为JSON字符串


- 读取时自动将JSON反序列化为对象


- 完全注解式开发,零XML配置


实现步骤

1. 实体类配置


@TableName(autoResultMap = true)
public class SourceRawData {
    @TableField(typeHandler = JsonTypeHandler.class)
    private RawData rawData;  //  自动序列化/反序列化
}

注意这里使用了自动创建 ResultMap 映射关系,避免手动编写XML配置,同时JSON字段自动反序列化功能,需要依赖此特性实现。


2. 自定义 `TypeHandler`(只在需要特殊处理逻辑的时候添加,否则可以直接使用原生的JsonTypeHandler)


public class SpecialJsonTypeHandler extends BaseTypeHandler<Object> {
    private static final ObjectMapper mapper = new ObjectMapper();


    @Override
    public void setNonNullParameter(...) {  // 写入时转JSON
        ps.setString(i, mapper.writeValueAsString(parameter));
    }


    @Override
    public Object getNullableResult(...) {  // 读取时转对象
        return mapper.readValue(json, returnType);
    }
}


3. 高级配置(如有自定义的TypeHandler,需要这一步)

// 注册TypeHandler到 MyBatis 配置
@Configuration
public class MybatisConfig {


    @Bean
    public ConfigurationCustomizer configurationCustomizer() {
        return configuration -> 
            configuration.getTypeHandlerRegistry()
                             .register(SpecialJsonTypeHandler.class);
    }
}


踩坑记录


  • 类型匹配问题:如果有自己写的`TypeHandler`,一定要确保TypeHandler 处理的Java类型与字段类型一致。


  • 空值处理:如果害怕出现空值,可以使用 `@TableField(updateStrategy = FieldStrategy.IGNORED)`。


  • 日期格式:统一配置ObjectMapper的日期序列化格式,默认的 `ObjectMapper` 用的可是`UTC+0` 时区。

  • 存储占用过高:格式化的JSON文本有很多冗余的空格,可以尝试对CLOB字段添加压缩 `ALTER TABLE source_raw_data MODIFY raw_data CLOB COMPRESS;`


凌晨两点半,陆沉跑完最后一个JSON存储与读取测试用例,一口喝光那罐标着[3.21MB算力]的黑牛。

忽然电脑桌面上弹出架构团队的通知:[经公司董事会批准,公司将升级底层数据库为Oracle21c+。]

伴随着右眼中的电子义眼散发出的红光,陆沉在技术文档的最后一段添加上一句话:构建新表时,强制使用Oracle原生 `JSON` 数据类型。

[哼,在我写出这句话之前的都算是旧表,无需遵守这个约定……]



相关推荐

重大故障!业务核心表被truncate删除,准备跑路……

完蛋!最近项目组同事说,核心业务表被truncate删除,也惊呆了,现在的业务都这么粗暴了,安全机制、作业规范形同虚设?接下来就给大家一起聊下,表被truncate,解决问题的关键就是找到关键的问题!...

数据孤岛(Data Silos)(数据孤岛解决方案)

数据孤岛(DataSilos)是指组织内部数据因技术、管理或文化壁垒被隔离在不同部门、系统或平台中,无法有效共享、整合和交互的状态。这些数据如同分散的“岛屿”,虽各自有价值,但因孤立性难以发挥整体效...

弱口令漏洞总结及研究(弱口令是高危漏洞吗)

1.1弱口令漏洞定义弱口令漏洞是指因使用简单、易猜测、易破解的密码导致的系统安全风险。常见的弱口令包括:默认密码:如admin/admin、root/123456。规律字符:如连续数字(123456)...

SQL 逻辑处理核心知识点全解析,从入门到精通看这篇就够了!

刚入行程序员/数据分析?写SQL总卡壳?别愁!今天一次性把SQL逻辑处理核心技能讲透,涵盖数值、字符、日期函数+条件表达式,附超全数据库差异对比,工作中直接套用!一、SQL函数大揭秘!...

智能文档检索:AI语义搜索实践(智能语音检索)

以下是基于AI语义搜索的智能文档检索实践要点解析,结合行业前沿案例与技术框架:一、核心技术架构与实现路径语义理解与嵌入模型采用BERT、GPT等预训练模型进行文本向量化,捕捉上下文语义15通过多模态分...

国产IAutodraw办公工具更新到3.7.5!这些隐藏功能你知道吗?

大家好,IAuto流程软件(简称IAutodraw)终于迎来2025年的第一个版本更新,本次更新同时包含Window、Mac等操作系统,更新的内容包括:1、流程画布支持Mermaid语法的粘贴(mer...

企业复杂数据处理必备:五款主流好用的报表工具

1.山海鲸报表山海鲸报表(免费的零代码BI报表工具,为您提供BI报表+GIS+数字孪生+可视化大屏一体化服务)作为国产报表工具中的后起之秀,专注于为企业提供高效、便捷的数据可视化与分析方案。它最大的...

Oracle数据库批量更新翻车!老司机3招省80%时间

开篇热梗:凌晨3点,程序员老张盯着屏幕上转不停的进度条,第N次猛灌咖啡——10万条数据更新跑了半小时还没完!突然“啪”的一声,屏幕黑了...(你的系统是不是也这样崩溃过?评论区扣1)终极总结:3句话讲...

硬盘smart健康深度检测工具——wgcloud

S.M.A.R.T的全称为“Self-MonitoringAnalysisandReportingTechnology”,上个世纪九十年代,由于经常发生硬盘莫名其妙的故障问题,导致很多用户的数...

Oracle 数据库培训:让你从菜鸟到大师的华丽转身

深入学习理论知识基础教程:介绍数据库管理系统的基本原理,让学员理解数据库的工作机制。讲解Oracle数据库的安装过程,包括各种环境配置和参数设置。教授如何使用SQL语言进行基本操作,如数据的查...

从 0 到 1:30 天变身 Oracle 数据库大师的独家学习秘籍

基础理论学习数据库基础概念:学习数据库的基本概念,如数据库管理系统表、行、列、索引、事务等。可以阅读《数据库系统概念》这样的经典教材,系统地掌握数据库的基础知识。SQL语言:SQL是与数据库交互的...

数据库故障排查指南(数据库故障处理流程)

数据库故障排查指南大纲常见故障类型与症状连接问题:无法连接、连接超时、连接数过多性能问题:查询缓慢、CPU/内存占用过高、锁等待数据一致性问题:数据丢失、数据损坏、主从不一致日志与错误消息:关键错误日...

Java性能监控工具大揭秘:全面掌握你的应用表现

Java性能监控工具大揭秘:全面掌握你的应用表现在Java开发的世界里,性能优化如同一场永无止境的马拉松。一个程序再优雅的设计,如果执行效率低下,也会让人头疼不已。而性能监控工具就像是我们身边的“跑表...

jmap(jmap -heap详解)

jmap是JDK自带的一个命令行工具,用于生成Java进程的堆内存快照(heapdump),也可以查看Java堆内存的详细统计信息。它是排查内存泄漏、分析对象占用内存情况的重要工具之...

Java性能监控工具:让程序跑得更快的秘密武器

Java性能监控工具:让程序跑得更快的秘密武器大家好呀!今天咱们来聊聊Java程序背后的“幕后英雄”——性能监控工具。这些工具就像是医生手中的听诊器,能够帮我们及时发现程序运行中的各种“健康问题”。无...

取消回复欢迎 发表评论: