近日,Oracle推出了多个自治数据库(OracleAutonomousDatabase)增强功能,主要包括在SelectAI中支持对话功能、OracleMachineLearning中的空间增强功能、无代码模型监视界面以及自治数据库中新的GraphStudio用户界面。
其中,SelectAI是Oracle在2023年9月发布的一项新功能,主要支持用户使用自然语言通过自治数据库分析数据。以前使用SelectAI时,用户可以通过自然语言使用大型语言模型(LLM)来提出有关数据的问题。不过,SelectAI无法记住先前的问题,也不允许用户进行追问。现在,SelectAI的历史聊天记录对LLM可用,以便它能够理解后续问题的背景。用户现在可以与数据库进行“对话”,以检索并缩小他们所需答案的范围。
AI与数据库的结合已成趋势
随着AI技术的快速发展,越来越多的领域开始借助AI技术来加速业务流程和优化数据存储。数据库行业也不例外,AI技术的应用日益普及,能够帮助数据库领域中的企业进行更智能的数据管理和决策。
业内专家表示,AI技术与数据库的结合可以体现在DB4AI(数据库技术优化AI模型)和AI4DB(AI促使数据库更智能)两个层面。对于DB4AI,在一定意义上讲,这一轮AI热潮自其产生之日起就受到了数据库或广义的数据管理技术的推动,实际上,数据库或数据管理技术发挥的作用是怎么样组织和管理数据,提高算法效率,把算力发挥到极致,也正因如此,向量数据库等应运而生。对于AI4DB,未来一定是趋势,但目前其结合还只在浅层面,未来的数据库管理系统从外围的数据库运维管理到数据库内核实现都会广泛用到AI技术。
“AI技术与数据库的结合确实已经成为一种趋势,并且这种融合给数据库领域带来了多方面的提升。例如,通过AI算法,可以更有效地理解查询意图,并选择最优的执行计划。这可以显著提高查询的执行效率,尤其是在处理复杂查询和大数据集时;AI可以实现自动化的数据管理,如数据清洗、数据整合和数据治理。这不仅可以减少人工工作量,还可以提高数据质量和一致性;在应用层面结合机器学习和深度学习技术,数据库可以提供更高级的数据分析功能,如预测分析、模式识别和异常检测等。这可以帮助企业从数据中获得更深入的洞察,并做出更明智的决策;在数据库安全性方面,AI通过识别潜在的安全威胁和异常行为,可以防止数据泄露和其他安全事件。此外,AI还可以帮助实施数据脱敏和隐私保护措施,确保敏感信息的安全。”优炫软件研发总经理、UXDB飞天实验室主任李勇如此说道。
进一步应用还心存疑虑
从OracleSelectAI的增强功能中可以看出,生成SQL语句和优化检索查询能力是AI+数据库应用的基础场景,也是使用最为广泛的AI数据库能力。不过,企业对于更高级的AI数据库应用仍心存疑虑。
第一,安全性和隐私问题。众所周知,数据是当前企业组织的核心资产之一,而引入AI技术可能会增加数据库系统的攻击面,从而导致数据泄露、篡改或者其他安全问题,因此,作为数据的所有者,业务负责人难以决策并批准在数据库中高度绑定AI技术。
第二,透明性和可解释性问题。由于AI技术的“黑盒”特性,AI模型的训练、推理、优化等过程难以透明化地为使用者提供足够的信任度,从而降低使用AI技术的信心。换言之,在数据库技术中大范围应用AI的前提是,AI作出的每一个决策或动作,都必须给出符合人类偏好的解释说明。
补齐非结构化数据分析能力
以前,使用自然语言通过数据库分析数据,通常是基于常用的文本数据或者以某种规律存在的结构化数据,主要实现智能检索和查询功能。不过,为了进一步提升数据分析的准确性和洞察力,大语言模型还须“理解”数据库的逻辑结构以及描述性元数据的非结构化文本。
事实上,在大模型问世之初,向量数据库就备受关注。其中原因在于,向量数据库能够将非结构化数据(如文本、图像、音视频等)转换为向量形式进行存储,以便广泛用于大模型的训练工作。如今,随着AI技术与数据库的结合,AI也迫切地需要从非结构化数据中挖掘更大价值。
李勇表示,从这一点来看,AI在数据管理特别是数据库场景的应用至关重要,需要进一步释放和挖掘AI能力。
例如,提高AI决策过程的可解释性,以便用户和开发者可以理解模型的决策依据。这对于增强用户对AI系统的信任至关重要,特别是在关键业务决策和敏感领域(如医疗、金融和法律);建立更强大的数据保护机制来确保用户数据的隐私和安全。这包括加强数据加密技术、访问控制、数据脱敏方法以及遵守相关的数据保护法规;提升数据库处理和分析不同类型数据(如文本、图像、视频和语音)的能力,支持更广泛的业务场景和分析需求;提升数据库系统利用AI进行个性化设置和优化的能力,根据不同用户的行为、偏好和上下文环境调整数据呈现和查询优化策略;提升AI系统与人类用户和专家协作的能力,确保AI能够辅助而非替代人类决策;增强AI系统在面对输入数据的噪声、异常值或故意的欺骗攻击(如对抗性攻击)时的鲁棒性和可靠性。
作者:路沙
编辑:高珊珊
监制:刘晶