IT历史连载33-数据库的历史
1961年:通用电气(General Electric)的Charles W.Bachman 开发出世界上第一个网状DBMS,即第一个数据库管理系统-集成数据存储IDS(Integrated Data Store),奠定了网状数据库的基础,得到广泛的发行和应用。IDS 具有数据模式和日志的特征,但只能在GE主机上运行,数据库只有一个文件,数据库所有的表必须通过手工编码生成。
1968年:IBM创建世界上第一个层次数据库系统-IMS(Information Management System),世界上第一个大型商用的数据库系统,IMS也称DB1
1960年代中期:Bachman组成数据库任务组。
1970年:E.F. Codd撰写《大型共享数据库的数据关系模型“A Relational Model of Data for Large Shared Data Banks”》的论文是数据库历史上具有划时代意义的里程碑。后来Codd又陆续发表多篇文章,论述范式理论和衡量关系系统的12条标准,用数学理论奠定关系数据库的基础。
1971年:数据库任务组提出标准CODASYL方法:非常复杂的系统、需要大量的培训、使用链接数据集的“手动”导航技术从而形成一个大型网络。随着更简单易于使用系统的出现,CODASYL方法失去流行性。
1972年:加州大学伯克利分校的Micheal提出Ingres数据库,2014年获图灵奖
1973年:Michael Stonebraker和Eugene Wong利用System R已发布的信息开始开发自己的关系数据库系统Ingres:使用QUEL查询语言,从而创建了Ingres Corp.、MS SQL Server、Sybase、Wang’s PACE和Britton-Lee。
1974年:IBM的Ray Boyce和Don Chamberlin将Codd关系数据库的12条准则的数学定义以简单的关键字语法表现出来,里程碑式地提出了SQL(Structured Query Language)结构化查询语言。
1974年:ACM组织一场分别以Codd和Bachman为首的支持和反对关系数据库两派的辩论。推动了关系数据库的发展,使其最终成为现代数据库产品的主流。
1976年:IBM实验室System R项目实现数据结构和操作,证明关系模型实用性
1976年:E.F.Codd发表一篇里程碑的论文“R系统:数据库关系理论”,介绍了关系数据库理论和查询语言SQL。
1976年:霍尼韦尔(Honeywell)公司开发第一个商用关系数据库系统-Multics Relational Data Store
1977年:System R 原型安装在波音、Pratt & Whitney公司和 Upjohn 药业3个客户,标志System R是比较成熟的数据库系统,能支撑重要的商业应用。
1978年:SDL公司(后更名Oracle公司)Oracle 1.0版发布;第二年,SDL发布Oracle 2 版本,这是第一个基于SQL的商业版RDBMS
1979年:美国计算机公司(Computer Corporation of America,CCA)在DEC计算机上实现了世界上第一个分布式数据库系统SDD-1。
1980年:IBM正式把System R推向市场。
1980年:Informix成立,目的是为Unix开放操作系统提供专业的关系型数据库产品InformixSE(SE:StandardEngine;Informix=Information+Unix),第一个真正支持SQL语言的关系数据库产品。InformixSE是在当时的微机Unix环境下主要的数据库产品,第一个被移植到Linux上的商业数据库产品。
1980年:Ashton-Tate公司发布dBase,在CP/M系统上;后移植到Apple II与IBM PC的DOS上。
1983年3月:RSI发布ORACLE第三版,具备关键的可移植性
1983年:IBM发布Database2 fo rMVS(DB2),DB2诞生,在大型机上运行
1984年:Sybase(system database的缩写)公司成立
1986年:ANSI把SQL作为关系数据库语言的美国标准,公布标准SQL文本。
1986年:Graphael公司开发第一个商用的对象数据库系统Gbase。
1986年:UCB启动POSTGRES项目:Stonebraker教授领导,美国DARPA(防务高级研究项目局,Defense Advanced Research Projects Agency)、ARO(陆军研究办公室,the Army Research Office)、NSF(国家科学基金,the National Science Foundation)、ESL公司赞助。同年,Stonebraker发表“The design of POSTGRES”、“The POSTGRES data model ”、“The design of the POSTGRES rules system”、“The design of the POSTGRES storage system ”等论文,引入对象关系理念,探讨该系统最初的概念、数据模型定义、规则系统设计、存储管理器的理论基础和体系结构
1987年:C.J.Date提出完全真正的分布式数据库系统应遵循的12条原则
1987年:国际标准组织ISO对SQL进行标准化
1987年:Sybase推出首个关系型数据库Sybase SQL Server,这是第一个C/S架构的数据库系统。
1987年:IBM发布OS/2 V1.0扩展版,把关系型数据库处理能力扩展到微机系统。OS/2 V1.0是DB2 for OS/2、Unix and Window的雏形,DB2开始支持小型机
1988年:SQL/400发布,为集成RDBMS的AS/400服务器提供SQL支持。IDUG(国际DB2用户组织)组织成立。
1988年:Microsoft、Sybase和Ashton-Tate合作,在Sybase的基础上生产出了在OS/2操作系统上使用的SQL Server 1.0。
1988年:System R和Ingres系统获得ACM的1988年“软件系统奖”
1988年:IBM公司的研究者Barry Devlin和Paul Murphy发明术语-数据仓库(DataWarehouse)。IT厂商开始构建实验性的数据仓库。
1989年6月:Postgres 1发布
1989年:微软发布Microsoft SQL Server 1.0版,取得成功。
1991年:微软发布Access。
1991年:数据仓库之父比尔·恩门(W.H. Bill Inmon)在《Building the Data Warehouse 》一书中数据仓库的定义被广泛接受
1992年:发布稳定的Oracle7版本,取得巨大成功
1992年:第一届 IDUG欧洲大会在瑞士日内瓦召开,标志DB2应用的全球化。
1993年:DB2 for OS/2 V1(DB2/2)和DB2 forRS/6000V1(DB2/6000)发布,Intel和Unix平台。
1994年:基于Ingres的Postgres95诞生,1996年更名为PostgreSQL。
1995年:瑞典MySQL AB发布MySQL 1.0版本,第一个面向互联网的数据库应用
1995年:DB2 V1发布,支持Windows、UNIX等多平台,这是标志性的一年。
1996年:DB2 V2.1.2发布,第一个真正支持JAVA和JDBC。DB2更名为DB2 UDB(UniversalDatabase)DB2通用数据库。
1996年:SQL Server 6.5发布,取得巨大成功。
1997年1月:PostgreSQL 6.0发布,PostgreSQL第一个正式版本
1997年:支持Web的DB2 for OS/390 V5发布,唯一支持64000个并发用户和百 TB级别的数据库产品
1998年:SQL Server 7.0发布,进军企业级数据库市场
1998年:NoSQL一词诞生,是Carlo Strozzi开发的一个轻量、开源、不提供SQL功能的数据库,指非关系型、分布式、不提供ACID的数据库设计模式
1999年10月:德国软件股份公司(Software AG)宣布世界上第一个“原状XML数据库系统(Native XML Database System)”产品Tamino问世
2000年:MySQL采用GPL协议开源, MySQL 4.0开始支持MyISAM、InnoDB引擎
2000年8月:D. Richard Hipp用C语言开发了SQL Lite
2000年左右:Oracle击败几乎所有商用数据库对手,奠定不可动摇的地位
2005年:谷歌首次提出大数据的概念
2005年10月:MySQL 5.0发布,成为里程碑版本
2006年:DB2 UDB V9发布,划时代的一个版本,首个混合型数据库
2008年:Facebook公司发布开源的Hives与Cassandra数据库,带动数据库产业技术上的变动,非关系型数据库逐渐普及。
2009年1月:从MySQL Server 5.5开始一条新的GPL分支,起名MariaDB
2009年:在Johan Oskarsson开源分布式数据库的讨论中,来自Rackspace的Eric Evans重提NoSQL,指代非关系型的分布式数据储存系统。NoSQL访问速度快,适宜处理互联网时代容量大、多样性高、流动性强的数据
2009年:Hadoop和MongoDB 1.0推出
2009年:Oracle收购了MySQL
2009年:Merzia创始人开发了Redis。
2010年2月:Elastic Search的第一个版本发布
2010年:基于HDFS构建的数据库HBase推出,为大型表提供快速查找。
2010年:甲骨文公司收购MySQL母公司。
2011年:451研究所的Matthew Aslett首次提出NewSQL概念
2011年:Pentaho公司的创始人兼首席技术官詹姆斯·狄克逊提出数据湖的概念
2012年1月18日:亚马逊发布DynamoDB。
2012年:谷歌开发了内部自用数据库F1
2012年:谷歌发布spanner论文
2012年:DB2 UDB V10.1 for Linux、UNIX、Windows发布,支持Apache Hadoop
2015年7月:Amazon正式发布关系型数据库Amazon Aurora。
2015年:Gartner发布的数据库管理系统魔力象限让人眼前一亮:在领导者象限,除了Oracle、微软、IBM、SAP这些老面孔,云服务提供商AWS赫然位居前三,让传统数据库阵营大跌眼镜,十分出人预料,却又在情理之中。
2016年:数据库演进图谱
2017年5月:Amazon发表论文《Amazon Aurora: DesignConsiderations for High Throughput Cloud-Native Relational Databases》,第一次公开介绍了Aurora的设计理念和内部实现。自2014年末发布预览版,Amazon Aurora至今仍旧保持着一份纪录:“AWS有史以来增长最为迅速的服务”。关键原因是Aurora将两种对立的特征实现了完美的统一:既具备高端商用数据库的速度和可用性,又兼具开源数据库的简单性和成本效益,且成本只有商业级数据库的十分之一。
2017年:卡耐基·梅隆大学Peloton项目组提出自治数据库的概念。Oracle Open World大会,总裁拉里·埃里森公布Oracle自治数据库云,集成人工智能和自适应的机器学习技术,实现全面自动化。
2017年5月:微软发布CosmosDB
2017年5月:IBM把Informix业务卖给印度公司HCL
2018年10月9日:MongoDB 4.0.3发布,当前稳定版
2019年初:谷歌联合麻省理工学院、布朗大学推出新型数据库系统SageDB。
2019年5月:华为发布全球首款AI原生(AI-Native)数据库GaussDB,实现两大革命性突破:
(1) 首次将人工智能技术融入分布式数据库的全生命周期,实现自运维、自管理、自调优、故障自诊断和自愈。
(2) 通过异构计算创新框架充分发挥x86、ARM、GPU、NPU 多种算力优势。
2019年6月:DB-Engines最新数据库排名
2019年6月:Gartner报告,提出传统部署数据库已经过时,云是未来,但不可忽略云数据库的安全问题。
2020年1月:关系型数据库仍是当今的主流。DB-Engines的排行榜,RDBMS的积分占比高达73.9%,牢牢掌握着企业的核心数据。
2020年3月:DB-Engines发布排名,300+种数据库,oracle评分1300+,评分上百的只有11家,市场上绝大多数还是选择oracle和mysql
2020年11月:Gartner公布2020年度全球数据库魔力象限评估结果,阿里云首次挺进全球数据库第一阵营-领导者(LEADERS)象限,这也是中国数据库40年来首次进入全球顶级数据库行列
2020年:VLDB 刊登63篇论文,来自中国学者和研究人员的文章23篇,在所有国家中排行第一,占比36.5%
2021年1月:DB-Engines的排行榜,开源数据库第一次超过了商业数据库,现在开源数据库的流行度以50.6分领先于商业数据库。
2021年6月:Oracle官方公众号发布文章《GPL协议保障MySQL的自由免费开放》
2021年12月:Gartner公布2021年Gartner?全球云数据库魔力象限?评估结果,领导者象限中,微软是最有远见者,AWS执行力第一位。微软和AWS交相叠加,已经超越Oracle。阿里云再次入选领导者象限,华为云位列特定领域者象限,是唯二进入领导者象限的中国公司。
数据库的发展史、英雄史