数据库基础设施现状
信息化系统目前已经是支撑现代化企业运营的重要组成部分,在企业内部存在几十甚至上百个不同的 IT 应用系统,支撑企业的服务渠道、客户营销、产品业务处理、经营管理和决策等各方面,大多数的应用系统围绕数据库开发和运行。一般有十多个核心应用数据库和几十个一般应用数据库,同时多种数据库和多个不同版本、不同规格的数据库在运行。
例如,某区域银行拥有 6 套 Oracle RAC,以每套 3TB 的数据量支撑核心账务,而其他一般生产业务使用了超过 100 套、容量从 2TB 到 100GB 不等的 MySQL;某三甲医院除了核心的 HIS 系统采用 1.4TB 数据量的 Oracle RAC 作为支撑,其他的 EMR 、电子票据、用药指导等 5 个应用系统,采用 Oracle 数据库作为支撑,容量从 80GB 到 1TB 不等;PACS、LIS、门诊排队叫号等 17 个系统采用 SQL Server 数据库作为支撑,容量从 80GB 到 800GB 不等;无纸化病案应用采用 MongoDB 作为数据库支撑,容量为 400GB。
目前,这些数据库的基础设施主要采用传统集成架构、虚拟化部署模式和数据库一体机几种方案,每种方案的定位概述如下:
以上银行、医疗客户也分别采用了基于物理服务器和中高端存储的传统架构,以及基于虚拟化的架构支撑不同业务需求的数据库运行。以下将针对三种主流架构的优势和问题给出更详细的解析。
主流数据库基础设施方案优劣势解析
1、基于传统集成架构(物理机 + 集中式存储)的数据库解决方案
在实际部署环境中,为保证数据库具有高可用、高性能、大容量的特性,同时避免由于服务器的单点故障造成服务无法访问,一般会采用数据库应用实例和数据库分离部署模式,采用 2 台或者多台服务器作为数据库实例服务器,通过 SAN 网络连接到中高端大容量的 SAN 存储设备,进行数据访问服务。具体如下图:
这种部署的优势是:
- 确保数据库实例具有高可用性(通过主备、热备或者集群技术)。
- 采用 SAN 高端存储技术,确保存储具有高性能、大容量。
- 利用存储设备的 RAID 特性,确保数据安全、完整、可靠。
- 可通过服务器、存储设备分层建设,实现系统的高扩展性,满足应用部署需要。
该方案的配置和成本预估如下:
除了产品的采购费用,其他服务和维保维架构参考如下:
系统集成部署费用按采购成本 12% 计算,1388000 * 12% = 166000
3 年维保费用每年按 8% 计算,1388000 * 8% * 2 = 222000
总计成本:约 1770000
在以存储为核心的数据中心建设时期,这种方式广为采用,有力的支持了用户应用系统、数据库的部署和业务的开展。现在许多用户的遗留系统中,都有大量的部署案例。
这种模式主要存在两方面的问题:
一是根据摩尔定律,IT 系统特别是服务器的 CPU、内存等,每隔两年性能就翻一倍。而网络和磁盘的性能,却不能相应的以同样的速度提升。这样网络和磁盘就成为了系统性能的瓶颈。主要体现在:
- 存储层面,数据量不断增加,带来 IO 瓶颈;随着数据长时间运行带来的数据分布不均匀,存在 IO 热点。
- 网络层面,传输带宽不足够,无法快速传输大量数据到服务器进行处理。
- 服务器层面,接收到过多无效数据需要处理,高性能处理器和内存的优势无法发挥。
针对这种问题,部分数据库服务提供商基于软硬件的深度研发和融合,推出了极限性能数据库一体机。
二是基于物理机的部署模式,在设备故障、系统升级、扩容、维护等方面,会带来计划内和计划外的停机时间,进而影响用户业务的正常运行。
因此,随着虚拟化技术的发展,许多用户在 VMware 等虚拟化系统上创建虚拟机 VM 部署数据库,通过虚拟化技术所具有的 HA、vMotion、DRS、快照、克隆等技术,确保虚拟机 VM 和数据库系统具有高可用特性,减少数据库和 IT 应用系统的停机时间。
2、数据库虚拟化部署方案
下图是在虚拟化平台部署数据库的一个典型拓扑示意图,包括核心的集中式存储、存储交换机和多台 x86 服务器。通过采用 VMware 虚拟化技术,在 x86 服务器上创建虚拟机 VM,在虚拟机 VM 内部安装操作系统运行 Oracle、MySQL、SQL Server 等数据库管理系统,数据库的数据保存在集中式存储。
这种架构的优势和特点是:
- 利用虚拟化技术,提高可用性,可动态迁移,可支持高用(HA),可在不中断用户应用的情况下进行系统升级等。
- 通过利用快照、克隆等技术,在升级出现问题时候,可支持回滚,避免系统故障停机,通过 DRS 动态资源调配,可提升 IT 系统对应用和业务的适应能力。
- 支持在线扩展 x86 服务器,可根据需要增加计算资源。
该方案的配置和成本预估如下:
系统集成部署费用按照采购成本的 12% 计算,1198000 * 12% = 143000
3 年维保费用硬件每年按 8%,软件按每年 22% 计算,1088000 * 8% * 2 + 110000 * 22% * 2 = 222400
总计成本:约 1560000
这种架构的主要缺点和问题是:
- 这种架构以集中式存储为核心,受到存储系统控制器数量和性能的限制,存储的整体性能被限定,只能垂直扩展容量,无法通过扩容提升存储性能,进而随着计算资源的增加,虚拟机 VM 的平均性能是不断下降的,这样就会影响虚拟机 VM 和数据库的性能。
- 运维管理不方便,整个系统分为多个 IT 层次,在进行维护和变更时需要在多个设备维护系统中(包括 Web、图形、命令行)由相关的专家和技术人员统一协调部署,人力成本高。
- 采用 VMware 等虚拟化技术增强了系统的灵活性,但是也增加了 IO 路径,降低了系统性能,无法满足一些高性能 VM 和数据库运行的需要。
3、数据库一体机方案
在数据库架构设计中,主要有 Shared Disk,Shared Nothing 两种架构。
Shared Disks 架构和 Shared Nothing 架构各适应不同的场景,以 Oracle 公司为代表的数据库服务商把这两种架构的特点结合起来,提供了一种混合式的数据库架构,能够有效的解决二者的冲突,吸取两种架构的优势:既可以满足 OLTP 的高并发、高可用特点;又可以满足 OLAP 的大数据量处理的要求。其架构如下图:
基于这样的混合架构,Oracle 公司推出了极限性能数据库一体机 Exadata,主要的特点是:
- 已经在工厂由厂商软硬件专家完全预装,开箱即用。
- 利用业界最为先进的软硬件技术,并将这些技术发挥到极致。
- 解决传统的系统配置中的性能瓶颈。
- 提供全面的工具和手段,简化管理和运维。
这种架构可以提升数据库性能,简化数据库系统的部署,但是缺点也非常明显。采购和运维成本高,不灵活,只能支持专有的数据库,且均为专用系统,架构封闭不开放,无法满足云化转型需要。
该方案的配置和成本预估如下:
(注:不包含 Oracle DB 许可和 RAC 许可费用)。
另外,国内也有诸多公司推出了类似的数据库一体机,如沃趣公司 QData 数据库一体机,云和恩墨公司 zData 数据库一体机,天玑数据公司 PBData 数据库一体机。它们同样具备了开箱即用,简化管理和运维等特点,但是在软硬件的优化层面,和 Oracle 原厂的数据库一体机尚有差距。
数据库基础设施的挑战总结
目前随着企业数字化转型进程的加快,企业对数据库需求不断增加,类型不断增多,敏捷性要求更高,同时要求更简单的架构和更合理的拥有成本以便应对业务的快速增长,但总结以上主流的方案存在主要问题包括:
- 数据库一体机成本高,运维复杂,弹性差,无法支持多数据库。
- 物理服务器加集中式存储的方案,在成本、易维护性和敏捷性方面比较差。
- VMware 加集中存储的方案,在性能与延迟方面与裸金属以及数据库一体机方案仍有差距,同时存储扩展性和整体成本方面仍然不能更好满足用户需求。
同时,金融等行业还出现了新的政策和技术路线转型需求:
- 在金融等行业目前面临国产化转型的需求,面临着全新的软硬件适配问题,对数据库基础设施提出更大的挑战。
- 目前以容器和 K8s为基础的云原生架构对基础设施的敏捷性提出更高要求。
综上所述,用户数据库场景需要满足性能、稳定性、敏捷性、简易性甚至信创和云原生需求的一系列新型方案。SmartX 基于超融合、分布式存储、云原生存储等核心产品,针对不同用户场景,提供了一系列的数据库云化基础设施解决方案,让数据库资源池不仅部署运维简单、具备弹性敏捷的公有云特性,同时获得和传统架构一致的性能体验。