您当前的位置:首页 > 互联网教程

mysql中间件有哪些

发布时间:2025-05-20 21:11:45    发布人:远客网络

mysql中间件有哪些

一、mysql中间件有哪些

mysql-proxy是官方提供的mysql中间件产品可以实现负载平衡,读写分离,failover等,但其不支持大数据量的分库分表且性能较差。下面介绍几款能代替其的mysql开源中间件产品,Atlas,cobar,tddl,让我们看看它们各自有些什么优点和新特性吧。

Atlas是由 Qihoo 360, Web平台部基础架构团队开发维护的一个基于MySQL协议的数据中间层项目。它是在mysql-proxy 0.8.2版本的基础上,对其进行了优化,增加了一些新的功能特性。360内部使用Atlas运行的mysql业务,每天承载的读写请求数达几十亿条。

Atlas是一个位于应用程序与MySQL之间,它实现了MySQL的客户端与服务端协议,作为服务端与应用程序通讯,同时作为客户端与MySQL通讯。它对应用程序屏蔽了DB的细节,同时为了降低MySQL负担,它还维护了连接池。

以下是一个可以参考的整体架构,LVS前端做负载均衡,两个Altas做HA,防止单点故障。

主库宕机,Atlas自动将宕机的主库摘除,写操作会失败,读操作不受影响。从库宕机,Atlas自动将宕机的从库摘除,对应用没有影响。在mysql官方的proxy中主库宕机,从库亦不可用。

2.通过管理接口,简化管理工作,DB的上下线对应用完全透明,同时可以手动上下线。

(1)为了解决读写分离存在写完马上就想读而这时可能存在主从同步延迟的情况,Altas中可以在SQL语句前增加/*master*/就可以将读请求强制发往主库。

主库可设置多项,用逗号分隔,从库可设置多项和权重,达到负载均衡。

(2)支持SELECT、INSERT、UPDATE、DELETE、REPLACE语句。

(3)支持多个子表查询结果的合并和排序。

这里不得不吐槽Atlas的分表功能,不能实现分布式分表,所有的子表必须在同一台DB的同一个database里且所有的子表必须事先建好,Atlas没有自动建表的功能。

5.之前官方主要功能逻辑由使用lua脚本编写,效率低,Atlas用C改写,QPS提高,latency降低。

(1)通过配置文件中的pwds参数进行连接Atlas的用户的权限控制。

(2)通过client-ips参数对有权限连接Atlas的ip进行过滤。

(3)日志中记录所有通过Altas处理的SQL语句,包括客户端IP、实际执行该语句的DB、执行成功与否、执行所耗费的时间,如下面例子。

通过配置文件中设置lvs-ips参数实现平滑重启功能,否则重启Altas的瞬间那些SQL请求都会失败。该参数前面挂接的lvs的物理网卡的ip,注意不是虚ip。平滑重启的条件是至少有两台配置相同的Atlas且挂在lvs之后。

source:

Cobar是阿里巴巴(B2B)部门开发的一种关系型数据的分布式处理系统,它可以在分布式的环境下看上去像传统数据库一样为您提供海量数据服务。那么具体说说我们为什么要用它,或说cobar--能干什么?以下是我们业务运行中会存在的一些问题:

1.随着业务的进行数据库的数据量和访问量的剧增,需要对数据进行水平拆分来降低单库的压力,而且需要高效且相对透明的来屏蔽掉水平拆分的细节。

2.为提高访问的可用性,数据源需要备份。

3.数据源可用性的检测和failover。

4.前台的高并发造成后台数据库连接数过多,降低了性能,怎么解决。

针对以上问题就有了cobar施展自己的空间了,cobar中间件以proxy的形式位于前台应用和实际数据库之间,对前台的开放的接口是mysql通信协议。将前台SQL语句变更并按照数据分布规则转发到合适的后台数据分库,再合并返回结果,模拟单库下的数据库行为。

1.通过Cobar提供一个名为test的数据库,其中包含t1,t2两张表。后台有3个MySQL实例(ip:port)为其提供服务,分别为:A,B,C。

2.期望t1表的数据放置在实例A中,t2表的数据水平拆成四份并在实例B和C中各自放两份。t2表的数据要具备HA功能,即B或者C实例其中一个出现故障,不影响使用且可提供完整的数据服务。

1.数据和访问从集中式改变为分布:

(1)Cobar支持将一张表水平拆分成多份分别放入不同的库来实现表的水平拆分

(2)Cobar也支持将不同的表放入不同的库

(3)多数情况下,用户会将以上两种方式混合使用

注意!:Cobar不支持将一张表,例如test表拆分成test_1,test_2, test_3.....放在同一个库中,必须将拆分后的表分别放入不同的库来实现分布式。

(1)Cobar的主备切换有两种触发方式,一种是用户手动触发,一种是Cobar的心跳语句检测到异常后自动触发。那么,当心跳检测到主机异常,切换到备机,如果主机恢复了,需要用户手动切回主机工作,Cobar不会在主机恢复时自动切换回主机,除非备机的心跳也返回异常。

(2)Cobar只检查MySQL主备异常,不关心主备之间的数据同步,因此用户需要在使用Cobar之前在MySQL主备上配置双向同步。

开源版本中数据库只支持mysql,并且不支持读写分离。

source:

淘宝根据自己的业务特点开发了TDDL(Taobao Distributed Data Layer外号:头都大了©_Ob)框架,主要解决了分库分表对应用的透明化以及异构数据库之间的数据复制,它是一个基于集中式配置的 jdbc datasource实现,具有主备,读写分离,动态数据库配置等功能。

TDDL所处的位置(tddl通用数据访问层,部署在客户端的jar包,用于将用户的SQL路由到指定的数据库中):

淘宝很早就对数据进行过分库的处理,上层系统连接多个数据库,中间有一个叫做DBRoute的路由来对数据进行统一访问。DBRoute对数据进行多库的操作、数据的整合,让上层系统像操作一个数据库一样操作多个库。但是随着数据量的增长,对于库表的分法有了更高的要求,例如,你的商品数据到了百亿级别的时候,任何一个库都无法存放了,于是分成2个、4个、8个、16个、32个……直到1024个、2048个。好,分成这么多,数据能够存放了,那怎么查询它?这时候,数据查询的中间件就要能够承担这个重任了,它对上层来说,必须像查询一个数据库一样来查询数据,还要像查询一个数据库一样快(每条查询在几毫秒内完成),TDDL就承担了这样一个工作。在外面有些系统也用DAL(数据访问层)这个概念来命名这个中间件。

下图展示了一个简单的分库分表数据查询策略:

4.集中式数据源信息管理和动态变更

7.基于jdbc规范,很容易扩展支持实现jdbc规范的数据源

8.无server,client-jar形式存在,应用直连数据库

9.读写次数,并发度流程控制,动态变更

10.可分析的日志打印,日志流控,动态变更

二、数据库系列:业内主流MySQL数据中间件梳理

在互联网架构师的必备知识库中,MySQL作为关键的数据库组件,已无法满足大规模流量场景下的复杂需求。为应对数据持久化和扩展性挑战,业界广泛使用数据中间件来补充MySQL的功能。这些中间件以业务需求为导向,提供诸如连接池、读写分离、负载均衡等解决方案。

首先,ProxySQL以C++开发的强项,如连接池管理、故障切换和SQL路由等,成为高性能的首选中间件,尤其在处理千亿级数据时表现出色。它的轻量级和易扩展性使其在众多功能中脱颖而出。

MaxScale作为MariaDB的扩展服务,专注于高可用性和安全性,通过分离数据库架构简化开发。对于MariaDB 10.3.1及以上版本,它的特性介绍同样值得关注。

DBProxy作为美团DBA团队的开源之作,提供读写分离和透明运维功能,降低了开发人员的复杂度,同时让DBA对前端应用的管理更为简单。DBProxy在Atlas基础上进行了优化和扩展。

MyCat,源于阿里巴巴的Cobar项目,经过社区改进,适用于多个行业领域,如金融、电信等。它在功能丰富度和活跃社区上表现出色。

TDDL,淘宝开发的分布式数据库系统,强调透明化、扩展性和数据复制,特别适合于处理大规模、高并发的数据存储和访问需求。

总的来说,这些MySQL中间件各有侧重,可以帮助解决互联网业务中的不同痛点。深入探讨这些工具的功能特性,将有助于我们更好地选择和应用它们,以适应不断发展的数据存储需求。原文链接和更多详情请参阅相关链接。

三、数据库分库分表中间件的整理

1.1、主要分库分表中间件包括:cobar、TDDL、atlas、sharding-jdbc、mycat。其中,cobar和atlas属于proxy层方案,分别由阿里和360团队开发,但社区维护有限;TDDL属于client层方案,由淘宝团队开发,不支持高级查询语法,使用较少;sharding-jdbc为当当网开源,支持分库分表、读写分离等,社区活跃,适用于中小型公司;mycat基于cobar改造,功能完善,是目前流行的选择,适合中大型公司。

1.2、选择分库分表中间件时,应考虑成本和维护需求。sharding-jdbc轻量级,部署简单,但需同步升级,耦合性高;mycat为proxy层方案,需要额外部署,但对项目透明,适合中大型公司。

2.1、水平拆分:将一个表数据分散到多个库,每个库表结构相同,数据分布均匀,有利于并发处理和数据量扩展。

2.2、垂直拆分:将大表拆分成多个小表,根据访问频率将不同字段分到不同表中,减少缓存压力,提升性能。

2.3、表层面拆分:将大表划分为多个小表,控制单表数据量,优化SQL性能。

3.1、范围分库:按固定范围(如时间)分配数据到不同库,易于扩容,但易产生数据热点。

3.2、哈希分库:通过哈希算法均匀分配数据到各库,避免数据热点,但扩容复杂。

4.1、规划好服务器配置,每台服务器上部署多个库。

4.2、设计路由规则,如根据orderId计算库和表。

4.3、申请新服务器,逐步增加数据库资源。

4.4、使用数据库迁移工具,将数据从旧服务器迁移至新服务器。

4.5、调整系统配置,修改路由规则。

4.6、重新部署系统,确保服务不间断提供。