为什么微服务并不是越早越好?

Source

微服务架构,是分层架构演进过程中很重要的一环,那微服务是不是越早越好呢?今天和大家一起聊聊这一个问题。

什么时候进行DAO层的分层抽象?

最开始,分层架构长什么样?

一个业务系统最初的分层架构如上:

(1)web-server层从db层获取数据并进行加工处理;

(2)db层存储数据;

此时,web-server层如何获取底层的数据呢?

web-server层获取数据的一段伪代码如上,不用纠结代码的细节,也不用纠结不同编程语言与不同数据库驱动的差异,其获取数据的过程大致为:

(1)创建一个与数据库的连接,初始化资源;

(2)根据业务拼装一个SQL语句;

(3)通过连接执行SQL语句,并获得结果集;

(4)通过游标遍历结果集,取出每行数据,亦可从每行数据中取出属性数据;

(5)关闭数据库连接,回收资源;

如果业务不复杂,这段代码写1次2次还可以,但如果业务越来越复杂,每次都这么获取数据,就略显低效了,有大量冗余、重复、每次必写的代码。

如何让数据的获取更加高效快捷呢?

通过技术手段能够实现:

(1)表与类的映射;

(2)属性与成员的映射;

(3)SQL与函数的映射;

绝大部分公司正在用的ORM,DAO等技术,就是一种分层抽象,可以提高数据获取的效率,屏蔽连接,游标,结果集这些复杂性。

于是,分层架构就演进了。

手写代码从DB中获取数据,成为通用痛点的时候,应该分层抽象出DAO层,简化数据获取过程,提高数据获取效率,向上游屏蔽底层的复杂性。

然后呢?

抽象出DAO层之后,系统架构并不会一成不变:

(1)随着业务越来越复杂,业务系统会不断进行垂直拆分;

(2)随着数据量越来越大,数据库会进行水平切分;

(3)随着读并发的越来越大,会增加缓存降低数据库的压力;

于是系统架构变成了这个样子:

业务系统垂直拆分数据库水平切分缓存这些都是常见的架构优化手段。

此时,web-server层如何获取底层的数据呢?

根据楼主的经验,以用户数据为例,流程一般是这样的:

(1)先查缓存:先用uid尝试从缓存获取数据,如果cache hit,数据获取成功,返回User实体,流程结束;

(2)确定路由:如果cache miss,先查询路由配置,确定uid落在哪个数据库实例的哪个库上;

(3)查询DB:通过DAO从对应库获取uid对应的数据实体User;

(4)插入缓存:将kv(uid, User)放入缓存,以便下次缓存查询数据能够命中缓存;

如果业务不复杂,这段代码写1次2次还可以,但如果业务越来越复杂,每次都这么获取数据,就略显低效了,有大量冗余、重复、每次必写的代码。

特别的,业务垂直拆分成非常多的子系统之后:

(1)一旦底层有稍许变化,所有上游的系统都需要升级修改;

(2)子系统之间很可能出现代码拷贝;

(3)一旦拷贝代码,出现一个bug,多个子系统都需要升级修改;

不相信业务会垂直拆分成多个子系统?举两个例子:

(1)58同城有招聘、房产、二手、二手车、黄页等5大头部业务,都需要访问用户数据;

(2)到家集团有月嫂、保姆、快狗打车、蓝服等多个业务,也都需要访问用户数据;

如果每个子系统都需要关注缓存,分库,读写分离的复杂性,调用层会疯掉的。

如何让数据的获取更加高效快捷呢?

服务化,数据服务层的抽象势在必行。

通过抽象数据服务层:

(1)web-server层可以通过RPC接口,像调用本地函数一样调用远端的数据;

(2)数据服务层,只有这一处需要关注缓存,分库,读写分离这些复杂性;

于是,分层架构就又演进了。

业务越来越复杂,垂直拆分的系统越来越多,数据库实施了水平切分,数据层实施了缓存加速之后,底层数据获取复杂性成为通用痛点的时候,应该抽象出数据服务层,简化数据获取过程,提高数据获取效率,向上游屏蔽底层的复杂性。

那微服务是不是越早越好呢?

互联网分层架构是一个很有意思的问题,服务化的引入,并不是越早越好:

(1)请求处理时间可能会增加;

(2)运维可能会更加复杂;

(3)定位问题可能会更加麻烦;

千万别鲁莽的在“微服务”大流之下,草率的进行微服务改造,看似“高大上架构”的背后,隐藏着更多并未接触过的“大坑”。还是那句话,架构和业务的特点和阶段有关:一切脱离业务的架构设计,都是耍流氓

相关推荐

InnoDB并发如此高,原因竟然在这?

InnoDB索引,终于懂了

InnoDB,调试死锁的方法!