本文目录
分库分表的几种常见玩法及如何解决跨库查询问题
在现在的互联网架构中,分库分表是一种非常常见的手段,主要用于解决单表或者单库数据过多而导致的性能问题。
通常,我们分库有水平切分和垂直切分两种方式
垂直切分在我们的微服务架构中很常见,将数据库根据业务模块进行拆分,业务的逻辑处理都通过服务调用来进行,而不是将逻辑放在数据层面,这样就能降低数据库表与表之间的耦合度。
而水平切分,就是我们通常用来解决数据问题的手段了。将数据库中单表的数据进行切分,分成多张相同的表单,数据按照一定的规则分布到不同的数据库实例中,从而达到降低数据量、提高性能的目的。
而水平切分,就需要有分库的依据
使用哪个字段来作为分库的依据呢?
通常情况下,我们会选择主键作为分库的依据,根据一定的算法,将数据均匀的分布到每个数据库实例中,同时,尽量让请求也均匀的分布到每个数据库实例上。
例如:我们将订单表进行了切分,一分为二(DB1、BD2),订单表的主键就是订单ID,我们想要均匀的分布数据的话,我们可以对订单ID进行判断,是单数,我们就放在DB1中,是双数,我们就放到DB2中,这样,我们的数据分布就非常的平均,同时,我们的请求在概率上,也是平均的。
当然,分库依据可以很多,这个可以根据自己的业务场景进行设置,只要明白,我们分库是为了缓解数据库的压力,降低单表的数据量,如果我们分库以后,DB1的数据量和请求数远大于DB2,那么我们分库的意义就不是很大了。
而分库以后,最难解决的就是分页查询的问题
通常情况下,我们的分页查询都是通过时间维度进行排序的。如以下sql:
select * from T order by time offset X limit Y;但是,分库以后,不同的数据库如何进行查询排序呢?我们就来说一跨库的分页查询方式。
全局视野方式
假设,我们现在要查询某张表的第三页数据,每页100条数据,曾经没有分库的时候,我们只需要
select * from T order by time offset 200 limit 100;但是,分库以后,这第三页的100条数据就有很多种分布方式了。
1)均匀分布(极端情况)
数据非常均匀的分布在两个库中,想要找到第三页的数据,就在两个库中各取50%就好了。
2)全部来自一个库(极端情况)
数据非常不平均的分配到了一个库中,所有的数据都来至于一个库,也就是说,只需要取这个单库的数据就可以了。
3)散乱分布(通常情况)
这种情况下,我们很难知道,第三页的数据应该在不同的库中从第几条开始取数,因为分库后,我们丢失了全局视野。因此,如果我们想要精准的找到目标数据,就必须重新构建全局的视野。
如何重新构建这种全局视野呢?
还是用我们要查询第三页的数据来举例,我们可以将两个库中的第一到第三页的数据全部查询出来,然后在内存中合并后进行排序,再取出第三页的数据。
我们的sql也就发生了变化,从
select * from T order by time offset 200 limit 100;改为
select * from T order by time offset 0 limit 100+200;全局视野方式进行查询的好处很明显,就是能够让业务数据绝对精准的返回。但是缺点也是明显,数据的查询量大,而且消耗的内存资源较多,当页码增大的时候,性能会集聚的下降。
如果想要解决全局视野方式的缺点,我们可以做出交互上的一点小牺牲来实现
禁止跳转页方式
相信这个分页方式大家都不陌生,但是,这种分页方式确实让我们分库以后的查询难度几何级的提升,如果想要解决跨页查询的问题,我们可以对我们的分页控件进行优化,只保留“上一下”、“下一页”的功能,去掉跳转页的功能。
当禁止跳页以后,我们每次查询后,就能够得到当页最后一次查询结果的时间,我们要查询一个分页中的记录时,是需要查询大于当前时间的100条记录就可以了。
两个数据库中各取100条,然后再汇总排序,这样就能够大大的提升查询的效率,同时也保证了数据的精准。
我们的sql也就改成了
select * from T order by time where time》@preMaxTime limit 100;使用此方式,我们就不会因为页码增加而出现性能的下降了,只是用户的交互体验会稍差一些了。当然,如果是APP用户,就不用担心这点了,因为APP用户很少使用跳转页的交互方式。
允许精度损失方式
允许精度损失的方式就比较暴力,我们不去管数据的分布问题,只是单纯的每个库中取出50条数据,然后排序展示。
在业务中,可能会出现第二页的部分数据时间上早于第一页的数据,这主要还是根据我们的保存数据时候分分布情况来决定。如果我们存储数据的时候,分布得越平均,这种查询方式得到的结果自然就越精准。
使用这种方式,我们就不需要考虑性能上的问题,也不需要考虑页面跳转和页码的问题,查询的复杂度是最低的,是比较推荐的一种查询方式。
当然,如果你的业务不允许这样的情况出现,还需要满足交互、效率等等各种需求,那么,就只有使用最后一个方式了。
二次查询方式
这可以说是解决分库查询的究极武器了,能够保证数据的精准度、查询的效率、用户的交互页面,牺牲的只是小小的性能开销和一些代码难度的上升。
方式其实也不难,假设我们要查询第21页的数据,每页5条。这个时候,我们先假设数据是平均分布的,但是我们在每个库都查询全量的5条数据。也就是:
select * from T order by time offset 100 limit 5;这时,我们得到的数据可能是这样的。
而两个DB中,最小的时间是1487500001【minTime】,这个时间记录下来。两个DB中各自的最大时间也记录下来,分别是DB1:1487500041【maxTime1】 和 DB2:1487500061【maxTime2】。
这时,我们在使用时间去两个数据库中再次进行查询。
select * from T where time between minTime and maxTime1 order by time;select * from T where time between minTime and maxTime2 order by time;
由于之前minTime来自于DB1,因此,DB1的数据不会发生变化,但是DB2中的条件被放宽了,因此可能会查询出更多的数据。结果可能如下:
而两个结果集合并以后,相当于就获得了全局视野,也就可以很容易的找出这一页需要的5条数据了。
如果谁还有更好的分库分页查询的方法,也欢迎指教!
如何将数据库中查询出来的数据再进行分页操作
“我是哟哟吼说科技,专注于数据网络的回答,欢迎大家与我交流数据网络的问题”
如题,如何将数据库查询出来的数据进行分页操作?
哟哟简单说一下分析及操作步骤:
1、创建一个page对象
a、创建所需要的属性,如当前的页码CurrentPage;
b、通过数据库查出得到数据的总和TotalConunt;
c、分析一共需要多少页TotalPage(所有数据的总和/CurrentCount,采用math.ceil()方法);
d、生成setter和getter方法;
2、servlet层调用service层的方法
a、创建一个service层的对象;
b、在service层创建findPageCategory方法,目的是为了获取跟分页有关的所有属性,如TotalPage,TotalCount等;
3、Dao层实现
a、查询数据库中所有数据的总和;
b、分页查询数据,即使用SQL聚合语句limit查询数据后第一个数据的起始位置,第二个参数表示每个分页查询的数据条数;
欢迎大家多多关注我,在下方评论区说出自己的见解。
请问各位DBA大佬,SQL如何进行多对多表的统计排序分页查询
以oracle为例:
SELECT * FROM
(
SELECT A.*, ROWNUM RN
FROM (SELECT rs.student_id,count(1) FROM relationship rs group by rs.student_id order by count(1) desc) A
WHERE ROWNUM 《= 10
)
WHERE RN 》= 0
Java中如何实现分页功能
虽然现在有很多好用的框架,对分页进行支持,很简单的就把分页的效果做出来,但是如果手动实现分页效果又如何呢。
一、分页的思路
首先我们得知道写分页代码时的思路,保持思路清晰,有步骤的进行,才能行云如水。先来看看分页的效果
这就是一个分页导航,其中能得到的数据有
totalRecord:总共员工数,数据库中总的记录数,这里有55条
totalPage:总页数,11页
pageSize:每页显示的记录数,这里可以看到每页显示5条
pageNum:当前页为第几页,比如图中就为第9页,因为9是没有超链接的,
start:总共能显示5页,让用户进行点击,7为起始页
end:11为能显示的尾页,也就是,如果用户点击第8页,那么start就为6,end就为10,每次都只有5页共点击查询。
每次能够得到对应页数所需要的5条数据,等等这些数据都要在jsp中显示出来,也就是说,每次都要从后台拿那么多数据过来进行显示,所以我们就想办法把这些数据封装在一个javabean当中,每次后台都将查询到的数据放入javabean对象中,我们只需要将该对象存入request作用域,然后在jsp页面中从域中获取需要的数据即可。
二、创建PageBean存放数据
PageBean.java
总共需要8个属性pageNum、pageSize、totalRecord、totalPage、startIndex、list、start、end,
pageNum、pageSize、totalRecord:通过构造方法就能得到。pageNum请求页面提交过来的参数,pageSize是自己设置的,totalRecord是查询数据库得到的
totalPage、startIndex、start、end是通过内部算法得出,
list需要通过查询数据库在通过set方式得到。
注意:该类使用泛型是为了不仅仅在这个项目中使用,在别的项目中也同样可以使用,
代码如下
View Code
三、在service层编写业务逻辑代码
其实就是在该层将我们所需要的PageBean对象构建好,返回给上一层
User类是我们需要显示的数据的封装后的javabean。
四、Servlet中编写控制代码
五、JSP中显示数据,构建分页导航
因为将我们所有需要的数据都封装在了pageBean中,pageBean对象又在request域中,所以在jsp页面中,我们只需要拿到我们所需要的数据,进行显示即可,构造导航图需要注意的有一点,逻辑要搞清楚,想要显示什么不想显示什么,全屏自己控制了,只需要记得一点,在请求Servlet时,需要把请求的页码交给服务器。不然服务器不知道你要获得第几页的数据。
我做的导航图的逻辑代码
显示所有员工数量、总页数
首先超链接
如果当前页为第一页时,就没有上一页这个超链接显示
如果当前页不是第一页也不是最后一页,则有上一页和下一页这个超链接显示
如果当前页是最后一页,则只有上一页这个超链接显示,下一页没有
尾页超链接
、
代码
View Code
六、总结
其实分页真的很简单,难点就在一个地方,javabean的构建,只要理清楚了pageBean中需要哪些属性,各种属性的作用是什么,那么分页就so easy了。还有一个就是在jsp中写分页导航时的逻辑,不要混乱了。