Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >数据库SQL,NoSQL之小感悟

数据库SQL,NoSQL之小感悟

作者头像
用户1105954
发布于 2018-01-12 10:11:01
发布于 2018-01-12 10:11:01
7580
举报
文章被收录于专栏:mini188mini188

遇到1000万数据表

最近遇到一个问题,就是单表数据过1000万的存储及查询问题。举个例子:1000万的数据存在一个表中,字段4-5个样子,日常 开发中难免要做过滤、排序、分页。如果把这几个放在一起即要过滤又要排序,还要分页那么数据量大一些就会发现特别慢。

10多年前刚入行时就听许多的人讨论分页,说什么1000万大表分页存储过程啥的。我之后一直工作中也没怎么遇到大数据量的开发工作,也真是惭愧啊,现在算是补补课吧。

1000万数据分个页吧

常用的数据库产品对分页都是有一些支持的,SQL语句肯定是OK的,同样的问题在于如何高效。因为分页查询最大的问题在于查询越往后的数据就越慢,因为要扫描的数据多。比如要查询第9999900-10000000之前的记录,就得将前面的数据找起。

为什么会这样呢?因为数据存在存储介质里,是一种数据结构的,计算机通过指令来查找想要的数据就要有一种算法,因为机器本身不知道你想要哪些数据。所以在数据写入时的自然顺序会在具体查找时变成麻烦。

换句话说,如果不在乎时间长短,那么分页查询其实也没多大事,大不行等个几十秒也能出来数据。但现实是这很难被接受。所以现在有一些方法来加快这个过程。

比如人们就想出一个方法,在分页查询前记录一下最后那页的记录的ID,然后查询时直接从这个ID往后找数据,这种方法就解决了上面说的扫描问题,利用数据库的数据检索功能大大提升性能。

但这种方法有弊端,毕竟这个ID需要有顺序啊,所取的数据也要是排过序的。但这说明想要提升效率方法是有的。

索引

我也不知道为什么,一直以来就很惧怕数据库方面的开发,我心中索引一直是个很复杂的东西,所以工作许久也没有好好去学习一下。最近正好亲密接触了一下,才发现这东西真是好东西,也没有想象中的那么可怕。

所谓索引其实就是对特定的数据进行一种排序,然后与实际的数据记录作映射,这样的好处就是扫描数据时可以在一个有序的集合里查找,那么算法自然就简单高效啦。在实际应用中也发现,通过索引查询性能可以大幅提升。

当然索引并没有这么简单,在什么字段上建索引很有讲究,要根据实际业务情况来决定。这也就是为什么一些电商的网站很少会有所有字段都给排序的原因,因为这种成本是很昂贵的,甚至不可实现。大家注意淘宝是不是只给了特定的一些排序方式?

NoSQL

N多年前在NoSql开始流行时我就想学习来着,但可能是自己太懒的原因,直到今年我才开始了解了NoSql。目前听的最多的Mongodb,甚至还有Redis也称为Nosql,HBase之类的。它们有什么特别呢?

我觉得Nosql最大的特点在于基于Key-value,这个特点的好处就是易于数据的扩展。传统数据库一旦遇到数据大了要么就是分库、分表,还有垂直,水平分的。但是NoSql天然解决这个问题,因为数据可以通过算法进行横向扩展。而且Nosql通常保存的数据结构也比较特别。另外Nosql通常是利用内存多于磁盘,这样可以大大提升读写效率吧。

在K-V的基础上提供一些类SQL的功能,就变得非常好用了。比如Mongodb可以实现过滤、排序、分页等操作,这对于开发人员来说简直神了,不用担心跨库或者跨表查询啦。

但是也有弊端,比如join操作可能就没这么好玩啦。

SQL+NoSQL

最近看到国内有个团队在做一处TiDB的开源项目,是基于google的论文开发的一套数据库,特点就是兼容mysql,同时又有nosql的高效和扩展性。这简直更神了,我只能膜拜。只不过我连mongodb都还不会,所以这种好东西我暂时也没有去了解。有空要学习学习吧。

结语

看起来复杂的东西其实道理不复杂,对,简单的就是好的。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2017-02-09 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
缓存遇到的数据过滤与分页问题
遇到的问题 1、最初阶段 系统中做了一个监控功能,用于记录所有的请求数据,数据插入频繁,量非常大,比如一天1000万条。考虑到数据插入的效率,就使用内存KV缓存来保存。写入过程是在接收到请求后放入到线程池中,然后线程池异步处理后写入。到这问题基本上没什么事情。 2、新的需求 后面数据保存了,就需要在运维系统中可以查询到,所以这个缓存还必须是分布式的。于是就换成了redis,这样系统都可以连接到。但是数据量太大,需要分页查询,这就有点头痛了。还好redis是可以支持有序集合的,而且可以通过zrange来获取指
用户1105954
2018/01/12
2.4K0
【大话NoSQL】——什么是NoSQL?
开始之前,先说说写这篇博文的背景,本来是想写MongoDB的内容,但是MongoDB又是非关系型数据库中最火的一个。我还是本着自己一直习惯的学习步骤,先有全局观,再着眼于微观,所以有必要先了解一下非关系数据库的发展历史,再开始学习MongoDB。否则,我们学习再多的MongoDB也只能是手中的一把沙,抓的越紧,剩下的越少。
程序猿小亮
2021/01/28
1.3K0
老司机总结的12条 SQL 优化方案(非常实用)
点击上方“芋道源码”,选择“设为星标” 管她前浪,还是后浪? 能浪的浪,才是好浪! 每天 10:33 更新文章,每天掉亿点点头发... 源码精品专栏 原创 | Java 2021 超神之路,很肝~ 中文详细注释的开源项目 RPC 框架 Dubbo 源码解析 网络应用框架 Netty 源码解析 消息中间件 RocketMQ 源码解析 数据库中间件 Sharding-JDBC 和 MyCAT 源码解析 作业调度中间件 Elastic-Job 源码解析 分布式事务中间件 TCC-Transaction
芋道源码
2022/06/20
9350
老司机总结的12条 SQL 优化方案(非常实用)
数据库SQL优化大总结1之- 百万级数据库优化方案
小编最近几天一直未出新技术点,是因为小编在忙着总结整理数据库的一些优化方案,特此奉上,优化总结较多,建议分段去消化,一口吃不成pang(胖)纸 一、百万级数据库优化方案 1.对查询进行优化,要尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如: select id from t where num is null 最好不要给数据库留NULL,尽
码神联盟
2018/03/16
5.7K1
数据库SQL优化大总结1之- 百万级数据库优化方案
传统的关系型数据库与NOSQL数据库间的对应关系、MongoDB的安装以及使用、 MongoDB中针对于MapReduce的实现、MongoDB数据库的用户管理、使用Java操作MongoDB数据库
MongoDB数据库是现在使用较为广泛的数据库,但是使用它都是需要一定的应用环境,在实际的开发环境之中,传统的关系型数据库依然是使用的主体,因为这样的数据属于结构化数据,而MongoDB这样的NOSQL数据库只是一个辅助,与Node.JS结合的时候它就是主力。
爱明依
2019/03/12
1.1K0
写好SQL很有必要
最近很多朋友来交流关于数据分析中的SQL技能需求,昨天看了这篇文章,写的很好,给大家推荐一下,其中关于数据表设计、SQL优化部分需要重点阅读,第一部分「MySQL性能」了解即可,全文共5758字,阅读大概需要20分钟,建议收藏,以下是作者自诉。
数据森麟
2020/02/20
5800
NoSQL数据库探讨
随着互联网web2.0网站的兴起,非关系型的数据库现在成了一个极其热门的新领域,非关系数据库产品的发展非常迅速。
黄规速
2022/04/14
1.9K0
NoSQL之Redis数据库初探
  随着互联网Web2.0网站的兴起,传统的关系数据库在应付Web2.0网站,特别是超大规模和高并发的SNS类型的Web2.0纯动态网站已经显得力不从心,暴露了很多难以克服的问题:
全栈程序员站长
2021/12/29
2880
NoSQL之Redis数据库初探
数据库SQL优化总结
.应尽量避免在 where 子句中对字段进行表达式操作,这将导致引擎放弃使用索引而进行全表扫描。如:
品茗IT
2019/09/12
1K0
Sql Or NoSql,看完这一篇你就懂了
你是否在为系统的数据库来一波大流量就几乎打满CPU,日常CPU居高不下烦恼?你是否在各种NoSql间纠结不定,到底该选用那种最好?今天的你就是昨天的我,这也是写这篇文章的初衷。
Java_老男孩
2019/08/28
7270
NoSQL数据库的战争 - MongoDB和Oracle NoSQL的比较
文章来源:https://severalnines.com/database-blog/battle-nosql-databases-comparing-mongodb-and-oracle-nosql
MongoDB中文社区
2020/05/11
1.9K0
NoSQL数据库的战争 - MongoDB和Oracle NoSQL的比较
数据库SQL复习
RDBMS(Relaction DataBase Mangement System):MySQL、SQL Server、IBM DB2、Oracle
京剧猫
2023/03/06
2.7K0
Mongodb分页查询优化上
最近遇到mongo集群性能问题,主要体现在查询性能或者聚合性能慢(查询类似关系型数据库中select * from xx where a='xx',另外聚合类似group by+count、sum),nosql与关系型数据库存在很多类似,比如分页查询语句是比较常见问题,分页优化在数据库优化原理类似.常见分页场景需求(本次主要基于这2种场景进行优化介绍)
徐靖
2020/08/05
2.1K0
Mongodb分页查询优化上
【愚公系列】《AIGC辅助软件开发》024-AI辅助应用性能优化:数据库优化
在现代应用开发中,数据库的性能直接关系到应用的整体表现和用户体验。随着数据量的不断增加和业务需求的多样化,如何高效地管理和优化数据库,成为开发者面临的重要挑战。幸运的是,人工智能(AI)技术的迅速发展为我们提供了新的工具和思路,帮助我们在数据库优化方面实现突破。
愚公搬代码
2024/12/28
1370
逻辑删除还是物理删除
看到标题,有的童鞋心中暗想“数据删除有什么可提的呢?不就是执行个delete语句吗?有什么难的呀?”其实呢数据删除没有你想的这么简单,一般情况下公司会明确的要求数据只能逻辑删除,不能物理删除。那什么优势逻辑删除,什么又是物理删除呢?
全栈程序员站长
2022/09/05
1.4K0
逻辑删除还是物理删除
关于SQL优化若干
博主负责的项目主要采用阿里云数据库MySQL,最近频繁出现慢SQL告警,执行时间最长的竟然高达5分钟。导出日志后分析,主要原因竟然是没有命中索引和没有分页处理。其实这是非常低级的错误,我不禁后背一凉,团队成员的技术水平亟待提高啊。改造这些SQL的过程中,总结了一些经验分享给大家,如果有错误欢迎批评指正。
用户4283147
2022/10/27
3970
关于SQL优化若干
如何写出一手好 SQL ?很有必要!
点击关注公众号,Java干货及时送达 来源:编码砖家   链接:cnblogs.com/xiaoyangjia/p/11267191.html 背景 最近频繁出现慢SQL告警,执行时间最长的竟然高达5分钟。导出日志后分析,主要原因竟然是没有命中索引和没有分页处理 。 其实这是非常低级的错误,我不禁后背一凉,团队成员的技术水平亟待提高啊。改造这些SQL的过程中,总结了一些经验分享给大家,如果有错误欢迎批评指正。 MySQL性能 最大数据量 抛开数据量和并发数,谈性能都是耍流氓 。MySQL没有限制单表最大记
Java技术栈
2022/05/12
5390
如何写出一手好 SQL ?很有必要!
大数据量分页查询,SQL语句怎么优化?
当需要从数据库查询的表有上万条记录的时候,一次性查询所有结果会变得很慢,特别是随着数据量的增加特别明显,这时需要使用分页查询。对于数据库分页查询,也有很多种方法和优化的点。下面简单说一下我知道的一些方法。
Bug开发工程师
2019/06/20
3.3K0
如何去写一手好SQL?
博主负责的项目主要采用阿里云数据库MySQL,最近频繁出现慢SQL告警,执行时间最长的竟然高达5分钟。导出日志后分析,主要原因竟然是没有命中索引和没有分页处理。其实这是非常低级的错误,我不禁后背一凉,团队成员的技术水平亟待提高啊。改造这些SQL的过程中,总结了一些经验分享给大家,如果有错误欢迎批评指正。
芋道源码
2019/10/08
3090
如何去写一手好SQL?
【数据库】MySQL:从基础到高级的SQL技巧
上篇文章是对MySQL的简单介绍和基本操作,接下来会对MySQL数据查询最更进一步的讲解。
易辰君
2024/11/07
2980
推荐阅读
相关推荐
缓存遇到的数据过滤与分页问题
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档