1
0
mirror of https://github.com/Snailclimb/JavaGuide synced 2025-06-20 22:17:09 +08:00

[feat]MySQL 部分内容更新完善

This commit is contained in:
guide 2021-03-27 16:22:18 +08:00
parent 3f0916873a
commit 3b7c8981a2
2 changed files with 165 additions and 151 deletions

View File

@ -1,16 +1,30 @@
## 关系型数据库 ## MySQL 基础
### 关系型数据库介绍
顾名思义,关系型数据库就是一种建立在关系模型的基础上的数据库。关系模型表明了数据库中所存储的数据之间的联系(一对一、一对多、多对多)。
### 什么是MySQL? 关系型数据库中,我们的数据都被存放在了各种表中(比如用户表),表中的每一列就存放着一条数据(比如一个用户的信息)。
![](https://guide-blog-images.oss-cn-shenzhen.aliyuncs.com/java-guide-blog/5e3c1a71724a38245aa43b02_99bf70d46cc247be878de9d3a88f0c44.png)
大部分关系型数据库都使用 SQL 来操作数据库中的数据。并且,大部分关系型数据库都支持事务的四大特性(ACID)。
**有哪些常见的关系型数据库呢?**
MySQL、PostgreSQL、Oracle、SQL Server、SQLite微信本地的聊天记录的存储就是用的SQLite ......。
### MySQL介绍
![](https://img-blog.csdnimg.cn/20210327143351823.png)
**MySQL 是一种关系型数据库,主要用于持久化存储我们的系统中的一些数据比如用户信息。** **MySQL 是一种关系型数据库,主要用于持久化存储我们的系统中的一些数据比如用户信息。**
由于 MySQL 是开源免费并且比较成熟的数据库因此MySQL 被大量使用在各种系统中。任何人都可以在 GPL(General Public License) 的许可下下载并根据个性化的需要对其进行修改。MySQL的默认端口号是**3306**。 由于 MySQL 是开源免费并且比较成熟的数据库因此MySQL 被大量使用在各种系统中。任何人都可以在 GPL(General Public License) 的许可下下载并根据个性化的需要对其进行修改。MySQL的默认端口号是**3306**。
### 存储引擎 ## 存储引擎
#### 一些常用命令 ### 存储引擎相关的命令
**查看MySQL提供的所有存储引擎** **查看MySQL提供的所有存储引擎**
@ -38,19 +52,61 @@ show table status like "table_name" ;
![查看表的存储引擎](https://my-blog-to-use.oss-cn-beijing.aliyuncs.com/2019-6/查看表的存储引擎.png) ![查看表的存储引擎](https://my-blog-to-use.oss-cn-beijing.aliyuncs.com/2019-6/查看表的存储引擎.png)
#### MyISAM和InnoDB区别 ### MyISAM和InnoDB区别
MyISAM是MySQL的默认数据库引擎5.5版之前。虽然性能极佳而且提供了大量的特性包括全文索引、压缩、空间函数等但MyISAM不支持事务和行级锁而且最大的缺陷就是崩溃后无法安全恢复。不过5.5版本之后MySQL引入了InnoDB事务性数据库引擎MySQL 5.5版本后默认的存储引擎为InnoDB。 ![](https://img-blog.csdnimg.cn/20210327145248960.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM0MzM3Mjcy,size_16,color_FFFFFF,t_70)
大多数时候我们使用的都是 InnoDB 存储引擎,但是在某些情况下使用 MyISAM 也是合适的比如读密集的情况下。(如果你不介意 MyISAM 崩溃恢复问题的话) MySQL 5.5 之前MyISAM 引擎是MySQL的默认存储引擎可谓是风光一时
**两者的对比:** 虽然MyISAM 的性能还行各种特性也还不错比如全文索引、压缩、空间函数等。但是MyISAM不支持事务和行级锁而且最大的缺陷就是崩溃后无法安全恢复。
1. **是否支持行级锁** : MyISAM 只有表级锁(table-level locking)而InnoDB 支持行级锁(row-level locking)和表级锁,默认为行级锁。 5.5版本之后MySQL引入了InnoDB事务性数据库引擎MySQL 5.5版本后默认的存储引擎为InnoDB。小伙子一定要记好这个 InnoDB 你每次使用MySQL数据库都是用的这个存储引擎吧
2. **是否支持事务和崩溃后的安全恢复: MyISAM** 强调的是性能,每次查询具有原子性,其执行速度比InnoDB类型更快但是不提供事务支持。但是**InnoDB** 提供事务支持,外部键等高级数据库功能。 具有事务(commit)、回滚(rollback)和崩溃修复能力(crash recovery capabilities)的事务安全(transaction-safe (ACID compliant))型表。
3. **是否支持外键:** MyISAM不支持而InnoDB支持。 言归正传!咱们下面还是来简单对比一下两者:
4. **是否支持MVCC** :仅 InnoDB 支持。应对高并发事务, MVCC比单纯的加锁更高效;MVCC只在 `READ COMMITTED``REPEATABLE READ` 两个隔离级别下工作;MVCC可以使用 乐观(optimistic)锁 和 悲观(pessimistic)锁来实现;各数据库中MVCC实现并不统一。推荐阅读[MySQL-InnoDB-MVCC多版本并发控制](https://segmentfault.com/a/1190000012650596)
5. ...... **1.是否支持行级锁**
MyISAM 只有表级锁(table-level locking)而InnoDB 支持行级锁(row-level locking)和表级锁,默认为行级锁。
也就说MyISAM 一锁就是锁住了整张表,这在并发写的情况下是多么滴憨憨啊!这也是为什么 InnoDB 在并发写的时候,性能更牛皮了!
**2.是否支持事务 **
MyISAM 不提供事务支持。
InnoDB 提供事务支持,具有提交(commit)和回滚(rollback)事务的能力。
**3.是否支持外键**
MyISAM不支持而InnoDB支持。
🌈拓展一下:
一般我们也是不建议在数据库层面使用外键的,应用层面可以解决。不过,这样会对数据的一致性造成威胁。具体要不要使用外键还是要根据你的项目来决定。
**4.是否支持数据库异常崩溃后的安全恢复**
MyISAM 不支持而InnoDB支持。
使用 InnoDB 的数据库在异常崩溃后,数据库重新启动的时候会保证数据库恢复到崩溃前的状态。这个恢复的过程依赖于 `redo log`
🌈拓展一下:
- MySQL InnoDB 引擎使用 **redo log(重做日志)** 保证事务的**持久性**,使用 **undo log(回滚日志)** 来保证事务的**原子性**。
- MySQL InnoDB 引擎通过 **锁机制**、**MVCC** 等手段来保证事务的隔离性( 默认支持的隔离级别是 **`REPEATABLE-READ`** )。
- 保证了事务的持久性、原子性、隔离性之后,一致性才能得到保障。
**5.是否支持MVCC**
MyISAM 不支持而InnoDB支持。
讲真这个对比有点废话毕竟MyISAM连行级锁都不支持。
MVCC 可以看作是行级锁的一个升级,可以有效减少加锁操作,提供性能。
### 关于MyISAM和InnoDB的选择问题
大多数时候我们使用的都是 InnoDB 存储引擎,在某些读密集的情况下,使用 MyISAM 也是合适的。不过,前提是你的项目不介意 MyISAM 不支持事务、崩溃恢复等缺点(可是~我们一般都会介意啊!)。
《MySQL高性能》上面有一句话这样写到: 《MySQL高性能》上面有一句话这样写到:
@ -58,30 +114,32 @@ MyISAM是MySQL的默认数据库引擎5.5版之前)。虽然性能极佳,
一般情况下我们选择 InnoDB 都是没有问题的但是某些情况下你并不在乎可扩展能力和并发能力也不需要事务支持也不在乎崩溃后的安全恢复问题的话选择MyISAM也是一个不错的选择。但是一般情况下我们都是需要考虑到这些问题的。 一般情况下我们选择 InnoDB 都是没有问题的但是某些情况下你并不在乎可扩展能力和并发能力也不需要事务支持也不在乎崩溃后的安全恢复问题的话选择MyISAM也是一个不错的选择。但是一般情况下我们都是需要考虑到这些问题的。
### 字符集及校对规则 因此,对于咱们日常开发的业务系统来说,你几乎找不到什么理由再使用 MyISAM 作为自己的MySQL数据库的存储引擎。
字符集指的是一种从二进制编码到某类字符符号的映射。校对规则则是指某种字符集下的排序规则。MySQL中每一种字符集都会对应一系列的校对规则。 ## 锁机制与InnoDB锁算法
MySQL采用的是类似继承的方式指定字符集的默认值每个数据库以及每张数据表都有自己的默认值他们逐层继承。比如某个库中所有表的默认字符集将是该数据库所指定的字符集这些表在没有指定字符集的情况下才会采用默认字符集 PS整理自《Java工程师修炼之道》 **MyISAM和InnoDB存储引擎使用的锁**
详细内容可以参考: [MySQL字符集及校对规则的理解](https://www.cnblogs.com/geaozhang/p/6724393.html#MySQLyuzifuji) - MyISAM采用表级锁(table-level locking)。
- InnoDB支持行级锁(row-level locking)和表级锁,默认为行级锁
### 索引 **表级锁和行级锁对比:**
MySQL索引使用的数据结构主要有**BTree索引** 和 **哈希索引** 。对于哈希索引来说底层的数据结构就是哈希表因此在绝大多数需求为单条记录查询的时候可以选择哈希索引查询性能最快其余大部分场景建议选择BTree索引。 - **表级锁:** MySQL中锁定 **粒度最大** 的一种锁对当前操作的整张表加锁实现简单资源消耗也比较少加锁快不会出现死锁。其锁定粒度最大触发锁冲突的概率最高并发度最低MyISAM和 InnoDB引擎都支持表级锁。
- **行级锁:** MySQL中锁定 **粒度最小** 的一种锁,只针对当前操作的行进行加锁。 行级锁能大大减少数据库操作的冲突。其加锁粒度最小,并发度高,但加锁的开销也最大,加锁慢,会出现死锁。
MySQL的BTree索引使用的是B树中的B+Tree但对于主要的两种存储引擎的实现方式是不同的。 **InnoDB存储引擎的锁的算法有三种**
- **MyISAM:** B+Tree叶节点的data域存放的是数据记录的地址。在索引检索的时候首先按照B+Tree搜索算法搜索索引如果指定的Key存在则取出其 data 域的值,然后以 data 域的值为地址读取相应的数据记录。这被称为“非聚簇索引”。 - Record lock单个行记录上的锁
- **InnoDB:** 其数据文件本身就是索引文件。相比MyISAM索引文件和数据文件是分离的其表数据文件本身就是按B+Tree组织的一个索引结构树的叶节点data域保存了完整的数据记录。这个索引的key是数据表的主键因此InnoDB表数据文件本身就是主索引。这被称为“聚簇索引或聚集索引”。而其余的索引都作为辅助索引辅助索引的data域存储相应记录主键的值而不是地址这也是和MyISAM不同的地方。**在根据主索引搜索时直接找到key所在的节点即可取出数据在根据辅助索引查找时则需要先取出主键的值再走一遍主索引。** **因此,在设计表的时候,不建议使用过长的字段作为主键,也不建议使用非单调的字段作为主键,这样会造成主索引频繁分裂。** PS整理自《Java工程师修炼之道》 - Gap lock间隙锁锁定一个范围不包括记录本身
- Next-key lockrecord+gap 锁定一个范围,包含记录本身
**更多关于索引的内容可以查看文档首页MySQL目录下关于索引的详细总结。** ## 查询缓存
### 查询缓存的使 执行查询语句的时候会先查询缓存。不过MySQL 8.0 版本后移除,因为这个功能不太实
> 执行查询语句的时候会先查询缓存。不过MySQL 8.0 版本后移除,因为这个功能不太实用 `my.cnf` 加入以下配置重启MySQL开启查询缓存
my.cnf加入以下配置重启MySQL开启查询缓存
```properties ```properties
query_cache_type=1 query_cache_type=1
query_cache_size=600000 query_cache_size=600000
@ -93,29 +151,75 @@ MySQL执行以下命令也可以开启查询缓存
set global query_cache_type=1; set global query_cache_type=1;
set global query_cache_size=600000; set global query_cache_size=600000;
``` ```
如上,**开启查询缓存后在同样的查询条件以及数据情况下,会直接在缓存中返回结果**。这里的查询条件包括查询本身、当前要查询的数据库、客户端协议版本号等一些可能影响结果的信息。因此任何两个查询在任何字符上的不同都会导致缓存不命中。此外如果查询中包含任何用户自定义函数、存储函数、用户变量、临时表、MySQL库中的系统表其查询结果也不会被缓存。 如上,**开启查询缓存后在同样的查询条件以及数据情况下,会直接在缓存中返回结果**。这里的查询条件包括查询本身、当前要查询的数据库、客户端协议版本号等一些可能影响结果的信息。因此任何两个查询在任何字符上的不同都会导致缓存不命中。此外如果查询中包含任何用户自定义函数、存储函数、用户变量、临时表、MySQL库中的系统表其查询结果也不会被缓存。
缓存建立之后MySQL的查询缓存系统会跟踪查询中涉及的每张表如果这些表数据或结构发生变化那么和这张表相关的所有缓存数据都将失效。 缓存建立之后MySQL的查询缓存系统会跟踪查询中涉及的每张表如果这些表数据或结构发生变化那么和这张表相关的所有缓存数据都将失效。
**缓存虽然能够提升数据库的查询性能,但是缓存同时也带来了额外的开销,每次查询后都要做一次缓存操作,失效后还要销毁。** 因此开启查询缓存要谨慎尤其对于写密集的应用来说更是如此。如果开启要注意合理控制缓存空间大小一般来说其大小设置为几十MB比较合适。此外**还可以通过sql_cache和sql_no_cache来控制某个查询语句是否需要缓存** **缓存虽然能够提升数据库的查询性能,但是缓存同时也带来了额外的开销,每次查询后都要做一次缓存操作,失效后还要销毁。** 因此开启查询缓存要谨慎尤其对于写密集的应用来说更是如此。如果开启要注意合理控制缓存空间大小一般来说其大小设置为几十MB比较合适。此外**还可以通过sql_cache和sql_no_cache来控制某个查询语句是否需要缓存**
```sql ```sql
select sql_no_cache count(*) from usr; select sql_no_cache count(*) from usr;
``` ```
### 什么是事务? ## 事务
**事务是逻辑上的一组操作,要么都执行,要么都不执行。** ### 何为事务?
事务最经典也经常被拿出来说例子就是转账了。假如小明要给小红转账1000元这个转账会涉及到两个关键操作就是将小明的余额减少1000元将小红的余额增加1000元。万一在这两个操作之间突然出现错误比如银行系统崩溃导致小明余额减少而小红的余额没有增加这样就不对了。事务就是保证这两个关键操作要么都成功要么都要失败。 一言蔽之,**事务是逻辑上的一组操作,要么都执行,要么都不执行。**
### 事务的四大特性(ACID) **可以简单举一个例子不?**
![事务的特性](https://my-blog-to-use.oss-cn-beijing.aliyuncs.com/2019-6/事务特性.png) 事务最经典也经常被拿出来说例子就是转账了。假如小明要给小红转账 1000 元,这个转账会涉及到两个关键操作就是:
1. **原子性Atomicity** 事务是最小的执行单位,不允许分割。事务的原子性确保动作要么全部完成,要么完全不起作用; 1. 将小明的余额减少 1000 元
2. **一致性Consistency** 执行事务后,数据库从一个正确的状态变化到另一个正确的状态; 2. 将小红的余额增加 1000 元。
3. **隔离性Isolation** 并发访问数据库时,一个用户的事务不被其他事务所干扰,各并发事务之间数据库是独立的;
4. **持久性Durability** 一个事务被提交之后。它对数据库中数据的改变是持久的,即使数据库发生故障也不应该对其有任何影响。 事务会把这两个操作就可以看成逻辑上的一个整体,这个整体包含的操作要么都成功,要么都要失败。
这样就不会出现小明余额减少而小红的余额却并没有增加的情况。
### 何为数据库事务?
数据库事务在我们日常开发中接触的最多了。如果你的项目属于单体架构的话,你接触到的往往就是数据库事务了。
平时,我们在谈论事务的时候,如果没有特指**分布式事务**,往往指的就是**数据库事务**。
**那数据库事务有什么作用呢?**
简单来说数据库事务可以保证多个对数据库的操作也就是SQL语句构成一个逻辑上的整体。构成这个逻辑上的整体的这些数据库操作遵循**要么全部执行成功,要么全部不执行** 。
```sql
# 开启一个事务
START TRANSACTION;
# 多条 SQL 语句
SQL1,SQL2...
## 提交事务
COMMIT;
```
![](https://guide-blog-images.oss-cn-shenzhen.aliyuncs.com/2020-12/640-20201207160554677.png)
另外,关系型数据库(例如:`MySQL``SQL Server``Oracle` 等)事务都有 **ACID** 特性:
![事务的特性](https://my-blog-to-use.oss-cn-beijing.aliyuncs.com/2019-6/%E4%BA%8B%E5%8A%A1%E7%89%B9%E6%80%A7.png)
### 何为ACID特性呢
1. **原子性**`Atomicity` 事务是最小的执行单位,不允许分割。事务的原子性确保动作要么全部完成,要么完全不起作用;
2. **一致性**`Consistency` 执行事务前后,数据保持一致,例如转账业务中,无论事务是否成功,转账者和收款人的总额应该是不变的;
3. **隔离性**`Isolation` 并发访问数据库时,一个用户的事务不被其他事务所干扰,各并发事务之间数据库是独立的;
4. **持久性**`Durabilily` 一个事务被提交之后。它对数据库中数据的改变是持久的,即使数据库发生故障也不应该对其有任何影响。
**数据事务的实现原理呢?**
我们这里以 MySQL 的 InnoDB 引擎为例来简单说一下。
MySQL InnoDB 引擎使用 **redo log(重做日志)** 保证事务的**持久性**,使用 **undo log(回滚日志)** 来保证事务的**原子性**。
MySQL InnoDB 引擎通过 **锁机制**、**MVCC** 等手段来保证事务的隔离性( 默认支持的隔离级别是 **`REPEATABLE-READ`** )。
保证了事务的持久性、原子性、隔离性之后,一致性才能得到保障。
### 并发事务带来哪些问题? ### 并发事务带来哪些问题?
@ -130,9 +234,9 @@ select sql_no_cache count(*) from usr;
不可重复读的重点是修改比如多次读取一条记录发现其中某些列的值被修改,幻读的重点在于新增或者删除比如多次读取一条记录发现记录增多或减少了。 不可重复读的重点是修改比如多次读取一条记录发现其中某些列的值被修改,幻读的重点在于新增或者删除比如多次读取一条记录发现记录增多或减少了。
### 事务隔离级别有哪些?MySQL的默认隔离级别是? ### 事务隔离级别有哪些?
**SQL 标准定义了四个隔离级别:** SQL 标准定义了四个隔离级别:
- **READ-UNCOMMITTED(读取未提交)** 最低的隔离级别,允许读取尚未提交的数据变更,**可能会导致脏读、幻读或不可重复读**。 - **READ-UNCOMMITTED(读取未提交)** 最低的隔离级别,允许读取尚未提交的数据变更,**可能会导致脏读、幻读或不可重复读**。
- **READ-COMMITTED(读取已提交)** 允许读取并发事务已经提交的数据,**可以阻止脏读,但是幻读或不可重复读仍有可能发生**。 - **READ-COMMITTED(读取已提交)** 允许读取并发事务已经提交的数据,**可以阻止脏读,但是幻读或不可重复读仍有可能发生**。
@ -148,6 +252,8 @@ select sql_no_cache count(*) from usr;
| REPEATABLE-READ | × | × | √ | | REPEATABLE-READ | × | × | √ |
| SERIALIZABLE | × | × | × | | SERIALIZABLE | × | × | × |
### MySQL的默认隔离级别是什么?
MySQL InnoDB 存储引擎的默认支持的隔离级别是 **REPEATABLE-READ可重读**。我们可以通过`SELECT @@tx_isolation;`命令来查看MySQL 8.0 该命令改为`SELECT @@transaction_isolation;` MySQL InnoDB 存储引擎的默认支持的隔离级别是 **REPEATABLE-READ可重读**。我们可以通过`SELECT @@tx_isolation;`命令来查看MySQL 8.0 该命令改为`SELECT @@transaction_isolation;`
```sql ```sql
@ -159,119 +265,24 @@ mysql> SELECT @@tx_isolation;
+-----------------+ +-----------------+
``` ```
这里需要注意的是:与 SQL 标准不同的地方在于 InnoDB 存储引擎在 **REPEATABLE-READ可重读** ~~这里需要注意的是:与 SQL 标准不同的地方在于 InnoDB 存储引擎在 **REPEATABLE-READ可重读** 事务隔离级别下使用的是Next-Key Lock 锁算法,因此可以避免幻读的产生,这与其他数据库系统(如 SQL Server)是不同的。所以说InnoDB 存储引擎的默认支持的隔离级别是 **REPEATABLE-READ可重读** 已经可以完全保证事务的隔离性要求,即达到了 SQL标准的 **SERIALIZABLE(可串行化)** 隔离级别。~~
事务隔离级别下使用的是Next-Key Lock 锁算法,因此可以避免幻读的产生,这与其他数据库系统(如 SQL Server)
是不同的。所以说InnoDB 存储引擎的默认支持的隔离级别是 **REPEATABLE-READ可重读** 已经可以完全保证事务的隔离性要求,即达到了 🐛问题更正:**MySQL InnoDB的REPEATABLE-READ可重读并不保证避免幻读需要应用使用加锁读来保证。而这个加锁度使用到的机制就是 Next-Key Locks。**
SQL标准的 **SERIALIZABLE(可串行化)** 隔离级别。因为隔离级别越低,事务请求的锁越少,所以大部分数据库系统的隔离级别都是 **READ-COMMITTED(读取提交内容)** 但是你要知道的是InnoDB 存储引擎默认使用 **REPEAaTABLE-READ可重读** 并不会有任何性能损失。
因为隔离级别越低,事务请求的锁越少,所以大部分数据库系统的隔离级别都是 **READ-COMMITTED(读取提交内容)** 但是你要知道的是InnoDB 存储引擎默认使用 **REPEAaTABLE-READ可重读** 并不会有任何性能损失。
InnoDB 存储引擎在 **分布式事务** 的情况下一般会用到 **SERIALIZABLE(可串行化)** 隔离级别。 InnoDB 存储引擎在 **分布式事务** 的情况下一般会用到 **SERIALIZABLE(可串行化)** 隔离级别。
### 锁机制与InnoDB锁算法 🌈拓展一下(以下内容摘自《MySQL技术内幕InnoDB存储引擎(第2版)》7.7章)
**MyISAM和InnoDB存储引擎使用的锁** > InnoDB存储引擎提供了对XA事务的支持并通过XA事务来支持分布式事务的实现。分布式事务指的是允许多个独立的事务资源transactional resources参与到一个全局的事务中。事务资源通常是关系型数据库系统但也可以是其他类型的资源。全局事务要求在其中的所有参与的事务要么都提交要么都回滚这对于事务原有的ACID要求又有了提高。另外在使用分布式事务时InnoDB存储引擎的事务隔离级别必须设置为SERIALIZABLE。
- MyISAM采用表级锁(table-level locking)。 ## 参考
- InnoDB支持行级锁(row-level locking)和表级锁,默认为行级锁
**表级锁和行级锁对比:** - 《高性能MySQL》
- **表级锁:** MySQL中锁定 **粒度最大** 的一种锁对当前操作的整张表加锁实现简单资源消耗也比较少加锁快不会出现死锁。其锁定粒度最大触发锁冲突的概率最高并发度最低MyISAM和 InnoDB引擎都支持表级锁。 - https://www.omnisci.com/technical-glossary/relational-database
- **行级锁:** MySQL中锁定 **粒度最小** 的一种锁,只针对当前操作的行进行加锁。 行级锁能大大减少数据库操作的冲突。其加锁粒度最小,并发度高,但加锁的开销也最大,加锁慢,会出现死锁。
详细内容可以参考: MySQL锁机制简单了解一下[https://blog.csdn.net/qq_34337272/article/details/80611486](https://blog.csdn.net/qq_34337272/article/details/80611486)
**InnoDB存储引擎的锁的算法有三种**
- Record lock单个行记录上的锁
- Gap lock间隙锁锁定一个范围不包括记录本身
- Next-key lockrecord+gap 锁定一个范围,包含记录本身
**相关知识点:**
1. innodb对于行的查询使用next-key lock
2. Next-locking keying为了解决Phantom Problem幻读问题
3. 当查询的索引含有唯一属性时将next-key lock降级为record key
4. Gap锁设计的目的是为了阻止多个事务将记录插入到同一范围内而这会导致幻读问题的产生
5. 有两种方式显式关闭gap锁除了外键约束和唯一性检查外其余情况仅使用record lock A. 将事务隔离级别设置为RC B. 将参数innodb_locks_unsafe_for_binlog设置为1
### 大表优化
当MySQL单表记录数过大时数据库的CRUD性能会明显下降一些常见的优化措施如下
#### 1. 限定数据的范围
务必禁止不带任何限制数据范围条件的查询语句。比如:我们当用户在查询订单历史的时候,我们可以控制在一个月的范围内;
#### 2. 读/写分离
经典的数据库拆分方案,主库负责写,从库负责读;
#### 3. 垂直分区(待完善)
**根据数据库里面数据表的相关性进行拆分。** 例如,用户表中既有用户的登录信息又有用户的基本信息,可以将用户表拆分成两个单独的表,甚至放到单独的库做分库。
**简单来说垂直拆分是指数据表列的拆分,把一张列比较多的表拆分为多张表。** 如下图所示,这样来说大家应该就更容易理解了。
![数据库垂直分区](https://my-blog-to-use.oss-cn-beijing.aliyuncs.com/2019-6/数据库垂直分区.png)
- **垂直拆分的优点:** 可以使得列数据变小在查询时减少读取的Block数减少I/O次数。此外垂直分区可以简化表的结构易于维护。
- **垂直拆分的缺点:** 主键会出现冗余需要管理冗余列并会引起Join操作可以通过在应用层进行Join来解决。此外垂直分区会让事务变得更加复杂
#### 4. 水平分区(待完善)
**保持数据表结构不变,通过某种策略存储数据分片。这样每一片数据分散到不同的表或者库中,达到了分布式的目的。 水平拆分可以支撑非常大的数据量。**
水平拆分是指数据表行的拆分表的行数超过200万行时就会变慢这时可以把一张的表的数据拆成多张表来存放。举个例子我们可以将用户信息表拆分成多个用户信息表这样就可以避免单一表数据量过大对性能造成影响。
![数据库水平拆分](https://my-blog-to-use.oss-cn-beijing.aliyuncs.com/2019-6/数据库水平拆分.png)
水平拆分可以支持非常大的数据量。需要注意的一点是分表仅仅是解决了单一表数据过大的问题但由于表的数据还是在同一台机器上其实对于提升MySQL并发能力没有什么意义所以 **水平拆分最好分库**
水平拆分能够 **支持非常大的数据量存储,应用端改造也少**,但 **分片事务难以解决** 跨节点Join性能较差逻辑复杂。《Java工程师修炼之道》的作者推荐 **尽量不要对数据进行分片,因为拆分会带来逻辑、部署、运维的各种复杂度** 一般的数据表在优化得当的情况下支撑千万以下的数据量是没有太大问题的。如果实在要分片尽量选择客户端分片架构这样可以减少一次和中间件的网络I/O。
**下面补充一下数据库分片的两种常见方案:**
- **客户端代理:** **分片逻辑在应用端封装在jar包中通过修改或者封装JDBC层来实现。** 当当网的 **Sharding-JDBC** (推荐) 、阿里的TDDL是两种比较常用的实现。
- **中间件代理:** **在应用和数据中间加了一个代理层。分片逻辑统一维护在中间件服务中。** 我们现在谈的 **Mycat** 、360的Atlas、网易的DDB等等都是这种架构的实现。
详细内容可以参考: MySQL大表优化方案: [https://segmentfault.com/a/1190000006158186](https://segmentfault.com/a/1190000006158186)
### 解释一下什么是池化设计思想。什么是数据库连接池?为什么需要数据库连接池?
池化设计应该不是一个新名词。我们常见的如java线程池、jdbc连接池、redis连接池等就是这类设计的代表实现。这种设计会初始预设资源解决的问题就是抵消每次获取资源的消耗如创建线程的开销获取远程连接的开销等。就好比你去食堂打饭打饭的大妈会先把饭盛好几份放那里你来了就直接拿着饭盒加菜即可不用再临时又盛饭又打菜效率就高了。除了初始化资源池化设计还包括如下这些特征池子的初始值、池子的活跃值、池子的最大值等这些特征可以直接映射到java线程池和数据库连接池的成员属性中。这篇文章对[池化设计思想](https://mp.weixin.qq.com/s?__biz=Mzg2OTA0Njk0OA==&mid=2247485679&idx=1&sn=57dbca8c9ad49e1f3968ecff04a4f735&chksm=cea24724f9d5ce3212292fac291234a760c99c0960b5430d714269efe33554730b5f71208582&token=1141994790&lang=zh_CN#rd)介绍的还不错,直接复制过来,避免重复造轮子了。
数据库连接本质就是一个 socket 的连接。数据库服务端还要维护一些缓存和用户权限信息之类的 所以占用了一些内存。我们可以把数据库连接池是看做是维护的数据库连接的缓存,以便将来需要对数据库的请求时可以重用这些连接。为每个用户打开和维护数据库连接,尤其是对动态数据库驱动的网站应用程序的请求,既昂贵又浪费资源。**在连接池中,创建连接后,将其放置在池中,并再次使用它,因此不必建立新的连接。如果使用了所有连接,则会建立一个新连接并将其添加到池中**。 连接池还减少了用户必须等待建立与数据库的连接的时间。
### 分库分表之后,id 主键如何处理?
因为要是分成多个表之后,每个表都是从 1 开始累加,这样是不对的,我们需要一个全局唯一的 id 来支持。
生成全局 id 有下面这几种方式:
- **UUID**:不适合作为主键,因为太长了,并且无序不可读,查询效率低。比较适合用于生成唯一的名字的标示比如文件的名字。
- **数据库自增 id** : 两台数据库分别设置不同步长生成不重复ID的策略来实现高可用。这种方式生成的 id 有序,但是需要独立部署数据库实例,成本高,还会有性能瓶颈。
- **利用 redis 生成 id :** 性能比较好,灵活方便,不依赖于数据库。但是,引入了新的组件造成系统更加复杂,可用性降低,编码更加复杂,增加了系统成本。
- **Twitter的snowflake算法** Github 地址https://github.com/twitter-archive/snowflake。
- **美团的[Leaf](https://tech.meituan.com/2017/04/21/mt-leaf.html)分布式ID生成系统** Leaf 是美团开源的分布式ID生成器能保证全局唯一性、趋势递增、单调递增、信息安全里面也提到了几种分布式方案的对比但也需要依赖关系数据库、Zookeeper等中间件。感觉还不错。美团技术团队的一篇文章https://tech.meituan.com/2017/04/21/mt-leaf.html 。
- ......
### 一条SQL语句在MySQL中如何执行的
[一条SQL语句在MySQL中如何执行的](<https://mp.weixin.qq.com/s?__biz=Mzg2OTA0Njk0OA==&mid=2247485097&idx=1&sn=84c89da477b1338bdf3e9fcd65514ac1&chksm=cea24962f9d5c074d8d3ff1ab04ee8f0d6486e3d015cfd783503685986485c11738ccb542ba7&token=79317275&lang=zh_CN#rd>)
### MySQL高性能优化规范建议
[MySQL高性能优化规范建议](<https://mp.weixin.qq.com/s?__biz=Mzg2OTA0Njk0OA==&mid=2247485117&idx=1&sn=92361755b7c3de488b415ec4c5f46d73&chksm=cea24976f9d5c060babe50c3747616cce63df5d50947903a262704988143c2eeb4069ae45420&token=79317275&lang=zh_CN#rd>)
### 一条SQL语句执行得很慢的原因有哪些
[腾讯面试一条SQL语句执行得很慢的原因有哪些---不看后悔系列](https://mp.weixin.qq.com/s?__biz=Mzg2OTA0Njk0OA==&mid=2247485185&idx=1&sn=66ef08b4ab6af5757792223a83fc0d45&chksm=cea248caf9d5c1dc72ec8a281ec16aa3ec3e8066dbb252e27362438a26c33fbe842b0e0adf47&token=79317275&lang=zh_CN#rd)
## 公众号
如果大家想要实时关注我更新的文章以及分享的干货的话,可以关注我的公众号。
**《Java面试突击》:** 由本文档衍生的专为面试而生的《Java面试突击》V2.0 PDF 版本[公众号](#公众号)后台回复 **"Java面试突击"** 即可免费领取!
**Java工程师必备学习资源:** 一些Java工程师常用学习资源公众号后台回复关键字 **“1”** 即可免费无套路获取。
![我的公众号](https://my-blog-to-use.oss-cn-beijing.aliyuncs.com/2019-6/167598cd2e17b8ec.png)

View File

@ -486,9 +486,9 @@ public enum Isolation {
因为平时使用 MySQL 数据库比较多,这里再多提一嘴! 因为平时使用 MySQL 数据库比较多,这里再多提一嘴!
MySQL InnoDB 存储引擎的默认支持的隔离级别是 **`REPEATABLE-READ`(可重读)**。我们可以通过`SELECT @@tx_isolation;`命令来查看MySQL 8.0 该命令改为`SELECT @@transaction_isolation;` MySQL InnoDB 存储引擎的默认支持的隔离级别是 **REPEATABLE-READ可重读**。我们可以通过`SELECT @@tx_isolation;`命令来查看MySQL 8.0 该命令改为`SELECT @@transaction_isolation;`
``` ```sql
mysql> SELECT @@tx_isolation; mysql> SELECT @@tx_isolation;
+-----------------+ +-----------------+
| @@tx_isolation | | @@tx_isolation |
@ -497,14 +497,17 @@ mysql> SELECT @@tx_isolation;
+-----------------+ +-----------------+
``` ```
这里需要注意的是:与 SQL 标准不同的地方在于 InnoDB 存储引擎在 **`REPEATABLE-READ`(可重读)** 事务隔离级别下使用的是 Next-Key Lock 锁算法,因此可以避免幻读的产生,这与其他数据库系统(如 SQL Server)是不同的。所以说 InnoDB 存储引擎的默认支持的隔离级别是 **`REPEATABLE-READ`(可重读)** 已经可以完全保证事务的隔离性要求,即达到了 SQL 标准的 **`SERIALIZABLE`(可串行化)** 隔离级别。 ~~这里需要注意的是:与 SQL 标准不同的地方在于 InnoDB 存储引擎在 **REPEATABLE-READ可重读** 事务隔离级别下使用的是Next-Key Lock 锁算法,因此可以避免幻读的产生,这与其他数据库系统(如 SQL Server)是不同的。所以说InnoDB 存储引擎的默认支持的隔离级别是 **REPEATABLE-READ可重读** 已经可以完全保证事务的隔离性要求,即达到了 SQL标准的 **SERIALIZABLE(可串行化)** 隔离级别。~~
因为隔离级别越低,事务请求的锁越少,所以大部分数据库系统的隔离级别都是 **`READ-COMMITTED`(读取提交内容)** :,但是你要知道的是 InnoDB 存储引擎默认使用 **`REPEATABLE-READ`(可重读)** 并不会什么任何性能上的损失。 🐛问题更正:**MySQL InnoDB的REPEATABLE-READ可重读并不保证避免幻读需要应用使用加锁读来保证。而这个加锁度使用到的机制就是 Next-Key Locks。**
更多关于事务隔离级别的内容请看: 因为隔离级别越低,事务请求的锁越少,所以大部分数据库系统的隔离级别都是 **READ-COMMITTED(读取提交内容)** 但是你要知道的是InnoDB 存储引擎默认使用 **REPEAaTABLE-READ可重读** 并不会有任何性能损失。
1. [《一文带你轻松搞懂事务隔离级别(图文详解)》](https://mp.weixin.qq.com/s?__biz=Mzg2OTA0Njk0OA==&mid=2247485085&idx=1&sn=01e5c29c49f32886bc897af7632b34ba&chksm=cea24956f9d5c040a07e4d335219f11f888a2d32444c16cade3f69c294ae0a1e416bcd221fb6&token=1613452699&lang=zh_CN&scene=21#wechat_redirect) InnoDB 存储引擎在 **分布式事务** 的情况下一般会用到 **SERIALIZABLE(可串行化)** 隔离级别。
2. [面试官:你说对 MySQL 事务很熟?那我问你 10 个问题](https://mp.weixin.qq.com/s?__biz=Mzg2OTA0Njk0OA==&mid=2247486625&idx=2&sn=e235dab2757739438b8f33d205a9327f&chksm=cea2436af9d5ca7c9a1a8db9d020f71205687beca23ac958f9c9a711ee0185cab30173ad2b1a&token=1776990505&lang=zh_CN#rd)
🌈拓展一下(以下内容摘自《MySQL技术内幕InnoDB存储引擎(第2版)》7.7章)
> InnoDB存储引擎提供了对XA事务的支持并通过XA事务来支持分布式事务的实现。分布式事务指的是允许多个独立的事务资源transactional resources参与到一个全局的事务中。事务资源通常是关系型数据库系统但也可以是其他类型的资源。全局事务要求在其中的所有参与的事务要么都提交要么都回滚这对于事务原有的ACID要求又有了提高。另外在使用分布式事务时InnoDB存储引擎的事务隔离级别必须设置为SERIALIZABLE。
#### 3.3.3. 事务超时属性 #### 3.3.3. 事务超时属性