|
数据库三范式
1.第一范式: 确保每列的原子性,每列都是不可分割的最小数据单元。
2.第二范式: 在第一范式的基础上,要求每列都和主键相关。
3.第三范式: 在第二范式的基础上,要求其他列和主键是直接相关,而不是间接相关。
分别说一下范式和反范式的优缺点
1.范式化
优点:
· 减少数据冗余
· 表中重复数据较少,更新操作比较快
· 范式化的表通常比反范式化的表小
缺点:
· 在查询的时候通常需要很多的关联,降低性能
· 增加了索引优化的难度
2.反范式化
优点:
· 可以减少表的关联
· 更好的进行索引优化
缺点:
· 数据重复冗余
· 对数据表的修改需要更多的成本
[url=]Mysql[/url] 数据库索引。B+ 树和 B 树的区别
MySQL数据库索引和存储引擎有关,MyISAM和InnoDB只支持BTREE索引。MEMORY和HEAP支持HASH和BTREE索引
B+树和B树的区别
· B+树非叶子节点只存储关键字和指向子节点的指针,而B树还存储了数据,在同样大小的情况下,B+树可以存储更多的关键字
· B+树叶子节点存储了所有关键字和数据,并且多个节点用链表连接。可以快速支撑范围查找
· B+树非叶子节点不存储数据,所以查询时间复杂度固定为O(logN),B树查询时间复杂度不固定,最好是O(1)
聚簇索引和非聚簇索引
· 聚簇索引,又叫主键索引,每个表只有一个主键索引,叶子节点保存主键的值和数据。
· 非聚簇索引,又叫辅助索引,叶子节点保存索引字段的值和主键的值。
前缀索引和覆盖索引
1.前缀索引
对于列的值较长,比如BLOB、TEXT、VARCHAR,就必须建立前缀索引,即将值的前一部分作为索引。这样既可以节约空间,又可以提高查询效率。但无法使用前缀索引做 ORDER BY 和 GROUP BY,也无法使用前缀索引做覆盖扫描。
2.覆盖索引
select的数据列从索引中就能获得,不必再从数据表中读取。如果一个索引包含了(或覆盖了)满足查询语句中字段与条件的数据就叫 做覆盖索引。
当发起一个被索引覆盖的查询(也叫作索引覆盖查询)时,在EXPLAIN的Extra列可以看到“Using index”的信息。
Mysql 什么情况会造成脏读、不可重复读、幻读?如何解决?
· 脏读:有两个事务A和B,A读取已经被B修改但未提交的字段,此时B回滚,那么A读取的字段就是临时且无效的。可以提高隔离级别,改成读已提交
· 不可重复读: 有两个事务A和B,A读取了一个字段值,然后B更新并且提交事务,A再重新读取这个字段,就和之前不相等了。可以提高隔离级别,改成可重复读
· 幻读: 有两个事务A和B,A读取某个范围内的[url=]记录[/url]时,B又在该范围内插入了新的记录并提交,当事务A再次读取该范围的记录时,会产生幻行。可以升级隔离级别到串行化,或者使用 MVCC + next-key锁机制实现
Mysql 在可重复读的隔离级别下会不会有幻读的情况,为什么?
不会。InnoDB存储引擎默认隔离级别为RR,通过MVCC + next-key锁机制解决了幻读的问题。
PS:其实严格来说,是存在幻读的。。。可以尝试一下这个操作,A开启事务,执行查询,此时B开启事务新增一条数据并提交,此时A再查询,发现没有幻读,但是如果A执行一个update操作,再查询,会发现出现了幻读。我认为应该是A在执行update操作的时候,新建了一条创建版本号为A事务版本号的记录,然后标记B事务创建的记录为待删除的,查询的版本号依据是删除版本号为空或大于当前版本号,并且创建版本号小于等于当前事务版本号,那么这里刚刚A更新的这条数据,显然也符合查询的条件,所以也会被查出来。
Mysql 事务是如何实现的
· 原子性:通过undo log实现的。每条数据变更都伴随一条undo log日志的生成,当系统发生错误或执行回滚根据undo log做逆向操作。
· 持久性:通过redo log实现的。redo log记录了数据的修改日志。数据持久化到磁盘,先是储存到缓冲池里,然后缓冲池中的数据定期同步到磁盘中,如果系统宕机,可能会丢失数据,系统重启后会读取redo log恢复数据。
· 隔离性:mysql数据库通过MVCC + next-key机制实现了隔离性。
· 一致性:以上3大特性,保障了事务的一致性。
Binlog 和 Redo log 的区别是什么,分别是什么用?
· binlog是二进制文件,记录了对数据库执行更改的所有操作,不包括 select、show,因为这两个操作没有对数据本身做修改。但是若操作了数据,但是数据没有发生变化,也会记录到binlog。常用来数据恢复,数据备份。
· redo log又叫做重做日志文件,记录了事务的修改,不管事务是否提交都记录下来。在实例和介质失败时,InnoDB存储引擎会使用redo log恢复到之前的状态,保证数据的完整性
谈一谈 MVCC 多版本并发控制
MVCC是通过在每行记录后面保存两个隐藏的列来实现的。这两个列,一个保存了行的创建时间,一个保存行的过期时间(或删除时间)。当然存储的并不是实际的时间值,而是系统版本号(system version number)。每开始一个新的事务,系统版本号都会自动递增。事务开始时刻的系统版本号会作为事务的版本号,用来和查询到的每行记录的版本号进行比较。
SELECT
InnoDB会根据以下两个条件检查每行记录:
1.InnoDB只查找版本早于当前事务版本的数据行(也就是,行的系统版本号小于或等于事务的系统版本号),这样可以确保事务读取的行,要么是在事务开始前已经存在的,要么是事务自身插入或者修改过的。
2.行的删除版本要么未定义,要么大于当前事务版本号。这可以确保事务读取到的行,在事务开始之前未被删除。
只有符合上述两个条件的记录,才能返回作为查询结果:
- <span style="background-color: rgb(255, 255, 255);"> </span>INSERT<div style="margin-right: auto; margin-left: auto; line-height: 24px;"> InnoDB为新插入的每一行保存当前系统版本号作为行版本号。</div><div style="margin-right: auto; margin-left: auto; line-height: 24px;"> DELETE</div><div style="margin-right: auto; margin-left: auto; line-height: 24px;"> InnoDB为删除的每一行保存当前系统版本号作为行删除标识。</div><div style="margin-right: auto; margin-left: auto; line-height: 24px;"> UPDATE</div><div style="margin-right: auto; margin-left: auto; line-height: 24px;"> InnoDB为插入一行新记录,保存当前系统版本号作为行版本号,同时保存当前系统版本号到原来的行作为行删除标识。</div>
复制代码 Innodb 和 MyISAM 的区别是什么
1.Innodb 支持事务。MyISAM 不支持
2.Innodb 支持外键。MyISAM 不支持
3.Innodb 主键索引的叶子节点是数据文件,辅助索引的叶子节点是主键的值。MyISAM 的主键索引和辅助索引,叶子节点都是数据文件的指针
4.Innodb 不保存表的行数,执行 select count(*) from tb需要全表扫描。MyISAM 用一个变量保存了整个表的行数,执行上述语句只需要读取该变量,速度很快
5.Innodb 所有的表在磁盘上保存在一个文件中。MyISAM 存储成三个文件。
6.Innodb 需要更多的内存和存储。MyISAM 可被压缩,存储空间较小。
7.Innodb 移植方案拷贝文件、备份 binlog,或者用 mysqldump,移植较困难。MyISAM 数据以文件形式存储,在备份和回复时可以单独针对表进行操作
8.Innodb 支持行锁、表锁。MyISAM 支持表锁
9.Innodb 在5.7版本之前不支持全文索引。MyISAM 支持全文索引
Innodb 的默认加锁方式是什么,是怎么实现的
· Innodb默认加锁方式是行级锁
· 通过给索引上的索引项加锁来实现的
如何高效处理大库 DDL
DDL是值数据定义语句,即建表,建视图这种,所以这里的问题,我认为可能是考察建表的时候注意事项。
比如数据字段的定义,遵循从小原则。表的创建,降低耦合。
这道题不是很明白,欢迎留言讨论。
(未完待续))
|
|