存储引擎

数据存储

数据页在磁盘怎么存

在MySQL中,实际负责存储和查询的模块称为存储引擎。不同的存储引擎,对数据的存储和读取方式是不同的。MySQL支持多种存储引擎,甚至可以为每张表单独设置不同的存储引擎

数据都是保存在磁盘中的,但是其处理是需要首先加载到内存的。从磁盘读取是非常耗时的IO操作,为了减少对磁盘的读取次数,InnoDB采用页而不是行的粒度来保存数据,也就是数据被分为若干页,然后以页为单位保存在磁盘中。InnoDB的页大小,一般是16KB

设置系统默认的存储引擎

查看默认的默认存储引擎

1
2
3
show variable like '%storage_engine%';
#或
SELECT @@default_storage_engine;

修改默认的存储引擎

如果在创建表的语句中没有显式指定表的存储引擎的话,那就会默认使用 InnoDB 作为表的存储引擎。如果我们想改变表的默认存储引擎的话,可以这样写启动服务器的命令行:

1
SET DEFAULT_STORAGE_ENGINE=MyISAM;

或者修改my.cnf文件:

1
2
3
4
default-storage-engine=MyISAM 

# 重启服务
systemctl restart mysqld.service

设置表的存储引擎

存储引擎是负责对表中的数据进行提取和写入工作的,我们可以为 不同的表设置不同的存储引擎 ,也就是说不同的表可以有不同的物理存储结构,不同的提取和写入方式。

创建表的存储引擎

我们之前创建表的语句都没有指定表的存储引擎,那就会使用默认的存储引擎 InnoDB 。如果我们想显式的指定一下表的存储引擎,那可以这么写:

1
2
3
CREATE TABLE 表名(
建表语句;
)ENGINE=存储引擎名称;

修改表的存储引擎

1
2
3
ALTER TABLE 表名=存储引擎名称;
#查看表结构
SHOW CREATE TABLE engine_demo_table\G

引擎介绍

InnoDB引擎:具有外键支持功能的事务存储引擎

  • MySQL3.23.34a开始就包含InnoDB存储引擎。 大于等于5.5之后,默认采用InnoDB引擎`。
  • InnoDBMySQL的默认事务型引擎,它被设计用来处理大量的短期(short-lived)事务。可以确保事务的完整提交(Commit)和回滚(Rollback)
  • 除了增加和查询外,还需要更新、删除操作,那么,应优先选择InnoDB存储引擎。
  • 除非有非常特别的原因需要使用其他的存储引擎,否则应该优先考虑InnoDB引擎。
  • 数据文件结构:
    • 表名.frm 存储表结构(MySQL8.0时,合并在表名.ibd中)
    • 表名.ibd 存储数据和索引
  • InnoDB是 为处理巨大数据量的最大性能设计`。
    • 在以前的版本中,字典数据以元数据文件、非事务表等来存储。现在这些元数据文件被删除
      了。比如: .frm.par.trn.isl.db.opt 等都在MySQL8.0中不存在了。
  • 对比MyISAM的存储引擎, InnoDB写的处理效率差一些,并且会占用更多的磁盘空间以保存数据和索引。
  • MyISAM只缓存索引,不缓存真实数据;InnoDB不仅缓存索引还要缓存真实数据,对内存要求较 高,而且内存大小对性能有决定性的影响。

MyISAM引擎:主要的非事务处理存储引擎

  • MyISAM提供了大量的特性,包括全文索引、压缩、空间函数(GIS)等,但MyISAM 不支持事务行级锁外键 ,有一个毫无疑问的缺陷就是崩溃后无法安全恢复 。
  • 5.5之前默认的存储引擎
  • 优势是访问的速度快,对事务完整性没有要求或者以SELECTINSERT为主的应用
  • 针对数据统计有额外的常数存储。故而 count(*) 的查询效率很高
  • 数据文件结构:(在《第02章_MySQL数据目录》章节已讲)
    • 表名.frm 存储表结构
    • 表名.MYD 存储数据 (MYData)
    • 表名.MYI 存储索引 (MYIndex)
  • 应用场景:只读应用或者以读为主的业务

Memory引擎:置于内存的表

概述

Memory采用的逻辑介质是 内存响应速度很快 ,但是当mysqld守护进程崩溃的时候 数据会丢失 。另外,要求存储的数据是数据长度不变的格式,比如,Blob和Text类型的数据不可用(长度不固定的)。

主要特征

  • Memory同时 支持哈希(HASH)索引B+树索引
    • 哈希索引相等的比较快,但是对于范围的比较慢很多。
    • 默认使用哈希(HASH)索引,其速度要比使用B型树(BTREE)索引快。
    • 如果希望使用B树索引,可以在创建索引时选择使用。
  • Memory表至少比MyISAM表要 快一个数量级
  • MEMORY 表的大小是受到限制的。表的大小主要取决于两个参数,分别是 max_rowsmax_heap_table_size 。其中,max_rows可以在创建表时指定;max_heap_table_size的大小默认为16MB,可以按需要进行扩大。
  • 数据文件与索引文件分开存储。
    • 每个基于MEMORY存储引擎的表实际对应一个磁盘文件,该文件的文件名与表名相同,类型为frm 类型,该文件中只存储表的结构,而其数据文件都是存储在内存中的。
    • 这样有利于数据的快速处理,提供整个表的处理效率。
  • 缺点:其数据易丢失,生命周期短。基于这个缺陷,选择MEMORY存储引擎时需要特别小心。

使用Memory存储引擎的场景

  1. 目标数据比较小 ,而且非常 频繁的进行访问 ,在内存中存放数据,如果太大的数据会造成 内存溢出 。可以通过参数 max_heap_table_size 控制Memory表的大小,限制Memory表的最大的大小。
  2. 如果 数据是临时的 ,而且 必须立即可用 得到,那么就可以放在内存中。
  3. 存储在Memory表中的数据如果突然间 丢失的话也没有太大的关系