上一篇文章《MySQL 8.0 JSON增强到底有多强?(一)》,我们简单介绍了MySQL中JSON数据类型,相信大家对JSON数据类型有了一定的了解,那么今天我们来简单看下如何在JSON列上添加索引?
InnoDB支持虚拟生成列的二级索引。不支持其他索引类型。在虚拟列上定义的二级索引有时称为“虚拟索引”。
二级索引可以在一个或多个虚拟列上创建,也可以在虚拟列和常规列或存储的生成列的组合上创建。包含虚拟列的二级索引可以定义为UNIQUE。
在虚拟生成的列上创建辅助索引时,生成的列值将在索引的记录中具体化。如果索引是覆盖索引(包含查询检索到的所有列的索引),则从索引结构中的物化值检索生成的列值,而不是“动态”计算。
在虚拟列上使用二级索引时,由于在操作期间INSERT和 UPDATE操作期间在二级索引记录中实现虚拟列值时要执行计算,因此要考虑额外的写入成本。即使有额外的写入成本,虚拟列上的二级索引也可能比生成的存储列更好,后者在聚簇索引中实现,从而导致需要更多磁盘空间和内存的较大表。如果未在虚拟列上定义二级索引,则读取会产生额外成本,因为每次检查列的行时都必须计算虚拟列值。
对索引的虚拟列的值进行MVCC记录,以避免在回滚或清除操作期间对生成的列值进行不必要的重新计算。对于 COMPACT和REDUNDANT格式,记录值的数据长度受索引键限制767字节,对于DYNAMIC和 COMPRESSED列格式,受索引键限制3072字节。
在虚拟列上添加或删除二级索引是就地操作。
通过索引生成列以提供JSON列索引
JSON 不能直接对列进行索引。要创建间接引用此类列的索引,可以定义一个生成列,该列提取应建立索引的信息,然后在生成的列上创建索引,如下所示:
说明:8.0和5.7都支持在生成列上添加索引
mysql>CREATE TABLE jemp ( -> c JSON, -> g INT GENERATED ALWAYS AS (c->"$.id"), -> INDEX i (g) -> ); Query OK, 0 rows affected (0.01 sec) 查看表结构: 8.0表结构: mysql >show create table jemp\G *************************** 1. row *************************** Table: jemp Create Table: CREATE TABLE `jemp` ( `c` json DEFAULT NULL, `g` int GENERATED ALWAYS AS (json_extract(`c`,_utf8mb3'$.id')) VIRTUAL, KEY `i` (`g`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8 1 row in set (0.00 sec) 5.7表结构: mysql>show create table jemp\G *************************** 1. row *************************** Table: jemp Create Table: CREATE TABLE `jemp` ( `c` json DEFAULT NULL, `g` int(11) GENERATED ALWAYS AS (json_extract(`c`,'$.id')) VIRTUAL, KEY `i` (`g`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8 1 row in set (0.00 sec) mysql >INSERT INTO jemp (c) VALUES -> ('{"id": "1", "name": "Fred"}'), ('{"id": "2", "name": "Wilma"}'), -> ('{"id": "3", "name": "Barney"}'), ('{"id": "4", "name": "Betty"}'); Query OK, 4 rows affected (0.00 sec) Records: 4 Duplicates: 0 Warnings: 0 mysql >select * from jemp; +-------------------------------+------+ | c | g | +-------------------------------+------+ | {"id": "1", "name": "Fred"} | 1 | | {"id": "2", "name": "Wilma"} | 2 | | {"id": "3", "name": "Barney"} | 3 | | {"id": "4", "name": "Betty"} | 4 | +-------------------------------+------+ 4 rows in set (0.00 sec) mysql >SELECT c->>"$.name" AS name FROM jemp WHERE g > 2; +--------+ | name | +--------+ | Barney | | Betty | +--------+ 2 rows in set (0.00 sec) 查看执行计划: mysql >EXPLAIN SELECT c->>"$.name" AS name FROM jemp WHERE g > 2\G *************************** 1. row *************************** id: 1 select_type: SIMPLE table: jemp partitions: NULL type: range possible_keys: i key: i key_len: 5 ref: NULL rows: 2 filtered: 100.00 Extra: Using where 1 row in set, 1 warning (0.00 sec)
通过上述查看执行计划,可以看到使用到了我们在生成列上创建的索引;
当EXPLAIN在SELECT包含一个或多个使用->or->> 运算符的一个 或其他SQL语句上使用时 ,这些表达式将使用JSON_EXTRACT()和(如果需要)转换为它们的等效项JSON_UNQUOTE(),如SHOW WARNINGS输出所示:
mysql>EXPLAIN SELECT c->>"$.name" FROM jemp WHERE g > 2 ORDER BY c->"$.name"\G *************************** 1. row *************************** id: 1 select_type: SIMPLE table: jemp partitions: NULL type: range possible_keys: i key: i key_len: 5 ref: NULL rows: 2 filtered: 100.00 Extra: Using where; Using filesort 1 row in set, 1 warning (0.00 sec) mysql >SHOW WARNINGS\G *************************** 1. row *************************** Level: Note Code: 1003 Message: /* select#1 */ select json_unquote(json_extract(`wjqdb`.`jemp`.`c`,'$.name')) AS `c->>"$.name"` from `wjqdb`.`jemp` where (`wjqdb`.`jemp`.`g` > 2) order by json_extract(`wjqdb`.`jemp`.`c`,'$.name') 1 row in set (0.00 sec)
在MySQL 8.0.21和更高版本中,还可以JSON使用JSON_VALUE()带有表达式的函数在列上创建索引,该表达式可用于优化使用该表达式的查询;
后面文章我们会介绍如何在 JSON数组上创建索引以及JSON数据类型涉及到的函数等,敬请期待。。。
JSON系列文章
MySQL 8.0新特性:多值索引 –为JSON数组添加索引(三)