1、引言

在我们使用MySQl创建数据表结构时,为了给字符串类型的数据定义数据类型, 一般我们使用的都是char或者varchar, 那么它们到底有什么区别呢?

2、char:定长字符串类型

2.1、char特点

(1)存储空间固定。
(2)长度不够时内部存储使用空格填充。
(3)若字段本身末尾存在空格,检索出来自动截断末尾空格(因为分不清空格是字段含有的还是填充产生的)。
(4)若字段本身前端存在空格,是不会截断的。
(5)当输入的字符长度超过指定长度时,char会截取超出的字符。

例如: 当定义一个字段类型为 char(10),插入的值为"abc"这一字符串时,它们占的空间一样是10个字节,因为剩余7个位置被空格填充。

2.2、适用情况

适合存储很短的或者长度接近同一个长度的字符串。char比 varchar在存取上更具效率,因为它是固定长度。对于非常短的列,char比varchar在存储空间上也更有效率。

测试如下:

drop table if exists Test;

CREATE TABLE Test 
(
    id tinyint(3) unsigned NOT NULL AUTO_INCREMENT,
    username char(10) NOT NULL,
    PRIMARY KEY (id)
);
    
INSERT INTO Test(username) VALUES('test1'),('test2  '),('test3    ');

SELECT username FROM Test;

所以,由上面例子我们可以看出若字段本身末尾存在空格,检索出来自动截断末尾空格。

3、varchar:可变长字符串

3.1、varchar特点

(1)存储空间不固定,根据字段长度决定。
(2)需要额外的1个或2个字节记录字符串的长度,字符串长度小于255字节使用1个字节,否则使用2个。
(3)最大长度为 65535 字节(这里单位是字节而非字符)
(4)如果列可以为null,则需要额外的一个字节作为标志。
(5)最大长度 = 字段长度 + [长度记录:(1或2) B] + [null标志位:1B]

例如: 当定义一个字段类型为 varchar(10),插入的值为"abc"这一字符串时,那么实际存储大小为3个字节,除此之外,varchar还需要使用1个额外字节(因为"abc"字节数<255)来记录字符串的长度。

3.2、适用情况:

字符串列的最大长度比平均长度大很多。使用了像 utf-8 这样复杂的字符集,每个字符都是用不同的字节数存储。

4、char与varchar类型区别

取数据的时候,char类型会去掉末尾多余的空格,而varchar是不会的。

在时间与空间效率方面,char的存取数度要比varchar要快得多,varchar空间利用率要比char更充分。

存储方式方面,char的存储方式是,对英文字符(ASCII)占用1个字节,对一个汉字占用两个字节,而varchar的存储方式是每个英文字符占用2个字节,汉字也占用2个字节。备注:此处待考证

如下所示:

drop table if exists Test;
CREATE TABLE Test 
(
    id tinyint(3) unsigned NOT NULL AUTO_INCREMENT,
    username varchar(10) NOT NULL,
    PRIMARY KEY (id)
);
    
INSERT INTO Test(username) VALUES('test1'),('test2  '),('test3    ');


SELECT username FROM Test;

由上述可以看出取数据的时候,char类型会去掉末尾多余的空格,而varchar是不会的。

所以,从空间上考虑,varchar较合适;从效率上考虑,用char合适。如何使用,还需要根据实际情况查询

5、MySQL5.0.3版本之后varchar类型的变化

MySQL 5.0.3 之前,可存储0-255字节,如:varchar(20)中的20表示字节数,如果存放utf-8编码的话只能放6个汉字。varchar(n),这里的n表示字节数。备注:此处待考证

MySQL 5.0.3 之后,可存储0-65535字节,varchar(20)表示字符数,不管什么编码,汉字总能放20个。但最多占65532字节(两个字节存放长度,小于255字节用1个字节存放长度),varchar(n)这里的n表示字符数,比如varchar(200),不管是英文还是中文都可以存放200个。备注:此处待考证

MySQL中length()、char_length()的区别

(1)length():mysql里面的length()函数是一个用来获取字符串长度的内置函数。
(2)char_length():在mysql内置函数里面查看字符串长度的还有一个函数是char_length()。
(3)这两个函数的区别是:

(a)length(): 单位是字节,utf8编码下,一个汉字三个字节,一个数字或字母一个字节。gbk编码下,一个汉字两个字节,一个数字或字母一个字节。
(b)char_length():单位为字符,不管汉字还是数字或者是字母都算是一个字符。

小技巧:

length()<>char_length(),可以用来检验是否含有中文字符。

utf-8编码中判定某个字段为全英文,length(字段) = char_length(字段)即可。

标签: none

[2024年]-[红黑树技术联盟介绍]-[成员故事]


[2024年]-[JavaOffer]-[训练营]


添加新评论