MySQL基礎(chǔ)教程3 —— 數(shù)據(jù)類型之字符串類型
字符串類型指CHAR、VARCHAR、BINARY、VARBINARY、BLOB、TEXT、ENUM和SET。該節(jié)描述了這些類型如何工作以及如何在查詢中使用這些類型。
1.CHAR和VARCHAR類型CHAR和VARCHAR類型類似,但它們保存和檢索的方式不同。它們的最大長度和是否尾部空格被保留等方面也不同。在存儲或檢索過程中不進行大小寫轉(zhuǎn)換。
CHAR和VARCHAR類型聲明的長度表示你想要保存的最大字符數(shù)。例如,CHAR(30)可以占用30個字符。
CHAR列的長度固定為創(chuàng)建表時聲明的長度。長度可以為從0到255的任何值。當(dāng)保存CHAR值時,在它們的右邊填充空格以達到指定的長度。當(dāng)檢索到CHAR值時,尾部的空格被刪除掉。在存儲或檢索過程中不進行大小寫轉(zhuǎn)換。
VARCHAR列中的值為可變長字符串。長度可以指定為0到65,535之間的值。(VARCHAR的最大有效長度由最大行大小和使用的字符集確定。整體最大長度是65,532字節(jié))。
同CHAR對比,VARCHAR值保存時只保存需要的字符數(shù),另加一個字節(jié)來記錄長度(如果列聲明的長度超過255,則使用兩個字節(jié))。
VARCHAR值保存時不進行填充。當(dāng)值保存和檢索時尾部的空格仍保留,符合標(biāo)準(zhǔn)SQL。
如果分配給CHAR或VARCHAR列的值超過列的最大長度,則對值進行裁剪以使其適合。如果被裁掉的字符不是空格,則會產(chǎn)生一條警告。如果裁剪非空格字符,則會造成錯誤(而不是警告)并通過使用嚴(yán)格SQL模式禁用值的插入。
下面的表顯示了將各種字符串值保存到CHAR(4)和VARCHAR(4)列后的結(jié)果,說明了CHAR和VARCHAR之間的差別:
值CHAR(4)存儲需求VARCHAR(4)存儲需求’’’’4個字節(jié)’’1個字節(jié)’ab’’ab’4個字節(jié)’ab ’3個字節(jié)’abcd’’abcd’4個字節(jié)’abcd’5個字節(jié)’abcdefgh’’abcd’4個字節(jié)’abcd’5個字節(jié)請注意上表中最后一行的值只適用不使用嚴(yán)格模式時;如果MySQL運行在嚴(yán)格模式,超過列長度不的值不保存,并且會出現(xiàn)錯誤。
從CHAR(4)和VARCHAR(4)列檢索的值并不總是相同,因為檢索時從CHAR列刪除了尾部的空格。通過下面的例子說明該差別:
mysql> CREATE TABLE vc (v VARCHAR(4), c CHAR(4));Query OK, 0 rows affected (0.02 sec)mysql> INSERT INTO vc VALUES (’ab ’, ’ab ’);Query OK, 1 row affected (0.00 sec)mysql> SELECT CONCAT(v, ’+’), CONCAT(c, ’+’) FROM vc;+----------------+----------------+| CONCAT(v, ’+’) | CONCAT(c, ’+’) |+----------------+----------------+| ab + | ab+ |+----------------+----------------+1 row in set (0.00 sec)
根據(jù)分配給列的字符集校對規(guī)則對CHAR和VARCHAR列中的值進行排序和比較。
請注意所有MySQL校對規(guī)則屬于PADSPACE類。這說明在MySQL中的所有CHAR和VARCHAR值比較時不需要考慮任何尾部空格。例如:
mysql> CREATE TABLE names (myname CHAR(10), yourname VARCHAR(10));Query OK, 0 rows affected (0.09 sec)mysql> INSERT INTO names VALUES (’Monty ’, ’Monty ’);Query OK, 1 row affected (0.00 sec)mysql> SELECT myname = ’Monty ’, yourname = ’Monty ’ FROM names;+--------------------+----------------------+| myname = ’Monty ’ | yourname = ’Monty ’ |+--------------------+----------------------+| 1 | 1 |+--------------------+----------------------+1 row in set (0.00 sec)
請注意所有MySQL版本均如此,并且它不受SQL服務(wù)器模式的影響。
對于尾部填充字符被裁剪掉或比較時將它們忽視掉的情形,如果列的索引需要唯一的值,在列內(nèi)插入一個只是填充字符數(shù)不同的值將會造成復(fù)制鍵值錯誤。
CHAR BYTE是CHAR BINARY的別名。這是為了保證兼容性。
ASCII屬性為CHAR列分配latin1字符集。UNICODE屬性分配ucs2字符集。
2.BINARY和VARBINARY類型BINARY和VARBINARY類類似于CHAR和VARCHAR,不同的是它們包含二進制字符串而不要非二進制字符串。也就是說,它們包含字節(jié)字符串而不是字符字符串。這說明它們沒有字符集,并且排序和比較基于列值字節(jié)的數(shù)值值。
BINARY和VARBINARY允許的最大長度一樣,如同CHAR和VARCHAR,不同的是BINARY和VARBINARY的長度是字節(jié)長度而不是字符長度。
BINARY和VARBINARY數(shù)據(jù)類型不同于CHAR BINARY和VARCHAR BINARY數(shù)據(jù)類型。對于后一種類型,BINARY屬性不會將列視為二進制字符串列。相反,它致使使用列字符集的二元 校對規(guī)則,并且列自身包含非二進制字符字符串而不是二進制字節(jié)字符串。例如CHAR(5) BINARY被視為CHAR(5) CHARACTER SET latin1 COLLATE latin1_bin,假定默認字符集是latin1。這不同于BINARY(5),它保存5字節(jié)二進制字符串,沒有字符集或 校對規(guī)則。
當(dāng)保存BINARY值時,在它們右邊填充值以達到指定長度。填充值是0x00(零字節(jié))。插入值時在右側(cè)添加0x00on,并且選擇時不刪除尾部的字節(jié)。比較時所有字節(jié)很重要,包括ORDER BY和DISTINCT操作。比較時0x00字節(jié)和空格是不同的,0x00<空格。
例如:對于一個BINARY(3)列,當(dāng)插入時’a’變?yōu)椤痑0’。’a0’插入時變?yōu)椤痑00’。當(dāng)選擇時兩個插入的值均不更改。
對于VARBINARY,插入時不填充字符,選擇時不裁剪字節(jié)。比較時所有字節(jié)很重要,包括ORDER BY和DISTINCT操作。比較時0x00字節(jié)和空格是不同的,0x00<空格。
對于尾部填充字符被裁剪掉或比較時將它們忽視掉的情形,如果列的索引需要唯一的值,在列內(nèi)插入一個只是填充字符數(shù)不同的值將會造成復(fù)制鍵值錯誤。
如果你計劃使用這些數(shù)據(jù)類型來保存二進制數(shù)據(jù)并且需要檢索的值與保存的值完全相同,應(yīng)考慮前面所述的填充和裁剪特征。下面的例子說明了用0x00填充的BINARY值如何影響列值比較:
mysql> CREATE TABLE t (c BINARY(3));Query OK, 0 rows affected (0.01 sec)mysql> INSERT INTO t SET c = ’a’;Query OK, 1 row affected (0.01 sec)mysql> SELECT HEX(c), c = ’a’, c = ’a00’ from t;+--------+---------+-------------+| HEX(c) | c = ’a’ | c = ’a00’ |+--------+---------+-------------+| 610000 | 0 | 1 |+--------+---------+-------------+1 row in set (0.09 sec)
如果檢索的值必須與指定進行存儲而沒有填充的值相同,最好使用BLOB數(shù)據(jù)類型。
創(chuàng)建表時,MySQL可以默默更改BINARY或VARBINARY列的類型。
3.BLOB和TEXT類型BLOB是一個二進制大對象,可以容納可變數(shù)量的數(shù)據(jù)。有4種BLOB類型:TINYBLOB、BLOB、MEDIUMBLOB和LONGBLOB。它們只是可容納值的最大長度不同。
有4種TEXT類型:TINYTEXT、TEXT、MEDIUMTEXT和LONGTEXT。這些對應(yīng)4種BLOB類型,有相同的最大長度和存儲需求。
BLOB列被視為二進制字符串(字節(jié)字符串)。TEXT列被視為非二進制字符串(字符字符串)。BLOB列沒有字符集,并且排序和比較基于列值字節(jié)的數(shù)值值。TEXT列有一個字符集,并且根據(jù)字符集的 校對規(guī)則對值進行排序和比較。
在TEXT或BLOB列的存儲或檢索過程中,不存在大小寫轉(zhuǎn)換。
當(dāng)未運行在嚴(yán)格模式時,如果你為BLOB或TEXT列分配一個超過該列類型的最大長度的值值,值被截取以保證適合。如果截掉的字符不是空格,將會產(chǎn)生一條警告。使用嚴(yán)格SQL模式,會產(chǎn)生錯誤,并且值將被拒絕而不是截取并給出警告。
在大多數(shù)方面,可以將BLOB列視為能夠足夠大的VARBINARY列。同樣,可以將TEXT列視為VARCHAR列。BLOB和TEXT在以下幾個方面不同于VARBINARY和VARCHAR:
·當(dāng)保存或檢索BLOB和TEXT列的值時不刪除尾部空格。(這與VARBINARY和VARCHAR列相同)。
請注意比較時將用空格對TEXT進行擴充以適合比較的對象,正如CHAR和VARCHAR。
·對于BLOB和TEXT列的索引,必須指定索引前綴的長度。對于CHAR和VARCHAR,前綴長度是可選的。
·BLOB和TEXT列不能有 默認值。
LONG和LONG VARCHAR對應(yīng)MEDIUMTEXT數(shù)據(jù)類型。這是為了保證兼容性。如果TEXT列類型使用BINARY屬性,將為列分配列字符集的二元 校對規(guī)則。
MySQL連接程序/ODBC將BLOB值定義為LONGVARBINARY,將TEXT值定義為LONGVARCHAR。
由于BLOB和TEXT值可能會非常長,使用它們時可能遇到一些約束:
·當(dāng)排序時只使用該列的前max_sort_length個字節(jié)。max_sort_length的 默認值是1024;該值可以在啟動mysqld服務(wù)器時使用--max_sort_length選項進行更改。
運行時增加max_sort_length的值可以在排序或組合時使更多的字節(jié)有意義。任何客戶端可以更改其會話max_sort_length變量的值:
mysql> SET max_sort_length = 2000;mysql> SELECT id, comment FROM tbl_name -> ORDER BY comment;
當(dāng)你想要使超過max_sort_length的字節(jié)有意義,對含長值的BLOB或TEXT列使用GROUP BY或ORDER BY的另一種方式是將列值轉(zhuǎn)換為固定長度的對象。標(biāo)準(zhǔn)方法是使用SUBSTRING函數(shù)。例如,下面的語句對comment列的2000個字節(jié)進行排序:
mysql> SELECT id, SUBSTRING(comment,1,2000) FROM tbl_name -> ORDER BY SUBSTRING(comment,1,2000);
·BLOB或TEXT對象的最大大小由其類型確定,但在客戶端和服務(wù)器之間實際可以傳遞的最大值由可用內(nèi)存數(shù)量和通信緩存區(qū)大小確定。你可以通過更改max_allowed_packet變量的值更改消息緩存區(qū)的大小,但必須同時修改服務(wù)器和客戶端程序。例如,可以使用mysql和mysqldump來更改客戶端的max_allowed_packet值。
每個BLOB或TEXT值分別由內(nèi)部分配的對象表示。這與其它列類型形成對比,后者是當(dāng)打開表時為每1列分配存儲引擎。
4.ENUM類型ENUM是一個字符串對象,其值來自表創(chuàng)建時在列規(guī)定中顯式枚舉的一列值。
在某些情況下,ENUM值也可以為空字符串(’’)或NULL:
·如果你將一個非法值插入ENUM(也就是說,允許的值列之外的字符串),將插入空字符串以作為特殊錯誤值。該字符串與“普通”空字符串不同,該字符串有數(shù)值值0。后面有詳細討論。
·如果將ENUM列聲明為允許NULL,NULL值則為該列的一個有效值,并且 默認值為NULL。如果ENUM列被聲明為NOT NULL,其默認值為允許的值列的第1個元素。
每個枚舉值有一個索引:
·來自列規(guī)定的允許的值列中的值從1開始編號。
·空字符串錯誤值的索引值是0。這說明你可以使用下面的SELECT語句來找出分配了非法ENUM值的行:
·mysql> SELECT * FROM tbl_name WHERE enum_col=0;
·NULL值的索引是NULL。
例如,定義為ENUM的列(’one’,’two’,’three’)可以有下面所示任何值。還顯示了每個值的索引:
值索引NULLNULL’’0’one’1’two’2’three’3枚舉最多可以有65,535個元素。
當(dāng)創(chuàng)建表時,ENUM成員值的尾部空格將自動被刪除。
當(dāng)檢索時,保存在ENUM列的值使用列定義中所使用的大小寫來顯示。請注意可以為ENUM列分配字符集和 校對規(guī)則。對于二進制或大小寫敏感的校對規(guī)則,當(dāng)為列分配值時應(yīng)考慮大小寫。
如果在數(shù)值上下文中檢索一個ENUM值,將返回列值的索引。例如,你可以這樣從ENUM列搜索數(shù)值值:
mysql> SELECT enum_col+0 FROM tbl_name;
如果將一個數(shù)字保存到ENUM列,數(shù)字被視為索引,并且保存的值是該索引對應(yīng)的枚舉成員。(但是,這不適合LOAD DATA,它將所有輸入視為字符串)。不建議使用類似數(shù)字的枚舉值來定義一個ENUM列,因為這很容易引起混淆。例如,下面的列含有字符串值’0’、’1’和’2’的枚舉成員,但數(shù)值索引值為1、2和3:
numbers ENUM(’0’,’1’,’2’)
根據(jù)枚舉成員在列定義中列出的順序?qū)NUM值進行排序。(換句話說,ENUM值根據(jù)索引編號進行排序)。例如,對于ENUM(’a’,’b’),’a’排在’b’前面,但對于ENUM(’b’,’a’),’b’排在’a’前面。空字符串排在非空字符串前面,并且NULL值排在所有其它枚舉值前面。要想防止意想不到的結(jié)果,按字母順序規(guī)定ENUM列。還可以使用GROUP BY CAST(col AS CHAR)或GROUP BY CONCAT(col)來確保按照詞匯對列進行排序而不是用索引數(shù)字。
如果你想要確定一個ENUM列的所有可能的值,使用SHOW COLUMNS FROMtbl_nameLIKEenum_col,并解析輸出中第2列的ENUM定義。
5.SET類型SET是一個字符串對象,可以有零或多個值,其值來自表創(chuàng)建時規(guī)定的允許的一列值。指定包括多個SET成員的SET列值時各成員之間用逗號(‘,’)間隔開。這樣SET成員值本身不能包含逗號。
例如,指定為SET(’one’, ’two’) NOT NULL的列可以有下面的任何值:
’’’one’’two’’one,two’
SET最多可以有64個不同的成員。
當(dāng)創(chuàng)建表時,SET成員值的尾部空格將自動被刪除。
當(dāng)檢索時,保存在SET列的值使用列定義中所使用的大小寫來顯示。請注意可以為SET列分配字符集和 校對規(guī)則。對于二進制或大小寫敏感的校對規(guī)則,當(dāng)為列分配值時應(yīng)考慮大小寫。
MySQL用數(shù)字保存SET值,所保存值的低階位對應(yīng)第1個SET成員。如果在數(shù)值上下文中檢索一個SET值,檢索的值的位設(shè)置對應(yīng)組成列值的SET成員。例如,你可以這樣從一個SET列檢索數(shù)值值:
mysql> SELECT set_col+0 FROM tbl_name;
如果將一個數(shù)字保存到SET列中,數(shù)字中二進制表示中的位確定了列值中的SET成員。對于指定為SET(’a’,’b’,’c’,’d’)的列,成員有下面的十進制和二進制值:
SET成員十進制值二進制值’a’10001’b’20010’c’40100’d’81000如果你為該列分配一個值9,其二進制形式為1001,因此第1個和第4個SET值成員’a’和’d’被選擇,結(jié)果值為’a,d’。
對于包含多個SET元素的值,當(dāng)插入值時元素所列的順序并不重要。在值中一個給定的元素列了多少次也不重要。當(dāng)以后檢索該值時,值中的每個元素出現(xiàn)一次,根據(jù)表創(chuàng)建時指定的順序列出元素。例如,假定某個列指定為SET(’a’,’b’,’c’,’d’):
mysql> CREATE TABLE myset (col SET(’a’, ’b’, ’c’, ’d’));
插入值’a,d’、’d,a’、’a,d,d’、’a,d,a’和’d,a,d’:
mysql> INSERT INTO myset (col) VALUES -> (’a,d’), (’d,a’), (’a,d,a’), (’a,d,d’), (’d,a,d’);Query OK, 5 rows affected (0.01 sec)Records: 5 Duplicates: 0 Warnings: 0
當(dāng)檢索時所有這些值顯示為’a,d’:
mysql> SELECT col FROM myset;+------+| col |+------+| a,d || a,d || a,d || a,d || a,d |+------+5 rows in set (0.04 sec)
如果將SET列設(shè)置為一個不支持的值,則該值被忽略并發(fā)出警告:
mysql> INSERT INTO myset (col) VALUES (’a,d,d,s’);Query OK, 1 row affected, 1 warning (0.03 sec)mysql> SHOW WARNINGS;+---------+------+------------------------------------------+| Level | Code | Message |+---------+------+------------------------------------------+| Warning | 1265 | Data truncated for column ’col’ at row 1 |+---------+------+------------------------------------------+1 row in set (0.04 sec)mysql> SELECT col FROM myset;+------+| col |+------+| a,d || a,d || a,d || a,d || a,d || a,d |+------+6 rows in set (0.01 sec)
SET值按數(shù)字順序排序。NULL值排在非NULLSET值的前面。
通常情況,可以使用FIND_IN_SET()函數(shù)或LIKE操作符搜索SET值:
mysql> SELECT * FROM tbl_name WHERE FIND_IN_SET(’value’,set_col)>0;mysql> SELECT * FROM tbl_name WHERE set_col LIKE ’%value%’;
第1個語句找出SET_col包含valueset成員的行。第2個類似,但有所不同:它在其它地方找出set_col包含value的行,甚至是在另一個SET成員的子字符串中。
下面的語句也是合法的:
mysql> SELECT * FROM tbl_name WHERE set_col & 1;mysql> SELECT * FROM tbl_name WHERE set_col = ’val1,val2’;
第1個語句尋找包含第1個set成員的值。第2個語句尋找一個確切匹配的值。應(yīng)注意第2類的比較。將set值與’val1,val2’比較返回的結(jié)果與同’val2,val1’比較返回的結(jié)果不同。指定值時的順序應(yīng)與在列定義中所列的順序相同。
如果想要為SET列確定所有可能的值,使用SHOW COLUMNS FROMtbl_nameLIKEset_col并解析輸出中第2列的SET定義。
相關(guān)文章:
1. Windwos下MySQL 64位壓縮包的安裝方法學(xué)習(xí)記錄2. MySQL存儲過程例子(包含事務(wù)、參數(shù)、嵌套調(diào)用、游標(biāo)循環(huán)等)3. Mysql入門系列:建立MYSQL客戶機程序的一般過程4. mysql innodb的重要組件匯總5. mysql啟動時報錯 ERROR! Manager of pid-file quit without6. 啟動MYSQL出錯 Manager of pid-file quit without updating file.7. Windows下不能啟動mysql服務(wù)--錯誤總結(jié)8. 巧用SQL語言在ACCESS數(shù)據(jù)庫中批量替換內(nèi)容9. [Oracle]數(shù)據(jù)庫訪問限制繞過漏洞10. 在SQL Server中謹(jǐn)慎導(dǎo)入導(dǎo)出大容量數(shù)據(jù)(一)
