c++實例研究

從0開始

C++博客 :: 首頁 :: 新隨筆 :: 聯系 :: 聚合

:: 管理 ::

104 隨筆 :: 0 文章 :: 20 評論 :: 0 Trackbacks

<

2010年11月

>

日

一

二

三

四

五

六

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

1

2

3

4

5

6

7

8

9

10

11

公告

常用鏈接

留言簿(1)

隨筆分類

隨筆檔案

參考

besterChen
Make手冊
高性能編程參考站

我的幾個分站

CSDN站
GoogleAppEngine站
JavaEye站
北郵人站
豆瓣站
新浪站

搜索

閱讀排行榜

評論排行榜

[zz]MySQL 的 collation

MySQL 的 collation 收藏
先轉一別人的學習文章做個引子和基礎
http://logzgh.itpub.net/post/3185/467401

在以前用oracle的時候，很少關于它的collation方法，但是在mysql中，這點不加注意的話，卻有可能會出現問題。

問題是這樣的：
一張test的表，字符集采用的latin1。

取cn象_王的數據,居然把cn陶_陶的數據也取回來了。

這顯然是不允許的。

查看它們的編碼：

(root@im_offlog1a)[test]> select hex('cn陶_陶');
+----------------+
| hex('cn陶_陶') |
+----------------+
| 636ECCD55FCCD5 |
+----------------+
1 row in set (0.00 sec)

(root@im_offlog1a)[test]> select hex('cn象_王');
+----------------+
| hex('cn象_王') |
+----------------+
| 636ECFF35FCDF5 |
+----------------+
1 row in set (0.00 sec)

編碼的確是不一樣的，但是為什么mysql會認為這兩條記錄是一樣的呢？

一開始我們就把問題定位于collation引起的問題。

手工把這些參數修改為latin1_bin，結果居然一樣。這下感覺真是奇怪了。

這里先解釋一下mysql collation的命名規則：
它們以其相關的字符集名開始，通常包括一個語言名，并且以_ci（大小寫不敏感）、_cs（大小寫敏感）或_bin（二元）結束

比如latin1字符集有以下幾種校正規則：

校對規則含義
latin1_german1_ci 德國DIN-1
latin1_swedish_ci 瑞典/芬蘭
latin1_danish_ci 丹麥/挪威
latin1_german2_ci 德國 DIN-2
latin1_bin 符合latin1編碼的二進制
latin1_general_ci 多種語言(西歐)
latin1_general_cs 多種語言(西歐ISO),大小寫敏感
latin1_spanish_ci 現代西班牙

最后我們將表格重建，手工指定表格級別的collation為latin1_bin。
這個問題就得到了解決。

那么問題又來了，為什么我前面手工測試latin1_bin時不生效呢？

原來MySQL按照下面的方式選擇表字符集和校對規則：
如果指定了CHARACTER SET X和COLLATE Y，那么采用CHARACTER SET X和COLLATE Y。
如果指定了CHARACTER SET X而沒有指定COLLATE Y，那么采用CHARACTER SET X和CHARACTER SET X的默認校對規則。
否則，采用服務器字符集和服務器校對規則。

而我們在建表的時候指定了character set，所以它永遠是采用對應的默認的校對規則。

當然我們其實也沒必要重建表格，只需要alter table db_allot CONVERT TO CHARACTER SET latin1 COLLATE latin1_bin這樣轉換即可。

另外建議collation都盡量采用字符集相應的bin類型的校對規則，這樣不容易出錯。

再說說我自己的體會

覺得 character set latin1 collate latin1_bin 就是老版的 VARCHAR BINARY 的改進，只是新版的先用 character set 定字符集，再用此字符集名字加 _bin 定校對規則為二進制的，從而確保中文查詢正確。
再測試了一下，把此字段屬性改為不帶 BINARY 的
ALTER TABLE `comment_content_1_01` CHANGE `thread` `thread` VARCHAR( 50 ) DEFAULT NULL
然后再看表結構確實變成 `thread` varchar(50) default NULL, 即不帶 character set latin1 collate latin1_bin 了，可見character set latin1 collate latin1_bin 就是老版的 VARCHAR BINARY 的改進。

此外還讀到更方便的做法，不用逐個改字段屬性，而只要表格級別的collation為latin1_bin就行了。
測試：
alter table comment_content_1_01 CONVERT TO CHARACTER SET latin1 COLLATE latin1_bin
后，

再導出表結構

CREATE TABLE comment_content_1_01 (
content_id int(11) NOT NULL auto_increment,
thread varchar(50) collate latin1_bin default NULL,
uname varchar(100) collate latin1_bin default NULL,
nick varchar(100) collate latin1_bin default NULL,
uid int(11) unsigned default NULL,
content text collate latin1_bin,
post_time datetime default NULL,
post_ip int(10) unsigned default NULL,
`status` enum('unaudit','normal','deleted') collate latin1_bin NOT NULL default 'unaudit',
PRIMARY KEY (content_id)
) ENGINE=MyISAM DEFAULT CHARSET=latin1 COLLATE=latin1_bin;

即便原來沒定各字段的 collate，現在也全都是 collate latin1_bin 了。

本文來自CSDN博客，轉載請標明出處：http://blog.csdn.net/xfsnow/archive/2008/09/05/2885948.aspx

posted on 2010-06-20 11:36 elprup 閱讀(204) 評論(0) 編輯收藏引用所屬分類: web開發

只有注冊用戶登錄后才能發表評論。
【推薦】100%開源！大型工業跨平臺軟件C++源碼提供，建模，組態！

相關文章: svn 提交時文件夾 missing 問題的解決 apache mod_python ImportError: Could not import settings 'mysite.settings': 獨立IP，godaddy域名轉向到國內博客【zz】ISBN校驗碼計算公式 http跨域訪問 [zz]mysql如何為一個數據表指定字符集 [zz]MySQL 的 collation [zz]MySQL數據庫中用GRANT語句增添新用戶 mysql python 的字符編碼問題 [zz]mysql默認字符編碼集

網站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品