Поиск

Символьные наборы и порядки сопоставления MySQL

Сервер MySQL может поддерживать множество символьных наборов. Для получения полного списка доступных символьных наборов воспользуйтесь оператором SHOW CHARACTER SET:
mysql SHOW CHARACTER SET;
+--------------- +---------------------------------------------- +--------------------------------- +
I Charset | Description I Default collation |
+------- +---------------------- +---------------- +
big5 | Big5 Traditional Chinese | big5_chinese_ci I
[ dec8 | DEC West European I dec8_swedish_ci |
I cp850 | DOS West European I cp850_general_ci |
| hp8 | HP West European I hp8_english_ci |
I koi8r | KOI8-R Relcom Russian | koi8r_general_ci |
latinl | ISO 8859-1 West European | latinl_swedish_ci |
Iatin2 | ISO 8859-2 Central European | Iatin2_general_ci |

Вывод также включает другой столбец, который не приведен, дабы пример помес­тился на страницу.
Любой из символьных наборов всегда имеет, как минимум, один порядок сопостав­ления. Он может также иметь несколько порядков сопоставления.
Чтобы получить список порядков сопоставления для символьного набора, исполь­зуйте оператор SHOW COLLATION. Например, чтобы увидеть порядки сопоставления для набора latinl (;ISO-8859-1 West European;), воспользуйтесь приведенным ниже опера­тором для поиска порядков сопоставления, которые начинаются с 'latinl':
mysql SHOW COLLATION LIKE 4atinl%';

Collation
i.
Charset
i
Id
I J
Default Compiled
i j
Sortlen
latinl germanl ci latinl 5 1   0  
1 latinl_swedish__ci latinl 8 | Yes Yes 1  
I latinldanish ci latinl 15     0  
I latinl german2 ci latinl 31   Yes 2  

I latinlbin 1 latinl

47   Yes 1  
I latinlgeneralci I latinl 48     0  

latinlgeneralcs 1 latinl

49     0  

latinl_spanishci 1 latinl
i i

94
j_
  i 0

Порядки сопоставления latinl имеют следующие

назначения:    

Порядок Описание

     

latinlbin Бинарный, в соответствии с кодировкой[ latinl.
latinl_danish_ci Датский/норвежский.
latinlgeneralci Многоязычный.
latinl_generalcs Многоязычный, чувствительный к регистру.
latinlgermanlci Немецкий DIN-1.
Iatinl_german2ci Немецкий DIN-2.
latinlSpanishci Современный испанский.
latinlSwedishci Шведский/финский.

Порядки сопоставления обладают следующими общими характеристиками:

  • Два разных символьных набора не могут иметь один и тот же порядок сопоставления.
  • Каждый символьный набор имеет один порядок сопоставления, называемый порядком по умолчанию. Например, порядком сопоставления по умолчанию для latinl является latinl_swedish_ci.
  • Существует соглашение об именах порядков. Имена начинаются с имени символьного набора, с которым ассоциированы (обычно включают наименование языка), и завершаются на _ci (не зависящие от регистра), cs (зависящие от регистра), _bin (бинарные), или _uca (Unicode Collation Algorithm - порядок сопоставления Unicode, см. http://www.unicode.org/reports/trlO/).