10.10.2. Западноевропейские наборы символов

10.10.2. Западноевропейские наборы символов

Западноевропейские наборы символов покрывают большинство западноевропейских языков, типа French, Spanish, Catalan, Basque, Portuguese, Italian, Albanian, Dutch, German, Danish, Swedish, Norwegian, Finnish, Faroese, Icelandic, Irish, Scottish и English.

Объединения ascii (US ASCII):

ascii_bin

ascii_general_ci (значение по умолчанию)

Объединения cp850 (DOS West European):

cp850_bin

cp850_general_ci (значение по умолчанию)

Объединения dec8 (DEC Western European):

dec8_bin

dec8_swedish_ci (значение по умолчанию)

Объединения hp8 (HP Western European):

hp8_bin

hp8_english_ci (значение по умолчанию)

Объединения latin1 (cp1252 West European):

latin1_bin

latin1_danish_ci

latin1_general_ci

latin1_general_cs

latin1_german1_ci

latin1_german2_ci

latin1_spanish_ci

latin1_swedish_ci (значение по умолчанию)

latin1 заданный по умолчанию набор символов. MySQL latin1 представляет собой тот же набор символов, что и Windows cp1252. Это означает, что это официальный ISO 8859-1 или IANA (Internet Assigned Numbers Authority) latin1, но IANA latin1 обрабатывает точки между 0x80 и 0x9f как неопределенные в то время, как cp1252 и, следовательно, MySQL latin1 назначают символы для тех позиций. Например, 0x80 знак Euro. Для неопределенных записей в cp1252 MySQL транслирует 0x81 в Unicode 0x0081, 0x8d в 0x008d, 0x8f в 0x008f, 0x90 в 0x0090 и 0x9d в 0x009d.

Объединение latin1_swedish_ci это значение по умолчанию, которое, вероятно, используется большинством заказчиков MySQL. Хотя часто скажется, что это основано на правилах объединения Swedish/Finnish, имеются шведы и финны, кто не соглашаются с этой инструкцией.

Объединения основаны на latin1_german1_ci и latin1_german2_ci на стандартах DIN-1 и DIN-2, где DIN замещает Deutsches Institut f??r Normung (немецкий эквивалент ANSI, в общем). DIN-1 называется словарным объединением, а DIN-2 называется объединением телефонного справочника.

Правила latin1_german1_ci (словарного):

?Д = A

?Ц = O

?Ь = U

?Я = s

Правила latin1_german2_ci (телефонного справочника):

?Д = AE

?Ц = OE

?Ь = UE

?Я = ss

В объединении latin1_spanish_ci ?? (n-tilde) отдельный символ между letter between n и o.

Объединения macroman (Mac West European):

macroman_bin

macroman_general_ci (значение по умолчанию)

Объединения swe7 (7bit Swedish):

swe7_bin

swe7_swedish_ci (значение по умолчанию)

Поделитесь на страничке

Следующая глава >

Похожие главы из других книг:

Собственные наборы символов и способы сортировки

Из книги автора

Собственные наборы символов и способы сортировки Сами кодировки хранятся в файле gdsintl.dll, который находится в каталоге %INTERBASE%Intl. Вы можете самостоятельно разрабатывать и подключать свои собственные наборы символов и COLATION ORDERS в InterBase и во все его клоны. Для их разработки


10.1. Наборы символов и объединения вообще

Из книги автора

10.1. Наборы символов и объединения вообще Набор символов представляет собой множество символов и их кодов. Объединение задает набор правил для сравнения символов в наборе символов. Давайте сделаем различие явным с помощью примера.Предположите, что мы имеем алфавит с


10.10. Наборы символов и объединения, которые поддерживает MySQL

Из книги автора

10.10. Наборы символов и объединения, которые поддерживает MySQL MySQL поддерживает свыше 70 объединений для более 30 наборов символов. Этот раздел указывает, которые наборы символов MySQL поддерживает. Имеется один подраздел для каждой группы связанных наборов символов. Для


10.10.1. Наборы символов Unicode

Из книги автора

10.10.1. Наборы символов Unicode MySQL имеет два набора символов Unicode. Вы можете сохранять текст приблизительно для 650 языков, используя эти наборы символов.Объединения ucs2 (UCS-2 Unicode):ucs2_bin ucs2_czech_ci ucs2_danish_ci ucs2_esperanto_ci ucs2_estonian_ci ucs2_general_ci (default) ucs2_hungarian_ci ucs2_icelandic_ci ucs2_latvian_ci ucs2_lithuanian_ci ucs2_persian_ci


10.10.3. Центральноевропейские наборы символов

Из книги автора

10.10.3. Центральноевропейские наборы символов MySQL обеспечивает поддержку для наборов символов, используемых в Czech Republic, Slovakia, Hungary, Romania, Slovenia, Croatia и Poland.Объединения cp1250 (Windows Central European):cp1250_bin cp1250_croatian_ci cp1250_czech_cs cp1250_general_ci (значение по умолчанию) cp1250_polish_ciОбъединения cp852 (DOS Central


10.10.4. Южноевропейские и ближневосточные наборы символов

Из книги автора

10.10.4. Южноевропейские и ближневосточные наборы символов Южныоевропейские и ближневосточные наборы символов, обеспечиваемые MySQL, включают Armenian, Arabic, Georgian, Greek, Hebrew и Turkish.Объединения armscii8 (ARMSCII-8 Armenian):armscii8_bin armscii8_general_ci (значение по умолчанию)Объединения cp1256 (Windows Arabic):cp1256_bin


10.10.5. Балтийские наборы символов

Из книги автора

10.10.5. Балтийские наборы символов Балтийские наборы символов охватывают Estonian, Latvian и Lithuanian.Объединения cp1257 (Windows Baltic):cp1257_bin cp1257_general_ci (значение по умолчанию) cp1257_lithuanian_ciОбъединения latin7 (ISO 8859-13 Baltic):latin7_bin latin7_estonian_cs latin7_general_ci (значение по умолчанию)


10.10.6. Наборы символов кириллицы

Из книги автора

10.10.6. Наборы символов кириллицы Наборы символов и объединения кириллицы для использования с Belarusian, Bulgarian, Russian и Ukrainian.Объединения cp1251 (Windows Cyrillic):cp1251_bin cp1251_bulgarian_ci cp1251_general_ci (значение по умолчанию) cp1251_general_cs cp1251_ukrainian_ciОбъединения cp866 (DOS Russian): cp866_bin cp866_general_ci (значение по


10.10.7. Азиатские наборы символов

Из книги автора

10.10.7. Азиатские наборы символов Азиатские наборы символов, которые поддерживает пакет, включают Chinese, Japanese, Korean и Thai. Они могут быть усложнены. Например, китайские наборы должны учесть тысячи различных символов.Объединения big5 (Big5 Traditional Chinese):big5_bin big5_chinese_ci (значение по


Наборы символов и последовательность сортировки

Из книги автора

Наборы символов и последовательность сортировки Набор символов, выбранный для хранения текстовых данных, определяет:* символы, которые могут быть использованы в столбцах CHAR, VARCHAR и BLOB SUB_TYPE | (текст);* число байтов, выделяемых для каждого символа;* последовательность


Специальные наборы символов

Из книги автора

Специальные наборы символов Основное правило для наборов символов то, что каждый байт (пара или тройка байтов в случае многобайтовых наборов) специально определен по стандарту его реализации. Существует четыре особых исключения - NONE, OCTETS, ASCII и UNICODE FSS. В табл. 11.1 показаны


Приложение 8. Наборы символов и порядков сортировки

Из книги автора

Приложение 8. Наборы символов и порядков сортировки В табл. П8.1 содержатся наборы символов и порядки сортировки, которые существовали на момент создания Firebird 1.5.0. Некоторые из указанных элементов недоступны в более ранних версиях Firebird. Если вы инсталлировали более