Приложение 8. Наборы символов и порядков сортировки
Приложение 8. Наборы символов и порядков сортировки
В табл. П8.1 содержатся наборы символов и порядки сортировки, которые существовали на момент создания Firebird 1.5.0. Некоторые из указанных элементов недоступны в более ранних версиях Firebird. Если вы инсталлировали более позднюю версию, и набор символов или порядок сортировки, нужные вам, здесь не указаны, обратитесь к заметкам по релизу вашей версии и любой другой версии после 1.5, чтобы узнать были ли они добавлены.
Таблица П8.1. Наборы символов и порядок сортировки для Firebird 1.5.0
ID
Название
Байтов на символ
Порядок сортировки
Язык
Алиас
2
ASCII
1
ASCII
Английский
ASCII7 USASCII
56
BIG_5
2
BIG_5
Китайский, Вьетнамский, Корейский
BIG5, DOS_950, WIN_950
50
CYRL
1
CYRL, DB_RUS, PDOX_CYRL
Русский, Русский dBase, Русский Paradox
10
DOS437
1
DOS437, DB_DEU437, DB_ESP437, DB_FIN437, DB_FRA437, DB_ITA437, DB_NLD437, DB_SVE437, DB_UK437
Английский (США), Немецкий dBase, Испанский dBase, Финский dBase, Французский dBase, Итальянский dBase, Голландский dBase, Шведский dBase, Английский (Великобритания) dBase,
DOS_437
DB_US437
Английский (США) dBase,
PDOX_ASCII
Кодовая страница Paradox- ASCII,
PDOX_SWEDFIN
Paradox Шведская / Финская кодовые страницы,
PDOX_NTL
Paradox международный английский кодовая страница
9
DOS737
1
DOS737
Греческий
DOS_737
15
DOS775
1
DOS775
Страны Балтии
DOS_775
11
DOS850
1
DOS850, DB_DEU850, DB_ESP850, DB_FRA850, DB_FRC850, DB_ITA850, DB_NLD850, DB_PTB850, DB_SVE850, DB_UK850, DB_US850
Латинский I (нет символа Евро), Немецкий, Испанский, Французский, Французский - Канада, Итальянский, Голландский, Португальский - Бразилия, Шведский, Английский - Великобритания, Английский - США
DOS_85C>
45
DOS852
1
DOS852, DB_CSY, DB_PLK, DB_SLO, PDOX_CSY, PDOX_HUN, PDOX_PLK, PDOX_SLO
Латинский II, Чешский dBase, Польский dBase, Словацкий dBase, Чешский Paradox, Венгерский Paradox, Польский Paradox, Словацкий Paradox
DOS_852
46
DOS857
1
DOS857 DB_TRK
Турецкий, Турецкий dBase
DOS_857
16
DOS858
1
DOS858
Латинский I с символом Евро
DOS_858
13
DOS86Q
1
DOS86O DB PTG860
Португальский, Португальский dBase
1
47
DOS861
1
DOS861 PDOX_SL
Исландский, Исландский Paradox
DOS_861
17
DOS862
1
DOS862
Иврит
DOS_862
14
DOS863
1
DOS863 DB_FRC863
Французский - Канада, Французский dBase - Канада
DOS_863
18
DOS864
1
DOS864
Арабский
DOS_864
12
DOS865
1
DOS865 DB_DAN865 DB_NOR865 PDOX_NORDAN4
Скандинавские, Датский dBase, Норвежский dBase, Paradox Норвегия и Дания
DOS_865
48
DOS866
1
DOS866
Русский
DOS_866
49
DOS869
1
DOS869
Современный греческий
DOS_869
6
EUCJ_0208
2
EUCJ_0208
Японские EUC
EUCJ
57
GB_2312
2
GB_2312
Упрощенный китайский (Гонконг, Корея)
DOS_936, GB2312, WIN_936
21
ISO8859_1
1
ISO8859_1, DA_DA, DE_DE, DU_NL, EN_UK, EN_US, ES_ES, FI_FI, FR_CA, FR_FR, IS_IS, IT_IT
NO_NO, PT_PT, sv_sv
Латинский I, Датский, Немецкий, Голландский, Английский, Великобритания, Английский, США, Испанский, Финский, Французский, Канада, Французский, Исландский, Итальянский, Норвежский, Португальский, Шведский
ANSI, ISO88591, LATIN 1
22
ISO8859_2
1
ISO8859_2, CS_CZ ISO_HUN
Латинский 2 - Центральная Европа (хорватский, чешский, венгерский, польский, румынский, сербский, словацкий, словенский), Чешский, Венгерский
ISO-8859-2, ISO88592, LATIN2
23
ISO8859_3
1
ISO8859_3
Латинский 3 - Южная Европа (мальтийский, эсперанто)
ISO-8859-3, ISO88593, LATIN3
34
ISO8859_4
1
ISO8859_4
Латинский 4 - Северная Европа (эстонский, латышский, литовский, гренландский, саамский)
ISO-8859-4, ISO88594, LATIN4
35
ISO8859_5
1
ISO8859_5
Кириллица (русский)
ISO-8859-5, ISO88595
36
ISO8859_6
1
ISO8859_6
Арабский
ISO-8859-6, ISO88596
37
ISO8859_7
1
ISO8859_7
Греческий
ISO-8859-7, ISO88597
38
ISO8859_8
1
ISO8859_8
Иврит
ISO-8859-8, ISO88598
39
ISO8859_9
1
ISO8859_9
Латинский 5
ISO-8859-9, ISO88599, LATIN5
40
ISO8859_1 3
1
ISO8859_13
Латинский 7 - Балтика
ISO-8859- 13, ISO885913, LATIN 7
44
KSC_5601
2
KSC_5601 KSC_DICTIONARY
Корейский, Корейский - словарный порядок сортировки
DOS_949, KSC5601, WIN_949
19
NEXT
1
NEXT
NXT_DEU
NXT_FRA
NXT_ITA
NXT_US
Кодирование NeXTSTEP, Немецкий, Французский, Итальянский, Английский, США
0
NONE
1
NONE
Нейтральная кодовая страница. Перевод в верхний регистр ограничен кодами ASCII 97-122
1
OCTETS
1
OCTETS
Двоичный символ
BINARY
5
SJIS_0208
2
SJIS_0208
Японский
SJIS
3
UNICODE FSS
3
UNICODE_FSS
UNICODE
SQL_TEXT, UTF-8, UTF8, UTF_FSS
51
WIN1250
1
WIN1250, PXW_CSY, PXW_HUN, PXW_HUNDC, PXW_PLK PXW_SLO
ANSI, Центральная Европа, Чешский, Венгерский, Венгерский, словарная сортировка, Польский, Словацкий
WIN.1250
52
WIN1251
1
WIN1251 WIN1251_UA PXW_CYRL
ANSI кириллица, Украинский, Paradox кириллица (русский)
WIN_1251
53
WIN1252
1
WIN1252 PXW_NTL PXW_INTL850 PXW_NORDAN4 PXW_SPAN PXW_SWE D FIN
ANSI - Латинский I, Английский интернациональный, Paradox многоязыковой Латинский I, Норвежский и датский, Paradox испанский, Шведский и финский
WIN_1252
54
WIN1253
1
WIN1253 PXW_GREEK
ANSI греческий, Paradox греческий
WIN_1253
55
WIN1254
1
WIN1254 PXW_TURK
ANSI турецкий, Paradox турецкий
WIN_1254
58
WIN1255
1
WIN1255
ANSI иврит
WIN_1255
59
WIN1256
1
WIN1256
ANSI арабский
WIN_1256
60
WIN1257
1
WIN1257
ANSI стран Балтии
WIN_1257
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКЧитайте также
Собственные наборы символов и способы сортировки
Собственные наборы символов и способы сортировки Сами кодировки хранятся в файле gdsintl.dll, который находится в каталоге %INTERBASE%Intl. Вы можете самостоятельно разрабатывать и подключать свои собственные наборы символов и COLATION ORDERS в InterBase и во все его клоны. Для их разработки
10.1. Наборы символов и объединения вообще
10.1. Наборы символов и объединения вообще Набор символов представляет собой множество символов и их кодов. Объединение задает набор правил для сравнения символов в наборе символов. Давайте сделаем различие явным с помощью примера.Предположите, что мы имеем алфавит с
10.10. Наборы символов и объединения, которые поддерживает MySQL
10.10. Наборы символов и объединения, которые поддерживает MySQL MySQL поддерживает свыше 70 объединений для более 30 наборов символов. Этот раздел указывает, которые наборы символов MySQL поддерживает. Имеется один подраздел для каждой группы связанных наборов символов. Для
10.10.1. Наборы символов Unicode
10.10.1. Наборы символов Unicode MySQL имеет два набора символов Unicode. Вы можете сохранять текст приблизительно для 650 языков, используя эти наборы символов.Объединения ucs2 (UCS-2 Unicode):ucs2_bin ucs2_czech_ci ucs2_danish_ci ucs2_esperanto_ci ucs2_estonian_ci ucs2_general_ci (default) ucs2_hungarian_ci ucs2_icelandic_ci ucs2_latvian_ci ucs2_lithuanian_ci ucs2_persian_ci
10.10.2. Западноевропейские наборы символов
10.10.2. Западноевропейские наборы символов Западноевропейские наборы символов покрывают большинство западноевропейских языков, типа French, Spanish, Catalan, Basque, Portuguese, Italian, Albanian, Dutch, German, Danish, Swedish, Norwegian, Finnish, Faroese, Icelandic, Irish, Scottish и English.Объединения ascii (US ASCII):ascii_bin ascii_general_ci (значение по
10.10.3. Центральноевропейские наборы символов
10.10.3. Центральноевропейские наборы символов MySQL обеспечивает поддержку для наборов символов, используемых в Czech Republic, Slovakia, Hungary, Romania, Slovenia, Croatia и Poland.Объединения cp1250 (Windows Central European):cp1250_bin cp1250_croatian_ci cp1250_czech_cs cp1250_general_ci (значение по умолчанию) cp1250_polish_ciОбъединения cp852 (DOS Central
10.10.4. Южноевропейские и ближневосточные наборы символов
10.10.4. Южноевропейские и ближневосточные наборы символов Южныоевропейские и ближневосточные наборы символов, обеспечиваемые MySQL, включают Armenian, Arabic, Georgian, Greek, Hebrew и Turkish.Объединения armscii8 (ARMSCII-8 Armenian):armscii8_bin armscii8_general_ci (значение по умолчанию)Объединения cp1256 (Windows Arabic):cp1256_bin
10.10.5. Балтийские наборы символов
10.10.5. Балтийские наборы символов Балтийские наборы символов охватывают Estonian, Latvian и Lithuanian.Объединения cp1257 (Windows Baltic):cp1257_bin cp1257_general_ci (значение по умолчанию) cp1257_lithuanian_ciОбъединения latin7 (ISO 8859-13 Baltic):latin7_bin latin7_estonian_cs latin7_general_ci (значение по умолчанию)
10.10.6. Наборы символов кириллицы
10.10.6. Наборы символов кириллицы Наборы символов и объединения кириллицы для использования с Belarusian, Bulgarian, Russian и Ukrainian.Объединения cp1251 (Windows Cyrillic):cp1251_bin cp1251_bulgarian_ci cp1251_general_ci (значение по умолчанию) cp1251_general_cs cp1251_ukrainian_ciОбъединения cp866 (DOS Russian): cp866_bin cp866_general_ci (значение по
10.10.7. Азиатские наборы символов
10.10.7. Азиатские наборы символов Азиатские наборы символов, которые поддерживает пакет, включают Chinese, Japanese, Korean и Thai. Они могут быть усложнены. Например, китайские наборы должны учесть тысячи различных символов.Объединения big5 (Big5 Traditional Chinese):big5_bin big5_chinese_ci (значение по
Наборы символов и последовательность сортировки
Наборы символов и последовательность сортировки Набор символов, выбранный для хранения текстовых данных, определяет:* символы, которые могут быть использованы в столбцах CHAR, VARCHAR и BLOB SUB_TYPE | (текст);* число байтов, выделяемых для каждого символа;* последовательность
Специальные наборы символов
Специальные наборы символов Основное правило для наборов символов то, что каждый байт (пара или тройка байтов в случае многобайтовых наборов) специально определен по стандарту его реализации. Существует четыре особых исключения - NONE, OCTETS, ASCII и UNICODE FSS. В табл. 11.1 показаны