13.5. Сортировка локализованных строк
13.5. Сортировка локализованных строк
Проблема
Имеется последовательность строк, содержащая символы не в коде ASCII, и требуется ее отсортировать с учетом местных особенностей.
Решение
В класс локализации встроена поддержка операций сравнения символов в заданной локализации путем перегрузки оператора operator<. При вызове любой стандартной функции, принимающей функтор сравнения, можно использовать в качестве такого функтора экземпляр класса локализации. (См. пример 13.8.)
Пример 13.8. Сортировка с учетом местных особенностей
#include <iostream>
#include <locale>
#include <string>
#include <vector>
#include <algorithm>
using namespace std;
bool localelessThan(const string& s1, const string& s2) {
const collate<char>& col =
use_facet<collate<char> >(locale()); // Использовать глобальную
// локализацию
const char* pb1 = s1.data();
const char* pb2 = s2.data();
return (col.compare(pb1, pb1 + s1.size(),
pb2, pb2 + s2.size()) < 0);
}
int main() (
// Создать две строки, одна с немецким символом
string s1 = "di?t";
string s2 = "dich";
vector<string> v;
v.push_back(s1);
v.push_back(s2);
// Сортировать, не используя заданную локализацию, т.е. Применяя
// правила текущей глобальной локализации
sort(v.begin(), v.end());
for (vector<string>::const_iterator p = v.begin();
p != v.end(); ++p)
cout << *p << endl;
// Установить в качестве глобальной немецкую локализацию и затем
// сортировать
locale::global(locale("german"));
sort(v.begin(), v.end(), localelessThan);
for (vector<string>::const_iterator p = v.begin();
p != v.end(); ++p)
cout << *p << endl;
}
Первый вариант обеспечивает сортировку по коду ASCII, и поэтому результат будет выглядеть следующим образом.
dich
di?t
Вторая сортировка использует правильный порядок букв немецкого алфавита, и поэтому результат будет противоположным.
di?t
dich
Обсуждение
Сортировка усложняется, когда вы работаете с различными локализациями, но стандартная библиотека решает эту проблему. Фасет collate обеспечивает функцию-член compare, которая работает как strcmp: она возвращает значение -1, если первая строка меньше второй, значение 0, если они равны, и значение 1, если первая строка больше второй. В отличие от strcmp, функция collate::compare использует определенную в целевой локализации упорядоченность символов.
В примере 13.8 приводится функция localeLessThan, которая возвращает True, если согласно глобальной локализации первый аргумент меньше второго. Самым важным здесь моментом является вызов функции сравнения.
col.compare(pb1, // Указатель на первый символ
pb1 + s1.size(), // Указатель на позицию за последним символом
pb2,
pb2 + s2.size());
Выполнение примера 13.8 на вашем компьютере может дать результат как совпадающий, так и не совпадающий с приведенным мною, — это зависит от используемого в вашей реализации набора символов. Однако, если требуется обеспечить сравнение строк с учетом местных особенностей, вам следует использовать collate::compare. Конечно, стандарт не требует, чтобы реализация поддерживала какую-либо локализацию, кроме локализации «C», поэтому не забудьте протестировать все используемые вами локализации.
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКЧитайте также
Сортировка массивов
Сортировка массивов array_reverseРасстановка элементов массива в обратном порядке.Синтаксис:array array_reverse(array arr [, bool preserve_keys])Функция array_reverse() возвращает массив, элементы которого следуют в обратном порядке относительно массива, переданного в параметре. При этом связи между
Сортировка
Сортировка В отличие от предыдущих версий в Проводнике Windows Vista заголовки столбцов, с помощью которых можно проводить сортировку объектов и другие действия, доступны при любом способе отображения значков.Щелчком кнопки мыши на заголовке любого столбца вы можете
Сортировка
Сортировка Трудности? Это еще что такое? Однако бесплатный сыр сами знаете где. Дело в том, что, так как сами элементы в списке не хранятся, придется самим заботится о сортировке. Не удастся воспользоваться функцией CListCtrl::SortItems, бесполезно писать CompareItems и т.п. Все, что у вас
8.1.5. Сортировка массива
8.1.5. Сортировка массива Самый простой способ отсортировать массив — воспользоваться встроенным методом sort:words = %w(the quick brown fox)list = words.sort # ["brown", "fox", "quick", "the"]# Или отсортировать на месте:words.sort! # ["brown", "fox", "quick", "the"]Здесь предполагается, что все элементы массива сравнимы
8.2.10. Сортировка хэша
8.2.10. Сортировка хэша Хэши по природе своей не упорядочены ни по ключам, ни по значениям. Чтобы отсортировать хэш, Ruby преобразует его в массив, который затем сортирует. Понятно, что и результатом является массив.names = {"Jack"=>"Ruby","Monty"=>"Python", "Blaise"=>"Pascal", "Minnie"=>"Perl"} list =
ПРИМЕР: СОРТИРОВКА СТРОК
ПРИМЕР: СОРТИРОВКА СТРОК Возьмем реальную задачу сортировки строк в алфавитном порядке. Эта задача может возникнуть при подготовке списка фамилий, при создании алфавитного указателя и во многих других ситуациях. В такой программе одним из главных инструментов
Сортировка (Sort)
Сортировка (Sort) template ‹class RandomAccessIterator›void sort(RandomAccessIterator first, RandomAccessIterator last);template ‹class RandomAccessIterator, class Compare›void sort(RandomAccessIterator first, RandomAccessIterator last, Compare соmр);sort сортирует элементы в диапазоне [first, last). Делается приблизительно NIogN (где N равняется last-first) сравнений в среднем. Если
Поиск и сортировка
Поиск и сортировка Следующие библиотечные функции предназначены для поиска и сортировки в массиве: Функция Краткое описание bsearch выполняет двоичный поиск lfind выполняет линейный поиск для заданного значения lsearch выполняет линейный поиск для заданного значения,
Сортировка данных
Сортировка данных Практически вся информация, с которой вы работаете в электронном редакторе, представляет собой разнообразные списки. В терминологииMicrosoft Excel они называются «списками базы данных». Excel предоставляет возможность сортировать данные внутри таблицы по
Сортировка и группирование
Сортировка и группирование Когда столбцы, указанные в предложениях ORDER BY или GROUP BY, являются индексированными, оптимизатор может упорядочить выходные данные, просматривая индексы, и собирать упорядочиваемые наборы быстрее, чем без использования индексов.Убывающий
Сортировка
Сортировка При преобразовании документа элементами xsl:for-each и xsl:apply-templates, выбранные узлы по умолчанию обрабатываются в порядке просмотра документа, который зависит от выражения, использованного в атрибуте select этих элементов. XSLT позволяет изменять этот порядок
9.1.2. Сортировка списков
9.1.2. Сортировка списков Сортировка применяется очень часто. Список можно отсортировать (упорядочить), если между его элементами определено отношение порядка. Для удобства изложения мы будем использовать отношение порядкабольше( X, Y)означающее, что X больше, чем Y,
11.1.6. Простейшая сортировка
11.1.6. Простейшая сортировка В простейшем случае, чтобы отсортировать файл, достаточно передать его имя команде sort. Сортировка будет выполнена по строкам:$ sort video.txtA Few Good Men:KL:445:5851A. Iien:HK:119:1982Aliens:HK:532:4892Boys in Company C:HK:192:2]92Star Wars:HK:301:4102The tfili:KL:63:2972Toy Story.
11.1.10. Сортировка с отбрасыванием повторяющихся строк
11.1.10. Сортировка с отбрасыванием повторяющихся строк Иногда приходится иметь дело с файлом, содержащим повторяющиеся строки. Чтобы избавиться от них, достаточно воспользоваться командой sort с опцией — и. Ниже показан вариант тестового файла, в котором запись о фильме "Alien"