11.3.6. Карта преобразования слов

Завершим этот раздел программой, иллюстрирующей создание, поиск и перебор карты. Программа получает одну строку и преобразует ее в другую. Программе передаются два файла: первый содержит правила, используемые для преобразования текста во втором файле. Каждое правило состоит из слова, которое может встретиться во входном файле, и фразы, используемой вместо него. Идея в том, чтобы, встретив во вводе некое слово, заменить его соответствующей фразой. Второй файл содержит преобразуемый текст.

Вот содержимое файла преобразования слов.

brb be right back

k okay?

y why

r are

u you

pic picture

thk thanks!

l8r later

Подлежащий преобразованию текст таков:

where r u

y dont u send me a pic

k thk l8r

Программа должна создать следующий вывод:

where are you

why dont you send me a picture

okay? thanks! later

Программа преобразования слова

Решение подразумевает использование трех функций. Функция word_transform() будет осуществлять общую обработку. Потребуются два аргумента типа ifstream: первый будет связан с файлом преобразования слов, а второй — с текстовым файлом, который предстоит преобразовать. Функция buildMap() будет читать файл правил преобразования и создавать элемент карты для каждого слова и результата его преобразования. Функция transform() получит строку и, если она есть в карте, возвратит результат преобразования.

Давайте начнем с определения функции word_transform(). Важнейшие ее части — вызовы функций buildMap() и transform():

void word_transform(ifstream &map_file, ifstream &input) {

 auto trans_map = buildMap(map_file); // хранит преобразования

 string text; // содержит каждую строку из ввода

 while (getline(input, text)) { // читать строку из ввода

  istringstream stream(text); // читать каждое слово

  string word;

  bool firstword = true; // контролирует вывод пробела

  while (stream >> word) {

   if (firstword)

    firstword = false;

   else

    cout << " "; // вывод пробела между словами

   // transform() возвращает свой первый аргумент или

   // результат преобразования

   cout << transform(word, trans_map); // вывод результата

  }

  cout << endl; // обработка текущей строки ввода окончена

 }

}

Функция начинается вызовом функции buildMap(), создающим карту преобразования слов. Результат сохраняется в карте trans_map. Остальная часть функции обрабатывает входной файл. Цикл while использует функцию getline() для чтения входного файла по одной строке за раз. Построчно чтение осуществляется для того, чтобы строки вывода заканчивались там же, где и строки входного файла. Для получения слов каждой строки используется вложенный цикл while, использующий строковый поток istringstream (см. раздел 8.3) для обработки каждого слова текущей строки.

Внутренний цикл while выводит результат, используя логическую переменную firstword, чтобы решить, выводить ли пробел. Вызов функции transform() получает подлежащее выводу слово. Значение, возвращенное функцией transform(), будет либо исходным словом строки, либо соответствующим ему преобразованием из карты transmap.

Создание карты преобразования

Функция buildMap() читает переданный ей файл и создает карту преобразований.

map<string, string> buildMap(ifstream &map_file) {

 map<string, string> trans_map; // хранит преобразования

 string key;   // слово для преобразования

 string value; // фраза, используемая вместо него

 // прочитать первое слово в ключ, а остальную часть строки в значение

 while (map_file >> key && getline(map_file, value))

  if (value.size() > 1) // проверить, есть ли преобразование

   trans_map[key] = value.substr(1); // убрать предваряющий

                                     // пробел

 else

  throw runtime_error("no rule for " + key);

 return trans_map;

}

Каждая строка файла map_file соответствует правилу. Каждое правило — это слово, сопровождаемое фразой, способной содержать несколько слов. Для чтения слов, преобразуемых в ключи, используется оператор >> и функция getline() для чтения остальной части строки в значение. Поскольку функция getline() не отбрасывает предваряющие пробелы (см. раздел 3.2.2), необходимо убрать пробел между словом и соответствующим ему правилом. Прежде чем сохранить преобразование, осуществляется проверка наличия в нем хотя бы одного символа. Если это так, то происходит вызов функции substr() (см. раздел 9.5.1), позволяющий устранить пробел, отделяющий фразу преобразования от соответствующего ему слова, и сохранить эту подстроку в карте trans_map.

Обратите внимание на использование оператора индексирования при добавлении пары ключ-значение. При этом неявно игнорируется происходящее при повторении слова в файле преобразования. Если слово повторяется несколько раз, то в карте trans_map окажется последняя соответствующая фраза. По завершении цикла while карта trans_map содержит все данные, необходимые для преобразования ввода.

Осуществление преобразования

Фактическое преобразование осуществляет функция transform(). Ее параметры — ссылки на преобразуемую строку и карту преобразования. Если переданная строка находится в карте, функция transform() возвращает соответствующую ей фразу преобразования. Если переданной строки в карте нет, функция transform() возвращает свой аргумент:

const string &

transform(const string &s, const map<string, string> &m) {

 // фактическая работа карты; это основная часть программы

 auto map_it = m.find(s);

 // если слово есть в карте преобразования

 if (map it != m.cend())

  return map_it->second; // использовать замену слова

 else

  return s; // в противном случае возвратить исходное слово

}

Код начинается с вызова функции find(), позволяющего определить, находится ли данная строка в карте. Если это так, то функция find() возвращает итератор на соответствующий элемент. В противном случае функция find() возвращает итератор на элемент после конца. Если элемент найден, обращение к значению итератора возвращает пару, содержащую ключ и значение этого элемента (см. раздел 11.3). Функция возвращает значение переменной-члена second этой пары, являющееся преобразованной фразой, используемой вместо строки s.

Упражнения раздела 11.3.6

Упражнение 11.33. Реализуйте собственную версию программы преобразования слов.

Упражнение 11.34. Что будет, если в функции transform() вместо функции find() использовать оператор индексирования ?

Упражнение 11.35. Что будет (если будет) при таком изменении функции buildMap():

trans_map[key] = value.substr(1);

as trans_map.insert({key, value.substr(1)})?

Упражнение 11.36. Текущая версия программы не проверяет допустимость входного файла. В частности, она подразумевает, что все правила в файле преобразований корректны. Что будет, если строка в этом файле содержит ключ, один пробел и больше ничего? Проверьте свой ответ на текущей версии программы.