19.4. Обработка текста

We use cookies. Read the Privacy and Cookie Policy

19.4. Обработка текста

bpe файл

Программа bpe — это редактор двоичных файлов. Данная программа позволяет редактировать файл в двоичном или шестнадцатиричном режиме. После запуска программы вы можете использовать множество команд редактирования. Некоторые из них представлены в табл. 19.20.

Команды программы bpe Таблица 19.20

Команда Описание + Прокрутка вперед на две строки - Прокрутка назад на две строки / Поиск строки, начиная с текущей позиции 9 Справочная информация D Вывод одной страницы Е Редактирование в текстовом режиме Е Редактирование в шестнадцатиричном режиме F Поиск строки, начиная с текущей позиции Н Поиск последовательности байтов, начиная с текущей позиции N Переход к следующему сектору Р Переход к предыдущему сектору Q Выход без сохранения S Установить позицию в файле W Запись изменений на диск

cat [параметр] файл

В этой книге команда cat неоднократно использовалась, но нигде я не упомянул о ее параметрах. Все параметры команды cat рассмотрены в табл. 19.21.

Параметры команды cat Таблица 19.21

Параметр Описание -А Вывод всех непечатаемых символов. Не выводятся символы перевода строки и символы табуляции. В конце каждой строки выводится символ «$». Символ табуляции заменяется на последовательность символов «^I» -е В конце каждой строки выводится символ «$» -n Вывод нумерации строк -S Не выводит пустые строки -t Заменяет символ табуляции на последовательность символов «^I» Символы протяжки страницы заменяются на «^L» -Т Заменяет символ табуляции на последовательность символов «^I» -v Вывод всех непечатаемых символов. Не выводятся символы перевода строки и символы табуляции

cmp [параметры] файл1 файл2

Программа cmp сравнивает два файла и выводит различия. Если файлы не отличаются, программа ничего не выводит. Если найдено различие, то выводится номер строки и номер символа в строке. Эту программу можно использовать как для текстовых, так и для двоичных файлов. Параметры программы представлены в табл. 19.22

Параметры программы cmp Таблица 19.22

Параметр Описание -с Программа выведет отличающиеся символы -i n Программа будет игнорировать первые n байтов обоих файлов -l Выведет позиции всех различий -s Программа не будет выводить информацию на экран. Код возврата программы cmp будет равен: 0 — если файлы не отличаются; 1 — если файлы отличаются; 2 — если произошла ошибка

column [параметры] файл

Программа column форматирует текст файла, разбивая его на колонки. Исходный текст может быть введен со стандартного ввода. Параметры программы приведены в табл. 19.23.

Параметры программы column Таблица 19.23

Параметр Описание -с n Задает число колонок -s символ Указанный символ будет использоваться в качестве разделителя колонок. Этот параметр используется вместе с параметром –t -t Форматирование выполняется в виде таблицы. Разделителем по умолчанию является символ пробела. Другой разделитель задается параметром –s -x Заполняет сначала колонки, а потом строки

csplit [параметры] файл образец

Данная программа позволяет разбить текстовый файл на несколько частей. Части файла определяются требуемым размером или с помощью указанного образца. Исходный файл при этом не изменяется. Имена частей файла начинаются с символов хх. Первая часть будет иметь имя хх00, вторая — xx01 и так далее. Программа csplit может разбить файл максимум на сто частей. За более подробной информацией обратитесь к справочной системе.

diff [параметры] [расширенные_параметры] файл1 файл2

Программа diff предназначена для сравнения файлов. Она выводит отличающиеся строки. Строка файла «файл1» помечается символом «<», а строка файла «файл2» помечается символом «>». С помощью тире разделяется содержимое файлов. Описание основных параметров данной программы сведено в табл. 19.24. Программу diff можно использовать для сравнения файлов из разных каталогов. Для этого используются расширенные параметры (см. табл. 19.25).

Основные параметры программы diff Таблица 19.24

Параметр Описание -а Сравнение всех файлов, в том числе и двоичных -b Игнорируются символы пробела в конце строки -В Игнорируются пустые строки в файлах -с Вывод контекста для каждого найденного различия -d Игнорируются области со многими изменениями -е Создается сценарий редактора ed, с помощью которого можно превратить файл «файл1» в файл «файл2» -Н Поиск только небольших изменений -i Игнорировать регистр букв -I шаблон Игнорировать строки, содержащие указанный шаблон -n Установить формат вывода RCS -N Несуществующие файлы считать пустыми -t Замена символов табуляции на восемь пробелов -Т В начало выводимых строк вставить символ табуляции -u Вывод новой и старой версий файла в одной строке -w Игнорировать пробелы -y Вывод в две колонки

Расширенные параметры программы diff Таблица 19.25

Параметр Описание -l Постраничный вывод -r Рекурсивный режим. Сравниваются файлы во всех подкаталогах -s Выводит имена совпадающих файлов -S файл Начать сравнение с указанного файла -х шаблон Игнорировать файлы, имена которых содержат указанный шаблон -X шаблон Аналогичен параметру –х

diff3 [параметры] файл! файл2 файл3

Сравнение трех файлов. Программа diff3 не выводит отличающиеся строки. Вместо этого она выводит следующие сообщения:

1. = = = =, если все три файла отличаются;

2. = = = 1, если первый файл отличается от второго и третьего;

3. = = = 2, если второй файл отличается от первого и третьего;

4. = = = 3, если третий файл отличается от первого и второго.

emacs [параметры] файл

Программа emacs — это мощный и довольно сложный текстовый редактор. Этот редактор входит в состав большинства дистрибутивов ОС Linux. Полное описание редактора вы сможете найти в документации, поставляемой вместе с самим редактором.

expand [параметр] файл

Программа expand заменяет символы табуляции на определенное количество пробелов. Обычно один символ табуляции заменяется на восемь пробелов. Вы можете использовать параметр –i для замены символов табуляции только в начале строки.

fmt [параметры] файл

Программа fmt форматирует текст в файле, выравнивая его по правому краю. При этом удаляются символы новой строки. Параметры программы рассмотрены в табл. 19.26.

Параметры программы fmt Таблица 19.26

Параметр Описание -с Две первые строки не будут форматироваться -р образец Будут форматироваться строки, которые начинаются с указанного образца -s Строки не будут объединяться -t Делать отступ в начале нового абзаца -u Установить один пробел между словами и два — между предложениями -w n Устанавливает длину строки. По умолчанию длина равна 72 символам

fold [параметры] файл

Данная программа выравнивает текст по правому краю. Ширина строки по умолчанию — 80 символов. Необходимую ширину строки вы можете задать с помощью параметра –w n.

ghostview [параметры] файлы

Программа ghostview позволяет просматривать файлы в формате PostScript. Для своей работы эта программа использует интерпретатор ghostscript.

grep [параметры] образец файлы

Программа grep ищет заданный образец в указанных файлах. Возможен ввод файла со стандартного ввода. Если образец содержит пробелы, его необходимо заключить в кавычки, а если образец начинается со знака «-», то его нужно указывать с помощью параметра –е. Параметры программы приведены в табл. 19.27.

Параметры программы grep Таблица 19.27

Параметр Описание -A n Выводит n строк после строки, которая содержит образец -B n Выводит n строк перед строкой, которая содержит образец -b Выводит для каждой строки, которая содержит образец, ее номер в файле -с Выводит только количество совпадений -С Выводит две строки перед строкой, содержащей образец, и две строки после нее -е образец Определяет образец -f файл Поиск образцов, которые находятся в файле -h Выводит строки, содержащие образец, но не выводит имена файлов -i Игнорируется регистр букв -l Выводит только имена файлов, строки которых содержат образец -L Выводит имена файлов, строки которых не содержат образец -n Вывод строк, которые содержат образец, и их номеров в файле -S Не выводит сообщение об ошибке, если один из указанных файлов невозможно открыть -v Вывод строк, которые не содержат образец -w Поиск совпадения целого слова с образцом -x Поиск совпадения целой строки с образцом -число Выводит указанное число строк до и после строки с образцом

grodvi [параметры] файл

Данная программа преобразует файл в формате groff в файл в формате DVI.

groff [параметры] файл

Данная программа обеспечивает работу пользователя и других программ с документами в формате groff. Для более подробного описания обратитесь к справочной системе.

head [параметры] файлы

Программа head выводит начало файла. По умолчанию выводятся первые десять строк файла. Однако число строк можно задать с помощью параметра –n число.

ispell [параметры] файлы

Программа ispell выполняет проверку правописания в указанных файлах. Обычно данная программа используется другими программами, например, текстовыми редакторами или почтовыми клиентами, для проверки правописания.

join [параметры] файл1 файл2

Программа join позволяет объединить два файла по общему полю. Описание программы и ее параметров вы найдете в справочной системе.

less [параметры] файлы

Данная программа предназначена для просмотра файлов. Эта программа была создана как альтернатива старой программе more. Программа more позволяет просматривать файлы только по одной странице вперед. В отличие от программы more, программа less позволяет просматривать текст в обоих направлениях и имеет множество параметров, управляющих процессом просмотра (см. табл. 19.28).

При просмотре файла можно использовать пробел для прокрутки вперед на один экран, клавишу «Enter» для прокрутки вперед на одну строку, клавишу «b» для возврата назад на один экран, а клавишу «/» для поиска образца. За более подробным описанием комбинаций клавиш обратитесь к документации.

Параметры программы less Таблица 19.28

Параметр Описание --help Выводит краткое описание параметров и другую справочную информацию -а Начинать поиск с первой строки. По умолчанию поиск начинается со второй строки -bчисло Определяет число буферов для каждого файла. Размер буфера равен 1024 байт -В Не выделять буферы при чтении данных из потока -с Перерисовка экрана сверху вниз -С То же, что и параметр –с, но перед перерисовкой будет выполнена очистка экрана -d Не выводить предупреждения при недостаточных возможностях терминала -е Завершение работы при втором достижении конца файла -Е Завершение работы при достижении конца файла -f Может использоваться для открытия файлов или файлов устройств -m Запуск в режиме программы more — внизу экрана будет отображаться процентное положение в файле -М То же, что и –m, но внизу экрана будет отображаться номер строки в файле -n Не выводить номера строк в файле -N Выводить номера строк в файле -Офайл Копирование информации в файл при чтении из потока. Если файл существует, он будет перезаписан без предупреждения -q Запрет звуковых сигналов -r Вывод всех символов. По умолчанию управляющие символы выводятся как «^» -s Замена нескольких пустых строк на одну пустую строку -u Символы табуляции и возврата каретки будут считаться печатаемыми -U Символы табуляции и возврата каретки будут считаться управляющими -V Вывод версии -хшаг Установка шага табуляции -yчисло Устанавливает максимальную прокрутку вперед

look [параметры] образец файл

Программа look производит поиск указанного образца в файлах. Если файл не указан, поиск производится в системном словаре. Обычно это файл /usr/dict/words.

lpq [параметры] пользователь

Проверяет очередь печати указанного пользователя. Данная программа используется вместе с демоном печати lpd. Если пользователь не задан, то используется имя пользователя, запустившего программу. С помощью параметра –Pпринтер можно указать принтер.

lpr [параметры] файлы

Данная программа предназначена для постановки в очередь печати указанных файлов. Можно использовать параметр –Рпринтер для указания принтера. Параметр –s позволяет сэкономить дисковое пространство, так как с помощью этого параметра можно создать символическую ссылку вместо копирования файла в каталог для спула. Однако при этом вы не должны изменять файл до окончания печати. Описание других параметров вы найдете в справочной системе.

lprm [параметры] номер_задания пользователь

Данная программа позволяет удалить указанное задание из очереди печати. Вы не можете удалить задание другого пользователя, а другие пользователи не могут удалить ваше задание. Это ограничение, конечно, не распространяется на пользователя root. Номер задания можно узнать, используя программу lpq. Как обычно, имя принтера можно задать с помощью параметра –Рпринтер. Если использовать параметр «-», то можно удалить все задания.

more [параметры] файлы

Как и программа less, программа more управляет просмотром файла. Вместо нее предпочтительнее использовать программу less, обладающую большими возможностями. Единственное преимущество данной программы состоит в том, что она присутствует в составе даже самых старых дистрибутивов UNIX и Linux.

paste [параметры] файлы

Программа paste объединяет строки двух файлов.

pico [параметры] файлы

Программа pico является текстовым редактором. Данная программа входит в состав пакета pine и вызывается программой pine для редактирования сообщений. Параметры редактора pico представлены в табл. 19.29.

Параметры программы pico Таблица 19.29

Параметр Описание +число Позиционирование на указанном номере строки -d Клавиша «Delete» будет использоваться для удаления символа под курсором -е Автоматическое завершение имен файлов -Q Выводит курсор перед текущим выделенным блоком -k Удаление от курсора до конца строки вместо удаления всей строки -m Поддержка мыши. Только при работе в системе X Window -n секунды Уведомляет о прибытии новой почты. Наличие новой почты проверяется через указанное время -о каталог Устанавливает рабочий каталог -r число Определяет положение правой границы -t Обычно используется при вызове редактора из других программ, например, из программы pine -v Просмотр файла -w Не переносить строки -x Не выводить строку подсказок в нижней части экрана -z Разрешает перевод редактора в фоновый режим при нажатии

pr [параметры] файл

Программа pr предназначена для подготовки файла для печати. Эта программа не печатает файл. Распечатать вы его должны самостоятельно. Для подготовки файла к печати можно использовать параметры, приведенные в табл. 19.30.

Параметры программы pr Таблица 19.30

Параметр Описание +страница Начало печати с указанной страницы -колонки Вывод в несколько колонок -а Печать колонок «поперек» -b Выравнивание колонок на последней странице -с Вывод управляющих символов при помощи символа «^» -d Установить двойной интервал между строками -e n Замена символов табуляции на n пробелов. По умолчанию параметр n равен 1 -F Использовать символы протяжки страницы вместо символов новой строки для разделения страниц -h заголовок Установить заголовок -I Заменить последовательность пробелов на символы табуляции -l длина Установить длину строки (по умолчанию — 66 символов) -m Вывести несколько файлов одновременно. Вывод каждого файла будет производиться в отдельной колонке -n символ число Перед каждой строкой будет выведен ее номер, состоящий из указанного числа цифр. Если задан символ, то он будет использоваться для отделения номера от строки -о ширина Устанавливает ширину левого поля -r Не выводить сообщения об ошибке, если невозможно открыть файл -s символ Устанавливает разделитель для колонок -t Не выводить верхний и нижний колонтитул -v Вместо непечатаемых символов выводить их номер в восьмеричной системе -w ширина Устанавливает ширину страницы в символах

printf параметр

Выводит строку, используя синтаксис языка С.

sed [параметры] файл

Программа sed модифицирует файл согласно списку команд. Результат отправляется на стандартный вывод, исходный файл не изменяется. Список команд можно задать с помощью параметра –fимя_файла. Более подробное описание вы найдете в справочной системе.

sort [параметры] файл

Программа sort используется для сортировки, объединения и сравнения текстовых файлов. Выбрать режим работы вы можете с помощью параметров программы (см. табл. 19.31).

Параметры программы sort Таблица 19.31

Параметр Описание +число1[-число2] Устанавливает поля сортировки. Сортировка выполняется от позиции строки «число1» до позиции «число2». Если аргумент «число2» не задан, то до конца строки -b Пробелы в начале строки игнорируются -с Если файлы не отсортированные, выводит сообщение об ошибке -d При сортировке игнорируются все символы, кроме букв, цифр и пробелов -f Преобразовать при сортировке строчные буквы в прописные -I Символы, не входящие в таблицу ASCII, будет проигнорированы -М Сокращенные англоязычные названия месяцев (Jan, Feb и так далее) преобразуются в сокращения, написанные прописными буквами, и сортируются в календарном порядке -n Сортировка по числовым значениям -о файл Определяет файл результата -r Обратный порядок сортировки -tсимвол Использовать указанный символ в качестве разделителя полей

split [параметры] файл1 файл2

Используется для разбиения файла на две или более частей. Установить размер каждой части можно с помощью параметра –С. Если вам нужно разбить файл на определенное количество строк, используйте параметр -число.

tac [параметры] файл

Выводит содержимое файла в обратном порядке — от последней строки до первой. Данная программа противоположна программе cat.

tail [параметры] файл

Данная программа противоположна программе head. Другими словами, программа tail выводит последние 10 строк файла. Указать другое число можно с помощью параметра –1 число.

tr [параметры] строка1 строка2

Программа tr заменяет строку строка1 на строку строка2. Обычно используется для поиска и замены символов в указанных строках. За более подробной информацией обратитесь к справочной системе.

unexpand [параметры] файл

Программа unexpand заменяет в текстовом файле последовательность пробелов на символы табуляции. С помощью параметра –а можно заменить все последовательные пробелы на символы табуляции. По умолчанию замена производится только в начале строки. Параметр –t n определяет, сколько пробелов будут заменены на один символ табуляции. По умолчанию аргумент n равен 8.

uniq [параметр] файл1 файл2

Программа uniq удаляет повторяющиеся строки из файла файл1 и записывает в файл файл2. Если параметр файл2 не указан, то программа выводит результат на стандартный вывод. Параметры данной программы представлены в табл. 19.32.

Параметры программы uniq Таблица 19.32

Параметр Описание -с Подсчитывает количество повторяющихся строк -d Выводит только повторяющиеся строки -f n Пропускает указанное число полей строки -sчисло Пропускает указанное число символов поля -r Выводит только неповторяющиеся строки -wn Сравнивает первые n символов строк -число Пропуск указанного числа полей в строке +ЧИСЛО Пропуск указанного числа символов в строке --check-chars=n Сравнивает первые n символов строк --skip-chars=n Пропускает первые n символов в строке --skip-fields=n Пропускает первые n полей в строке. Поля разделяются пробелами или символами табуляции

vi [параметры] файл

Программа vi — это текстовый редактор. Более подробную информацию вы сможете получить в справочной системе.

wc [параметры] файл

Эта программа подсчитывает количество строк, символов или слов в текстовом файле. Если файл не указан, используется стандартный ввод. Данную программу удобно использовать при написании сценариев обработки текста. Параметры программы рассмотрены в табл. 19.33.

Параметры программы wc Таблица 19.33

Параметр Описание --bytes Подсчет количества байтов -с Подсчет количества символов --chars Подсчет количества символов -l Подсчет количества строк --lines Подсчет количества строк -w Подсчет количества слов. Данный параметр используется по умолчанию --words Подсчет количества слов. Данный параметр используется по умолчанию

xedit файл

Программа xedit является простейшим текстовым редактором, предназначенным для работы в системе X Window. Вместо него обычно удобнее использовать редакторы kedit или gedit. Первый из них является стандартным редактором оконной среды KDE, а второй — оконной среды Gnome.

zdiff файлы

Данная программа распаковывает архивы gzip и выполняет программу diff.

Данный текст является ознакомительным фрагментом.