Глава 12. Программы для работы с текстом
Глава 12. Программы для работы с текстом
12.1. Несколько слов о форматах текстовых файлов
Как вы знаете, любой файл, в том числе и файлы, в которых сохранены текстовые документы того или иного вида, представляет собой просто последовательность байтов. Символы текста кодируются разными значениями байта или последовательностей байтов. Информация о том, как именно эти символы должны располагаться на странице, тоже кодируется с помощью неотображаемых управляющих символов, типа конца строки или символа табуляции. В простейших случаях число управляющих кодов ограничивается 32-мя первыми значениями байта (или кода ASCII), а все остальные значения байта используются для кодирования информационных символов. Именно такие файлы мы и называем ASCII-файлами. Примерами таких файлов могут служить файлы, создаваемые редакторами типа встроенного редактора программы Midnight Commander, файлы, создаваемые программой notepad в Windows и vi в UNIX.
Со временем появилось желание расширить возможности форматирования текста, а значит потребовалось увеличить число кодов, используемых в качестве управляющих, и в качестве таких кодов стали даже использовать последовательности байтов (символов ASCII). Но существенно то, что эти форматирующие последовательности (почти) не мешают вам прочитать текст, содержащийся в файле, с помощью любого простейшего средства просмотра или простейшего текстового редактора. Примерами таких файлов могут служить файлы, создаваемые редакторами типа Лексикон, файлы в формате html.
Третий тип - это файлы, использующие собственный формат для представления текста (в которых символы текста тоже представлены специальными последовательностями). Существеннейшее отличие форматов третьего типа от двух предыдущих заключается в том, что и просматривать и создавать файлы в таких форматах без специальных программ практически невозможно. Например, HTML-файлы можно редактировать с помощью Notepad, но невозможно делать то же самое с файлами формата MS Word 97.
Иногда трудно с первого взгляда отнести файл к тому или иному типу. Например, файлы формата Post Script формально относятся ко второму типу, поскольку весь читаемый текст там представлен в кодах ASCII, однако в этих файлах так много форматирующих вставок, что текст можно найти лишь с большим трудом, почти как в файлах третьего типа.
Из вышесказанного следует, что даже для просмотра некоторых типов текстовых файлов (не говоря уж об их редактировании) требуются специальные программные средства. Часто для просмотра файлов пользователь применяет привычный ему текстовый редактор. Но встречаются ситуации, когда информация представлена в незнакомом для этого редактора формате. Самая большая проблема приверженцев Linux -форматы, используемые в продуктах Microsoft. Пока большинство пользователей ПК создают тексты в MS Word, приходится либо изыскивать текстовый редактор, который понимает форматы Word, либо находить программы-переводчики из формата Word в один из открытых стандартных форматов. Впрочем, даже если информация представлена в "простом" коде ASCII, вы, просматривая какой-либо файл, можете столкнуться с "нечитаемым" текстом из-за различия используемых кодировок русского языка. Поэтому сначала давайте рассмотрим вопрос о том, как прочитать (или просмотреть) файлы различных форматов или в различных кодировках.
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКЧитайте также
Глава 3 Полезные утилиты для работы с текстом
Глава 3 Полезные утилиты для работы с текстом • Поиск и замена фрагментов• Ввод одинаковых фрагментов• Объединение текстовых документов• Разные утилиты• Работа с PDF-документами• Менеджеры буфера обменаНесмотря на то что Word – многофункциональная программа, у
Глава 7 Работа с текстом
Глава 7 Работа с текстом Прежде чем начинать работать с текстом в CorelDRAW, учтите главное – это все-таки не текстовый редактор и не программа верстки. Верстать книги или газеты нужно в специальных программах: Corel Ventura, Adobe PageMaker, QuarkXPress. Максимально сложный текстовый документ,
Урок 11 Некоторые особенности работы с текстом в замечательном растровом редакторе
Урок 11 Некоторые особенности работы с текстом в замечательном растровом редакторе До сих пор мы рассматривали редактор Photoshop только в разрезе работы с растровыми изображениями. Однако было бы неправильно обойти стороной возможности работы с текстом. Если когда-то, в
Глава 4 Программы для работы в Интернете
Глава 4 Программы для работы в Интернете • Веб-браузеры• Программы для работы с почтой• Менеджеры закачек• Программы для чтения RSS-новостей• Программы для работы с ICQ, IRC и Jabber• Клиенты IP-телефонииНе секрет, что китами, на которых держится Интернет, являются компьютеры
Глава 5 Программы для работы с графикой
Глава 5 Программы для работы с графикой • Растровые редакторы• Редакторы векторной графики• Программы для просмотра изображений• Программы для работы с фотографиями• Система автоматизированного проектирования QСadПринято считать, что обработка растровой и
Глава 20 Работа с текстом
Глава 20 Работа с текстом • Принципы работы с текстом• Настройки символов текста• Настройки абзацев текстаРабота с текстом во всех графических программах выглядит, в принципе, похоже: используются одни и те же настройки и в целом текст можно оформлять по одинаковым
Принципы работы с текстом
Принципы работы с текстом В Adobe Photoshop существует два вида текста – точечный и абзацный.Точечный текст предназначен для написания коротких текстов – два-три слова, строка, реже – две или три строки; то есть для написания текста в определенной точке. Создать такой текст
4. Особенности работы с текстом
4. Особенности работы с текстом 4.1. Работа с таблицами4.1.1. Виды таблицСуществует два вида таблиц – простые и сложные. Простые – прямоугольная матрица Row x Col. Сложные – в ячейке могут быть вложены другие строки или таблицы.Конвертер корректно экспортирует только простые
Глава 10 Программы для работы с Интернетом
Глава 10 Программы для работы с Интернетом 10.1. Браузер Firefox Как пользоваться браузером Firefox, надеюсь, знают почти все. Поэтому в этой главе мы поговорим о его усовершенствовании. По умолчанию установленный браузер Firefox не поддерживает Java-аплеты и Flash-ролики. Что касается Java,
21.4. Команды для работы с текстом
21.4. Команды для работы с текстом 21.4.1. Команда diff — сравнение файлов Команда используется для сравнения двух файлов. Формат вызова программы diff: diff параметры файл1 файл2 В выводе программы отличающиеся строки помечаются символами > и <:? строка из первого файла
Азы и буки работы с текстом
Азы и буки работы с текстом Создание и сохранение документаЕсли вы окрыли программу из меню Пуск , с панели быстрого запуска или с Рабочего стола – словом, без открытия текстового файла, – то новый пустой документ будет создан автоматически. Бери да работай. Сложнее
Глава 9 Работа с текстом
Глава 9 Работа с текстом ? Набор текста.? Печать текстов.? Форматирование текстовых документов.? Вставка рисунков, таблиц и других
Урок 1.4. Программа Блокнот. Основы работы с текстом
Урок 1.4. Программа Блокнот. Основы работы с текстом Работа с документами Пользователям компьютеров постоянно приходится работать с документами: текстами, таблицами, рисунками и др. Существует большое количество различных типов документов и соответствующих программ для
2.5. Программы для работы с текстом
2.5. Программы для работы с текстом Программы для обработки текста носят название текстовых редакторов. Чаще всего веб-дизайнер при составлении контента использует тексты, набранные в Microsoft Word. Word облегчает обработку и, самое главное, корректуру текста. Тщательно