12.2.5 Пакет WordViewer
12.2.5 Пакет WordViewer
Как уже говорилось выше, одна из самых больших проблем для пользователей Linux - это работа с файлами в форматах MS Word (и других программ из пакета MS Office). Ведь пока что большинство текстов создается именно в этом формате. Наиболее распространенное средство просмотра таких файлов, - это программа (точнее библиотека программ) wv, которая раньше носила более полное название mswordview.
Библиотека wv предназначена для получения доступа к файлам форматов MS Word 2000, 97, 95 и 6 из операционных систем типа UNIX, в частности из Linux. В состав дистрибутива ALT Linux Junior 1.0 включена версия 0.6.5 этого пакета, авторами которого являются Dom Lachowicz и Caolan McNamara (первый разработчик). Если у вас этот пакет не установлен, вы можете найти его на сайте http://www.wvware.com.
Идея, реализованная в этом пакете, очень проста: раз мы не имеем средств для просмотра файлов в формате MS Word, то давайте преобразуем текст из этих файлов в какой-то открытый формат. В качестве последнего можно выбрать один из следующих форматов: HTML, PS, PDF, LaTex, DVI (формат издательской системы TEX), ABW (формат текстового редактора AbiWord), Wml (формат, используемый в персональных органайзерах PDA и устройствах типа Web-телефонов), ASCII-текст. Вызов отдельных библиотечных процедур может быть использован в других приложениях. Разработчики обещают, что вскоре станет возможным и обратное преобразование: из перечисленных открытых форматов - в формат MS Word.
Пакет состоит из отдельных программ, каждая из которых предназначена для преобразования doc-файла в определенный формат. Этот формат указывается непосредственно в названиях отдельных программ пакета: wvAbw, wvCleanLatex, wvDVI, wvHtml, wvLatex, wvMime, wvPDF, wvPS, wvRTF, wvSimpleCLX, wvText, wvWml. Кроме того, в состав пакета входят две вспомогательных утилиты: wvVersion, которая служит для получения информации о версии документа MS Word, и wvSummary - эта утилита выводит общую информацию о документе, которую в самом MS Word можно ввести через пункт меню Файл | Свойства. Вот как выглядит вывод этих команд (для использованного мной в этом примере файла служебные данные не были введены; впрочем, если их ввести по-русски, то радости будет не много больше, поскольку вывод получим в кодовой странице CP-1251, так что текст на экране будет нечитаемым).
[user@linux tmp]$ wvVersion book-p1.doc
Version: word8, Encrypted: No
[user@linux tmp]$ wvSummary book-p1.doc
The title is В
The subject is
The author is kos
The keywords are no comments found
The template was Normal.dot
The last author was kos
The rev # was 12
The app name was Microsoft Word 8.0
PageCount is 1
WordCount is 52757
CharCount is 300716
Security is 0
Codepage is 0x4e3 (1251)
Основной утилитой пакета является программа wvWare (или wvConvert), вызов которой осуществляется следующим образом
wvWare [OPTION…] filename.doc › filename.html
Основные опции:
• -x --config=config.xml
Указывает на используемый выходной фильтр.
• -c --charset=charset
Задает кодовую страницу для iconv.
• -p --password=password
Задает пароль для зашифрованных документов Word.
• -d --dir=dir
Задает каталог, в котором будет сохранена создаваемая графика.
• -v -version
Выдает версию пакета wvWare.
• -? -help
Выводит краткую справку по использованию программы.
Выходной фильтр, указываемый опцией -x или -config=, задает формат выходного файла. Если эта опция не задана, то выходной фильтр ищется в текущем каталоге или (если в текущем не нашли) по месту установки пакета. По умолчанию используется фильтр wvHtml.xml, т. е. doc-файл преобразуется в формат HTML.
После преобразования полученный файл можно просмотреть с помощью соответствующей программы просмотра, например, html-файл - с помощью любого Web-браузера. Конечно, при этом некоторые возможности форматирования, имеющиеся в Word, теряются, и это надо иметь в виду, просматривая полученные файлы.
Насколько я могу судить, именно программы пакета wv используются для открытия файлов MS Word в некоторых текстовых редакторах для Linux, например, в AbiWord.
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКЧитайте также
Пакет Основные элементы
Пакет Основные элементы Ниже дается краткая характеристика элементов каждого из перечисленных подпакетов, входящих в состав пакета Основные элементы. Более полное рассмотрение отдельных компонентов метамодели будет представлено в главах, посвященных изучению
Пакет Элементы ядра
Пакет Элементы ядра Пакет Элементы ядра является наиболее фундаментальным из всех подпакетов, которые входят в пакет Основные элементы языка UML. Этот пакет определяет основные абстрактные и конкретные компоненты, необходимые для разработки объектных моделей. При этом
Пакет Кооперации
Пакет Кооперации Пакет Кооперации специфицирует контекст поведения при использовании элементов модели для выполнения отдельной задачи. В нем задается семантика понятий, которые необходимы для ответа на вопрос: «Как различные элементы модели взаимодействуют между
Пакет Варианты использования
Пакет Варианты использования Пакет Варианты использования специфицирует поведение при включении в модель специальных конструкций, которые в языке UML называются актерами и вариантами использования. Эти понятия служат для определения функциональности моделируемой
Пакет Автоматы
Пакет Автоматы Пакет Автоматы специфицирует поведение при построении моделей с использованием систем переходов для конечного множества состояний. В нем определено множесто понятий, которые необходимы для представления поведения модели в виде дискретного
9.1 Пакет макроопределений ms
9.1 Пакет макроопределений ms Основная идея, заложенная в пакет макроопределений, состоит в том, что документ описывается в терминах его логических частей названия, заголовков разделов, абзацев, а не в деталях: расстановка пробелов, выбор шрифтов, определение размеров букв.
19.3.1. Пакет iproute2
19.3.1. Пакет iproute2 Начиная с версии ядра 2.2, сетевая подсистема Linux была значительно переработана, в нее было добавлено много новых возможностей — управление трафиком, маршрутизация на основе правил и т.п. Доступ к этим возможностям предоставляется пакетом iproute2, входящим в
Глава 3. Пакет «Мозилла»
Глава 3. Пакет «Мозилла» Среди массы свободных клиентских программ, связанных с сетевой функциональностью, за ограниченностью печатного объема остановимся на проекте «Мозилла».«Мозилла» представляет собой свободный пользовательский прикладной пакет, реализующий
Пакет OpenOffice.org
Пакет OpenOffice.org Офисный пакет OpenOffice.org – это первый качественный продукт Linux, позволяющий работать с текстовыми документами, электронными таблицами, изображениями, базами данных и создавать презентации. За его основу был взят пакет StarOffice, разработанный немецкой фирмой
Офисный пакет KОffice
Офисный пакет KОffice KDE Оffice, или просто KOffice, – это также бесплатный и доступный в исходных кодах офисный пакет. Он распространяется по лицензии GNU GPL и состоит из большого количества приложений, каждое из которых отвечает за определенный участок работы и при необходимости
Пакет SubtitleRipper
Пакет SubtitleRipper Этот пакет включает пять консольных утилит – srttool, subtitle2pgm, pgm2txt, vobsub2pgm, subtitle2vobsub, выполняющих каждая свою задачу. Используя их, можно конвертировать DVD-субтитры в subrip-текстовый или VobSub форматы. Поток превращается в файл формата PGM или PPM, а затем распознается и
11. Лекция: Пакет java.awt
11. Лекция: Пакет java.awt Эта лекция начинает рассмотрение базовых библиотек Java, которые являются неотъемлемой частью языка и входят в его спецификацию, а именно описывается пакет java.awt, предоставляющий технологию AWT для создания графического (оконного) интерфейса
Глава 25. Пакет
Глава 25. Пакет В омнифонтовой системе распознавания текстов ABBYY FineReader существует специальное рабочее окно Пакет, в котором отображаются страницы, которые вы только что отсканировали или открыли через команду меню Файл к Открыть пакет.Пакетом в программе FineReader
Пакет Office recovery
Пакет Office recovery Компания Recoveronix Ltd. предлагает более 30 утилит для автоматического восстановления файлов большинства распространенных форматов. С официального сайта компании (http://www.officerecovery.com/office/) можно скачать как отдельные приложения, так и их пакет под общим названием