Пакет SubtitleRipper
Пакет SubtitleRipper
Этот пакет включает пять консольных утилит – srttool, subtitle2pgm, pgm2txt, vobsub2pgm, subtitle2vobsub, выполняющих каждая свою задачу. Используя их, можно конвертировать DVD-субтитры в subrip-текстовый или VobSub форматы. Поток превращается в файл формата PGM или PPM, а затем распознается и становится обычным текстом при помощи утилиты gocr (http://jocr.sourceforge.net/), который будет установлен в качестве зависимостей (для ksubtitleripper обязательной). Для полноценной работы первой понадобится и transcode (http://www.transcoding.org/), которую нужно установить, набрав sudo apt-get install transcode.
Для извлечения субтитров в ASCII из vob-файлов, принадлежащих первому фильму, находящемуся в текущем каталоге, выполните следующие команды:
$ сat vts_01_?.vob | tcextract -x ps1 -t vob -a 0x20 | subtitle2pgm -o movie_1
$ pgm2txt movie_1
$ srttool -s -i movie_1.srtx -o my_movie_1.srt
Это долгий процесс, и на маломощном компьютере на эту операцию уйдет немало времени. В итоге получится файл my_movie_1.srt, содержащий субтитры. Параметров у команд немного, остановимся только на –a 0x20. Фильмы могут содержать несколько субтитров, значение 0x20 соответствует первому, 0x21 – второму и так далее. Субтитры в формате VobSub получаются на порядок быстрее, но они несколько больше по размеру. Сначала извлеките поток субтитров командой
$ cat vts_01_?.vob | tcextract -x ps1 -t vob -a 0x20 > my_sub.ps1
Затем перекодируйте в формат VobSub:
$ subtitle2vobsub -i vts_01_0.ifo -p mysub.ps1 -o movie_name
В документации описаны все возможные варианты и комбинации использования этих утилит.
Есть также фронтэнд к subtitleripper для библиотек KDE – ksubtitleripper (http://ksubtitleripper.berlios.de/), который позволяет получить файл субтитров в формате SRT из исходных файлов VOB и SUB. Запускаете, набрав в терминале ksubtitleripper, затем в поле Vob or Sub Files (Файлы формата Vob или Sub) указываете источник, в поле Directory (Директория) – каталог для сохранения файлов и нажимаете кнопку OK (рис. 3.52). Вот и все. В случае если gocr не может распознать некоторые буквы, пользователю задается вопрос, параллельно производится проверка правописания. Поддерживаются три кодировки – UTF8, DOS и стандартная английская.
Рис. 3.52. Запуск KSubtitleRipper
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКДанный текст является ознакомительным фрагментом.
Читайте также
Пакет Основные элементы
Пакет Основные элементы Ниже дается краткая характеристика элементов каждого из перечисленных подпакетов, входящих в состав пакета Основные элементы. Более полное рассмотрение отдельных компонентов метамодели будет представлено в главах, посвященных изучению
Пакет Элементы ядра
Пакет Элементы ядра Пакет Элементы ядра является наиболее фундаментальным из всех подпакетов, которые входят в пакет Основные элементы языка UML. Этот пакет определяет основные абстрактные и конкретные компоненты, необходимые для разработки объектных моделей. При этом
Пакет Кооперации
Пакет Кооперации Пакет Кооперации специфицирует контекст поведения при использовании элементов модели для выполнения отдельной задачи. В нем задается семантика понятий, которые необходимы для ответа на вопрос: «Как различные элементы модели взаимодействуют между
Пакет Варианты использования
Пакет Варианты использования Пакет Варианты использования специфицирует поведение при включении в модель специальных конструкций, которые в языке UML называются актерами и вариантами использования. Эти понятия служат для определения функциональности моделируемой
Пакет Автоматы
Пакет Автоматы Пакет Автоматы специфицирует поведение при построении моделей с использованием систем переходов для конечного множества состояний. В нем определено множесто понятий, которые необходимы для представления поведения модели в виде дискретного
9.1 Пакет макроопределений ms
9.1 Пакет макроопределений ms Основная идея, заложенная в пакет макроопределений, состоит в том, что документ описывается в терминах его логических частей названия, заголовков разделов, абзацев, а не в деталях: расстановка пробелов, выбор шрифтов, определение размеров букв.
12.2.5 Пакет WordViewer
12.2.5 Пакет WordViewer Как уже говорилось выше, одна из самых больших проблем для пользователей Linux - это работа с файлами в форматах MS Word (и других программ из пакета MS Office). Ведь пока что большинство текстов создается именно в этом формате. Наиболее распространенное средство
19.3.1. Пакет iproute2
19.3.1. Пакет iproute2 Начиная с версии ядра 2.2, сетевая подсистема Linux была значительно переработана, в нее было добавлено много новых возможностей — управление трафиком, маршрутизация на основе правил и т.п. Доступ к этим возможностям предоставляется пакетом iproute2, входящим в
Глава 3. Пакет «Мозилла»
Глава 3. Пакет «Мозилла» Среди массы свободных клиентских программ, связанных с сетевой функциональностью, за ограниченностью печатного объема остановимся на проекте «Мозилла».«Мозилла» представляет собой свободный пользовательский прикладной пакет, реализующий
Пакет OpenOffice.org
Пакет OpenOffice.org Офисный пакет OpenOffice.org – это первый качественный продукт Linux, позволяющий работать с текстовыми документами, электронными таблицами, изображениями, базами данных и создавать презентации. За его основу был взят пакет StarOffice, разработанный немецкой фирмой
Офисный пакет KОffice
Офисный пакет KОffice KDE Оffice, или просто KOffice, – это также бесплатный и доступный в исходных кодах офисный пакет. Он распространяется по лицензии GNU GPL и состоит из большого количества приложений, каждое из которых отвечает за определенный участок работы и при необходимости
11. Лекция: Пакет java.awt
11. Лекция: Пакет java.awt Эта лекция начинает рассмотрение базовых библиотек Java, которые являются неотъемлемой частью языка и входят в его спецификацию, а именно описывается пакет java.awt, предоставляющий технологию AWT для создания графического (оконного) интерфейса
Глава 25. Пакет
Глава 25. Пакет В омнифонтовой системе распознавания текстов ABBYY FineReader существует специальное рабочее окно Пакет, в котором отображаются страницы, которые вы только что отсканировали или открыли через команду меню Файл к Открыть пакет.Пакетом в программе FineReader
Пакет Office recovery
Пакет Office recovery Компания Recoveronix Ltd. предлагает более 30 утилит для автоматического восстановления файлов большинства распространенных форматов. С официального сайта компании (http://www.officerecovery.com/office/) можно скачать как отдельные приложения, так и их пакет под общим названием