Пакет SubtitleRipper
Пакет SubtitleRipper
Этот пакет включает пять консольных утилит – srttool, subtitle2pgm, pgm2txt, vobsub2pgm, subtitle2vobsub, выполняющих каждая свою задачу. Используя их, можно конвертировать DVD-субтитры в subrip-текстовый или VobSub форматы. Поток превращается в файл формата PGM или PPM, а затем распознается и становится обычным текстом при помощи утилиты gocr (http://jocr.sourceforge.net/), который будет установлен в качестве зависимостей (для ksubtitleripper обязательной). Для полноценной работы первой понадобится и transcode (http://www.transcoding.org/), которую нужно установить, набрав sudo apt-get install transcode.
Для извлечения субтитров в ASCII из vob-файлов, принадлежащих первому фильму, находящемуся в текущем каталоге, выполните следующие команды:
$ сat vts_01_?.vob | tcextract -x ps1 -t vob -a 0x20 | subtitle2pgm -o movie_1
$ pgm2txt movie_1
$ srttool -s -i movie_1.srtx -o my_movie_1.srt
Это долгий процесс, и на маломощном компьютере на эту операцию уйдет немало времени. В итоге получится файл my_movie_1.srt, содержащий субтитры. Параметров у команд немного, остановимся только на –a 0x20. Фильмы могут содержать несколько субтитров, значение 0x20 соответствует первому, 0x21 – второму и так далее. Субтитры в формате VobSub получаются на порядок быстрее, но они несколько больше по размеру. Сначала извлеките поток субтитров командой
$ cat vts_01_?.vob | tcextract -x ps1 -t vob -a 0x20 > my_sub.ps1
Затем перекодируйте в формат VobSub:
$ subtitle2vobsub -i vts_01_0.ifo -p mysub.ps1 -o movie_name
В документации описаны все возможные варианты и комбинации использования этих утилит.
Есть также фронтэнд к subtitleripper для библиотек KDE – ksubtitleripper (http://ksubtitleripper.berlios.de/), который позволяет получить файл субтитров в формате SRT из исходных файлов VOB и SUB. Запускаете, набрав в терминале ksubtitleripper, затем в поле Vob or Sub Files (Файлы формата Vob или Sub) указываете источник, в поле Directory (Директория) – каталог для сохранения файлов и нажимаете кнопку OK (рис. 3.52). Вот и все. В случае если gocr не может распознать некоторые буквы, пользователю задается вопрос, параллельно производится проверка правописания. Поддерживаются три кодировки – UTF8, DOS и стандартная английская.
Рис. 3.52. Запуск KSubtitleRipper
Данный текст является ознакомительным фрагментом.