Пакет SubtitleRipper

We use cookies. Read the Privacy and Cookie Policy

Пакет SubtitleRipper

Этот пакет включает пять консольных утилит – srttool, subtitle2pgm, pgm2txt, vobsub2pgm, subtitle2vobsub, выполняющих каждая свою задачу. Используя их, можно конвертировать DVD-субтитры в subrip-текстовый или VobSub форматы. Поток превращается в файл формата PGM или PPM, а затем распознается и становится обычным текстом при помощи утилиты gocr (http://jocr.sourceforge.net/), который будет установлен в качестве зависимостей (для ksubtitleripper обязательной). Для полноценной работы первой понадобится и transcode (http://www.transcoding.org/), которую нужно установить, набрав sudo apt-get install transcode.

Для извлечения субтитров в ASCII из vob-файлов, принадлежащих первому фильму, находящемуся в текущем каталоге, выполните следующие команды:

$ сat vts_01_?.vob | tcextract -x ps1 -t vob -a 0x20 | subtitle2pgm -o movie_1

$ pgm2txt movie_1

$ srttool -s -i movie_1.srtx -o my_movie_1.srt

Это долгий процесс, и на маломощном компьютере на эту операцию уйдет немало времени. В итоге получится файл my_movie_1.srt, содержащий субтитры. Параметров у команд немного, остановимся только на –a 0x20. Фильмы могут содержать несколько субтитров, значение 0x20 соответствует первому, 0x21 – второму и так далее. Субтитры в формате VobSub получаются на порядок быстрее, но они несколько больше по размеру. Сначала извлеките поток субтитров командой

$ cat vts_01_?.vob | tcextract -x ps1 -t vob -a 0x20 > my_sub.ps1

Затем перекодируйте в формат VobSub:

$ subtitle2vobsub -i vts_01_0.ifo -p mysub.ps1 -o movie_name

В документации описаны все возможные варианты и комбинации использования этих утилит.

Есть также фронтэнд к subtitleripper для библиотек KDE – ksubtitleripper (http://ksubtitleripper.berlios.de/), который позволяет получить файл субтитров в формате SRT из исходных файлов VOB и SUB. Запускаете, набрав в терминале ksubtitleripper, затем в поле Vob or Sub Files (Файлы формата Vob или Sub) указываете источник, в поле Directory (Директория) – каталог для сохранения файлов и нажимаете кнопку OK (рис. 3.52). Вот и все. В случае если gocr не может распознать некоторые буквы, пользователю задается вопрос, параллельно производится проверка правописания. Поддерживаются три кодировки – UTF8, DOS и стандартная английская.

Рис. 3.52. Запуск KSubtitleRipper

Данный текст является ознакомительным фрагментом.