Голубятня: Толстовский эксперимент или золотая формула успеха Сергей Голубицкий
Голубятня: Толстовский эксперимент или золотая формула успеха
Сергей Голубицкий
Опубликовано 02 июля 2013
ABBYY сильно напоминает мне самого себя :) В смысле, что компании, как и мне, импонирует роль первопроходца: прийти куда-то первым, выложиться по полной, заложить основы чего-то, захватывающего дыхание, а потом … слегка подрастерять интерес, сбавить обороты, убавить пыл, наконец, заскучать и неистово ринуться дальше осваивать просторы.
В феврале 2012 года я написал восторженную «Голубятню» о технологической революции, которую произвел проект Compreno, над которым ABBYY корпела более 15 лет. Летом прошлого года планировался готовый продукт. Пишу это не для того, чтобы укорить, а, как бы, напомнить: «Ау, ребята! Мы вас очень любим, а оттого -помним и всё еще ждем, не теряя надежды :)». Уж очень хочется еще при жизни погулять на празднике реальной альтернативы Google Translate, выводящей компьютеризированный перевод на следующий качественный уровень.
Сегодня хочу поговорить о другом восхитительном начинании ABBYY, которое я лично не хотел бы видеть заброшенным в еще большей степени, чем Compreno. Здесь, впрочем, ситуация качественно отличная: если Compreno никто, кроме самих разработчиков, уже угрохавших на проект 15 лет, продолжить не сможет, то в случае с проектом «Весь Толстой за один клик» (именно о нем мы сегодня будем говорить в «Голубятне») благодарное человечество, выразив предварительно признательность первопроходцу, с легкостью подхватит выпавшее из рук знамя (если, конечно, оно выпадет :) и двинется в будущее уже своим ходом.
Итак, что же это за однокличенный Толстой. ABBYY открыла специальный портал для координации действий по коллективному созданию эталонной электронной версии 90-томного академического собрания сочинений Льва Толстого. Любой желающий регистрируется на сайте (с именем и фамилией, слава богу — никакой дешевой анонимности!), устанавливает у себя на компьютере специальную версию FineReader 11 Professional Edition, загружает сырец-пакет размером в 5-10 Мб, который содержит около 20 страниц факсимильного текста, OCR-ит его и начитает считывать, исправляя ошибки, которые неизбежно возникают в процессе машинного распознавания знаков.
После окончания работы вы возвращаете вычитанный пакет обратно в систему, где его проверяют аудиторы на предмет пропущенных вами ошибок, опечаток и т.д. Если качество достойное, пакет принимается, а вы получаете баллы, увеличивая, тем самым, собственный рейтинг в проекте. Если ошибок слишком много, аудитор ваш пакет отклонит, и он вернется обратно в базу данных, и, следовательно, любой другой участник проекта сможет его взять на вычитывание. Аудиторы тоже набираются из добровольцев, которым, правда, предварительно потребуется пройти специальный тест на грамотность.
Проект организовала ABBYY совместно с Государственным музеем Льва Толстого. Инициатива похвальная, благородная, полезная и… здесь, наверное, можно было поставить точку. Помянули и благополучно забыли. Мало ли в Сети было организовано таких вот групповых аутсорсингов? И где они сейчас?
Очень скоро после запуска «Всего Толстого за один клик» (18 июня 2013 года) случилось событие, которое перевернуло все мои представления о потенциальных возможностях подобных инициатив. За первые 10 дней после старта 1 600 зарегистрировавшихся участников сумели вычитать 41 800 страниц — практически все 90 томов академического собрания сочинений писателя!
Соответственно к работе подключились аудиторы, которым предстоит не только внимательно проверить первую вычитку, но и корректно отформатировать материалы. Очевидно, что это занятие займет побольше времени, чем первоначальная вычитка, но тоже не затянется дольше, чем на пару месяцев.
Что же мы получаем в итоге? Безупречная цифровая версия уникального памятника мировой культуры будет доступна всем желающим за какие-то совершенно невероятные сроки: несколько месяцев! 90 томов! Для ориентира: выпуск самого академического полного собрания сочинений Льва Толстого осуществлялся 30 лет. С 1928 по 1958 годы.
Что меня потрясло в этой истории больше всего? Феноменальная эффективность группового аутсорсинга! Разумеется, можно было предположить, что, объединив усилия многих сотен и даже тысяч людей, можно добиться реально высокой скорости продвижения любого проекта, связанного с оцифровкой текстов. Но чтобы так вот — за 10 дней вычитали 90 томов ПСС, даже и вообразить не мог.
Самое интересное, в чем хотелось бы сейчас разобраться (и самое важное в практическом отношении на будущее) — это факторы, которые способствовали выведению эффективности группового аутсорсинга на качественный уровень, который не имеет аналогов в Интернете (мне, по крайней мере, они не ведомы, так что если кто-то подскажет, буду признателен). Речь сейчас идет не о темпах проведения вычитки и не о качестве продукта, ожидаемого на выходе, а именно об эффективности самого проекта.
У меня перед глазами — два печальных примера. Первый связан с коллективно-анонимными попытками создания альтернативных переводов в Сети. В частности, я хорошо запомнил сагу о Гарри Поттере, которую форумные доброхоты переводили наперегонки с официальными российскими издательствами. Работа эта вдохновлялась вполне оправданным негодованием: качество переводов на русский язык в бумажных изданиях («Росмэн») просто чудовищно. Вернее даже убоищно, потому что большего примера филологической бездарности и отсутствия малейшей культуры перевода, образованности и знания хотя бы азов ремесла и традиций, я в жизни не встречал.
Есть альтернативный любительский перевод Марии Спивак, который хоть и вызывает у меня неприятие на концептуальном уровне (отказ от говорящих имен), тем не менее, кажется гораздо более живым и адекватным, чем работа блатных ремесленников по официальному заказу. Однако перевод, который получился на выходе коллективных усилий, ниже всякой критики.
Второй пример — цифровые издания, которые выложены на Lib.rus.ec, Flibusta, Avaxhome и проч. Это, конечно, замечательно, что в русскоязычной ноосфере есть такое уникальное место (недоступное абсолютно никому из наших родственников по индоевропейским языкам — за другие просто не берусь отвечать, потому как не знаю), где можно получить свободный и бесплатный доступ к колоссальному объему художественной и профессионально-технической литературы в оцифрованном виде, однако восторг никоим образом не отменяет печальной реальности: качество цифровых текстов в подобных публичных библиотеках чудовищное.
Я уж не говорю о том, что 80 % представленной там литературы вообще не являются цифровыми текстами, а — тоскливыми факсимиле (DJVU, PDF) — голыми сканами без всякого текстового слоя.
Так почему же проект ABBYY оказался таким эффективным во всех отношениях — и в качестве вычитки текста, и в темпах достижения результатов? Вопрос, на самом деле, прост и банален: «Весь Толстой за один клик» — это симбиоз двух лучших импульсов, какие только придумало человечество за свою историю: коллективное исполнение задач при непременном сохранении авторитарного управления!
Ничто на свете не сравнится с этой схемой по эффективности: так строились египетские пирамиды, так выигрывались сражения и целые войны. Делают многие, руководит один. Стоит принципу нарушиться,как инициатива либо сходит на нет, либо терпит поражение, либо порождает такой продукт, что лучше бы его вообще не было.
ABBYY, делегируя вовне всю непосредственную работу по подготовке цифровых текстов ПСС Льва Толстого, полностью сохранила контроль над движением проекта. Со всеми полагающимися атрибутами: раздачей пряников (баллы, рейтинги, подарки, призы) и кнутов (запорол три пакета — на выход!), многоуровневым контролем за качеством и т.п.
Аналогию, кстати, можно расширять в любом направлении. Почему в Linux такие непреодолимые сложности на пути к де-факто стандарту настольных операционных систем? Ведь ясно же, что сама по себе эта ОС лучше любого конкурента, ан нет: как была 15 лет назад маргинальной забавой для периферийных гиков, так и осталась поныне. Потому что у Linux нет руководящего центра, нет авторитетного вождя, чьи приказы не обсуждаются. Стоит попасть такому вот замечательному продукту коллективного творчества в жесткие и умелые руки (именно что еще и умелые: кому нужны бездарные полководцы?), как получается шедевр. Вроде Mac OS X.
Как бы там ни было, хочу пожелать ABBYY не бросать новый проект по существу: то есть, после удачного завершения работ с ПСС Толстого, продолжить начинание с Чеховым, Достоевским и далее — со всеми остановками по сокровищнице мировой литературы. Иначе, если бросят — убежден! — идея настолько плодотворна, что впредь ее уже не предадут забвению, но подхватят другие доброхоты.
К оглавлению
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКЧитайте также
Голубятня: Фиговина №29 Сергей Голубицкий
Голубятня: Фиговина №29 Сергей Голубицкий Опубликовано 01 августа 2010 года Последний клип из неистощимого доиндийского загашника посвящен совсем мистическим объектам — вибратору для глаз и вибратору для туловища. Вообще-то по правильному нужно
Голубятня: Ась? Сергей Голубицкий
Голубятня: Ась? Сергей Голубицкий Опубликовано 12 октября 2010 года Читатели со стажем не дадут соврать: о системах распознания речи (VRS, Voice Recognition Systems) я писал регулярно, начиная с самой первой статьи, опубликованной в бумажной «Компьютерре» аж в 1996
Голубятня: I Am You Сергей Голубицкий
Голубятня: I Am You Сергей Голубицкий Праздник «Холи» возбудил не только гоанцев, но и всю творчески активную тусовку европейского десанта. Надо сказать, что в Гоа постоянно проживает значительное количество музыкантов, художников, поэтов и танцоров, которые работают, не
Голубятня: Что еще? Сергей Голубицкий
Голубятня: Что еще? Сергей Голубицкий Опубликовано 25 июня 2011 года На мартовской презентации айпада Garage Band явился, как говориться, story apart. Не удивительно, что в среде профессиональных музыкантов и композиторов, познакомившихся с уникальными и
Голубятня: PX Сергей Голубицкий
Голубятня: PX Сергей Голубицкий На следующей неделе у меня будет большая съемка в передаче «Крипто» («Совершенно секретно»), посвященной «Филадельфийскому эксперименту». Казалось бы — ну что еще можно высосать интересного из этого замшелого сюжета в наши
Голубятня: Неофагия Сергей Голубицкий
Голубятня: Неофагия Сергей Голубицкий Опубликовано 09 июня 2011 года Удивительно, как приходят в голову ценные идеи (не путать со сверхценными ?) на ровном месте. Вот и сегодня — неожиданно поставил точный диагноз страдалищу, которое длится уж
Голубятня: Попугайчики Сергей Голубицкий
Голубятня: Попугайчики Сергей Голубицкий Опубликовано 23 июля 2011 года Сегодня — видеорассказ о первом на рынке андроидном смартфоне с двумя SIM-картами. Made by Gigabyte. И distributed в РФ уважаемой Vobis. Презентацию я снимал в мае месяце (пришлось задержать до
Голубятня: Just 5 Сергей Голубицкий
Голубятня: Just 5 Сергей Голубицкий Опубликовано 12 января 2011 года Продолжаем новогодний видео марафон. Сегодня вертим в руках телефоны второго поколения от Just 5. В видео клипе я назвал сотрудников этой удачливой компании «нашими соотечественниками»
Голубятня: Out-of-the-box Сергей Голубицкий
Голубятня: Out-of-the-box Сергей Голубицкий Опубликовано 24 августа 2010 года Концепция out-of-the-box хорошо известна шозистам мира, хотя и не особо принята в нашем айтишном королевстве. Смысл концепции прост: распаковал коробку, достал и сразу же начал
Голубятня: Сергей Комаров Сергей Голубицкий
Голубятня: Сергей Комаров Сергей Голубицкий Опубликовано 15 июля 2010 года Очередной микроюбилей — 200 публикация «Голубятни Онлайн». Вспоминаю бумажные «Голубятню 100», «Голубятню 200», «Голубятню 300», «Голубятню 400»! Надеялся дожить до совсем уж
Голубятня: АК-47 Сергей Голубицкий
Голубятня: АК-47 Сергей Голубицкий Опубликовано 16 июня 2010 года Пауза, вызванная традиционным летним анабазисом на юга, затянулась, поэтому беру стахановские обязательства: до конца месяца выдавать посты в удвоенном ритме! Тем более, что совсем без
Голубятня: Рецепт успеха Великого Гэтсби Сергей Голубицкий
Голубятня: Рецепт успеха Великого Гэтсби Сергей Голубицкий Опубликовано 21 сентября 2013 Зачем разлучница-судьба - Всегда любви помеха? И почему любовь — раба Достатка и успеха? В мае состоялась премьера «Великого Гэтсби», пятая по счету
Голубятня: Изгнание Сергей Голубицкий
Голубятня: Изгнание Сергей Голубицкий Опубликовано 29 июня 2013 «Любовь долготерпит, милосердствует, любовь не завидует, любовь не превозносится, не гордится, не бесчинствует, не ищет своего, не раздражается, не мыслит зла, не радуется неправде,
Голубятня: Белоснежка Сергей Голубицкий
Голубятня: Белоснежка Сергей Голубицкий Опубликовано 24 мая 2013 Сегодня день рождения моего замечательного друга, издателя журналов, в которых уже 17 лет выходит большинство моих публикаций, Дмитрия Мендрелюка! Я счастлив, что жизнь свела меня с
Голубятня: No trespassing? Сергей Голубицкий
Голубятня: No trespassing? Сергей Голубицкий Опубликовано 26 апреля 2012 года Культур-повидло сегодня об очень интересном явлении — индивидуальном жизненном пространстве (ИЖП — это я его так грубо зааббревиатурил).ИЖП — это такая удивительная штука, о
Голубятня: КГ/АМ Сергей Голубицкий
Голубятня: КГ/АМ Сергей Голубицкий Опубликовано 26 марта 2012 года Повидло у меня сегодня слегка не первой свежести, но не беда: сладкий продукт не тухнет :) Тем более, что хочу предложить читателям довольно непривычный аспект хорошо знакомой