Стартап из MIT наведёт порядок в форматах документов онлайн Андрей Васильков
Стартап из MIT наведёт порядок в форматах документов онлайн
Андрей Васильков
Опубликовано 31 октября 2013
Молодая компания Crocodoc, основанная выпускниками Массачусетского технологического института, решает проблему некорректного отображения документов в браузерах радикальным образом. Для этого она разрабатывает продвинутый онлайн-конвертер, преобразующий документы любого формата в чистый HTML с максимально возможным сохранением форматирования.
Доступные в сети документы в форматах PDF и Microsoft Word часто приходится сохранять перед просмотром, поскольку в окне браузера через плагины они отображаются не совсем корректно. Над общей проблемой искажения структуры документов при их онлайн-просмотре годами работали сотни людей. Разными способами её пытались решить программисты Adobe, Microsoft и авторы всех браузеров, но тщетно. Чтобы увидеть многие документы в оригинальном виде, по-прежнему приходится сохранять их — и только затем открывать локальную копию специализированной программой просмотра.
Генеральный директор Crocodoc Райан Дамико (Ryan Damico) так описывает достижения своей команды в пресс-релизе:
«Мы потратили огромное количество времени на понимание структуры документов разных форматов на очень глубоком уровне. Мы научились быстро и качественно воссоздавать их в любом веб-браузере, включая мобильные».
Почему на таких файлообменных сервисах, как Flickr и YouTube, вы всегда видите изображения и видео независимо от формата, в котором они были загружены? Просто потому, что они конвертируют медиаконтент любого типа в тот формат, который гарантированно поддерживается всеми браузерами.
Используя инструменты Crocodoc, пользователи могут загрузить документы в формате PDF или Microsoft Office, которые максимально точно будут преобразованы в HTML-версию. Последнюю можно сделать общей и просматривать в любом браузере.
Пример документа, загруженного в формате PDF и доступного для совместного редактирования (изображение: crunchbase.com).
Сrocodoc предлагает разработчикам интегрировать соответствующий интерфейс прикладного программирования (API) в свои веб-сервисы, чтобы пользователям не нужно было загружать файлы большого объёма, устанавливать плагины для браузеров и отдельные программы для просмотра документов.
На фоне растущих потребностей в простом обмене цифровым контентом и развития облачных технологий конвертер документов Crocodoc стал прибыльной инициативой. За прошедшие с момента выпуска первой бета-версии три года его стали применять такие крупные компании, как LinkedIn, Yammer, Blackboard, Edmodo и SAP. На данный момент Crocodoc использован для конвертации 200 млн документов и 14 млн аннотаций к ним.
В качестве теста поддержки кириллицы и последнего формата MS Word я загрузил на демонстрационной странице проекта текст данной заметки. Как видите, он отображается без проблем.
Тест поддержки кириллицы (скриншот сайта crocodoc.com).
Ещё когда команда искала первых клиентов через сайт поддержки стартапов Y Combinator, отмечалось, что эта технология просмотра документов функционирует лучше аналогичных и пользуется спросом.
Большинство других конвертеров формировало изображение каждой страницы. Такой подход был медленным и страдал от проблем с низким качеством форматирования. Вместо этого Crocodoc разделяет содержимое документа на логические фрагменты и конвертирует их в соответствии с принятыми стандартами для браузеров. Текст преобразуется в HTML, а изображения — в масштабируемую векторную графику. Форматирование сохраняется с помощью CSS (каскадных таблиц стилей).
Crocodoc восходит к любительскому проекту WebNotes, который был запущен соседями по общежитию в MIT — студентами Беннетом Роджерсом (Bennet Rogers), Мэттом Лонгом (Matt Long), и Питером Лаем (Peter Lai).
WebNotes давал возможность выделять и комментировать текст на веб-страницах. Вскоре после окончания Массачусетского технологического института команда решила значительно расширить функционал и преобразовала его в Crocodoc.
В этом году крупная компания Box, предоставляющая услуги облачного хранения данных, стала партнёром Crocodoc, получив права совместного использования платформой. Райан Дамико высоко оценивает результаты нового сотрудничества:
«С компанией BOX мы остались верны намеченному вектору развития, но теперь обладаем в десять раз большим количеством ресурсов».
С такой поддержкой авторы Crocodoc быстрее выпустят новую версию API и сделают свой продукт ещё более популярным.
К оглавлению