Джонатон Флетчер и его JumpStation: веб-поиск задолго до Google Олег Нечай
Джонатон Флетчер и его JumpStation: веб-поиск задолго до Google
Олег Нечай
Опубликовано 05 сентября 2013
Сегодня нам порой кажется, что известнейшая поисковая система Google существовала всегда — между тем она появилась только в 1998 году. Но, оказывается, самый настоящий веб-поисковик успешно функционировал ещё в 1994 году, задолго до возникновения Google, и его придумал британский программист Джонатон Флетчер.
В начале девяностых интернета, каким мы его знаем сегодня, не существовало: Сеть состояла из нескольких десятков тысяч текстовых страниц, объединённых в никак не связанные между собой блоки при помощи гиперссылок. Никакого поиска по этим страницам не было, и найти нужную информацию, не зная точного адреса, было невозможно.
Первый в мире браузер с удобным графическим пользовательским интерфейсом, рассчитанный на операционную систему WIndows 3.1, появился лишь в апреле 1993 года: он носил название NCSA Mosaic и был разработан в Национальном центре суперкомпьютерных приложений (NSCA) при Иллинойсском университете в США. Это был первый браузер, способный демонстрировать изображения внутри самого текста, а не в отдельном окне.
В браузере Mosaic была специальная страница What’s New («Что нового»), на которой собиралась информация о новых сайтах, появившихся в Сети. Однако чтобы такая информация была добавлена разработчиками Mosaic, создатели сайта должны были обратиться с соответствующей просьбой в Национальный центр суперкомпьютерных приложений. Сегодня сложно это себе представить, но данные вносились в ручном режиме, и об оперативности мало кто задумывался.
Но присутствовала и другая проблема: поскольку этот своеобразный браузерный каталог формировался вручную, ни о каких обновлениях входивших в него сайтов узнать было невозможно. Изменения никак не индексировались, о новом контенте ничего не сообщалось, а ссылки быстро устаревали и становились недействительными.
Как раз в эти годы талантливый студент Джонатон Флетчер (Jonathon Fletcher) завершал обучение в шотландском Университете Стёрлинга по специальности «информатика» (computer science) и очень рассчитывал продолжить образование, поступив в аспирантуру Университета Глазго. Однако финансирование было урезано, и вуз не смог принять нового аспиранта, поэтому Флетчер вернулся в alma mater и устроился на работу в технологический департамент Университета Стёрлинга. Здесь он впервые столкнулся с интернетом и со страницей What’s New браузера Mosaic.
Работая над созданием университетского веб-сервера, Флетчер понял, насколько несостоятельна сама идея, положенная в основу страницы What’s New. Ручное добавление сайтов и невозможность отслеживания обновлений делали её практически бесполезной. А поскольку Флетчер был дипломированным специалистом как раз в области компьютеров, он решил написать программу, способную автоматически индексировать изменения внесённых в список сайтов и позволяющую осуществлять поиск по актуальным страницам.
Так на свет появился первый в мире поисковый робот, «веб-паук», а это именно та технология, которая лежит в основе всех современных поисковых систем, включая Google, «Яндекс», Yahoo! и другие.
Флетчер назвал свою программу JumpStation. Она включала в себя список страниц, которые должен посетить поисковый робот, а также алгоритмы автоматической индексации и посещения всех гиперссылок, которые встречались ему на пути. Процесс должен был продолжаться до тех пор, пока роботу больше некуда будет зайти. Флетчер быстро написал простой в использовании поисковый алгоритм по индексируемым страницам и разместил ссылку на свою страницу на What’s New. Спустя 10 дней после первого запуска JumpStation, 21 декабря 1993 года, «паук» остановился: он проиндексировал 25 тысяч страниц.
К июню 1994 года количество проиндексированных JumpStation страниц достигло уже 275 тысяч. Интернет бурно развивался, и стали очевидны ограничения маленького университетского сервера: ёмкость винчестеров тогда была несоизмерима с современной, а сами жёсткие диски были очень дорогими. Недостаток места вынудил Флетчера ограничить глубину индексирования только названиями страниц и заголовками опубликованных на них текстов, однако даже с такой нагрузкой существующее оборудование справлялось с трудом.
К сожалению, Университет Стёрлинга не мог обеспечить необходимое финансирование, а Флетчер не сумел убедить руководство в перспективности проекта JumpStation, поэтому он был постепенно свёрнут. К тому же проект не являлся основной работой Флетчера, который должен был заниматься системным администрированием и технической поддержкой университетских занятий. История JumpStation закончилась, когда Флетчеру предложили научную работу в Токио, от которой молодой специалист просто не мог отказаться.
Разумеется, поиск по компьютерным базам данных существовал задолго до интернета и робота Флетчера. Однако именно он придумал систему поиска в Сети со всеми её необходимыми компонентами, присущими современным поисковым движкам.
* * *
В отличие от создателей Google Сергея Брина и Ларри Пейджа, имя Джонатона Флетчера ни о чём не говорит даже специалистам. Сегодня Флетчер живёт в Гонконге, и о его вкладе в развитие Всемирной сети знают лишь бывшие сотрудники по Университету Стёрлинга.
Джонатон Флетчер (в середине) на конференции SIGIR 2013.
И хотя Флетчер давно не работает в области обработки информации, бывшие коллеги не забыли о его существовании, и совсем недавно он был приглашён на международную конференцию по поиску информации SIGIR 2013, проходившую с 28 июля по 1 августа в ирландском Дублине. Первая же секция, открывшая форум, была посвящена 20-летию создания JumpStation — самого первого поискового движка в интернете, который работал и выглядел для пользователя практически так же, как и современные системы.
Джонатон Флетчер стал специально приглашённым гостем на этой конференции и принял участие в обсуждении истории и перспектив веб-поиска с представителями Google, Microsoft и Yahoo!. Флетчер предпочёл не касаться подробностей давно минувших дней, но заявил о важности самой идеи поиска в море данных. По его мнению, интернет отнюдь не вечен — в отличие от проблемы нахождения информации, и это желание искать и находить данные никак не зависит от конкретных носителей.
Двадцать лет назад Флетчер не смог заинтересовать своей идеей, намного опередившей время, ни университетское руководство, ни потенциальных инвесторов — и остался в стороне от огромного международного бизнеса, который уже вполне обоснованно сравнивают с некоей надгосударственной спецслужбой. Тем не менее не может не заслуживать уважения один тот факт, что ещё на заре интернета Флетчер смог реализовать на практике идею, которую с успехом эксплуатируют до сих пор.
К оглавлению
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКЧитайте также
Расширенный поиск в Google
Расширенный поиск в Google Рассмотрим некоторые инструменты расширенного поиска. В поисковой системе Google доступна настройка типа содержания запроса на искомых страницах. При этом возможны следующие варианты.– со всеми словами – в этом режиме поиска формируется список
Сложный поиск в Google
Сложный поиск в Google Сложный поиск предусматривает возможность использования особенностей языка поисковых запросов. Он является уникальным по своему синтаксису для каждой поисковой системы, но его возможности схожи.Вот наиболее популярные задачи, которые можно решить
Семь забавных «пасхальных яиц», или спрятанных сюрпризов, в сервисах Google Олег Нечай
Семь забавных «пасхальных яиц», или спрятанных сюрпризов, в сервисах Google Олег Нечай Опубликовано 18 октября 2013 «Пасхальные яйца», или скрытые шутливые сюрпризы, в самых разных приложениях — любимая забава программистов, которые считают
11 самых впечатляющих туров Google Street View Олег Нечай
11 самых впечатляющих туров Google Street View Олег Нечай Опубликовано 19 ноября 2013 Сервис фотопанорам Google Street View был открыт в мае 2007 года и стал одной из самых востребованных функций Google Maps и Google Earth. В самом начале проекта автомобили с панорамными камерами
8 способов отменить «улучшения» сервисов Google Олег Нечай
8 способов отменить «улучшения» сервисов Google Олег Нечай Опубликовано 28 ноября 2013 Компания Google постоянно совершенствует свои многочисленные сервисы: Gmail образца 2013 года совершенно не похож на Gmail из 2008-го, а современные карты Google Maps имеют мало
Как и почему в Google решили бороться с «бесконечным скроллингом» Олег Нечай
Как и почему в Google решили бороться с «бесконечным скроллингом» Олег Нечай Опубликовано 10 марта 2014 Около трёх лет назад с лёгкой руки веб-гигантов Google и Facebook у многих сайтостроителей вошёл в моду «бесконечный скроллинг» (БС), при котором новый
Модульные технологии: от Lego до Google Blockly Олег Нечай
Модульные технологии: от Lego до Google Blockly Олег Нечай Опубликовано 24 декабря 2013 Людям всегда нравилось изобретать что-то новое. Однако для плодотворного творчества требуется не только личная одарённость, но и среда, позволяющая реализовать новые
9 специализированных поисковиков, которые по-своему лучше Google Олег Нечай
9 специализированных поисковиков, которые по-своему лучше Google Олег Нечай Опубликовано 15 ноября 2013 Google — это самая крупная и самая популярная в мире поисковая система. Ежедневно на сайтах Google, доступных примерно на 200 языках, регистрируется более 50
Выбираем смартфон на основе Google Android Олег Нечай
Выбираем смартфон на основе Google Android Олег Нечай Опубликовано 19 января 2011 года По прогнозам экспертов, в обозримом будущем доля «гуглофонов» на рынке продолжит расти. Об этом свидетельствуют итоги выставки CES 2011, на которой подавляющее большинство
Современные смартфоны на основе Google Android Олег Нечай
Современные смартфоны на основе Google Android Олег Нечай Опубликовано 19 января 2011 года О том, на что стоит обратить внимание при выборе мобильного телефона на основе Android, читайте в первой части статьи. HTC Desire Z Клавиатурный вариант флагмана,
"Железо" Google TV: atomное телевидение Олег Нечай
"Железо" Google TV: atomное телевидение Олег Нечай Опубликовано 24 мая 2010 года На конференции I/O для разработчиков Google представила сетевую телевизионную платформу, которая объединяет простоту использования обычного телевизора и возможности интернета,
Почему социальная сеть Google+ лучше, чем Facebook: восемь очевидных преимуществ Олег Нечай
Почему социальная сеть Google+ лучше, чем Facebook: восемь очевидных преимуществ Олег Нечай Опубликовано 15 августа 2013 Google+ — самая молодая из крупных социальных сетей такого рода: она была запущена в июне 2011 года и открылась для всеобщего пользования в
10 самых полезных расширений для Google Chrome Олег Нечай
10 самых полезных расширений для Google Chrome Олег Нечай Опубликовано 16 июля 2013 Google Chrome — один из самых молодых браузеров: его первая версия увидела свет в конце 2008 года. Тем не менее на сегодня это самый популярный веб-просмотрщик в мире: его используют
7 полноценных и безопасных альтернатив Google Play Олег Нечай
7 полноценных и безопасных альтернатив Google Play Олег Нечай Опубликовано 17 февраля 2014 В марте 2014 года исполняется два года с момента появления сервиса Google Play, который пришёл на смену открытому в далёком 2008-м онлайновому магазину Android Market. Это главный
Без Google Reader: чем заменить незаменимый сервис Google, что теперь делать и кто в этом виноват Олег Парамонов
Без Google Reader: чем заменить незаменимый сервис Google, что теперь делать и кто в этом виноват Олег Парамонов Опубликовано 15 марта 2013 Компания Google объявила, что планирует закрыть RSS-агрегатор Google Reader. Это катастрофа, и не только для тех, кто пользовался
Google начинает битву за качество мобильных сайтов Олег Нечай
Google начинает битву за качество мобильных сайтов Олег Нечай Опубликовано 29 августа 2013 Мобильная версия вашего сайта корректно работает далеко не на всех портативных устройствах? Тогда он никогда не поднимется на первые места в поиске Google: именно