3.1.3. Как выглядят Яндекс. Новости

3.1.3. Как выглядят Яндекс. Новости

Набрав в браузере адрес главной страницы Яндекса — yandex.ru — вы увидите не только строку для ввода поискового запроса, разделы каталога и информеры. Над строкой ввода будут представлены пять главных на этот час новостей дня — только их заголовки. Эти же новости, но уже с аннотациями, будут представлены и на основной странице новостного раздела — news.yandex.ru. Следом за ними только заголовками будет представлена десятка новостей, следующая за первыми по важности (рис. 3.1).

Обратите внимание, что главная новостная страница максимально облегчена для загрузки — здесь отсутствует какая-либо графика, реклама. Загрузка страницы осуществляется быстро даже на плохих каналах связи. Тем не менее информации на странице вполне достаточно, чтобы составить представление об актуальных событиях дня.

Новостные разделы

Аналогично оформлены и тематические новостные разделы. Чтобы попасть в них, выберите нужный в левой колонке. Для некоторых разделов введены дополнительные подрубрики (например, для раздела Политика добавлена подрубрика Выборы). Подрубрики могут меняться в зависимости от конъюнктуры, от того, что может привлекать наибольшее внимание. Щелчок на названии рубрики переводит вас на тематическую страницу, где точно так же будет представлена пятерка новостей с аннотациями (но только по тематике данной рубрики), и далее десятка новостей, представленных своими заголовками.

Теперь обратите внимание на строку, размещенную над списком новостей (рис. 3.2), — сколько источников обработано, на какой момент времени. Это статистика. А вот в следующей строке, где представлено название раздела, можно увидеть, что существуют две раздельные новостные подборки по каждой тематике, одна для России, другая — для Украины. Какие-то новости окажутся общими, но многие новости и сюжеты будут основываться на региональных материалах.

Представленные на страницах разделов новости (сюжеты) не ограничиваются только своим названием и аннотацией для ведущих новостей. Помимо этого, для каждого из них присутствует дополнительная информация. Возьмем любую новость (рис. 3.3). Сразу за заголовком в скобках приведено количество публикаций в различных СМИ, связанных с этим событием и попавших в сюжет. Для некоторых новостей дополнительная информация на этом исчерпывается, но для большинства дополнена и другими данными.

Новости не только читают, о них высказывают и свои мнения. Обсуждают в блогах и на форумах. И следующая цифра в строке заголовка показывает, сколько записей (мнений) было сделано в блогах при обсуждении этой новости. Цифра, показывающая количество записей, является ссылкой на страницу поиска по блогам, перейдя по которой вы получите полный список этих записей.

Наконец, для ряда новостей может присутствовать еще одна ссылка — карта (рис. 3.4). Эта ссылка означает, что на карте отмечено место, где произошло данное событие. К примеру, когда в московском метро был открыт памятник бездомной собаке, место, где это произошло, было отмечено на карте Москвы, и его можно было посмотреть, перейдя по ссылке.

Страницы сюжетов

Если вас заинтересовала какая-либо новость, опубликованная на странице главного или тематического раздела, вы можете перейти на страницу сюжета, щелкнув на его названии.

На странице сюжета (рис. 3.5) представлены отобранные по содержательной близости новости различных источников, отсортированные в хронологическом порядке. Причем здесь подбираются не только текстовые сообщения, но также фотографии, аудио- и видеофайлы, входящие в сюжет. По умолчанию на странице сюжета показывается 30 заголовков, но под этим списком есть ссылка, по которой можно просмотреть все новости, включенные в сюжет, с их аннотациями.

Страница сюжета открывается, как правило, фотографией с места событий, а также более развернутой, чем на тематической странице, аннотацией. При этом аннотация может быть сборная, полученная из различных публикаций.

Следом приводится статистическая информация — сколько входит в этот сюжет сообщений, фотографий и других файлов, сколько высказано по этому поводу мнений в блогах. И не менее важная информация — какое информационное издание первым опубликовало эту новость (приводится название издания, дата и точное время публикации).

В конце списка новостей может присутствовать ссылка на другие сюжеты, связанные с данным. К примеру, с обсуждением установки памятника бездомной собаке Яндекс. Новости связали сюжет под названием "Суд рассмотрит дело охранника метро, убившего пса Рыжика". Поскольку все формирование раздела новостей происходит автоматически, остается лишь порадоваться такому точному определению тематически связанных сюжетов.

Если в новости упоминается географический адрес, связанный с событием, то в дополнение сюжет будет проиллюстрирован фрагментом карты города (пока поддерживается 10 городов, среди которых Москва, Киев, Екатеринбург, Самара). Как уже говорилось, в новости про памятник собаке упоминается станция метро, поэтому на странице сюжета приводится фрагмент карты Москвы (см. рис. 3.4) в районе упомянутой станции. Если вы захотите рассмотреть карту подробнее, то сможете сделать это с помощью одного щелчка, перейдя на большую карту в Яндекс. Картах.

Выделение адресов из контента проводится с помощью технологии извлечения данных, которая применяется и для выделения других важных компонентов сообщений (например, действующих лиц).

С технологической точки зрения интересной задачей оказалось определение города, к которому относится упомянутый в новости адрес. Дело в том, что авторы новостных сообщений достаточно редко пишут город непосредственно рядом с улицей, — говорит Лев Гершензон, ведущий разработчик компании "Яндекс". — Для решения этой задачи пришлось из каждого новостного сообщения выделять все названия населенных пунктов, а потом выбирать самое "релевантное" — в зависимости от количества вхождений в документ, от расположения в документе и т. п.

Очень часто в связи с тем или иным событием в онлайновых изданиях публикуются высказывания известных личностей. Наиболее интересные высказывания могут быть подобраны в специальный блок, который называется Сюжет в лицах. На странице сюжета в этом блоке представлены фамилии людей, выразивших свое отношение к обсуждаемому событию, либо тем или иным образом с ним связанные. Например, в сюжете, посвященном эмбарго на поставку мяса из Польши, в блоке Сюжет в лицах приведена фамилия Маркоса Киприану (рис. 3.6), специального уполномоченного по здравоохранению ЕС. Перейдя по ссылке с фамилии, попадаешь на страницу, посвященную этому человеку, где информация о нем представлена в виде четырех блоков:

? кто такой Маркос Киприану (в данном случае ЕС Маркос);

? Работа;

? Что он говорит по поводу события;

? Что о нем говорят по поводу события.

Примечание

Кстати, обратите внимание на то, что в данном случае обработка информации о человеке была выполнена некорректно. Вместо его имени была подставлена аббревиатура "ЕС", присутствующая в тексте рядом с фамилией человека, что и привело к возникновению ошибки. А вот его имя было, похоже, принято за что-то, имеющее отношение к Кипру.

Данный текст является ознакомительным фрагментом.