Склейка дубликатов
Склейка дубликатов
При продвижении порталов и крупных интернет-магазинов оптимизатору часто приходится сталкиваться с проблемой дублирования контента. Карточки товаров и страницы с описаниями моделей могут различаться буквально одним параметром или даже одной буквой в названии. С точки зрения поисковых систем такие страницы являются дублями, а дублирование контента нежелательно. Результаты – ухудшение ранжирования, исключение части страниц из индекса, а при совпадении нескольких негативных факторов – АГС.
Для того чтобы избежать проблем с дубликатами, их следует склеивать, однако при этом надо хорошо понимать, что мы склеиваем, как и зачем.
? Если разные товары имеют практически идентичные описания и список характеристик, но различаются ценой, их следует оставить несклеенными. Это разные товары, и они должны иметь отдельные карточки.
? Не следует склеивать карточки товаров, если они отличаются только одной, но значимой характеристикой. Карточки, на которых предлагаются красная футболка «Найк», синяя футболка «Найк», зеленая футболка «Найк», склеивать не надо, поскольку пользователи часто ищут одежду конкретного цвета. Применительно к цифровым фотоаппаратам цвет корпуса не является существенным параметром, и потому лишние карточки следует удалить, а в единственной оставшейся указать все возможные цвета.
? Нечеткие дубли (страницы, которых совпадает лишь фрагмент текста) склеивать не надо. Идеальным вариантом будет просто закрыть дублируемый фрагмент от индексации на всех страницах, кроме той, на которой этот фрагмент важен для поискового продвижения.
? Нечеткие дубли, когда одна страница полностью вложена в другую, также не склеивают. Необходимо просто закрыть текст от индексации на большей странице.
Как искать дубликаты? Проверять контент инструментами на основе анализа шинглов. Таковыми являются, в частности, сервис «Сайт-Репорт.рф», одна из утилит AllSubmitter и некоторые другие.
Более простой вариант – использовать выдачу поисковых систем для поиска дубликатов по содержимому тега Title. Введя в поисковую строку содержимое тега, мы получим страницы, которые могут быть дублями.
Еще одно решение предоставляет панель «Яндекс.Вебмастер». К сожалению, этот инструмент не способен выявить все дубли, а при смене CMS или структуры URL и вовсе будет давать неудовлетворительные результаты.
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКДанный текст является ознакомительным фрагментом.
Читайте также
Алгоритм поиска дубликатов
Алгоритм поиска дубликатов В переводе с английского shingle означает «гонт». Яснее не стало? Гонт – это кровельный материал, а точнее, небольшие дощечки с пазами и выступами, которые собираются в один лист. Применительно к поисковым системам шинглы – это алгоритм для поиска
Зеркала и склейка
Зеркала и склейка Понятия «зеркало» и «склейка» играют важную роль в поисковой оптимизации. Оптимизатор или владелец ресурса, который осуществляет продвижение своими силами, должен иметь представление об основных и дополнительных зеркалах сайта, знать, каким образом
Устранение дубликатов. Предложение DISTINCT.
Устранение дубликатов. Предложение DISTINCT. Следует отметить, что вертикальная выборка может содержать дубликаты строк в том случае, если она не содержит потенциального ключа, однозначно определяющего запись. В таблице PC потенциальным ключом является поле code, которое
2.30. Удаление дубликатов
2.30. Удаление дубликатов Цепочки повторяющихся символов можно сжать до одного методом squeeze:s1 = "bookkeeper"s2 = s1.squeeze # "bokeper"s3 = "Hello..."s4 = s3.squeeze # "Helo."Если указан параметр, то будут удаляться только дубликаты заданных в нем символов:s5 = s3.squeeze(".") # "Hello."Этот параметр подчиняется тем же
8.1.21. Удаление дубликатов из массива
8.1.21. Удаление дубликатов из массива Чтобы удалить из массива повторяющиеся экземпляры, воспользуйтесь методом uniq (или его вариантом для модификации на месте uniq!):breakfast = %w[spam spam eggs ham eggs spam]lunch = breakfast.uniq # ["spam","eggs","ham"]breakfast.uniq! # Массив breakfast
Б. Склейка разорванных строк абзаца
Б. Склейка разорванных строк абзаца Данный инструмент полезен для обработки многих текстов из Интернет-Библиотек, например, Мошкова, а также – некоторых html-файлов, где есть масса разрывов строк ‹BR›.Инструмент ищет признак (идентификатор) нового абзаца по определенным
Склейка лексем и преобразование аргументов макроопределений
Склейка лексем и преобразование аргументов макроопределений СП ТС и версия 5.0 СП MSC реализуют две специальные препроцессорные операции: ## и #.В директиве #define две лексемы могут быть "склеены" вместе. Для этого их нужно разделить знаками ## (слева и справа от ## допустимы