Рэнд Фишкин: «Насколько уникальным должен быть контент, чтобы он высоко оценивался поисковыми системами?»

Партнерская программа Vulkanpartner

Должны все страницы быть уникальнымиНасколько сайт уникален Спонсор поста Twidium - профессиональный инструмент для раскрутки твиттер-аккаунтов.

Мы все прекрасно знаем, чтобы поисковые машины высоко оценивали контент, он должен быть уникальным, но насколько уникальным? В плане создания контента необходимо понимать, что подразумевается под «дублированным контентом» и как он влияет на SEO.

Сегодня Рэнд обсуждает, какой контент воспринимается поисковиками как уникальный, и рассуждает о негативном влиянии дублированного контента. Рекомендую всем посмотреть данное видео, а так же подписаться на обновления канала «SEO в YouTube».

YouTube:


RuTube:

 

Как и всегда, я предлагаю вам текстовую версию данного видео:

Приветствую всех поклонников SEOmoz, предлагаю вашему вниманию новый пятничный видео выпуск. На этой неделе я хотел бы поговорить об очень важном аспекте маркетинга контента – уникальности контента.

В целях поисковой оптимизации, поисковым системам нравится отфильтровывать контент, который они считают дублированным, то есть повторяющим уже имеющийся на других ресурсах материал. Системам не нравится предлагать пользователям список результатов, где пункты 2, 3, 4 и 5 предлагают одну и ту же статью или текст с абсолютно идентичными тремя параграфами и продублированными картинками. Вполне возможно, контент лицензирован (или по праву используется) различными участниками. Этот подход характерен для новостных порталов. Вполне возможно, что кто-то грешит плагиатом и действительно продублировал часть информации. Возможно, кто-то разместил одну и ту же статью на нескольких порталах-каталогах статей. В любом случае, поисковые системы пытаются отфильтровать подобные варианты. Они предпочитают игнорировать подобный контент, поскольку прогнозируют следующее поведение пользователей: «Если мне не понравился этот результат на этот сайте, то скорее всего, мне не понравится третья строчка и на другом сайте». Поэтому они по мере возможностей отфильтровывают такого рода контент.

Для создателей контента и, в целом, с точки зрения SEO, необходимо понимать: «Что на самом деле подразумевается под уникальностью контента? Что понимается под дублированным контентом и насколько уникальными должны быть тексты?»

Когда речь заходит об уникальности контента, я считаю необходимым пояснить, что контент, который видят поисковые системы, это уникальный материал на странице. Соответственно, мы исключаем навигацию, рекламу, сноски, боковые меню и т.д.

У меня имеется макет страницы, и мы исключаем все эти параметры – лого, навигация, боковые меню. Возможно, на этой странице в боковых меню включена реклама. Возможно, они (владельцы этой страницы) вкратце рассказывают о себе, и кусок текста расположен внизу справа. Они начинают задумываться: «У меня всего лишь пара строчек текста на странице, картинки и несколько списков. Является ли эта страница уникальной по сравнению с другими страницами с подобной структурой, где отличается только раздел с текстом»? Это контент. Если вы переживаете: «Нет, думаю, мои страницы слишком тяжелые, а контента слишком мало», я бы не стал беспокоиться, если все остальное вы делаете правильно. Мы остановимся на некоторых моментах. Второй момент, уникальность касается как внутренних, так и внешних источников. Копирование одного из них уже может привести к возникновению проблем. Это могут быть другие страницы вашего сайта, или страницы других сайтов с таким же контентом, который вы скопировали и разместили на своем портале. Проблемы возникают в обоих случаях. В случае с внутренним дублированием контента, обычно поисковые системы пробуют игнорировать, если дублирование незначительное. Это что-то вроде: «Здесь четыре разных версии этой страницы, потому что предлагаются версия для печати, для мобильных устройств. ОК. Попробуем привести к какому-то стандарту.»

В подобном случае имеет смысл использовать что-то вроде rel=canonical. Или, если вы объединяете страницы после переезда сайта или меняете структуру сайта, оптимальный вариант - 301. Переживать стоит в том случае, если проблемы возникают с внешними источниками.

Однако, когда я говорю о дублировании внешних источников, и насколько я знаю, этот вопрос беспокоит многих, я не пытаюсь сказать, что вы не можете взять параграф из Википедии и использовать его в своей большой статье, или процитировать блогера, включив в текст пару фраз, или использовать цитату из New York Magazine или Wall Street Journal, Wired или любого другого источника; «Так, я возьму информацию отсюда и размещу небольшое видео с YouTube». Такой вариант не будет считаться дублированием до тех пор, пока вы добавляете уникальную ценность своему материалу.

Третий момент, уникальность сама по себе. Некоторые просто-напросто теряются в правилах SEO и поисковых систем, полагая: «Так, этого контента нет нигде в сети. Поэтому я просто возьму чей-нибудь контент и переставлю слова». Технически вы выдали уникальный контент, но вы не придали ему уникальную ценность. Уникальная ценность (или значение) – это совершенно другой аспект. Когда я говорю «уникальная ценность», я подразумеваю (и именно это нравится поисковым системам, выстраивающим свои алгоритмы), что вы предлагаете ценную информацию, которую не предлагает никто другой. Это означает, что вы обращаете внимание на интересы посетителей сайта, подход поисковых систем, потребности своих покупателей и говорите: «Ок, я попробую ответить на каждый вопрос».

Если кто-то ищет отели в Кейптауне (Южная Африка), скорее всего, им нужен список отелей, но при этом они ставят и другие задачи. Их также интересуют и дополнительные моменты, связанные с путешествием в Южную Африку. Вполне возможно, им интересна погода. Их может заинтересовать информация о местах, где расположены отели. Поэтому, уникальная ценность информации противоположна простому: «Ок, я просто возьму информацию с сайта Expedia и перефразирую параграфы об отелях» - такой вариант вам не поможет. Но если вы создадите что-то подобное Oyster hotels, которые отправляют фотографа с камерой, журналиста непосредственно в отель, они получают сотни уникальных снимков, они пишут о погоде, окрестностях, чистоте отеля, изучают мельчайшие подробности и предлагают правдивую информацию уникальной ценности в сочетании с уникальным контентом – в этом случае вы попадаете в самую цель того, что поисковые системы считают уникальным в противовес дубликатам.

Четвертый момент. В воображении SEOшников имеется, и имелось раньше, представление о существовании некого мифического процентного соотношения. Например, «Здесь 100% дубликат, а здесь 0% дублированного контента, 100% уникальный текст, а вот здесь 50/50, значит должно существовать некое магическое соотношение; если у меня будет как здесь, 41%, это и будет этот мифический показатель. Поэтому я создам огромный сайт, и уникальность всех моих страниц должна быть 47%». Это совершенно неверно. Абсолютно неверно. Ничего подобного не существует.

Алгоритмы оценивания контента, о которых вы думаете, значительно сложнее, нежели инструмент для подсчета процентного соотношения того, что продублировано, а что – нет. Не существует особого порога уникальности контента в процентном соотношении. Используется огромное количество параметров. Приведу несколько примеров.

Вы видели, что статья может быть опубликована на разных новостных сайтах, затем она перемещается из раздела Google news в основной каталог Google, при этом иногда высвечиваются дубликаты; зачастую дубликаты – это сайты с большим количеством ссылок на них, активно комментируемые, с активной пользовательской аудиторией, в этом случае Google считает, что эти сайты передают определенную уникальную ценность, даже если контент точно такой же.

Так Bloomberg и Business Week постоянно выдают одинаковые статьи. Business Insider публикует статьи, взятые отовсюду. Huffington Post возьмет статьи с порталов, где они размещены авторами и могут быть перепечатаны. Люди могут опубликовать текст на одном сайте, а затем они разместят статью в своем собственном блоге. Иногда Google выдаст оба результата, а иногда – нет. И дело не в процентном соотношении. Речь идет об уникальной ценности, здесь вовлечен очень сложный алгоритм, который принимает во внимание огромное количество других параметров.

Если вы находитесь в нише, где приходится конкурировать с другими порталами, публикующими такой же контент, подумайте об уникальной ценности, пользовательской активности, создании бренда, участии в соцсетях, ссылках, - все эти аспекты принимаются во внимание, когда дело доходит до: «Мы проранжируем ваш сайт или другой сайт, который использует ваш контент, или еще один, с которого вы используете контент?» Авторитет домена может играть весьма значимую роль.

И последний момент, о котором я хотел бы сказать, это дубликаты и низкоценный контент. После апгрейда Google's Panda в 2011, Panda считает, что продублированный контент в какой-либо части вашего сайта может существенно навредить всему сайту. Я бы был поаккуратнее, если бы полагал: «Давайте создадим раздел статей на сайте, где разместим 5000 статей, которые мы официально возьмем с другого ресурса или скопируем из чьего-нибудь блога. SEO ценности они не принесут, но мы получим больше трафика от поисковых систем». На самом деле, такой подход может принести много вреда, потому что алгоритм Панда воспримет ситуацию следующим образом: «Создается впечатление, что этот сайт продублировал контент», и ваши позиции по другим параметрам также опустятся.

Google придерживается четкой позиции: дублированный контент с низкой ценностью в одном разделе сайта может навредить всему вашему сайту. Не забывайте об этом. Если вы слишком переживаете, то всегда есть возможность использовать в отношении части текста robot.txt, тогда поисковые системы будут игнорировать этот материал. Кроме того, можно использовать rel=canonical. Можно вообще исключить материал из поисковых систем. Воспользуйтесь «disallow meta noindex», или в инструментах Google Webmaster Tools исключите отдельные страницы из поисковых систем. Можно воспользоваться разными вариантами.

 

Ну что же, на сегодня всё. Надеюсь, вам понравился сегодняшний выпуск и вы решили заняться созданием уникального или уникально ценного контента. До встречи на следующей неделе.

 

Вот так вот... Что скажите? Думаю, данное видео будет полезно всем! Удачи в области создания контента!

Урок биологии.
— Иванов, назови мне два диких зверя.
— Тигр и эээ... не помню!
— Не знаешь. Садись, двойка!
— Петров, назови мне три диких зверя.
— Тигр, лев, м-мэээ...
— Не знаешь. Садись, двойка!
— Вовочка! Пять диких зверей!
— Два тигра и три льва!

Робот блога считает, что это может быть вам интересно:

Похожие записи в блоге:

   

Нравится как я пишу? Давайте вместе формировать интересные материалы на моем блоге. Вы можете сделать ретвит данной статьи или подписаться на мою ленту в системе микроблогов Твиттер.
Читайте меня в Твиттере и будьте в курсе последних моих действий.

Комментирование Facebook:


  • Все подробно и понятно). Для новичков следует это знать. А те, кто варятся в этом, наверняка, ничего нового не узнали.

  • Татьяна Саксон

    Ага, а я всегда старалась избегать повторов.

  • Очень понравилось( и это действительно очень важно в продвижении сайта) про уникальную ценность. Рерайт может быть уникальным 100%, и статья не попадет под фильтры ПС, но в продвижении сайта сыграет не столь значительную роль, как статья, оценивающаяся уникально ценная.
    Чем больше уникально ценного материала - тем лучше для сайта!

  • А не придумает ли Гугол алгоритм, где будет пессимизировать контент, составленный и переведенный со звуковых и видео файлов. Google - он такой, гад: вечно что-нибудь выдумает 🙂

  • Андрей

    Насчет Гугла я сомневаюсь, что он придумает новый алгоритм, в отличие от Яндекса. Этот гад постоянно что-то непонятное мутит в своих алгоритмах, а отсюда и вытекающие проблемы у нормальных сайтов: выпадение страниц из индекса, фильтры и прочая лабуда.

  • Евгений

    Основной упор на уникальную ценность. В этом всегда был один и тот же смысл. И вот что интересно, если у тебя хороший ПФ то получается можно копипастить ценные сведения. Поэтому получается что новостной сайт на копипасте будет держаться в топе, и не попадет под фильтры. Такое тоже случалось.

  • Я бы сказал, что стараться нужно избегать не повторов, а копий. Полностью уникальный контент сгенерировать практически невозможно, если только нечитабельный, вопрос только в шаге (шингл).

  • Мне кажется по контенту Google куда активнее Яши. Яша просто если придумал, то координально. Google же все плавно, но не менее координально по сумме.

  • Случалось и что дубликат индексировался быстрее и воспринимался как оригинал)) Случаев полно, главное практика во всем этом деле.

  • Думаю, что прочесть роботом звуковое не скоро мы сможем, и даже не мы и не дети наши. Вы немного мыслями опередили время, пока Google, исходя из новостей сетевых, не брезгует перепиской в gmail и читая роботом ваши письма выдает рекламу. Но, это по-прежнему текст...

  • Интернет-технологии развиваются настолько быстро, что опередить время весьма сложно.

Я в Google Plus

Блоггеру

Рекомендую

Мануалы

Опрос

Есть ли у Вас привычки, уничтожающие вашу креативность и сдерживающие успех?

Просмотреть результаты

Загрузка ... Загрузка ...

Вовкин блог на Facebook

SEO Powered by Platinum SEO from Techblissonline