Совсем недавно мне попалась на глаза одна широко известная статья
«Что такое ПэйджРанк», к которой большинство людей обращается, когда
хочет уяснить для себя вопрос — что такое ПэйджРанк, и как он работает.
Page
Rank представляет собой численное значение, которое отражает, насколько
значима данная страница в интернете. Гугл полагает, что когда одна
страница ссылается на другую, она словно «отдает свой голос» за другую
страницу. Тогда, чем больше голосов отдано за страницу, тем важнее эта
страница должна быть.
Кроме того, — и это важно! — «отданные голоса» отличаются по
значимости в зависимости от того, «кто» голосует. Гугл подсчитывает
важность оцениваемой страницы, исходя из «голосов», отданных за нее.
При этом в процессе производства расчетов Гугл учитывает, насколько
важен (весом) каждый из отданных «голосов».
Таким образом, Page Rank Гугла — это его собственный способ
определения важности оцениваемой страницы. Это весьма важно, потому что
ПэйджРанк является одним из факторов, определяющих порядок вывода
результатов поиска. Это не единственный фактор, который Гугл использует
для оценки страниц, но один из важнейших. Начиная с этого момента, мы
будем использовать термин «ПэйджРанк» в сокращенной форме как «PR».
Традиционные способы нахождения релевантных страниц, в случае
односложных запросов не дают удовлетворительных результатов, т.к. по
популярным темам (например “рефераты”, “работа”) всегда найдётся
большое число страниц с одинаковой релевантностью. Для того, чтобы
как-то упорядочить такие страницы, поисковики пускаются на разные
хитрости. Например выдают первыми те страницы, которые имеют большую
посещаемость (Rambler) или которые присутствуют в каталоге (Yandex,
Aport).
В Google для этих целей применяется PageRank, что даёт потрясающие
результаты, и за короткое время Google стал занимать лидирующие позиции
не только по объёму базы, но и по качеству поиска. Из наших поисковиков
первым PageRank стал использовать Aport, за ним Yandex. В Rambler эта
технология не применяется, но на данном этапе такая возможность
рассматривается, и, не исключено, что PageRank будет использоваться и в
этой поисковой системе.
Наряду с упорядочиванием результатов поиска по PageRank, есть и другое
применение для этой технологии. Дело в том, что число страниц в
Интернете на столько велико, что поисковики уже не могут себе позволить
индексировать всё подряд. А поскольку PageRank служит критерием
ценности страницы, то логично проводить индексацию страниц в порядке
убывания PageRank. В Google пошли даже дальше: теперь простой отправки
формы для регистрации не достаточно для того, чтобы сайт был
проиндексирован необходимо наличие хотя бы одной внешней ссылки.
Введение в PageRank
PageRank - статическая величина, предназначенная для оценки качества
страниц не зависимо от каких либо запросов, т.е. с помощью PageRank
вычисляется “глобальная ценность” каждой страницы. Авторы PageRank
Сергей Брин и Ларри Пейдж, разработавшие технологию дополнительного
ранжирования результатов выдачи поисковиков, в последствии стали
основателями компании Google.
За основу PageRank был выбран академический подход оценки важности
публикации автора по числу её упоминаний в библиографических ссылках
других авторов. Для адаптации к применению в Интернет в алгоритм были
внесены следующие изменения: вес каждой ссылки учитывается
индивидуально и нормируется по числу ссылок на ссылающейся странице.
Кроме того, PageRank может быть интерпретирован в терминах случайного
блуждания
Вычисление PageRank
Представьте себе идеального веб-серфера перемещающегося по всемирной
паутине. Пусть сёрфер посещает страницу p, случайное блуждание при этом
находится в состоянии p. На каждом шаге, веб-сёрфер либо перепрыгивает
на другую страницу в сети, выбранную псевдо-случайным образом, либо он
следует по ссылке на текущей странице, при этом не возвращаясь и не
посещая одну и ту же страницу дважды. Вероятность случайного прыжка
обозначим как d тогда вероятность перехода по ссылке будет 1-d. Таким
образом, вероятность нахождения пользователя на странице p можно
вычислить по следующей формуле:
где R(p) - PageRank страницы, С(p) - число ссылок на странице, к -
число ссылающихся на p страниц, d- коэффициент затухания (damping
factor). Обычно 0.1<d<0.15. Если масштабировать PageRank таким
образом, что где N - число всех страниц, для которых производится
расчёт PageRank, то R(p) можно рассматривать как распределение
вероятности по всем страницам.
Для вычисления PageRank составляется матрица M размером NxN, где
каждому элементу mij матрицы присваивается значение R0(p)=1N в том
случае, если с i - й страницы имеется ссылка на j-ую, все оставшиеся
элементы матрицы заполняются нулями. Таким образом, вычисление PageRank
сводится к отысканию собственного вектора матрицы M что достигается
умножением матрицы M на вектор Rj на каждом шагу итерации. Введение
коэффициента затухания гарантирует, что процесс сходится.
Повышаем значимость сайта
Осознав победное шествие PageRank, нельзя не задуматься об его
увеличении для своей странички. Интуитивно понятно, что чем
авторитетнее ресурс, на котором размещена ссылка
тем больше она увеличивает PageRank страницы, на которую ссылается. И
наоборот, чем больше ссылок на странице, тем меньше будет её вклад в
повышение PageRank вашей страницы - ещё одно доказательство
бесполезности участия в FFA (Free For All - сайты, содержащие набор
ссылок со свободным добавлением). Менее очевидна оптимальная топология
взаимоссылающихся страниц.
Например, страницы организованные в “кольцо” (когда каждая страница
ссылается на соседа слева и справа, последняя ссылается на первую, а
первая на последнюю) будут иметь один и тот же PageRank не зависимо от
числа страниц в кольце (если не проводить масштабирование по сумме, то
PageRank у всех будет равен 1). То же справедливо для <звёзд> или
случая, когда все ссылаются на всех, и, вероятно, это утверждение
справедливо вообще для всех симметричных топологий. Гораздо более
перспективны с точки зрения увеличения PageRank асимметричные
топологии. Утверждение о бесполезности создания <пустых> (но
ссылающихся друг на друга) сайтов у бесплатных хостеров не столь
очевидно. Например, можно организовать обмен ссылками на 5 сайтах таким
образом, что у одного из них PageRank будет в 15 раз больше, чем
минимальный не нулевой PageRank. В этом несложно убедится, написав
небольшую программку.
Некоторые распространённые заблуждения связанные с PageRank
Проанализировав сообщения в рунетовских форумах, посвященных
позиционированию в поисковых системах, можно выделить целый ряд
утверждений о PageRank, как минимум спорных, а зачастую просто
неверных. Кратко рассмотрим эти утверждения:
Если на какой-то сайт есть много ссылок с FFA, гостевых книг или на сайтов другой тематики, то PageRank будет занижен.
Не стоит путать понятия <индекс цитирования> и PageRank. При
расчёте PageRank анализ содержимого ни сайта ни текста ссылки не
производится, учитываются только общее число ссылок и их веса, поэтому
никаких штрафных санкций при наличии ссылок с <неправильных>
страниц не применяется.
Если добиться высокого PageRank для какой-то страницы, то эта страница будет на первом месте в результатах поиска.
Не верно, по той причине, что PageRank является не основным критерием
для ранжирования страниц, а вспомогательным. В противном случае, на
первых страницах по очень многим запросам располагались бы только
рейтинги и топы. Только при прочих равных условиях страница с более
высоким PageRank будет располагаться выше в результатах поиска.
Если зарегистрировать сайт во всех популярных каталогах, то PageRank будет очень высоким.
Не стоит обольщаться - PageRank вычисляется не для сайта
целиком, а для отдельно взятой страницы. Поэтому ссылка из глубокой
поддириктории, скажем в Yahoo, может быть менее ценна чем страница Васи
Пупкина. Так что, тут можно взять не качеством ссылок, а их
количеством. Надо только обращать внимание на то, чтобы ссылки из
каталога шли напрямую на ваш сайт, а не через cgi-скрипт, иначе они
просто не будут учитываться. Кроме того, правила многих каталогах
требуют размещения корневой страницы, а не того документа, PageRank
которого вы собираетесь повышать. Поэтому гораздо эффективнее можно
повысить PageRank конкретной страницы ссылкой с корневой страницы
своего собственного сайта.
PageRank уменьшается при проставлении внешних ссылок
Весьма спорное утверждение, как говорилось выше PageRank понижается в
случае симметричного объединения ссылающихся страниц, вероятность
получить которое при проставлении внешней ссылки ничтожно мала. Если
такую фобию в себе не перебороть, то можно дать совет завести
специальную страницу для обмена ссылками. Кстати, стоит заметить, что
при расчёте PageRank никто не обещал разделять ссылки на внешние и
внутренние.
Индекс цитирования (ИЦ)
Тематический Индекс Цитирования
(ТИЦ) – показатель важности (степени авторитета) сайта или, если
точнее, Интернет-ресурса со стороны поисковой системы Яндекс,
определяемый за счёт внутреннего анализа качества внешних ссылок на
этот ресурс. Под качеством внешних ссылок в данном аспекте понимается,
прежде всего, схожесть тематики между ресурсом, который ссылается и
ресурсом, который получает ссылку. Чем больше это качество или, как ещё
говорят, вес ссылки, тем больший Индекс Цитируемости приобретает ресурс.
Интернет ресурсом может считаться отдельный сайт или отдельная его
директория. Но директория может выглядеть как отдельный ресурс лишь в
том случае, если есть её описание в Яндекс Каталоге.
Теперь рассмотрим, какие ссылки учитываются Яндексом при расчёте ТИЦ. Этот момент очень важен для тех, кто озабочен ростом ТИЦ своего сайта.
Поисковой системой Яндекс при расчете ТИЦ не учитываются ссылки с:
- других страниц рассчитываемого ресурса;
- ресурсов, которые ещё не проиндексированы Яндексом;
- различных форумов;
- досок объявлений;
- каталогов, которые не модерируются;
- сетевых конференций;
- сайтов на бесплатных доменах и хостингах, если их описания нет в Яндекс Каталоге;
- ресурсов, не относящихся к «русскому» Интернету.
А также с других ресурсов, на которых, по мнению Яндекса, можно
поместить свою ссылку без контроля за этим со стороны владельца того
сайта. То есть вес таких ссылок при расчёте Тематического Индекса
Цитирования равен нулю.
Как примерно посчитать ТИЦ своего сайта? По какой формуле можно
посчитать ТИЦ? Как можно высчитать (предугадать) ТИЦ сайта при будущем
апдейте? Ответ на эти вопросы вы вряд ли где найдёте. Лучше этим не
заниматься, а работать по наращиванию ссылочной массы для своего сайта с сайтов со схожей тематикой и рост ТИЦ не заставит себя ждать.
Для тех, кто гоняется за показателем Индекса Цитирования можно сказать, что ТИЦ не влияет на ранжирование сайтов
в поисковой выдаче. То есть на первом месте в выдаче по определённому
запросу может появиться сайт со значением ТИЦ менее 10, а сайт со
значением ТИЦ в несколько тысяч может быть на >100 позиции. ТИЦ
ранжирует сайты только непосредственно в конкретном разделе Яндекс
Каталога. Если раздел имеет определенную популярность, то возможен
неплохой трафик с данного каталога и повышение ТИЦ становится
актуальной задачей.
Если ваш сайт имеет несколько зеркал, то Индексы Цитирования этих
зеркал объединяются. Но в данном случае зеркалами могут являться только
сайты, которые тождественны по своему содержанию и по своей внутренней
структуре.
Как часто изменяется ТИЦ? Раньше это происходило каждую неделю. Сейчас
происходит с большими перерывами. Поэтому, если ваш новый сайт не
приобретает ТИЦ уже продолжительное время, то посмотрите когда были
последние апдейты ТИЦ. А также следуйте советам, которые приведены ниже.
Советы по увеличению Тематического Индекса Цитирования (ТИЦ) или как нарастить ТИЦ:
- ДСДЛ (Делать Сайт Для Людей) с интересным и уникальным содержанием. В
этом случае ваш сайт будет быстро обрастать естественными ссылками с
сайтов схожей тематики;
- меняться ссылками с сайтами со схожей тематикой при этом, выбирая те
сайты, вес с которых учитывается при расчёте ТИЦ. Анализируйте каждый
сайт, прежде чем производить обмен ссылок с ним.
При работе над увеличением ТИЦ следует обратить внимание на то, что при
использовании запрещённых методов, возможно суровое наказание со
стороны Яндекса, то есть, как и полное обнуление значения ТИЦ вашего
сайта, так и бан сайта в целом. Тщательно изучите Лицензию на
использование поисковой системы Яндекс и не нарушайте её, так как
вывести сайт из бана – дело очень трудоёмкое и продолжительное по
времени, может занимать несколько месяцев. Овчинка выделки в данном
случае не стоит. Подумайте над этим, прежде чем прибегать к чёрным
методам накрутки.
Публикация данной статьи возможна только при наличии ссылки на источник: http://www.woweb.ru/
|