воскресенье, 5 мая 2013 г.

PageRank

PageRank является анализ ссылок алгоритм, названный в честь Ларри Пейдж [1] и используется Google веб-поиска двигатель , который присваивает численное взвешивание к каждому элементу гиперссылкой набор документов, таких как World Wide Web , с целью " измерения "ее относительную важность в рамках набора. Алгоритм может быть применен к любой совокупности лиц с взаимных котировок и ссылки. Численные вес, что он присваивает любой элемент E упоминается как PageRank Е и обозначается

Значение входящих ссылок является разговорно называют "Google сок", "ссылка сок" или "Pagerank сок"
Описание

Мультфильм иллюстрирует основной принцип PageRank. Размер каждого лица пропорциональна общему размеру других лиц, которые должны быть обращены к нему.

PageRank результаты математического алгоритма, основанного на webgraph , созданные всеми веб-страницах в виде узлов и гиперссылок как края, с учетом полномочий, таких как концентраторы cnn.com или usa.gov . Ранг величина указывает важность конкретной страницы. Гиперссылку на страницу считается голосов поддержки. PageRank на странице определяется рекурсивно и зависит от количества и PageRank метрических всех страниц, ссылки на него (" входящие ссылки »). Страница, которая связана с многими страницы с высоким PageRank получает высокое звание самого. Если нет ссылки на веб-страницу, то нет никакой поддержки для этой страницы.

Многочисленные научные работы, касающиеся PageRank были опубликованы с Пейджем и оригинальной работе Брина. [2] На практике, понятие PageRank могут быть уязвимыми к манипуляциям. Проведены исследования в выявлении ложно влиянием PageRank рейтинга. Цель состоит в том, чтобы найти эффективные средства игнорируя ссылки из документов с ложно влияние PageRank. [ оригинальных исследований? ]

Другие ссылки на основе алгоритмов ранжирования веб-страниц включает HITS алгоритм изобретенный Джоном Клейнберг (используется Teoma и теперь Ask.com ) [ править ], IBM CLEVER проекта , и TrustRank алгоритма.
[ править ]История

PageRank был разработан в Стэнфордском университете на Ларри Пейджем (отсюда и название Page-Rank [3] ) и Сергеем Брином в 1996 году [4] в рамках научно-исследовательского проекта о новом виде поисковой системы. [5] Сергей Брин была идея , что информацию в Интернете можно заказать в иерархии "ссылочной популярности": страница имеет более высокий рейтинг, поскольку есть больше ссылок на него. [6] Он был соавтором Раджив Motwani и Терри Винограда . Первая статья о проекте, описывающих PageRank и начальное прототип поиска Google двигателя, был опубликован в 1998 году: [2] Вскоре после этого, Пейдж и Брин основали корпорации Google , компания за поисковой Google. В то время как только один из многих факторов, которые определяют рейтинг результатов поиска Google, PageRank продолжает обеспечивать основу для всех инструментов Google, веб-поиска. [7]

Название «PageRank» является торговой маркой компании Google, и процесс PageRank была запатентована ( патент США 6285999 ). Тем не менее, патент присваивается Стэнфордском университете , а не Google. Google обладает исключительными правами лицензии на патент от Стэнфордского университета. Университет получил 1800000 акций Google в обмен на использование патента; акции были проданы в 2005 году за $ . 336000000 [8] [9]

PageRank был под влиянием анализ цитирования , раннее разработанный Евгением Гарфилда в 1950-х в Университете Пенсильвании, и Hyper поиска , разработанный Массимо Marchiori в университете Падуи. В том же году была введена PageRank (1998), Джон Клейнберг опубликовал свою важную работу по HITS . Основатели компании Google ссылаются Гарфилд, Marchiori и Клейнберг в их первоначальной бумаги. [2]

Небольшое поисковой называется " RankDex "ИУС Информация разработан Робин Ли был, с 1996 года, уже изучают аналогичную стратегию для сайта тонировка и ранжирования страниц. [10] технологий в RankDex будет запатентован 1999 [11] и использовать позже, когда Ли основал Baidu в Китае. [12] [13] работа Ли будет ссылаться некоторые из патентов США Ларри Пейдж за его методы поиска Google. [14]
[ править ]Алгоритм

PageRank является распределение вероятностей , используемых для представления вероятность того, что человек случайно нажав на ссылку прибудет в любой конкретной страницы. PageRank можно рассчитать для сборников документов любых размеров. Предполагается, в нескольких научно-исследовательских работ, что распределение равномерно делится между всеми документами в коллекции в начале вычислительного процесса. PageRank вычислений потребоваться несколько проходов, называемый "итераций", путем сбора для регулировки приближенные значения PageRank, чтобы более точно отражать теоретические истинное значение.

Вероятность выражается в виде числовых значений от 0 до 1. 0,5 вероятности обычно выражается как "50% шанса" что-то происходит. Таким образом, PageRank 0,5 означает, что существует 50% вероятность того, что человек нажав на ссылку случайных будут направлены на документ с 0,5 PageRank.
[ править ]упрощенный алгоритм

Предположим, небольшая вселенную из четырех веб-страниц: A, B, C и D. Ссылки со страницы к себе, или несколько исходящих ссылок с одной страницы на другую, одной странице, игнорируются. PageRank инициализируется то же значение для всех страниц. В оригинальной форме PageRank, сумма PageRank по всем страницам и общее число страниц в Интернете в то время, так что каждая страница в нашем примере будет иметь начальный PageRank 1. Тем не менее, более поздние версии PageRank, а остальная часть этого раздела, предположим, распределение вероятностей между 0 и 1. Таким образом, начальное значение для каждой страницы составляет 0,25.

PageRank передается от одной странице своей цели исходящих ссылок на следующей итерации делится поровну среди всех исходящих ссылок.

Если только звеньев в системе были из страниц B, C, и D. каждая ссылка будет передавать 0,25 PageRank для на следующей итерации, в общей сложности 0,75.


Предположим, вместо этого, что страницы B была ссылка на страницах С и А, а страницы D были ссылки на все три страницы. Таким образом, после следующей итерации, стр. B будет передавать половину своей существующее значение, или 0,125, до страницы, а другую половину, или 0,125, стр. C. Так как D было три исходящих ссылок, было бы перевести одну треть своего существующего значения, или приблизительно 0,083, А.


Другими словами, PageRank предоставляемых исходящие ссылки равна собственной оценки PageRank документа, деленное на количество исходящих L ссылки ().


В общем случае, значение PageRank для любой страницы и может быть выражена как:
,

т.е. значение PageRank для страницы и зависит от значения PageRank для каждой страницы об содержится в множестве B и (набор, содержащий все страницы, ссылки на страницы и), деленное на количество L (V) ссылок на стр. объем.
[ править ]Коэффициент демпфирования

Теория PageRank считает, что даже мнимые Серфер, который случайно нажав на ссылку в конце концов остановить нажатием. Вероятность того, на любом этапе, что человек будет продолжать это затухание г фактором. Различные исследования протестировали разные коэффициенты затухания, но это, как правило, предполагается, что коэффициент затухания будет установлено около 0,85. [2]

Коэффициент демпфирования вычитается из 1 (и, в некоторых вариантах алгоритма, результат делится на количество документов (N) в коллекции), и этот термин затем добавляется к произведению коэффициента затухания и сумма входящих оценки PageRank. То есть


Так PageRank любой страницы опирается в значительной части от веса PageRank других страниц. Коэффициент затухания регулирует производное значение вниз. Оригинальная работа, однако, дал следующую формулу, что привело к некоторой путанице:


Разница между ними в том, что значения PageRank в первой сумме формулу к одному, в то время как во второй формуле PageRank каждой умножается на N и N сумма становится. С заявлением в бумагу Пейдж и Брин, что "сумма всех PageRanks одно" [2] и исков от других сотрудников Google [15] Поддержка первый вариант формулы выше.

Пейдж и Брин путать две формулы в их самой популярной газетой "Анатомия крупномасштабного Гипертекстовая Двигатель Поиск в Интернете", где они ошибочно утверждали, что последняя формула формируется распределение вероятностей по веб-страницам. [2]

Google PageRank пересчитывается баллы каждый раз сканирует веб-сайты и перестраивает его индексу. Как Google увеличивает количество документов в коллекции, начальное приближение PageRank уменьшается для всех документов.

Формула использует модели случайного серфера который становится скучно после нескольких кликов и переключается на случайной странице. Значение PageRank страницы отражает вероятность того, что случайный серфер приземлится на этой странице, нажав на ссылку. Это можно понимать как цепь Маркова , в которой государства страниц и переходов, которые все равновероятны, являются ссылки между страницами.

Если страница не имеет ссылки на другие страницы, она становится раковину и, следовательно, завершает процесс случайных серфинга. Если случайный серфер попадает на страницу раковины, он выбирает другой URL наугад и продолжает серфинг снова.

При расчете PageRank, страницы без исходящих ссылок предполагается связать, чтобы все остальные страницы в коллекции. Их оценки PageRank, разделяются поровну между всеми другими страницами. Другими словами, чтобы быть справедливым со страницами, которые не являются раковины, эти случайные переходы добавляются во все узлы в Интернете, с остаточной вероятностью обычно устанавливается на D = 0,85, оцененная по частоте, что средняя серфер использует свои браузера Возможность создания закладки.

Таким образом, уравнение следующим образом:


где , являются страницы рассматриваемом есть множество страниц, ссылающихся на , является количество исходящих ссылок на странице И N это общее число страниц.

PageRank значения записи доминирующего собственного вектора модифицированного матрицу смежности . Это делает PageRank особенно элегантно метрических: собственный вектор


где R является решением уравнения


где функция смежности 0, если страница не связано с И нормированные так, что для каждого у
,

т.е. элементы каждого столбца сумму до 1, поэтому матрица является стохастической матрицей (подробнее см. вычисления раздел ниже). Таким образом, это один из вариантов собственного вектора центральная мера, используемая обычно в сетевой анализ .

Из-за большого eigengap модифицированного матрицу смежности выше, [16] значения PageRank собственный вектор может быть аппроксимирована с точностью до высокой степенью точности в течение всего лишь нескольких итераций.

В результате марковской теории , можно показать, что PageRank страницы является вероятностью прибывающих на этой странице после большого числа щелчков. Это происходит равными где является ожидание числа кликов (или случайных прыжков), необходимых для получения со страницы назад к себе.

Один главный недостаток PageRank является то, что она способствует старше страницах. Новая страница, даже очень хороший, не будет иметь много связей, если она не является частью существующего сайта (сайт будучи плотно связан набор страниц, таких как Wikipedia ).

Некоторые стратегии были предложены, чтобы ускорить вычисления PageRank. [17]

Различные стратегии для манипулирования PageRank были использованы в рамках согласованных усилий для улучшения результатов поиска рейтинга и монетизировать рекламным ссылкам. Эти стратегии сильно пострадала надежность концепции PageRank, которое направлено на то, чтобы определить, какие документы на самом деле высоко ценится веб-сообщества.

С декабря 2007 года, когда он начал активно наказание сайтов продажи платных ссылок текста, Google была combatted ссылка ферм и других схем для искусственного раздувать PageRank. Как Google определяет ссылку хозяйств и других инструментов манипуляции PageRank является одним из Google, торговые секреты .
[ править ]Вычисление

PageRank может быть вычислена как итеративно или алгебраически. Итерационный метод можно рассматривать как итерацию мощности методом [18] [19] или степенной метод. Основные математические операции, выполняемые идентичны.
[ редактировать ]Итерационное

На , Начальное распределение вероятностей предполагается, как правило,
.

В каждый момент времени, вычисление, как описано выше, дает
,

или в матричном
(*)

где и есть вектор-столбец длины содержащие единственные.

Матрица определяется как


т.е.
,

где обозначает матрицу смежности графа и диагональная матрица с outdegrees в диагонали.

Вычисление заканчивается, когда для некоторых малых
,

т.е. когда предполагается сходимость.
[ править ]Алгебраическая

Для (Т.е. в установившемся режиме ), приведенного выше уравнения (*) читает
. (**)

Решение дается
,

с единичной матрицей .

Решение существует и является уникальным для . В этом можно убедиться, заметив, что по построению является стохастической матрицей и, следовательно, имеет собственное значение равно единице, как следствие теоремы Перрона-Фробениуса .
[ править ]Метод подачи питания

Если матрица является вероятность перехода, то есть, колонка-стохастические, без колонки, состоящий всего из нулей и распределение вероятностей (т.е. , где является матрицей все единицы), уравнение. (**) Эквивалентно
. (***)

Следовательно PageRank является основным собственным вектором . Быстрый и простой способ для вычисления этого является использование степенной метод : начиная с произвольного вектора , Оператор Применяется в последовательности, т.е.
,

до
.

Следует отметить, что в уравнении. (***) Матрицы в правой части в скобках могут быть интерпретированы как
,

где является начальным распределением вероятностей. В данном случае
.

Наконец, если имеет столбцы только с нулевыми значениями, то они должны быть заменены на начальный вектор вероятность . Другими словами
,

где матрица определяется как
,

с


В этом случае этих двух вычислений с использованием только те же самые PageRank, если их результаты нормированы:
.

PageRank MATLAB / октава реализации
Параметр% M матрицей смежности, где M_i, J представляет ссылку от "J" к "Я", такие, что для всех "J" Сумма (I, M_i, J) = 1
Параметр% D коэффициент затухания
% Параметр v_quadratic_error квадратичной ошибки для V
Вернуться% V, вектор такой, что ряды v_i является I-го ранга из [0, 1]

Функция [V] = ранг (M, D, v_quadratic_error)

N = размер (М, 2)%, N равен половине размера М
V = рандов (N, 1);
. V = V / норма (V, 2);
last_v те = (N, 1) * инф;
M_hat = (. Г * M) + (. ((1 - г) / N) * те, (N, N));

в то время как (норма (V - last_v, 2)> v_quadratic_error)
last_v = V;
V = V * M_hat;
. V = V / норма (V, 2);
конец

EndFunction



Функция [V] = rank2 (M, D, v_quadratic_error)

N = размер (М, 2)%, N равен половине размера М
V = рандов (N, 1);
V = V / норма (V, 1);.% Это сейчас L1, L2 не
last_v те = (N, 1) * инф;
M_hat = (. Г * M) + (. ((1 - г) / N) * те, (N, N));

в то время как (норма (V - last_v, 2)> v_quadratic_error)
last_v = V;
V = V * M_hat;
% Исключена норма L2 повторного PR
конец

EndFunction

Пример кода, вызывающего ранг функция, определенная выше:
M = [0 0 0 0 1; 0,5 0 0 0 0; 0,5 0 0 0 0; 0 1 0 0 0,5; 0 0 0,5 1 0];
Ранг (M, 0,80, 0,001)

В этом примере к 13 итерации сходятся.

Ниже приводится доказательство того, что rank.m неверно. Он основан на первый наглядный пример. Я понимаю, что rank.m использует неправильную норму на входе, затем продолжает перенормируют L2, которое не является обязательным.
% Это представляет собой пример графика, правильно нормированные и учета для раковин (Node)
%, Позволяя ей эффективно случайный переход 100% времени, в том числе к самому себе.
%, А RANK.m на самом деле не справиться с этим неправильно, он не показывает, как именно следует
% Ручки раковины узлов (одно из возможных решений было бы самостоятельно перехода 1.0), что не
% Дают правильный результат.

test_graph = ...
[0,09091 0,00000 0,00000 0,50000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000;
0,09091 0,00000 1,00000 0,50000 0,33333 0,50000 0,50000 0,50000 0,50000 0,00000 0,00000;
0,09091 1,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000;
0,09091 0,00000 0,00000 0,00000 0,33333 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000;
0,09091 0,00000 0,00000 0,00000 0,00000 0,50000 0,50000 0,50000 0,50000 1,00000 1,00000;
0,09091 0,00000 0,00000 0,00000 0,33333 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000;
0,09091 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000;
0,09091 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000;
0,09091 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000;
0,09091 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000;
0,09091 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000 0,00000]

PR = ранг (test_graph, 0,85, 0,001)% НЕПРАВИЛЬНО не нормируется.


0.062247%
0.730223%
0.650829%
0.074220%
0.153590%
0.074220%
0.030703%
0.030703%
0.030703%
0.030703%
0.030703%

PR / норма (пр., 1)% правильных раз нормализуется. Я до сих пор не знаю, почему происходит нормализация L2 (V = V / Норма (V, 2))

0.032781%
0.384561%
0.342750%
0.039087%
0.080886%
0.039087%
0.016170%
0.016170%
0.016170%
0.016170%
0.016170%

PR = rank2 (test_graph, 0,85, 0,001)% правильно, только требует нормализации входных PR (убедитесь, что он подводит до 1.0)

0.032781%
0.384561%
0.342750%
0.039087%
0.080886%
0.039087%
0.016170%
0.016170%
0.016170%
0.016170%
0.016170%
[ править ]Эффективность

В зависимости от структуры, используемой для выполнения вычислений, точное реализации методов и требуемой точности результата вычисления время эти методы могут значительно отличаться.
[ править ]Вариации
[ править ]PageRank неориентированного графа

PageRank из неориентированный граф G статистически близка к распределению степеней графа, [20] , но они, как правило, не идентичны: Если R является PageRank вектор определен выше, и D-вектор степень распределения


где обозначает степень вершины И Е является краем набора графа, то при , По: [21]



то есть, PageRank неориентированного графа равна векторной распределение степеней тогда и только тогда, когда граф является регулярным, т.е. каждая вершина имеет ту же степень.
[ править ]распределенный алгоритм для вычисления PageRank

Есть простой и быстрый случайного блуждания на основе распределенных алгоритмов вычисления PageRank узлов в сети. [22] Они представляют собой простой алгоритм, который принимает туров с высокой вероятностью на любой граф (режиссер или неориентированный), где N является размер сети и является сброс вероятности ( также называют коэффициентом затухания), используемыми при расчете PageRank. Они также представят более быстрый алгоритм, который раундов в неориентированных графах. Оба указанных выше алгоритмы масштабируемыми, так как каждый узел процессы и отправляет только небольшой (полилогарифмических по п, размера сети) число битов в раунд. Для ориентированных графов, они представляют алгоритм, который имеет время работы , Но это требует полином количество битов, обрабатываться и отправляться на узел в круглой.
[ править ]Панель инструментов Google

Панель инструментов Google "с PageRank функция отображает PageRank посещенной страницы в целом число между 0 и 10. Самый популярный веб-сайты имеют PageRank из 10. Мере, PageRank 0. Google не раскрывает конкретный способ определения значения PageRank панели инструментов, которые следует рассматривать лишь приблизительное представление значения веб-сайта.

PageRank измеряет количество сайтов, которые ссылаются на определенную страницу. [23] PageRank конкретной страницы грубо основан на количестве входящих ссылок, а также из PageRank страниц, давая ссылки. Алгоритм включает также другие факторы, такие как размер страницы, количество изменений с момента, когда страница была обновлена, текст в заголовки и текст в гиперссылки текстов якоря. [6]

PageRank панели инструментов Google обновляется нечасто, так что значения это показывает, часто устарели.
[ править ]SERP ранг

Результатов поиска страницы (SERP) является фактическим результат, возвращаемый поисковой системы в ответ на ключевые слова запроса. SERP состоит из списка ссылок на веб-страницы с соответствующими фрагментами текста. SERP ранг веб-страницы относится к размещению соответствующей ссылкой на SERP, где более высокое размещение означает более высокий ранг SERP. SERP ранг веб-страницы является функцией не только ее PageRank, но относительно большой и постоянно корректироваться множество факторов (более 200),. [24] Поисковая оптимизация (SEO) целью повлиять на его рангом SERP для веб-сайт или набор веб-страниц.

После введения места Google в русло органической поисковой выдаче, множество других факторов, в дополнение к PageRank влияет на ранжирование бизнес в локальные результаты бизнеса. [25]
[ править ]Каталог Google PageRank

Каталог Google PageRank представляет собой 8-единице измерения. В отличие от панели инструментов Google, которая показывает числовое значение PageRank на наведении курсора мыши на зеленую полосу, каталог Google отображает только бар, никогда не числовые значения.
[ править ]ложных или поддельных PageRank

В прошлом, показанном на PageRank панели инструментов был легко манипулировать. Перенаправление с одной страницы на другую, либо через HTTP 302 ответа или "Обновить" мета-тег , вызванный исходную страницу приобрести PageRank назначения страницы. Таким образом, новая страница с PR 0 и не входящих ссылок мог приобрести PR 10 путем перенаправления на домашнюю страницу Google. Это подмены техники, также известный как Google домкрата 302 , была известна уязвимость. Подмена в общем случае может быть обнаружен путем выполнения поиска Google для источника URL, если URL совершенно другой сайт отображается в результатах, последний URL может представлять собой пункт назначения переадресации.
[ править ]Управление PageRank

Для поисковой оптимизации целей, некоторые компании предлагают продавать ссылки с высоким PageRank для веб-мастеров. [26] В качестве ссылки с более высоким PR страниц которые считаются более ценными, они имеют тенденцию быть более дорогими. Это может быть эффективной и жизнеспособной маркетинговой стратегии ссылку Где купить рекламу на содержательных страницах качества и соответствующие сайты для привлечения трафика и увеличения ссылочной популярности веб-мастеров. Тем не менее, Google публично предупредил, что веб-мастерам, если они или были открыты для продажи ссылок с целью присвоения PageRank и репутацией, их связь будет девальвирован (игнорируется при расчете веса PageRank других страниц »). Практика покупки и продажи ссылок интенсивно обсуждается через сообщество веб-мастеров. Google советует веб-мастерам использовать Nofollow HTML атрибутов стоимости на рекламные ссылки. По Мэтт Каттс , Google обеспокоен веб-мастеров, которые пытаются играть с системой , и тем самым снизить качество и релевантность результатов поиска Google. [26]
[ править ]Преднамеренное модели Surfer

Оригинальный алгоритм PageRank отражает так называемую модель случайного серфера, а это означает, что PageRank конкретной страницы происходит от теоретической вероятности появления этой страницы при нажатии на ссылки в случайном порядке. Модель ранжирования страниц, что отражает важность конкретной страницы в зависимости от того, сколько фактически посещений он получает реальных пользователей называется преднамеренное модели серфера. [27] панели инструментов Google посылает информацию в Google для каждой страницы посетил, и тем самым обеспечивает основы для расчета показателей PageRank, основанных на целенаправленном модели серфера. Введение Nofollow атрибут Google по борьбе Поисковый спам имеет побочный эффект, что веб-мастера обычно используют его на исходящих ссылок с целью увеличения своего PageRank. Это приводит к потере фактической ссылки для веб-сканеров следовать, тем самым делая оригинальный алгоритм PageRank основан на модели случайного серфера потенциально ненадежными. Использование информации о пользователей привычки просмотра предоставляемые панели инструментов Google частично компенсирует потерю информации вызвано Nofollow атрибута. SERP ранг страницы, которое определяет фактическое размещение страницы в результатах поиска, основан на сочетании модели случайного серфера (PageRank) и преднамеренное модели Surfer (просматривают привычки) в дополнение к другим факторам. [28]
[ править ]Другие области применения

Версия PageRank Недавно был предложен в качестве замены для традиционных Института научной информации (ISI) импакт-фактор , [29] и осуществляются на eigenfactor.org . Вместо простого подсчета общего Цитирование в журнал, «важность» каждого Цитирование определяется в моде PageRank.

Аналогичное использование новых PageRank является ранжирование академических докторских программ, основанных на их отчетах размещения своих выпускников факультета в позициях. В условиях PageRank, академических ссылка ведомств друг с другом, нанимая их преподаватели друг от друга (и от самих себя). [30]

PageRank была использована для оценки пробелов или улицы, чтобы предсказать, как много людей (пешеходов или транспортных средств) приходят к отдельным пробелы или улиц. [31] [32] В лексической семантике она была использована для выполнения Многозначные смысле слова [33] и автоматически ранга WordNet синсетов по тому, как сильно они обладают данного семантического собственности, такие как положительный или отрицательный. [34]

Метод динамического взвешивания аналогичны PageRank был использован для создания настроены чтения списки основаны на соединении структуры Википедии. [35]

Роботы могут использовать PageRank как одно из ряда значений метрик он использует, чтобы определить, какой URL, чтобы посетить во время обхода в Интернете. Одним из первых рабочих документах [36] , которые были использованы в создании Google является эффективное сканирование по URL заказа, [37] которая обсуждается использование ряда различных метрик значение, чтобы определить, насколько глубоко, и сколько сайт Google будет ползать. PageRank представлена ​​как одна из ряда этих значений метрик, хотя есть и другие, перечисленные, такие как количество входящих и исходящих ссылок на URL, а расстояние от корневой директории сайта в URL.

PageRank также может быть использован в качестве методологии для измерения очевидным воздействие сообщества, как Blogosphere на общий веб-себе. Этот подход использует поэтому PageRank для измерения распределения внимания в отражении безмасштабных сети парадигмы.

В любой экосистеме, модифицированная версия PageRank может быть использована для определения видов, которые имеют важное значение для продолжения здоровья окружающей среды. [38]

Применение PageRank для анализа белковых сетей в биологии сообщается в последнее время. [39]
[ править ]Nofollow

В начале 2005 года Google внедрила новую стоимость ", Nofollow ", [40] для отн атрибут HTML ссылка и анкерных элементов, так что разработчикам веб-сайтов и блоггеров может сделать ссылки, которые Google не будет рассматривать для целей PageRank-они Ссылки, которые больше не представляют собой "голос" в системе PageRank. Nofollow отношений был добавлен в попытке помочь в борьбе Поисковый спам .

В качестве примера, люди раньше могли создать много сообщений бортового сообщения со ссылками на их сайт, чтобы искусственно завысить их PageRank. С Nofollow значения, сообщения бортового администраторы могут изменять свой код, чтобы автоматически вставлять "отн = 'Nofollow", чтобы все гиперссылки в сообщении, таким образом предотвращая PageRank от воздействия этих конкретных сообщений. Этот метод избегания, однако, также имеет различные недостатки, такие, как снижение значения ссылки законных комментариев. (См.: Спам в блогах # Nofollow )

В попытке вручную контролировать поток PageRank между страницами в пределах одного сайта, многие веб-мастера практике так называемый PageRank скульптуры [41] -которая является актом стратегически размещения Nofollow атрибут определенные внутренние ссылки веб-сайта для того, чтобы направить PageRank к этим страницам веб-мастера считаются самыми важными. Эта тактика была использована с момента создания Nofollow атрибут, но больше не может быть эффективной, так как Google объявил, что блокирование передачи PageRank с Nofollow не перенаправить PageRank для других связей. [42]
[ править ]Deprecation

PageRank когда-то была доступна для подтвержденный сайт Сопровождающие через интерфейс Google Webmaster Tools. Однако 15 октября 2009 года сотрудник Google подтвердили [43] , что компания удалила из своего PageRank разделе веб-мастеров, пояснив, что "мы говорили люди в течение длительного времени, что они не должны быть направлены на PageRank так много. Многие владельцы сайтов, кажется, думают, что это самый важный показатель для них, чтобы трек, который просто не соответствует действительности ". [43] Кроме того, показатель PageRank не доступны в собственной компании Google Chrome браузером.

Видимая ранг странице обновляется очень редко.

6 октября 2011 года многие пользователи ошибочно думали так же Google PageRank исчез. Как оказалось, это было просто обновление URL используется для запроса PageRank от Google. [44]

Google теперь также опирается на другие стратегии, а также PageRank, таких как Google Panda
Источник: http://forums2.gardenweb.com/forums/load/rosesant/msg0115283418430.html

Комментариев нет:

Отправить комментарий