|
Обзор технологий
Google – единственная компания, сосредоточившая свои усилия на
разработке "идеальной поисковой системы", которая, по словам
соучредителя компании Лэрри Пейджа (Larry Page), "точно определит, что
подразумевает пользователь, и покажет именно те результаты, которые ему
нужны". С этой целью Google непрестанно ищет новые методы и
отказывается смиряться с ограничениями существующих технологий. В итоге
Google разработала собственную инфраструктуру и революционную
технологию PageRank™, которая изменила подход к выполнению поиска.
С самого начала разработчики Google понимали, что для более быстрого
получения наиболее точных результатов необходим новый способ настройки
сервера. Большинство поисковых систем использовали несколько больших
серверов, которые часто работали медленно при пиковых нагрузках.
Компания Google задействовала связанные ПК, позволяющие быстро находить
ответы на все запросы. Внедрение этой инновационной технологии привело
к сокращению времени отклика, повышению масштабируемости и снижению
расходов. С тех пор все остальные компании копируют эту идею, в то
время как Google продолжает постоянно улучшать внутреннюю технологию с
целью повышения ее эффективности.
Программное обеспечение, используемое для реализации технологии
поиска Google, проводит ряд одновременных вычислений, которые занимают
не больше доли секунды. Традиционные поисковые системы в большей
степени основываются на том, как часто слово появляется на
веб-странице. Google же изучает всю структуру веб-ссылок и определяет,
какие страницы наиболее важны, с помощью PageRank™. Затем проводится
анализ соответствия гипертекста и выбор страниц, наиболее подходящих
для конкретного поиска. На основании общей значимости и соответствия
запросу Google отображает в первую очередь наиболее релевантные и
достоверные результаты.
-
Технология PageRank: PageRank объективно оценивает
значимость веб-страниц, основываясь на уравнении, включающем более 500
миллионов переменных и 2 миллиарда терминов. Вместо того, чтобы
подсчитывать прямые ссылки, PageRank рассматривает ссылку со страницы А
на страницу Б как голос в пользу страницы Б от страницы А. Затем по
количеству полученных голосов PageRank определяет значимость данной
страницы.
PageRank также оценивает важность каждой страницы, принимающей
участие в голосовании. При получении голосов от страниц с большей
значимостью ссылка становится более ценной. Значимые страницы получают
более высокий рейтинг PageRank и отображаются в начале результатов
поиска. Технология Google использует совокупные интеллектуальные
веб-средства, чтобы определить значимость страницы. Человеческий фактор
или подтасовка результатов невозможны, и именно поэтому пользователи
доверяют Google как источнику объективной информации, в результатах
поиска которого отсутствуют проплаченные рекламные объявления.
-
Анализ соответствия гипертекста: поисковая система
Google, как и другие системы, также анализирует содержание страницы.
Однако вместо простого сканирования текста страницы (который может
выполнить веб-издатель с помощью метатегов) технология Google
анализирует все содержание страницы, особенности шрифтов, разбивки
текста и точное расположение каждого слова. Google также анализирует
содержание соседних веб-страниц, чтобы убедиться в том, что полученные
результаты наиболее точно соответствуют запросу пользователя.
Инновационные технологии Google распространяются не только на
настольные ПК. Компания Google поставила перед собой задачу донести
результаты своего точного и быстрого поиска до пользователей,
работающих в Интернете через мобильные устройства. С этой целью Google
разработала первую в своем роде технологию беспроводного поиска для
мгновенного преобразования HTML в форматы, оптимизированные для WAP,
i-mode, J-SKY и EZWeb. В настоящее время беспроводная технология Google
используется множеством лидирующих на рынке компаний, включая AT &
T Wireless, Sprint PCS, Nextel, Palm, Handspring и Vodafone.
Жизненный цикл запроса Google
Время поиска Google обычно занимает менее чем полсекунды, однако эта
процедура включает в себя ряд действий, без которых результаты поиска
не будут доставлены пользователю.
|
3. Всего лишь доля секунды требуется для получения результатов поиска. | | | 1.
Веб-сервер отправляет запрос на серверы индексации. Содержимое серверов
индексации соответствует содержанию в конце книги – в нем сообщается,
на каких страницах представлены слова, соответствующие запросу. |
| 2.
Запрос отправляется на серверы, которые осуществляют поиск хранящихся
документов. Для описания каждого результата поиска создаются фрагменты. | |
В целом, веб-мастера могут повысить рейтинг своих сайтов, увеличив
число высококачественных сайтов, которые ссылаются на их страницы.
|
|
Статистика |
Онлайн всего: 1 Гостей: 1 Пользователей: 0 |
|