Принцип работы поисковых машин.

Функции поисковых машин. Поисковики интернета обладают четырьмя основными  функциями – это ползание (crawling), расчёт релевантности, индексирование, ну и как выход, естественно, предоставление данных результатов пользователю.   Crawling (Ползание)   Сканер («паук») или автоматизированный робот по заданному алгоритму ходит в гости на страницы интернет пространства, а паук заходит на все интернет страницы без  предпочтений по заданию. При поиске на веб-страницах роботы употребляют гиперссылки, по которым и осуществляются переходы.   Через гиперссылки, роботы поисковых  машин  достигают миллиардов взаимосвязанных веб-документов интернет сети. Важно понимать, что сканер посетит лишь ту страницу, на которую его будет вести  гиперссылка, и если ее нет, то и страница будет невидима для сканера.   После того, как «паук» посетит страницы  и «вытащит» с них часть нужной информации (сколько будет весить данный объём информации, зависит только от алгоритма задач конкретной поисковой машины). Внимание! Главный принцип работы поисковых машин заключается в следующем. Робот ведет сбор лишь определенной  части информации с посещаемой им веб-страницы и делает запись всего на гигантских объемов памяти жесткие диски, которые располагаться в специальных дата-центрах. А они в свою очередь разбросаны  по всему миру. Первое, что сделала поисковая система – это запуск «паука», который обошёл  всю интернет сеть и записал кусочки веб-страниц на гиганта жесткого диска в дата-центре. …

Страница 1 из 11