Принцип работы поисковых машин.

Функции поисковых машин.

Поисковики интернета обладают четырьмя основными  функциями – это ползание (crawling), расчёт релевантности, индексирование, ну и как выход, естественно, предоставление данных результатов пользователю.

 

Crawling (Ползание)

 

Сканер («паук») или автоматизированный робот по заданному алгоритму ходит в гости на страницы интернет пространства, а паук заходит на все интернет страницы без  предпочтений по заданию. При поиске на веб-страницах роботы употребляют гиперссылки, по которым и осуществляются переходы.

 

Через гиперссылки, роботы поисковых  машин  достигают миллиардов взаимосвязанных веб-документов интернет сети. Важно понимать, что сканер посетит лишь ту страницу, на которую его будет вести  гиперссылка, и если ее нет, то и страница будет невидима для сканера.  

После того, как «паук» посетит страницы  и «вытащит» с них часть нужной информации (сколько будет весить данный объём информации, зависит только от алгоритма задач конкретной поисковой машины).

Внимание! Главный принцип работы поисковых машин заключается в следующем. Робот ведет сбор лишь определенной  части информации с посещаемой им веб-страницы и делает запись всего на гигантских объемов памяти жесткие диски, которые располагаться в специальных дата-центрах. А они в свою очередь разбросаны  по всему миру. Первое, что сделала поисковая система – это запуск «паука», который обошёл  всю интернет сеть и записал кусочки веб-страниц на гиганта жесткого диска в дата-центре.

 

Большой объем информации (а это миллиарды интернет страниц!) находящийся в дата-центрах шлифуется мощными компьютерами, обеспечивающими пользователю выдачу задаваемой им в поиске браузеров информации.

 

Индексирование

 

На компьютерных системах дата-центров записанная пауком и роботом информация индексируется, то есть  все веб-страницы по отдельности  по нужному алгоритму обрабатываются и каждой присваивают индекс, «значимость» данной станицы для пользователя. Теперь, если в поисковике пользователь будет набирать запрос, то поисковая машина станет искать заданный запрос в своих индексах.

 

Релевантность

 

Когда интернет пользователь набирает на своей клавиатуре  запрос (словоформу) в поисковой системе, он тем самым заставляет её делать 2 вещи:

– Дать интернет пользователю адекватный ответ (релевантность – это, если говорить просто максимум соответствия между запросом интернет пользователя (словоформой)  и ответом поисковика)

– Ранжирование результатов выдачи (важность или значение страниц), то есть чем релевантнее будет ответ, тем он выше стоит в поисковой выдаче.

 

Релевантность для поисковиков – не только выдача интернет пользователю нужной веб-страницы, на которой располагаются заданные им слова (фразы, которые человек вбил в поиске), но это еще и выдача максимально полезной ему информации.  На сегодня  релевантность получает влияние от огромного числа факторов, а это значит, что на выдачу результатов поиска инет-пользователю влияют много факторов, которые и определяют своими  алгоритмами работы и пауки поисковых  машин.

 

Сегодня главным фактором, который влияет на ранжирование (и как результат выдачу по более высоким позициям)  считают популярность всего сайта или его отдельной страницы. Поисковая машина (роботы и пауки) определяет  популярность  документа, и тем самым определяет его  ценность отчего  собственно и происходит программа выдачи на верхних позициях поиска.

 

Например, чем популярнее  мой сайт, чем больше ссылок будет  на него с других сайтов, тем более выше он будет в поисковой выдачи.