Поисковые системы в WORLD WIDE WEB

Работа поисковых серверов основывается на трех основных принципах: создание Web-индексов (Web-indexes), создание каталогов (Web directories) и метод, сочетающий в себе таким или иным образом оба первых подхода. Существуют еще разнообразные онлайновые справочники, системы на компакт-дисках и т.д.
Создание Web-индексов предполагает поиск, анализ, классификацию и пополнение данных. Все это выполняется исключительно компьютерами, поэтому в ответ на запрос они выдают ссылки на большое количество документов, многие из которых имеют отдаленное отношение к интересующей теме. Примерами в этой области являются Yandex, AltaVista и HotBot, а также Open Text. Необходимо заметить, что AltaVista и Yandex являются поисковыми системами, работающими с русскоязычными документами.
Второй подход подразумевает систематизирование информации, касающейся разнообразных тем по каталогам. В отличие от первого принципа здесь обработкой данных занимаются люди, поэтому по качеству представления документов каталоги намного превосходят индексы. Также здесь можно найти аннотации, обзоры и многие другие материалы, подготовленные аналитиками этих компаний на различные темы. Представителями являются Yahoo и Magellan.
В качестве примеров, сочетающих в себе использование и Web-индексов и Web-каталогов, можно назвать Rambler, Lycos и Excite, также WebCrawler.
В сети постоянно появляется что-то новое, в том числе и поисковые системы.
Как уже отмечалось ранее - поиск можно производить также с помощью альтернативных средств, среди которых онлайновые справочники, конференции новостей, специализированные системы/справочники, разнообразные классификаторы, сгруппированные в различные "белые", "желтые" и другие страницы. Существуют внесетевые справочники, представленные на компакт-дисках или дискетах. Это локальные базы данных сетевых ресурсов, помогающие ко всему прочему еще экономить деньги, так как с их помощью производится предварительный поиск нужных ресурсов, только после этого производится соединение с Internet. Можно предложить осуществлять поиск по ссылкам, рекламным объявлениям и другим сообщениям в сети. Альтернативные формы могут оказться более эффективными, чем поисковые системы.
В зависимости от того, какой поисковой системой Вы пользуетесь, на запрос она может выдавать только заголовок и адрес каждой найденной страницы либо производить выделение содержимого некоторых тегов на них, или возвращать всю страницу.
Необходимо посмотреть подсказку для поисковой системы перед началом поиска. Многие из поисковых систем позволяют Вам ввести несколько слов, а затем искать их наличие в своей базе данных. Каждая поисковая система имеет свои собственные правила для принятия решения о похожих по звучанию словах, общих словоформах и усечении слов.
Задав для поиска слова из заголовков, можно получить страницы с краткими описаниями или упоминаниями нужного понятия, а затем с них перейти на страницы, на которых детально описывается то, что вам нужно.
Большинство поисковых систем по умолчанию используют нижний регистр, но слова, введенные на верхнем регистре будут сопоставляться только со словами в базе данных на верхнем регистре, хотя есть и исключения. Нет стандарта на усечение слов. Практически каждая поисковая система по-своему работает в расширенном режиме поиска. Понимание того, что на страницах могут встретиться не сами слова, а их сокращения, различные формы и т.д., может оказаться важным для успешного поиска.
Поисковые системы назначают каждому документу, который они нашли, некоторую меру (ранжировку - ranking) качества соответствия поисковому запросу - рейтинг (score). Рейтинги отражают число раз, которое данный термин появляется на странице, появляется ли он в начале документа в HTML-тегах, находятся ли слова из запроса близко друг к другу; некоторые системы объясняют свои принципы работы в подсказке. Некоторые поисковые системы позволяют пользователю управлять назначением рейтинга страницам с помощью назначения различных весов словам из запроса.
Большинство поисковых систем проверяют свои базы данных на актуальность - смотрят, существует ли еще URL, и сколько времени он находится в базе данных.
return_links(); ?> © АБС. 2012.   
Все права зарегистрированы.