Информационные технологии
Операционные системы
Информационные технологии
Информационные технологии представляют собой широкий класс дисциплин и сфер деятельности, которые относятся к технологиям создания, хранения, управления, ... читать далее »
Статьи по ИТ
28.06.2009 00:00

Поиск в Интернете . Информационные технологии.

Основная проблема поиска информации

Разберем основную проблему в Internet: необходимо найти некоторую информацию, но неизвестны адреса сайтов, на которых она выложена. Тут на помощь приходят поисковые системы. Обычно для приемлемой работы в Internet достаточно помнить только адреса нескольких поисковых систем. Все остальные адреса можно найти там. Также для поиска используются каталоги ссылок. Там ссылки аккумулируются и разбиваются по темам и подтемам, как в библиотечных каталогах. Последнее время происходит слияние этих двух сервисов и практически на любом поисковом сервере имеется и каталог. Поисковые системы, это обычные сайты, на которые можно зайти с помощью браузера, написать в специальном поле текст запроса и система выдаст адреса документов из своей базы данных, на которых встречаются слова из запроса. На любое одиночное слово поисковая система может выдать несколько тысяч ссылок.

Методы поиска

   1. Обращение по URL (простейший метод поиска). Подразумевает наличие адреса URL и сводится к обращению клиента (программы клиента) к серверу определенного типа, т.е. отправке запроса с использованием определенного протокола.
   2. Использование набора ссылок Большинство серверов, представляющие гипертекстовые материалы общего вида, предлагают ссылки и на другие серверы (содержат URL адреса других ресурсов).
   3. Использование специализированных поисковых механизмов:

Поисковые машины. Основная идея поисковых машин - создание базы данных содержащей слова, встречающихся в документах Internet. В этой базе для каждого слова будет храниться список документов, содержащих это слово.

Каталоги ресурсов. В каталогах используется иерархическая (древовидная) модель базы данных, так как любой ресурс, имеющий URL адрес, описание и другую информацию подчинен некой классификации.

Поиск ресурсов Internet с использованием поисковых механизмов должен осуществляться по приведенным ниже этапам. Это оптимизирует результат поиска (количество найденных документов будет не столь велико, а соответствие их запросу - более близко к истине).

Этапы поиска

   1. Выделение тематических и географических регионов поиска. Для поиска русских документов лучше использовать русские поисковые механизмы. Это связано с тем, что на их иностранных аналогах эти документы представлены в очень небольших количествах и поиск в них может не дать ожидаемого результата;
   2. Составление тезауруса. Переход от описания предметной области к формализованным описаниям и построение, в конечном счете, формального текста, т.е. составление списка ключевых слов;
   3. Выбор поискового инструмента - метода поиска;

Составление запросов, руководствуясь синтаксисом выбранного поискового инструмента.

















источник: www.chernykh.net

© WIKI.RU, 2008–2017 г. Все права защищены.