Приступим к поиску?

(Окончание. Предыдущие публикации в номерах за 6.10.01 и 20.10.01).


...Итак, ряд простейших приемов ввода ключевых слов в поисковые строки значительно оптимизирует поиск. Например, если между словами поставить запятые, поисковая машина Яndex выдаст на-гора лишь те документы, которые содержат хотя бы одно из введенных слов. Тильда "~" позволяет искать документы, содержащие в абзаце первое слово, но не содержащие второго. Например, по запросу "газета ~ журнал" будут найдены все документы, содержащие слово "газета", рядом с которым в пределах абзаца нет слова "журнал".


Если же требуется осуществить поиск не в первом абзаце (по его содержанию, как правило, можно судить о том, нужный ли текст вы нашли), а по всему документу, необходимо просто удвоить соответствующий знак. Одинарные знаки-операторы "&" и "~" ищут в пределах абзаца, двойные "&&" или "~~", соответственно, - во всем документе. То есть, по запросу "газета && журнал" поисковое средство отберет все документы, содержащие оба введенных слова где бы то ни было.


В Яndex возможен уникальный в своем роде вид поиска - по заданному расстоянию. Если представить, что все слова в тексте пронумерованы, а расстояние между ними есть разница между их порядковыми номерами, то расстояние между соседними словами слева направо будет условно равно единице, справа налево - минус единице. То же самое относится и к абзацам. Если между двумя словами поставлен слэш - знак "/", за которым сразу напечатано число, значит, требуется, чтобы расстояние между ними не превышало этого числа слов. Например, задав фразу "бульварная /5 газета", мы даем машине команду найти документы, в которых содержатся оба слова, но расстояние между ними должно быть не более пяти слов и они должны находиться в одном абзаце.


Вместо одного слова в запросе можно подставить целое выражение. Но для этого его надо взять в скобки. Вводим запрос "(серьезная, желтая) /+1(пресса | газеты)". В итоге мы получим список документов, которые содержат любую из следующих фраз "серьезная пресса", "желтая пресса", "серьезные газеты" и "желтые газеты".


Короче говоря, овладев нехитрыми приемами поиска, мы значительно сократим время работы в Интернете. Необходимо лишь помнить, что разные поисковые системы используют отличные друг от друга инструменты оптимизации поиска. Не поленитесь на их изучение, выясните эмпирическим путем, как они понимают служебные различные знаки или найдите в Интернете специальные сайты, посвященные технике поиска в разных системах. Так, например, другая русскоязычная поисковая машина - "Апорт" (http://www.aport.ru) - использует иные операторы, которые можно изучить на странице помощи по адресу: http://www.aport.ru/help.htm.


Зарубежные поисковые средства принципиально мало чем отличаются от отечественных. Наиболее популярны справочники "Yahoo" (http://www.yahoo.com), Lycos (http://www.lycos. com), Info-Seek (http://www.infoseek.com). Наиболее простым и самым посещаемым в мире (около миллиона посетителей в день часто делают его недоступным) является Yahoo, предназначенный для первичного ознакомления с потенциалом глобальных сетей. Справочник Yahoo обладает возможностью непосредственного поиска, однако его потенциал крайне ограничен и может принести результат только в случае, если осуществляется поиск весьма крупного объекта, имеющего свои собственные Web-страницы. Аналогичными характеристиками обладают также электронные справочники Lycos, InfoSeek и Galaxy. Однако автор зачастую при поиске терминов и уникальных документов предпочитает работать с "Google" (http://www.google.com).


Различия в мощности и чисто поисковых принципах разных систем порой приводят к тому, что разные поисковые средства дают разные, порой противоречащие друг другу, ответы на один и тот же запрос. Этим воспользовались разработчики поисковых орудий особого рода - так называемых метапоисковых машин.


К ним, например, относится "MetaCrawler" (http://www. metacrawler.com/), главное достоинство которого заключаются в умении рассылать вводимые в него запросы по другим системам, а затем суммировать результаты. Таким образом, пользователь, вводя поисковое предписание в MetaCrawler, фактически одновременно обращается к десятку различных поисковых систем. Этим гарантируется "объективность" полученных результатов, однако, учитывая уже упоминавшиеся различия в подходах к обработке терминов разными системами, результат может оказаться не всегда релевантным запросу.


Из российских заслуживает внимания метапоисковая система "Следопыт", которая позволяет перевести запрос на английский язык и обратиться сразу к 6 машинам (Alta Vista, HotBot, EuroSeek, Excite, Aport, WebCrawler).


Не забывайте, что поисковый сервер - это всего лишь машина, поэтому качество информации, которую она вам предложит в ответ на запрос, целиком и полностью зависит от искусства составления самих запросов. Каталоги лучше использовать, когда требуется осуществить быстрый поиск общих тем. Поисковые машины в чистом виде используются для поиска конкретных слов.


Андрей КОБЯКОВ.
www.mediasprut.ru


При содействии Алексея Орехова
- портал "Подводная лодка".
old.submarine.ru

Вы уже оставили реакцию
Новости Еще новости