Метапоисковые системы

Не является секретом тот факт, что Интернет представляет собой постоянно растущий огромными темпами массив информации. Для того, чтобы каким-то образом упорядочить этот непрерывный поток данных и, самое главное, иметь возможность находить в этом потоке необходимую информацию, были созданы знакомые нам поисковые машины. Каждый такой поисковик имеет свой индекс, который несет служебную информацию о содержимом проиндексированных страниц и документов.

Каждый обычный (назовем его "традиционным") поисковик имеет только свой собственный, ограниченный своими ресурсами перечень (индекс) документов, которые доступны для поиска. Ни одна из подобных систем не может охватить всех ресурсов, которые существуют в Интернет. Поэтому, может возникнуть ситуация, когда пользователя не удовлетворяют результаты поисковой выдачи. Обычно, в этом случае, пользователь переходит на другой поисковик и пытается найти то, что ему нужно, там.

Зачем нужны метапоисковые системы?
Теперь представим себе ситуацию, когда количество проиндексированных сайтов различными поисковыми системами растет в геометрической прогрессии, но доля непроиндексированного, так называемого "невидимого" Интернета для каждой поисковой системы (даже для такой мощной, как Gooogle) возрастает с каждым месяцем.

Происходит это потому, что разные поисковые машины используют различные алгоритмы поиска и уделяют свое внимание разным участкам Сети, к которым они наиболее адаптированы. Логичным решением, в таком случае, является поиск не одним, а несколькими поисковиками, для получения более релевантного результата. Именно такую возможность и предлагают метапоисковые системы.

Как работают метапоисковые системы.
Следует иметь в виду, что метапоисковые машины не имеют собственных поисковых баз данных (исключение - nigma.ru), не содержат никаких индексов и для поиска используют базы данных других поисковых систем. Принцип работы метапоисковика заключается в следующем: запрос пользователя преобразуется в запросы, отформатированные синтаксически и логически в конструкции, оптимальные для каждого отдельного, "традиционного" поисковика, т. е. из одного запроса метапоисковый механизм делает ряд запросов, которые адресуются нескольким "обычным" поискам.

Таким образом, метапоисковые системы объединяют для достижения результатов индексы поисковых серверов различных специализаций. В рамках одной метапоисковой системы можно осуществлять поиск информации различного типа. Метапоисковые системы не предназначены для индексирования и накопления данных, их назначение – чистый поиск и обработка результатов поиска. Все метапоисковые системы сортируют результаты поиска таким образом, чтобы избежать дублей и одинаковых страниц в выдаче, найденных различными поисковыми системами. Рассмотрим два метапоисковых механизма - один западный, другой российский.

Vivisimo
Vivisimo представляет собой метапоисковую систему, которая собирает данные, используя индексы нескольких поисковых машин одновременно. При более детальном рассмотрении можно говорить, что Vivisimo обладает набором уникальных, нигде больше не встречающихся функций.
Главная страница поисковика Vivisimo
Дело в том, что большинство метапоисковых систем отсылают запрос пользователя в несколько поисковиков одновременно, а затем результаты, попавшие в начало списков, выводят в качестве ответа на запрос. Vivisimo работает таким же образом, но кроме этого, система сортирует результаты поиска по группам со схожим смыслом. Особенно полезно это бывает, когда существуют разные варианты вводимых ключевых слов. Результаты поиска объединяются в список все более узких подразделов, что делает возможным обходиться без дополнительных поисковых запросов. Пример поискового запроса [abba] на скриншоте.
Скриншот запроса [abba]
Еще одна интересная функция Vivisimo заключается в возможности предварительного просмотра содержания страницы по найденным ссылкам. При этом пользователь может открыть окно просмотра прямо посреди страницы с поисковой выдачей, что позволяет быстро просматривать результаты поиска.
Предварительный просмотр Vivisimo
Но это еще не все возможности Vivisimo, достойные внимания. Если зайти на страницу расширенного поиска advanced search, можно найти много полезных инструментов для нашего дела. К примеру, пользователь может задать поиск по новостным сайтам (CNN, USA Today, Reuters, BBC и др.) или воспользоваться специализированными поисковыми машинами, такими как поисковик официального сайта правительства США FirstGov, Business.com, Энциклопедии Британника, аукциона eBay или системой поиска патентов Delphion. Поиск Vivisimo в расширенном режиме выдает 200 результатов. Если этого недостаточно, то можно настроить машину на вывод 300 или 500 результатов.

В своей работе Vivisimo использует результаты поиска следующих машин и каталогов: MSN, Lycos, Looksmart, Wisenut, Open Directory, Overture. Сервис может корректно работать и с контентом на русском – но, к сожалению, русскоязычных сайтов, проиндексированных приведенными выше системами, не так уж и много, поэтому результаты поиска для страниц на русском оставляют желать лучшего.

NIGMA.RU
Поисковый сервис nigma.ru позиционирует себя как "интеллектуальная поисковая система". Чтобы составить начальное представление о поисковике, обратимся к его странице в Википедии. Из описания становится понятно, что nigma.ru - универсальная поисковая машина, одновременно использующая несколько популярных поисковых движков, которые можно включать/отключать по желанию (главная стр. вкладка "поисковики").

Принцип действия NIGMA аналогичен поиску Vivisimo: поисковая выдача группируется по различным критериям, что позволяет быстро произвести уточняющий поиск. Например, вбиваем в строку поиска запрос по нашей теме [поисковые системы].
поиск nigma.ru
Получаем привычные нам ссылки на сайты, но с левой стороны страницы мы видим фильтр сервиса, благодаря которому можно исключить/добавить различные смысловые (контекстные) значения понятия "поисковые системы".

Поставив галочку на линке, например, "новости" и нажав кнопку "применить фильтр", мы получим в следующей выдаче только новости на тему поисковых систем (см. скриншот). Аналогично можно находить/отсеивать форумы, статьи, ресурсы и др. по любому поисковому запросу. По-моему, очень удобно и практично. Идем дальше...

Производит впечатление автозаполнение строки поиска и система подсказок сервиса. Мало того, что NIGMA предлагает разные варианты запросов по рейтингу их популярности на сервисе, она еще дает краткую справку (из Википедии) по теме возможного варианта. Да, такого пока нет даже в Google.
поисковик nigma.ru
Можно и дальше перечислять и описывать различные "фишки" и способности системы (нет, это действительно интересно!), например, в области химии или математики. Думаю заинтересованный читатель сам с удовольствием разберется в тонкостях работы данного сервиса. Хочу сказать о том, что меня действительно приятно удивило в nigma.ru - поиск музыки. Совершенно потрясная вещь!

Над строкой поиска главной страницы можно видеть вкладки, определяющие результаты наших запросов. Жмем на вкладку "музыка" и вписываем в строку ключевые слова - название музыкального произведения, слова из песни, имя автора и т. п. Кроме того, что NIGMA выдает вполне достаточное количество ссылок, любую композицию можно прослушать здесь же, на странице поисковой выдачи!

Рядом может быть линк на скачивание и текст песни. Просто подарок для меломана! Ну и, судя по тому, откуда (с каких поисковиков) nigma.ru черпает информацию, смею предположить, что сервис так же хорошо обрабатывает запросы на латинице, как и на русском языке.
поиск музыки
Конечно, приведенные выше два примера метапоисковых машин не единственные в своем роде. Существует много подобных систем и, возможно, они не хуже приведенных здесь. Ниже даны ссылки на некоторые из них.

Debriefing
Мощная метапоисковая система Dogpile использует для метапоиска не только поисковые системы, но и FTP-серверы, а также новостные сайты, котировки фондовых бирж и даже "желтые страницы" Интернета. Дополнительные услуги, предоставляемые сервисом, дают возможность получать подробные прогнозы погоды и топографические карты интересующей местности.

Mamma
Канадская система метапоиска Mamma Systems обеспечивает стандартный пакет услуг, принятый для подобных сервисов. Используя базы данных популярных поисковых машин, сервис Mamma отличается качественным поиском нужной информации.

MetaCrawler
MetaCrawler, как и многие подобные системы, первоначально производит поиск необходимой информации в базах данных других поисковых сервисов. Затем запускает свой алгоритм и анализирует полученную информацию: сортирует ссылки, ищет дубликаты и, учитывая рейтинги найденных ссылок, выдает их пользователю. Система адаптирована только для англоязычного сегмента Сети.

Exactus
Метапоисковая система Exactus - проект Института Системного Анализа РАН. Поиск информации осуществляется с учетом морфологического, синтаксического и семантического анализа поисковых запросов. Сервис использует индекс поисковых машин Google, Yandex, Rambler, Ask, MNS и Yahoo. Отличается точной выдачей ответов на конкретные завершенные фразы и вопросы.

Metabot.ru
Сервис, который использует не только индексы ведущих поисковиков, но и базы данных многих каталогов, новостных и FTP серверов. Мощнейший российский метапоисковый сервис. Расположен на серверах хостинг-оператора в США.

А теперь сделаем вот что: будем пускать мыльные пузыри.

4 коммент.:

  1. Наши соотечественники юзают в основном Яндекс. Поэтому регистрироваться в Яндексе очень рекомендую.
    Яндекс рулит! В статье та же тема

    ОтветитьУдалить
  2. То что наши соотечественники юзают в основном Яндекс согласен, но вот что "рулит" именно Яндекс - вопрос, на мой взгляд, спорный.

    ОтветитьУдалить
  3. Анонимный09:34

    блин..не проще дать чёткое определение чё эт такое...а то нам на информатике думать много получается..хDDD

    ОтветитьУдалить
  4. Познавательно. Прочитал пару статей, скопировал себе на винт, буду перечитывать пока не запомню. Спасибо за инфу.

    ОтветитьУдалить

 
Copyright © . Как найти информацию - Posts · Comments
Theme Template by BTDesigner · Powered by Blogger