Сбор информации из открытых источников

Сетевой шпионаж или сбор информации?
Интернет может рассматриваться как незаменимый источник информации. Полученные из Сети данные применяются в сфере образования, бизнеса, развлечений, отдыха, медицины и т. д. Но Интернет - это не только информационный Клондайк. Киберпространство уже давно стало ареной сетевого шпионажа, на которой активны различные разведывательные структуры и специальные службы, работающие на правительства, бизнес, криминал. Почему так происходит?

Почему Всемирная Паутина является пространством для добывания чужих секретов? Ответ простой: потому, что в Интернет есть ВСЁ. ВСЁ – это любая информация об общественных или государственных учреждениях, организациях, бизнес-структурах, частных лицах.

Эта статья не ставит своей целью пропаганду неэтичных и, тем более, незаконных способов добывания информации, - оставим это профессионалам. Речь идет о сборе данных законными методами, используя открытые источники информации. Открытыми источниками называются источники информации, доступ к которым происходит легально, на законных основаниях.

Нужно заметить, что к открытым источникам следует отнести не только те, к которым возможен публичный доступ, но также и те, доступ к которым технически возможен по причине, например, непрофессионализма или халатности службы защиты информации или системного администратора.

открытые источники информации
Фото Search Engine People Blog
Поиск необходимой информации с использованием открытых источников взят на вооружение многими гражданскими и военными структурами, работающими на поприще разведки и промышленного шпионажа. Положительные стороны сбора информации с помощью открытых источников очевидны: отсутствует риск провала агента и, следовательно, ущерба для собственной репутации.

Такой подход, к тому же, позволяет значительно экономить средства, ведь не нужно тратиться на кражу информации, если её можно взять вполне легально! Открытые источники информации могут быть различными, но именно Интернет является наиболее удобным и "технологичным" средством доступа к разного рода данным.

Информационные отделы крупных (и не только) компаний а также бизнес-разведчики разного калибра неустанно исследуют Киберпространство в поисках информации (отчетов, компромата, личных данных сотрудников и т. д.) о бизнес-партнерах различных компаний или их конкурентах. Очень часто информация, собранная из открытых источников, используется для проверки деловой репутации компании-контрагента и принятия правильных решений о сотрудничестве.

Например, перед заключением крупной сделки с некой компанией, заказчику бывает необходимо выяснить, сможет ли контрагент реально выполнить свои обязательства. Для этой цели исследуется находящаяся в открытом доступе информация: архивы СМИ, корпоративные сайты, на которых можно почерпнуть немало информации о хозяйственной деятельности компании.

Открытые источники позволяют выяснить, что компания рассказывает о себе в пресс-релизах, и что говорят о ней другие участники рынка. Важные данные о компании можно почерпнуть из БД (баз данных) государственных органов статистики и регистрации, из архивов арбитражных и хозяйственных судов, в случаях, если компания принимала участие в подобных судебных разбирательствах.

При решении подобных задач 80% занимает работа с открытыми источниками, оставшиеся 20% - обработка и анализ собранных данных. Изучение методик бизнес-разведки проводятся на специальных семинарах и тренингах, которые, при желании, можно найти в Сети.

Ссылка по теме - Провал ЦРУ: данные об агентах в свободном доступе

Где искать?
Доступ к нужной информации в Интернет может быть реализован различными способами. Это могут быть переходы по гиперссылкам, поиск по различным каталогам (сайтов, блогов и т. д.), можно просто вбить запрос в любимый поисковик и просматривать поисковую выдачу. Для определенных целей нельзя обойтись без поиска по специализированным базам данных (БД).

Выбор способа "передвижения" по Сети определяется вашей целью и желанием. Если вы выбрали неправильный метод поиска, вам придется переворотить массу информации, чтобы найти тот единственный нужный документ. И положительный результат еще не гарантирован. Коротко рассмотрим каждый из способов:

Переходы по гиперссылкам в поисках необходимого документа среди миллиардов страниц - дело совершенно бесперспективное. Но ссылки, вообще, могут оказаться очень полезны при сборе скрытой информации об объекте (т. н. обратный поиск). Вспомним статью "Как правильно искать в Google 2" и применим оператор [link:], благодаря которому можно отыскать все страницы, ссылающиеся на объект нашего исследования.

Например, такие поисковые сервисы, как google.com, alltheweb.com, altavista.com, search.msn.com по запросу [link:vsepoisk.ru] выдадут ресурсы, в которых упоминается любая страница сайта vsepoisk.ru. Для поискового сервера Yandex (yandex.ru) аналогичный запрос будет несколько отличаться и иметь вид [#link="vsepoisk.ru"].

Поиск по каталогам, когда нужно найти конкретный документ, неэффективен, но используется, если нужно найти определенную тематическую информацию. Как правило, в каталогах все ссылки являются профильными, так как их составлением занимаются не программы, а люди. Например, если ведется поиск общей информации по некоторой обширной теме, то целесообразно обратиться к каталогу. Существует огромное количество разнообразных каталогов, в том числе специализированных (узкотематических).

Например, крупнейший каталог ресурсов Интернет - проект "Открытый каталог" (dmoz.org) включает в себя сведения о более 4 млн. сайтов. Один из наиболее популярных русскоязычных каталогов находится по адресу list.mail.ru. Кроме каталогов общего профиля, в Сети много специализированных каталогов. Так, по адресу www.kinder.ru находится объемный каталог, посвященный ресурсам для детей. Введите в строку поиска запрос вида [каталоги сайтов спорт|живопись|программирование], и вы получите исчерпывающий набор каталогов на эти, или любые другие темы.

Поисковые машины служат для нахождения в Сети конкретных документов. Проблема состоит в том, что поисковик не является высокоинтеллектуальной системой, которой можно легко объяснить, что вы ищете. Если бы это было так, то он выдавал бы два-три документа - именно те, которые необходимы. Но, обычно, в ответ на поисковый запрос пользователь получает длинный перечень ссылок на страницы, многие из которых не удовлетворяют пользователя.

Такие документы называются нерелевантными (от англ. relevant - подходящий, относящийся к делу). Таким образом, релевантный документ - это документ, который содержит искомую информацию. Понятно, что от умения грамотно формулировать поисковый запрос зависит количество (процент) найденных релевантных документов.

Поиск по базам данных является эффективным методом тематического поиска. Сбор необходимой информации в русскоязычных и зарубежных информационных, образовательных и научных ресурсах очень часто требует больших усилий и может стоить значительных затрат средств и времени.

Применение некоторых методов сбора информации, описываемых в этом разделе, позволяет не только оптимизировать процесс, но и получить достоверную информацию по необходимой тематике, в нужном объеме и при минимальных затратах.

Наиболее оптимальным вариантом представляется работа со специализированными базами данных, которые предназначены для классификации, анонсирования и хранения образовательных, научных, статистических и прочих данных.

Следующая статья будет о поиске в базах данных.

1 коммент.:

  1. Анонимный13:14

    Спасибо. Интересная статья

    ОтветитьУдалить

 
Copyright © . Как найти информацию - Posts · Comments
Theme Template by BTDesigner · Powered by Blogger