Телевизоры. Приставки. Проекторы и аксессуары. Технологии. Цифровое ТВ

Интернет технологии в процессе поиска информации. Контрольные вопросы и задания. Сеть Интернет растет гигантскими темпами и найти информацию, необходимую конкретному пользователю, не очень просто. Но возможно, поскольку в сети есть ресурсы, которые помогу

Сегодня Интернет объединяет множество разных сетей, миллионы компьютеров, около 300 миллионов пользователей (данные от Robert Orenstein) всех континентов, и, по разным оценкам, число таких пользователей увеличивается на 15-80% ежегодно. Можно выделить два основных направления использования Интернета в бизнесе. Это оперативный доступ к поистине необозримым кладезям информации по любой тематике (на сотнях тысяч информационных серверов), поиск и интерактивное общение с партнерами, практически в любой специализации и географическом расположении. Как сориентироваться в столь масштабном информационном пространстве? Для этого существуют специализированные поисковые серверы. Их можно разделить на тематические каталоги, роботы индексов (поисковые машины), системы метапоиска. Также для поиска необходимой информации в Интернете весьма полезны системы поиска в конференциях Usenet и службы поиска людей.


Тематические каталоги

Наиболее популярным во всем мире признан тематический каталог Yahoo! (www.yahoo.com). Он представляет собой огромную базу данных URL-адресов сайтов самой различной тематики. Yahoo! предлагает вам воспользоваться иерархическим деревом при поиске информации. Т.е. вы выбираете сначала общую тематику, удовлетворяющую вашему запросу, и далее конкретизируете, следуя подсказкам каталога. В конечном итоге вы получаете список сайтов, содержащих информацию, соответствующую вашему запросу. На Yahoo! вы также можете пойти и по другому пути. Проанализируйте предполагаемое содержание запрашиваемой информации и выберите ключевые слова, которые обязательно встретятся в интересующих вас материалах или их заголовках. Набираете эти слова через пробел в строке ввода на главной странице Yahoo! и нажимаете Enter. Система попытается сама подобрать интересующую вас информацию. Так как Yahoo! - система англоязычная, то достаточно удобно использовать Интернет-переводчик, такой, как "Сократ Интернет" (www.arsenal.ru).

Если же вы ищете информацию заведомо русскоязычную, то имеет смысл использовать российские и местные белорусские каталоги. Принцип работы с ними идентичен тому, который мы рассмотрели на примере с Yahoo!. Здесь стоит отметить первый российский каталог Russia on the Net (www.ru) - один из крупнейших русскоязычных каталогов List.RU (www.list.ru), российский вариант Yahoo! (www.yahoo.ru). Имеет место также каталог "Созвездие Интернет", содержащий только избранные (заявлено как самые интересные) ресурсы. Среди белорусских каталогов стоит отметить наш национальный Yahoo! (unclesam.hypermart.net), новый быстроразвивающийся сервис 09 (www.09.open.by), сервер Unibel (www.unibel.by) и небольшую базу данных без возможности поиска Data (www.data.minsk.by). Говоря о базах данных, нельзя не вспомнить замечательный российский проект "Желтые страницы Интернета" (www.piter-press.ru/yp), где, как и в одноименной книге, представлена детальная информация о самых разных ресурсах Интернета.

В бизнесе также понадобятся каталоги предприятий и каталоги товаров и услуг. Пожалуй, самый крупный каталог предприятий СНГ Партнер (trifle.net/cis). В Интернете представлен и популярный белорусский каталог ТелеМедиа - "Бизнес Беларусь 99" (www.telemedia.minsk.by). Есть и другие белорусские каталоги "Каталог белорусских товаров и услуг" (www.open.by/abase), "Информационно-поисковая система товаров и производителей РБ на сервере Могилевской области" (enterprises.res.mogilev.by/EnterLogin.asp?Lang=R) и другие.


Роботы индексов или поисковые машины

Поисковые машины устроены несколько иначе. По сути, это сервер с огромной базой данных URL-адресов, который автоматически обращается к страницам WWW по всем этим адресам, изучает содержимое этих страниц, формирует и прописывает ключевые слова со страниц в свою базу данных (индексирует страницы). Более того, этот сервер обращается по всем встречаемым на страницах ссылкам, и переходя к новым страницам, проделывает с ними то же самое. Так как почти любая страница WWW имеет множество ссылок на другие страницы, то при подобной работе поисковая машина в конечном результате теоретически может обойти все сайты в Интернете. Самая популярная поисковая машина AltaVista (www.altavista.com) содержит 11 миллиардов слов, извлеченных из 30 миллионов WWW-страниц. Как пользоваться этим сервисом? Необходимо продумать строку запроса информации (не более чем 5 слов), как в случае с Yahoo!, и также набрать ее в поле ввода. Над кнопкой Search (Поиск) находится ниспадающее меню с выбором языка. Перед нажатием Enter или кнопки Search необходимо выбрать язык представления информации. Кроме того, в запрос информации можно включать специальный символ "*", расширяющий диапазон поиска. Скажем, чтобы AltaVista могла найти не только все вхождения слова "легкая", но слова "легкую", "легкой" и т.д., в запросе надо писать "легк**". Т.е. изменяющиеся буквы в окончании заменяем на символ "*".

Как и предыдущем случае, для поиска в русскоязычном Интернете AltaVista не очень подходит. Если на запрос "Light industry" AltaVista формирует список из 2917 URL-адресов, то по запросу "Легкая промышленность" появляется список ссылок всего на 9 сайтов. Наиболее развитый сервис поиска русскоязычной информации предоставляет сервер Яndex (www.yandex.ru). В Яndex можно просто написать по-русски фразу, описывающую то, что вы хотите найти. Система самостоятельно проанализирует и обработает ваш запрос, а затем постарается найти все, что относится к заданной теме. Ну а в том случае, если нужных документов не обнаружится, можно продолжить поиск через AltaVista, куда автоматически передается уже обработанный системой запрос. Но до передачи запроса AltaVista вряд ли дойдет, так как база Яndex содержит порядка 2 000 000 документов и постоянно обновляется. Проблема больше состоит в том, что поисковая машина в результате вашего запроса генерирует гигантский список адресов URL с короткими описаниями. Яndex позволяет конкретизировать ваш запрос для сокращения этого списка до разумных пределов. Вы можете на запрос либо набрать фразу по аналогии с предыдущими системами, либо, используя специальные операторы, составить строку, поясняющую Яndex, каким требованиям должна отвечать интересующая вас информация. На врезке приведены некоторые из операторов языка запросов Яndex.

Подробней о языке запросов Яndex можно прочесть в статье "Подробное описание языка запросов поисковой системы Яndex" (bforum.virtualave.net/yandex-request.htm).

Стоит вспомнить об еще одной популярной российской поисковой машине Rambler (www.rambler.ru). У этого сервера еще более полная база данных адресов URL, чем у Яndex. Отличительной чертой Rambler является то, что этот сервер ведет статистику посещаемости ссылок из собственной базы данных. Вы всегда можете зайти в раздел "Рейтинг" на главной странице Rambler и увидеть содержимое тематического каталога, отсортированного по убыванию числа посещений сайтов и, следовательно, их популярности. Тем самым отсекаются явные аутсайдеры, и вы не тратите на них свое время. Rambler так же, как и Yandex, позволяет, кроме простого запроса, запрос с языком запросов. Поддерживаются те же логические операторы И, ИЛИ, НЕ, метасимвол "*" (аналогично расширяющему диапазон запроса символу "*" в AltaVista), коэффициентные символы "+" и "-" для увеличения или уменьшения значимости вводимых в запрос слов.

Стоит также отметить прочие русскоязычные поисковые машины Апорт (www.aport.ru) и АУ (www.au.ru).

Поисковые машины и тематические каталоги сегодня имеют много общего. У каталогов присутствует возможность поиска информации по строке запроса с использованием логических операторов, а поисковые машины содержат свои собственные тематические каталоги. И тем не менее, лучше всего эти поисковые сервисы проявляют себя в своей первоначальной категории.


Системы метапоиска

Читая обо всех перечисленных поисковых службах, поневоле задумаешься: "А если для поиска необходимой мне информации не достаточно одной поисковой службы? Неужели мне придется входить на все здесь перечисленные серверы и каждый раз повторять один и тот же запрос?!". Наиболее качественный результат как раз будет именно при таком подходе. Но можно, исходя из экономии времени и денег, воспользоваться системами метапоиска. Наиболее популярная в мире система такого класса Search.com (www.search.com), но если мы работаем преимущественно с русскоязычными документами, то можно использовать Savvy Search (guaraldi.cs.colostate.edu:2000/form?lang=russian). Это достаточно мощная система, отсылающая ваш запрос на 13 крупнейших поисковых машин (в том числе и российских) и возвращающая вам их отчеты. Другая российская система метапоиска - "Следопыт" (www.medialingua.ru/www/Wwwsearc.htm) - работает только с пятью англоязычными поисковыми машинами и одной русскоязычной, но интересна тем, что переводит ваш русскоязычный запрос на английский язык для англоязычных поисковых машин.

Также существуют так называемые мультипоисковые страницы:


Службы поиска людей

У вас появилась возможность работать с электронной почтой, но вы не знаете адресов электронной почты партнеров вашей организации. Благодаря так называемым службам поиска людей в Интернете вы можете указав ФИО вашего оппонента, теоретически вы можете получить его адрес электронной почты и URL-адрес. Почему теоретически? Дело в том, что системы поиска людей, в основном, берут информацию об электронных адресах из открытых источников, таких, как конференции Usenet. Где гарантия, что ваши партнеры участвуют в этих конференциях? И тем не менее, рассмотрим некоторые службы поиска людей. В первую очередь, традиционно, о самой популярной англоязычной системе Four 11 (www.four11.com). Это действительно большой сервер - его база данных содержит порядка 6 000 000 адресов. Среди русскоязычных служб можно выделить Э-Рос (www.dubna.ru/eros) и Интермап (www.botik.ru/intermap/welcome.win0-abs.html).


Итоги

Подводя итог, можно сказать, что единой оптимальной схемы поиска в Интернете не существует. В зависимости от специфики необходимой вам информации, для ее поиска вы должны использовать соответствующие поисковые службы. В принципе, конечно, можно всегда пользоваться какой-нибудь одной поисковой системой, например, Rambler, но чем грамотнее подобраны поисковые службы и составлен запрос на поиск информации, тем качественнее будут результаты поиска. А в бизнесе качество информации играет далеко не последнюю роль.

Дмитрий ШЕЙКО,
Бобруйский Компьютерный Форум,
bforum.virtualave.net ,
[email protected] ,
[email protected] ,
ICQ: 35325827


Синтаксис запроса Яndex

пробел или & логическое И (краткое - в пределах одного абзаца)

Пример: легкая промышленность

Результат: все документы, где в пределах одного абзаца встречаются слова "легкая" и "промышленность".

&& логическое И (в пределах документа)

Пример: легкая&&промышленность

Результат: все документы, где встречаются слова "легкая" и "промышленность"

, или | логическое ИЛИ

Пример: легкая, промышленность

Результат: все документы, где встречается либо слово "легкая", либо слово "промышленность"

~ бинарный оператор И НЕ (в пределах одного абзаца)

Пример: производство~газета

Результат: все документы, где в пределах одного абзаца встречается слово "производство", но не в словосочетании "газета производство"

~~ бинарный оператор И НЕ (в пределах документа)

Пример: производство~~газета

Результат: все документы, где встречается слово "производство", но не в словосочетании "газета производство"

() группирование слов

Пример: (швейное&&производство)~газета

Результат: все документы, где встречаются слова "швейное" и "производство", но не в словосочетании со словом "газета"

/(число) расстояние в словах, где "число" - число слов между словами в запросе плюс единица.

Пример: швейное/1 производство

Результат: все документы, где встречается словосочетание "швейное производство"

Лекция ОРГАНИЗАЦИЯ И ТЕХНОЛОГИЯ ПОИСКА ИНФОРМАЦИИ В ИНТЕРНЕТЕ 1. 2. Средства информационного поиска Технология поиска информации

Характеристика сети Интернет предоставляет более быстрый способ поиска информации в сравнении с традиционными. Обладая значительным объемом информации, сеть является слабоструктурированной. В связи с этим активно ведутся разработки средств информационного поиска, автоматизирующих процесс поиска информации в данной среде. Слайд № 3

Средства информационного поиска Службы поиска интернета (средства, предназначенные для поиска информации) Поисковые системы Каталоги (search engines) (directories) Метапоисковые системы (metasearch engines) Слайд № 5

Классификация средств поиска по широте охвата информационных ресурсов Слайд № 6 ИНТЕРНЕТ Поисковые системы Каталоги Глобальные Региональные Локальные Специализированные Региональные Метапоисковые системы Сетевые Локальные Специализированные

Классификация средств поиска по широте охвата информационных ресурсов Конкретное средство поиска может одновременно соответствовать нескольким из перечисленных видов. Вид средства поиска определяет широту охвата информационных ресурсов интернета данным средством. Слайд № 7

Информационно-поисковая система Слайд № 8 Информационно-поисковая система (ИПС) – это система, обеспечивающая отбор, индексирование и поиск информации на основе индекса документов. Индексировать информацию означает приписать каждому документу ключевые слова, отражающие содержание документа и управляющие поиском, приводя к тем документам, слова которых оказываются более сходными со словами сделанного запроса ИПС, решая задачи сбора, хранения, обработки и выдачи информации, выполняют поиск документов, анализ их содержимого, построение поисковых образов документов (извлечение из документов информации, используемой системой как знания о документе), хранение поисковых образов, анализ запросов пользователей, поиск релевантных (соответствующих) запросу документов и выдачу ссылок на документы пользователям.

Типовая схема ИПС Слайд № 9 Запрос Клиент Информационные ресурсы Роботиндексировщик Пользовательский интерфейс Ответ Поисковая машина Ответ Запрос Индекс документов

Особенности ИПС Слайд № 10 В каждой конкретной поисковой системе хранятся сведения не обо всех документах интернета, а только о тех документах, которые известны данной системе (для различных систем процент проиндексированных документов различен, но, как правило, не превышает 70%). В поисковых системах хранятся не сами документы, а только сведения о них, достаточные для их нахождения пользователем и, как следствие этого, рассматриваемая система в результате поиска может не выдать некоторые соответствующие запросу документы. В результате поиска (отклике на запрос) системой сортируются документы по степени соответствия сделанному пользователем запросу с точки зрения алгоритма поисковой системы, а не с точки зрения их фактического соответствия запросу.

Использование ИПС Слайд № 11 Поисковые системы – это самый объемный источник знаний о страницах (документа) интернета. Выполнять поиск различной информации в интернете в большинстве случаев следует именно с помощью информационно-поисковых систем. По скорости и полноте получения информации на запрос пользователя им нет равных. Многие поисковые системы используют совместно систему поиска и каталог.

Информационно-поисковые системы Популярными информационно-поисковыми системами глобального масштаба в сети интернет являются: n Google (http: //www. google. com) n Bing (http: //search. msn. com/) n Ask. com (http: //www. ask. com) К российским ИПС относятся: n Яndex (http: //www. yandex. ru, http: //www. ya. ru) n Rambler (http: //www. rambler. ru) n Webalta (http: //www. aport. ru/) Слайд № 12

Каталог Слайд № 20 Каталог – это система, обеспечивающая классификацию информации. Его отличительная особенность – наличие иерархии (схемы упорядочения) ресурсов, в которой каждый из ресурсов относится к одному или более разделам. Каталоги хранят описания (аннотации) ресурсов интернета. Они наполняются web-мастерами (людьми, создающими информационные ресурсы) или специальными редакторами, которые просматривают информационные ресурсы сети. В ответ на запрос пользователя каталоги выполняют поиск по этим описаниям. Каталоги автоматически не обнаруживают изменения информационных ресурсов сети.

Типовая схема каталога Слайд № 21 Запрос Информационные ресурсы Технический персонал Пользовательский интерфейс Ответ Гипертекстовые связи Клиент Поисковая машина Ответ Запрос Иерархия информационных ресурсов и их описания

Использование каталога Слайд № 22 При решении поисковой задачи когда требуется найти группу информационных ресурсов на достаточно широкую тему каталог является наиболее лучшим средством для выполнения поиска, например при поиске сайтов, предоставляющих контактную информацию организаций г. Москвы или сайтов электронных СМИ. Результаты поиска в каталогах могут оказаться более осмысленными, так как информационные ресурсы в них подготовлены людьми.

Каталоги Слайд № 23 Электронными каталогами глобального масштаба в сети интернет являются: n Yahoo (http: //www. yahoo. com) n Open Directory (http: //www. dmoz. org) n Look. Smart (http: //www. looksmart. com) К наиболее значимым российским электронным каталогам относятся: n Каталог Яndex (http: //yaca. yandex. ru) n Каталог Mail. ru (http: //www. list. ru/) n Каталог Rambler’s Top 100 (http: //top 100. rambler. ru)

Метапоисковая система Слайд № 28 Метапоисковая система – это надстройка над поисковыми системами и электронными каталогами, которая не имеет собственной базы данных (индекса) и при поиске по поисковому предписанию пользователя автоматически формирует запросы для нескольких внешних средств поиска, а затем также автоматически анализирует полученные от них результаты и выдает список ссылок в порядке, определяемом соотношением рейтингов ответа сразу по нескольким средствам поиска. Отличия в стратегии и широте охвата информационных ресурсов различных поисковых систем часто приводят к тому, что разные средства поиска дают различные ответы на один и тот же запрос. Метапоисковые системы в своей работе используют потенциал других средств информационного поиска.

Типовая схема метапоисковой системы Слайд № 29 Запрос Клиент Пользовательский интерфейс Ответ Поисковая машина Запросы Информационные ресурсы Ответы ИПС 1 Каталог 1 ИПС N Каталог N

Использование метапоисковой системы Слайд № 30 Метапоисковые системы наиболее эффективны на начальных этапах поиска информации. Они позволяют быстро проверить есть ли в интернете необходимая информация и локализовать средства поиска, в которых она присутствует. Метапоисковые системы позволяют сократить время, затрачиваемое на поиск информации, так как при обработке запроса пользователя эти системы одновременно обращаются к нескольким различным средствам поиска.

Виды метапоисковых систем Слайд № 31 Сетевые - доступны через сеть для поиска информации К глобальным метапоисковым системам доступным через интернет относятся: n Meta. Crawler (http: //www. metacrawler. com) n Web. Crawler (http: //www. webcrawler. com) n Search. com (http: //www. search. com) Наиболее известные российские метапоисковые системы: n Meta. Bot. ru (http: //metabot. ru) n Nigma (http: //nigma. ru) Преимуществом российских средств поиска является корректная обработка запроса на национальном языке.

Специализированные средства поиска Слайд № 33 Системы, осуществляющие поиск файлов, например, File. Search. ru (http: //www. filesearch. ru) Системы, обеспечивающие поиск в новостях электронных СМИ, например, Яндекс Новости (http: //news. yandex. ru), Google Новости (http: //news. google. ru) Поиск товаров, например, Яндекс Маркет (http: //market. yandex. ru), Торг. ru (http: //www. torg. ru) Поиск людей, например, POISKI. ru (http: //poiski. ru), Poisk 24 (http: //www. poisk 24. de), Yahoo! People Search (http: //people. yahoo. com)

Специализированные средства поиска Поиск картинок, например, Яндекс Картинки (http: //images. yandex. ru), Google Картинки (http: //images. google. ru) Поиск видео, например, Яндекс Видео (http: //video. yandex. ru), Google Видео (http: //video. google. ru) Слайд № 34

Дополнительные средства и способы поиска Слайд № 36 В интернете можно искать информацию не только поисковыми системами, но и другими способами. В сети много различных сайтов, служб и пользователей, которые могут помочь в поиске. К таким службам можно отнести системы вопрос-ответ, форумы, различные интернет-сообщества (социальные сети), электронную почту, чаты. Все указанные способы получения информации объединяет то, что на ваши вопросы отвечают другие люди (а не программы). Системы вопрос-ответ: Ответы Mail. ru (http: //otveti. mail. ru), Вопросы и ответы Google (http: //otvety. google. ru), Знаток. ru (http: //znatok. ru)

Дополнительные средства и способы поиска Слайд № 37 Данные способы являются дополнительными, поскольку: n они не являются универсальными (накапливают адреса в недостаточном объеме или по узким направлениям); n нет точной гарантии получения ответа на вопрос (вопрос может быть просто проигнорирован), на получение ответа в таких системах иногда можно потратить много времени. Главным преимуществом при использовании дополнительных способов поиска является высокая точность получаемой информации.

Рекомендации к поиску информации Слайд № 40 Убедитесь в правильности написания слова (фразы) запроса. Ваш запрос может быть скорректирован, если слово, в котором ошиблись – общеупотребительное. Редкие слова или фразы могут быть не найдены. При поиске информации, используя поисковые системы, следует знать, что системы обычно отвечают на любой запрос пользователя (ввиду большого объема Интернета) (например, на запрос asgr вкт 5, являющийся, на первый взгляд, бессмысленным набором символов, поисковая система Яндекс нашла 12 web-страниц, в которых это словосочетание встречается). Будьте внимательны.

Рекомендации к поиску информации Слайд № 41 Уточните запрос. Чем точнее фраза запроса, тем больше шансов быстро найти нужную вам информацию, например результаты поиска по запросам стихотворения Есенина и стихотворения Есенина ранних лет будут разными. Используйте синонимы. Если по вашему запросу не была найдена нужная информация, попробуйте уточнить запрос заменой слова на его синоним, например оперативная память или оперативное запоминающее устройство или ОЗУ. Разные слова и фразы выдают разные результаты. Используйте слова, которые могли бы быть использованы на вебсайтах, которые ищете.

Рекомендации к поиску информации Слайд № 42 При составлении запроса всегда необходимо мысленно представить, каким может быть предполагаемое содержание документа. Например, если нужно найти сведения об А. С. Пушкине, то недостаточно просто указать его фамилию в запросе (в списке результата будет много всевозможных учреждений, расположенных на улицах Пушкина в разных городах). Больший эффект принесет поиск, если к фамилии добавить названия произведений поэта. Для поиска текстов произведений, стоит ввести отдельные строки из них (желательно редко используемые в цитатах).

Рекомендации к поиску информации Слайд № 43 Не вводите запрос к поисковой системе в обычной разговорной форме. Так, на запрос Какая погода сейчас в Нижнем Новгороде? будут найдены документы, включающие все слова запроса, а именно, тексты, содержащие данный вопрос (например, тексты литературных произведений). Более эффективным в данном случае будет ввести запрос погода в Нижнем Новгороде, в первой десятке ссылок ответа на который будет требуемая информация. Попробуйте слова запроса записать только малыми буквами – на такой запрос могут быть найдены дополнительные документы.

Рекомендации к поиску информации Слайд № 44 Выполните поиск похожих документов. Если один из найденных документов ближе к искомой теме, чем остальные, нажмите на ссылку «найти похожие документы» . Поисковая система проанализирует страницу и найдет документы, похожие на тот, что вы указали. Но если эта страница была стерта с сервера, а поисковая система еще не успела удалить ее из индекса, то вы получите сообщение «Запрошенный документ не найден» .

Рекомендации к поиску информации Слайд № 45 Используйте знаки «+» и «-» . Чтобы исключить документы, где встречается определенное слово, поставьте перед ним знак минуса. И наоборот, чтобы определенное слово обязательно присутствовало в документе, поставьте перед ним плюс. Обратите внимание, что между словом и знаком плюс-минус не должно быть пробела. Также вы можете использовать другие специальные команды для уточнения запроса. Список их можно найти в справке к системе, как правило, на странице «Язык запросов» .

Рекомендации к поиску информации Слайд № 46 Выполняйте поиск точных фраз. Если вам известна точная фраза, которая должна присутствовать на странице результатов, то укажите ее в запросе, взяв в кавычки. Например, "Широкий простор для мечты и для жизни Грядущие нам открывают года" Используйте региональные поисковые системы. Для получения более полной информации на языке отличном от английского, можно воспользоваться региональными системами, работающими с данным языком. Во многих странах региональные системы имеют широкий охват ресурсов. Самая крупная поисковая система в России – Яндекс (http: //www. yandex. ru).

Рекомендации к поиску информации Слайд № 47 Используйте специализированные поисковые системы. Если вы ищите картинки, видео, товары, карты и некоторые другие сведения, то всю эту информацию найти быстрее с использованием специализированных поисковых систем, предназначенных для этих целей. Многие поисковые системы общего назначения имеют специальные интерфейсы для поиска этих видов информации (смотрите описания конкретных систем). Запрос на поиск в данном случае может быть таким: поиск картинок.

Рекомендации к поиску информации Слайд № 48 Если источником информации является организация, то попробуйте поискать информацию на сайте этой организации. Поисковые системы могут не знать обо всей информации хранимой на сайтах интернета. Перейдите на сайт организации от которой исходила эта информация, возможно там будут подробные сведения о ней. На сайтах бывают локальные системы поиска (выполняющие поиск именно по этому сайту) или можно попробовать найти нужную информацию путем навигации по разделам сайта. Если, например вы слышали передачу по радио и знаете название этой радиостанции. Посмотрите информацию об этой передаче на официальном сайте этой радиостанции.

Рекомендации к поиску информации Слайд № 49 Попросите помощи в поиске информации у других людей. В интернете существуют специальные системы (например, системы вопрос-ответ) в которых одни пользователи могут помочь другим в поиске информации. Может быть люди уже интересовались тем же вопросом, что и вы и знают правильный ответ.

1. Введение С каждым годом объемы Интернета увеличиваются в разы, поэтому вероятность найти необходимую информацию резко возрастает. Интернет объединяет миллионы компьютеров, множество разных сетей, число пользователей увеличивается на 15-80% ежегодно. И, тем не менее, все чаще при обращении к Интернет основной проблемой оказывается не отсутствие искомой информации, а возможность ее найти. Как правило, обычный человек в силу разных обстоятельств не может или не хочет тратить на поиск нужного ему ответа больше 15-20 минут. Поэтому особенно актуально правильно и грамотно научиться, казалось бы, простой вещи – где и как искать, чтобы получать ЖЕЛАЕМЫЕ ответы. Чтобы найти нужную информацию, необходимо найти её адрес. Для этого существуют специализированные поисковые сервера (роботы индексов (поисковые системы), тематические Интернет-каталоги, системы мета-поиска, службы поиска людей и т.д.). В данном мастер-классе раскрываются основные технологии поиска информации в Интернет, предоставляются общие черты поисковых инструментов, рассматриваются структуры поисковых запросов для наиболее популярных русскоязычных и англоязычных поисковых систем. 2. Технологии поиска Web-технология World Wide Web (WWW) считается специальной технологией подготовки и размещения документов в сети Интернет. В состав WWW входят и web-страницы, и электронные библиотеки, каталоги, и даже виртуальные музеи! При таком обилии информации остро встает вопрос: «Как сориентироваться в столь огромном и масштабном информационном пространстве?» В решении данной проблемы на помощь приходят поисковые инструменты. 2.1 Поисковые инструменты Поисковые инструменты - это особое программное обеспечение, основная цель которого – обеспечить наиболее оптимальный и качественный поиск информации для пользователей Интернета. Поисковые инструменты размещаются на специальных веб-серверах, каждый из которых выполняет определенную функцию:
  1. Анализ веб-страниц и занесение результатов анализа на тот или иной уровень базы данных поискового сервера.
  2. Поиск информации по запросу пользователя.
  3. Обеспечение удобного интерфейса для поиска информации и просмотра результата поиска пользователем.
Приемы работы, используемые при работе с теми или другими поисковыми инструментами, практически одинаковы. Перед тем как перейти к их обсуждению, рассмотрим следующие понятия:
  1. Интерфейс поискового инструмента представлен в виде страницы с гиперссылками, строкой подачи запроса (строкой поиска) и инструментами активизации запроса.
  2. Индекс поисковой системы – это информационная база, содержащая результат анализа веб-страниц, составленная по определенным правилам.
  3. Запрос – это ключевое слово или фраза, которую вводит пользователь в строку поиска. Для формирования различных запросов используются специальные символы ("", ~), математические символы (*, +, ?).
Схема поиска информации проста. Пользователь набирает ключевую фразу и активизирует поиск, тем самым получает подборку документов по сформулированному (заданному) запросу. Этот список документов ранжируется по определенным критериям так, чтобы вверху списка оказались те документы, которые наиболее соответствуют запросу пользователя. Каждый из поисковых инструментов использует различные критерии ранжирования документов, как при анализе результатов поиска, так и при формировании индекса (наполнении индексной базы данных web-страниц). Таким образом, если указать в строке поиска для каждого поискового инструмента одинаковой конструкции запрос, можно получить различные результаты поиска. Для пользователя имеет большое значение, какие документы окажутся в первых двух-трех десятках документов по результатам поиска и на сколько эти документы соответствуют ожиданиям пользователя. Большинство поисковых инструментов предлагают два способа поиска – simple search(простой поиск) и advanced search(расширенный поиск) с использованием специальной формы запроса и без нее. Рассмотрим оба вида поиска на примере англоязычной поисковой машины. Например, AltaVista удобно использовать для произвольных запросов, «Something about online degrees in information technology», тогда как поисковый инструмент Yahoo позволяет получать мировые новости, информацию о курсе валют или прогнозе погоды. Освоение критериев уточнения запроса и приемов расширенного поиска, позволяет увеличивать эффективность поиска и достаточно быстро найти необходимую информацию. Прежде всего, увеличить эффективность поиска Вы можете за счет использования в запросах логических операторов (операций) Or, And, Near, Not, математических и специальных символов. С помощью операторов и/или символов пользователь связывает ключевые слова в нужной последовательности, чтобы получить наиболее адекватный запросу результат поиска. Формы запросов приведены в таблице 1. Таблица 1

Простой запрос дает некоторое количество ссылок на документы, т.к. в список попадают документы, содержащие одно из слов, введенных при запросе, или простое словосочетание (см. таблицу 1). Оператор and позволяет указать на то, что в содержании документа должны быть включены все ключевые слова. Тем не менее, количество документов может быть все еще велико, и их просмотр займет достаточно времени. Поэтому в ряде случаев гораздо удобнее применить контекстный оператор near, указывающий, что слова должны располагаться в документе в достаточной близости. Использование near значительно уменьшает количество найденных документов. Наличие символа "*" в строке запроса означает, что будет осуществляться поиск слова по его маске. Например, получим список документов, содержащих слова, начинающиеся на "gov", если в строке запроса запишем "gov*". Это могут быть слова government, governor и т.д.


Изучив эту тему, вы узнаете и повторите:

Для чего нужны поисковые серверы;
- назначение основных частей поисковых серверов;
- какие виды поиска информации существуют в Интернете;
- основные правила формирования запроса в поисковой системе Яндекс.

Поиск по адресам URL

Самый быстрый и надежный вид поиска информации в Интернете - поиск по адресам URL. Многие из них приводятся в печатных изданиях, специальных справочниках, звучат в эфире популярных радиостанций и с экранов телевизора.

♦ Фанаты футбольного клуба «Зенит» наизусть знают адрес www.fc-zenit.ru.
♦ Поклонникам группы «Король и шут» хорошо известен официальный сайт этой группы www.korol.spb.ru.
♦ Любители телеканала НТВ без труда найдут его сайт по адресу www.ntv.ru. Для быстрого доступа к вышеназванным ресурсам достаточно запустить программу-браузер, например Internet Explorer, и набрать знакомый адрес URL в строке адреса.

Поисковые системы

В Интернете сосредоточено огромное количество документов. Чтобы облегчить поиск нужной информации, создаются специальные поисковые машины.

Поисковые машины - это автоматические системы, опрашивающие серверы, подключенные к глобальной сети, и сохраняющие в своей базе информацию об имеющихся на серверах данных. По специальным образом сформулированному запросу поисковые машины предоставляют информацию о том, где можно получить необходимые данные.

Как правило, поисковые машины состоят из трех частей: робота, индекса и программы обработки запроса .

Робот (Spider, Robot или Bot) - это программа, которая посещает веб-страницы и считывает (полностью или частично) их содержимое. Роботы поисковых систем различаются индивидуальной схемой анализа содержимого веб-страницы.
Индекс поисковой системы - это хранилище поисковых образов, посещенных роботами страниц. Поисковый образ документа (в том числе и веб-страницы) - это описание содержания документа на специальном информационно-поисковом языке. Это описание содержит коды ключеных слов документа, отражающих его смысл и содержание. Индексы в каждой поисковой системе различаются по объему и способу организации хранимой информации. Базы данных ведущих поисковых машин хранят сведения о десятках миллионов документов, а объемы их индекса составляют сотни гигабайт. Индексы периодически обновляются и дополняются, поэтому результаты работы одной поисковой машины с одним и тем же запросом могут различаться, если поиск производился в разное время.

Программа обработки запроса - это программа, которая в соответствии с запросом пользователя «просматривает» индекс на предмет наличия нужной информации и возвращает ссылки на найденные документы. Множество ссылок на выходе системы распределяется программой в порядке убывания релевантности у то есть от наибольшей степени соответствия ссылки запросу к наименьшей.

В настоящее время самыми популярными для российских пользователей Интернета являются три крупные поисковые системы индексного типа:

Эти системы учитывают грамматические особенности русского языка, поэтому результаты их поиска в русскоязычных ресурсах отличаются более высоким качеством, чем у западных систем.

Поисковые машины различаются по охвату информационных ресурсов:

♦ поисковые машины общей тематики имеют базу данных по всем направлениям знаний и отличаются обширным индексом и большим объемом накапливаемой информации;
♦ поисковые машины специального назначения просматривают только сайты по определенной тематике, например музыкальные или музейные.

Основными характеристиками поисковых машин являются:

♦ объем документов в индексе;
♦ частота обновления информации;
♦ информационное пространство, которое охватывает робот поисковой машины, и разнообразие типов документов, о которых собирается информация;
♦ скорость обработки запроса;
♦ критерий определения релевантности (соответствия найденного документа поисковому запросу);
♦ возможность детализации и уточнения запроса.

Поиск по рубрикатору поисковой системы

Поисковые каталоги представляют собой систематизированную коллекцию (подборку) ссылок на другие ресурсы Интернета. Ссылки организованы в виде тематического рубрикатора, представляющего собой иерархическую структуру, перемещаясь по которой, можно найти нужную информацию.

Приведем в качестве примера структуру поискового интернет- каталога Яндекс. Это каталог общего назначения, так как в нем представлены ссылки на ресурсы Интернета практически по всем возможным направлениям. Б этом каталоге выделены следующие темы:

♦ Бизнес и экономика;
♦ Справочники и ссылки;
♦ Общество и политика;
♦ Дом и семья;
♦ Наука и образование;
♦ Развлечения и отдых;
♦ Компьютеры и связь;
♦ Культура и искусство.

Каждая тема включает множество подразделов, а они, в свою очередь, содержат рубрики и т. д.

Предположим, вы готовите мероприятие ко Дню победы и хотите найти в Интернете слова известной военной песни Булата Окуджавы «Вы слышите, грохочут сапоги». Поиск можно организовать следующим образом: Яндекс Каталог Культура и искусство Музыка Авторская песня.

Такой способ поиска является достаточно быстрым и эффективным. В конце вам предлагается всего 5 ссылок, среди которых есть ссылки на сайты с песнями известных бардов. Остается только найти на сайте архив с текстами песен Б. Окуджавы и выбрать в нем нужный текст.

Другой пример. Предположим, вы собираетесь приобрести мобильный телефон и хотите сравнить характеристики аппаратов разных фирм. Поиск мог бы вестись по следующим рубрикам каталога: Яндекс Каталог Компьютеры и связь Мобильная связь Мобильные телефоны.

Получив ограниченное количество ссылок, можно достаточно оперативно их просмотреть и выбрать телефон, исследовав характеристики по фирмам и модификациям аппаратов.

Поиск по ключевым словам

Большинство поисковых машин имеют возможность поиска по ключевым словам. Это один из самых распространенных видов поиска. Для поиска по ключевым словам необходимо ввести в специальном окне слово или несколько слов, которые следует искать, и щелкнуть на кнопке Поиск. Поисковая система найдет в своей базе и покажет документы, содержащие эти слова. Таких документов может оказаться множество, но много в данном случае не обязательно означает хорошо.

Проведем несколько экспериментов с любой из поисковых систем. Предположим, что мы решили завести аквариум и нас интересует любая информация по данной теме.

На первый взгляд самое простое - это поиск по слову «аквариум». Проверим это, например, в поисковой системе Яндекс. Результатом поиска будет более 460000 страниц на 3500 сайтах - огромное количество ссылок. Причем, если посмотреть внимательнее, среди них окажутся сайты, упоминающие группу Б. Гребенщикова «Аквариум», торговые центры и неформальные объединения с таким же названием, и многое другое, не имеющее отношения к аквариумным рыбкам.

Нетрудно догадаться, что такой поиск не может удовлетворить даже непритязательного пользователя. Слишком много времени придется потратить на то, чтобы отобрать среди всех предложенных документов те, что касаются нужного нам предмета, и уж тем более на то, чтобы ознакомиться с их содержимым.

Можно сразу сделать вывод, что вести поиск по одному слову, как правило, нецелесообразно, ведь по одному слову очень сложно определить тему, которой посвящен документ, веб-страница или сайт. Исключение составляют редкие слова и термины, которые практически никогда не используются вне своей тематической области.

Попробуем уточнить условия поиска и введем словосочетание «аквариумные рыбки». Результатом поиска будут немногим более 20 ООО страниц и около 650 сайтов. Как видим, количество ссылок уменьшилось более чем в 20 раз. Этот результат нас устраивает больше, но все равно среди предложенных ссылок могут встретиться, например, русские сувенирные наборы спичечных этикеток с изображениями рыбок, и коллекции заставок для Рабочего стола компьютера, и каталоги аквариумных рыбок с фотографиями, и магазины аквариумных аксессуаров.

Очевидно, что следует продолжить движение в направлении уточнения условий поиска.

Для того чтобы сделать поиск более продуктивным, во всех поисковых системах существует специальный язык формирования запросов со своим синтаксисом. Эти языки во многом похожи. Изучить их все достаточно сложно, но любая поисковая машина имеет справочную систему, которая позволит вам освоить нужный язык.

Приведем десять простых правил формирования запроса в поисковой системе Яндекс.

1. Ключевые слова в запросе следует писать строчными (маленькими) буквами. Это обеспечит поиск всех ключевых слов, а не только тех, которые начинаются с прописной буквы.

2. При поиске учитываются все формы слова по правилам русского языка, независимо от формы слова в запросе. Например, если в запросе было указано слово «знаю», то условию поиска будут удовлетворять и слова «знаем», «знаете» и т. п.

3. Для поиска устойчивого словосочетания следует заключить слова в кавычки, например «фарфоровая посуда».

4. Для поиска по точной словоформе перед словом надо поставить восклицательный знак. Например, для поиска слова «сентябрь» в родительном падеже следует написать «!сентября». 

5. Для поиска внутри одного предложения слова в запросе разделяют пробелом или знаком &: «приключенческий роман» или «приключенческий&роман». Несколько набранных в запросе слов, разделенных пробелами, означают, что все они должны входить в одно предложение искомого документа.

6. Если вы хотите, чтобы были отобраны только те документы, в которых встретилось каждое слово, указанное в запросе, поставьте перед каждым из них знак плюс «+». Если вы, наоборот, хотите исключить какие-либо слова из результата поиска, поставьте перед этим словом минус «-». Знаки «+» и «-» надо писать через пробел от предыдущего и слитно со следующим словом. Например, по запросу «Волга -автомобиль» будут найдены документы, в которых есть слово «Волга» и нет слова «автомобиль».

7. При поиске синонимов или близких по значению слов между словами можно поставить вертикальную черту «|». Например, по запросу «ребенок | малыш | младенец» будут найдены документы с любым из этих слов.

8. Вместо одного слова в запросе можно подставить целое выражение. Для этого его надо взять в скобки, например «(ребенок | малыш | дети | младенец) +(уход | воспитание)».

9. Знак *~» (тильда) позволяет найти документы с предложением, содержащим первое слово, но не содержащим второе. Например, по запросу «книги ~ магазин» будут найдены все документы, содержащие слово «книги», рядом с которым (в пределах предложения) нет слова «магазин».

10. Если оператор повторяется один раз (например, & или ~), поиск производится в пределах предложения. Двойной оператор (&&, -) задает поиск в пределах документа. Например, по запросу «рак - астрология» будут найдены документы со словом «рак», не относящиеся к астрологии.

Имея определенный набор наиболее употребительных терминов в нужной области, можно использовать расширенный поиск. На рис. 3.3 показано окно расширенного поиска в поисковой системе Яндекс. В этом режиме возможности языка запросов реализованы в виде формы. Подобный сервис, включающий словарные фильтры, предлагается почти всеми поисковыми системами.

Рис. 3.3. Пример расширенного поиска в системе Яндекс

При условии правильного выбора желательных и обязательных слов и исключения нежелательных терминов такой поиск может дать неплохие результаты.

Вернемся к примеру с аквариумными рыбками. После прочтения нескольких предлагаемых поисковой системой документов становится понятно, что поиск информации в Интернете следует начинать не с выбора аквариумных рыбок. Аквариум - сложная биологическая система, создание и поддержание которой требует специальных знаний, времени и серьезных капиталовложений.

На основании полученной информации человек, производящий поиск в Интернете, может кардинально изменить стратегию дальнейшего поиска, приняв решение изучить специальную литературу, относящуюся к исследуемому вопросу.

Для поиска литературы или полнотекстовых документов возможен следующий запрос:

«+(аквариум | аквариумист | аквариумистика) +начинающим +(советы | литература) +(статья | тезис | полнотекстовый) -(цена | магазин | доставка | каталог)».

После обработки запроса поисковой машиной получен следующий результат: страниц - 195, сайтов - не менее 43.

Как видно из статистики поиска, результат оказался весьма успешным. Уже первые ссылки приводят к искомым документам:

Размещение аквариума > Советы начинающему аквариумисту >
Статьи > Aq uascope. ru
http://aquascope.ru/modules/wfsection/article.php?page=l&articleid=49 (32КБ) - строгое соответствие.
СОВЕТЫ НАЧИНАЮЩИМ АКВАРИУМИСТАМ. Как выбрать и установить аквариум, как...
http://www.aquariums.ru/sovna.htm (2КБ) 23.07.2002 - нестрогое соответствие.

Теперь можно подытожить результаты поиска, сделать определенные выводы и принять решение о возможных действиях:

♦ Прекратить дальнейший поиск, так как в силу различных причин содержание аквариума вам не под силу.
♦ Прочитать предлагаемые статьи и приступить к устройству аквариума.
♦ Поискать материалы о хомячках или волнистых попугайчиках.

Профессиональный поиск

Для научных работников и специалистов придется более продуманно подойти к организации поиска. При профессиональном поиске информации в Интернете должны соблюдаться следующие требования:

высокая скорость проведения поиска;
♦ достоверность получаемой информации;
♦ полнота охвата ресурсов при поиске.

Скорость. Скорость проведения поиска зависит в основном от двух факторов: от грамотного планирования поиска (выбора поисковых сервисов и инструментов) и навыков работы с уже выбранным ресурсом (умения быстро разобраться в его структуре и способах навигации). Для обеспечения скорости поиска поисковых индексов недостаточно. Помимо них в Интернете существует еще целый ряд поисковых ресурсов, использование которых обеспечивает выполнение профессионального поиска.

Достоверность. Вопрос достоверности информации, получаемой из Интернета, очень актуален, так как любой человек может разместить там любую информацию без какого-либо контроля ее соответствия действительности. Это, в свою очередь, приводит к большому количеству недостоверных источников, каковыми являются, например, рефераты и курсовые работы, наводнившие Интернет.

Существуют специальные поисковые сервисы, позволяющие оценить надежность источника информации в Интернете.

Полнота. Необходимым условием успешного полномасштабного сбора информации является знание основных существующих на сегодняшний день типов ресурсов и использование различных поисковых сервисов. Ни одна поисковая система не может охватить все ресурсы Интернета.

Как правило, для достижения положительного результата пользователь должен прибегнуть к услугам нескольких поисковых систем. Можно сделать это самостоятельно, переходя из системы в систему, а можно поручить эту работу одной из метапоисковых систем (meta - первая составная часть сложных слов, обозначающая системы для описания и исследования других систем).

Рис. 3.4. Окна метапоисковых систем

Метапоисковые системы не имеют собственных поисковых баз данных и при поиске используют ресурсы множества других поисковых систем. За счет этого вероятность нахождения нужной информации оказывается очень высокой. Работа в метапоис- ковых системах проводится по тем же правилам, что и работа в поисковых системах. Это вызвано тем фактом, что метапоисковые системы являются своеобразной надстройкой к поисковым системам и используют в своей работе их индексные базы. Внешний вид метапоисковых систем напоминает внешний вид известных поисковых машин. На рис. 3.4 представлены окна метапоисковых систем myweb.ru и metabot.ru.

Опыт показывает, что в большинстве случаев лучший результат достигается при использовании нескольких независимых поисковых индексов, чем при использовании одной метапоисковой системы.

Контрольные вопросы и задания

1. Каково назначение программы-браузера?

2. Какие программы-браузеры вам известны?

3. Где пользователь, планирующий поиск в Интернете, может найти адреса URL?

4. Какова технология поиска по рубрикатору поисковой системы?

5. Какова технология поиска по ключевым словам?

6. Какие требования должны соблюдаться при профессиональном поиске информации в Интернете?

7. Когда в критерии поиска надо задавать знаки «+» или «-»?

8. Какие критерии поиска в Яндексе заданы следующей фразой:

(няня | воспитатель | гувернантка) ++(уход | воспитание | присмотр).

9. Что означает удвоение знака (∼∼ или ++) при формировании сложного запроса?

10. Что такое релевантность поиска?

11. Каково назначение метапоисковых систем?



Похожие публикации