телевизори. Конзоли. Проектори и аксесоари. Технологии. Цифрова телевизия

Интернет технологиите в процеса на търсене на информация. Тестови въпроси и задачи. Интернет се разраства с невероятни темпове и намирането на необходимата информация за конкретен потребител не е много лесно. Но е възможно, тъй като има ресурси онлайн, които могат да помогнат.

Днес Интернет свързва много различни мрежи, милиони компютри, около 300 милиона потребители (данни от Робърт Оренщайн) на всички континенти и според различни оценки броят на тези потребители нараства с 15-80% годишно. Има две основни области на използване на Интернет в бизнеса. Това е бърз достъп до наистина огромни съкровища от информация по всяка тема (на стотици хиляди информационни сървъри), търсене и интерактивна комуникация с партньори в почти всяка специализация и географско местоположение. Как да се ориентираме в такова мащабно информационно пространство? За това има специализирани сървъри за търсене. Те могат да бъдат разделени на тематични директории, индексиращи роботи (търсачки) и системи за метатърсене. Търсачките на Usenet и услугите за търсене на хора също са много полезни за намиране на необходимата информация в Интернет.


Предметни каталози

Тематичната директория на Yahoo! е призната за най-популярната в света. (www.yahoo.com). Това е огромна база данни от URL адреси за уебсайтове на голямо разнообразие от теми. Yahoo! ви кани да използвате йерархично дърво, когато търсите информация. Тези. първо избирате обща тема, която отговаря на вашата заявка, и след това я уточнявате, следвайки подканите в каталога. В крайна сметка получавате списък със сайтове, съдържащи информация, която отговаря на вашата заявка. В Yahoo! можете да отидете и в другата посока. Анализирайте очакваното съдържание на исканата информация и изберете ключови думи, които със сигурност ще се появят в материалите, които ви интересуват, или в техните заглавия. Въведете тези думи, разделени с интервал в реда за въвеждане на главната страница на Yahoo! и натиснете Enter. Системата ще се опита да избере информацията, която ви интересува. Тъй като Yahoo! - системата е на английски език, доста удобно е да се използва интернет преводач, като Socrates Internet (www.arsenal.ru).

Ако търсите информация, която очевидно е руска, тогава има смисъл да използвате руски и местни беларуски каталози. Принципът на работа с тях е идентичен с този, който разгледахме в примера с Yahoo!. Тук си струва да се отбележи първата руска директория Русия в мрежата (www.ru) - една от най-големите рускоезични директории List.RU (www.list.ru), руската версия на Yahoo! (www.yahoo.ru). Има и каталог "Съзвездие Интернет", съдържащ само избрани (декларирани като най-интересни) ресурси. Сред беларуските директории заслужава да се отбележи нашият национален Yahoo! (unclesam.hypermart.net), новата бързо развиваща се услуга 09 (www.09.open.by), сървърът на Unibel (www.unibel.by) и малка база данни без възможност за търсене (www.data.minsk. от). Говорейки за бази данни, не може да не си спомним прекрасния руски проект „Жълтите страници на Интернет“ (www.piter-press.ru/yp), който, подобно на едноименната книга, предоставя подробна информация за голямо разнообразие от Интернет ресурси.

Бизнесът също ще се нуждае от бизнес каталози и каталози на стоки и услуги. Може би най-големият каталог на компании от ОНД е Partner (trifle.net/cis). Популярният беларуски каталог на TeleMedia, „Business Belarus 99” (www.telemedia.minsk.by), също е достъпен в Интернет. Има и други беларуски каталози „Каталог на беларуски стоки и услуги“ (www.open.by/abase), „Система за извличане на информация за стоки и производители на Република Беларус на сървъра на Могилевска област“ (enterprises.res.mogilev .by/EnterLogin.asp?Lang =R) и други.


Индексни роботи или търсачки

Търсачките са проектирани малко по-различно. По същество това е сървър с огромна база URL данни, които автоматично осъществяват достъп до WWW страници на всички тези адреси, изследват съдържанието на тези страници, генерират и записват ключови думи от страниците в своята база данни (индексират страниците). Освен това този сървър има достъп до всички връзки, открити на страниците, и при преминаване към нови страници прави същото с тях. Тъй като почти всяка WWW страница има много връзки към други страници, с такава работа търсачката може теоретично да обходи всички сайтове в Интернет като краен резултат. Най-популярната търсачка AltaVista (www.altavista.com) съдържа 11 милиарда думи, извлечени от 30 милиона WWW страници. Как да използвате тази услуга? Необходимо е да обмислите ред за искане на информация (не повече от 5 думи), както е в случая с Yahoo!, и също така да го въведете в полето за въвеждане. Над бутона Търсене има падащо меню с избор на език. Преди да натиснете Enter или бутона Search, трябва да изберете език за представяне на информацията. Освен това в заявката за информация може да бъде включен специален знак „*“, разширявайки обхвата на търсене. Да кажем, че за да може AltaVista да намери не само всички срещания на думата „светлина“, но и думите „светлина“, „светлина“ и т.н., трябва да напишете „светлина**“ в заявката. Тези. Заменяме променящите се букви в края със символа „*“.

Както и в предишния случай, AltaVista не е много подходящ за търсене в рускоезичния интернет. Ако за заявката „Лека промишленост“ AltaVista генерира списък от 2917 URL адреса, то за заявката „Лека промишленост“ се появява списък с връзки към само 9 сайта. Най-развитата услуга за търсене на рускоезична информация се предоставя от сървъра на Yandex (www.yandex.ru). В Yandex можете просто да напишете фраза на руски, която описва това, което искате да намерите. Системата самостоятелно ще анализира и обработи вашата заявка, след което ще се опита да намери всичко, което се отнася до зададената тема. Е, ако необходимите документи не бъдат намерени, можете да продължите търсенето чрез AltaVista, където вече обработената от системата заявка се прехвърля автоматично. Но AltaVista едва ли ще достигне точката на предаване на заявката, тъй като базата данни на Yandex съдържа около 2 000 000 документа и се актуализира постоянно. По-големият проблем е, че търсачката генерира огромен списък от URL адреси с кратки описания в резултат на вашето запитване. Yandex ви позволява да посочите заявката си за намаляване на този списък до разумни граници. Когато бъдете попитани, можете или да въведете фраза, подобна на предишните системи, или, като използвате специални оператори, да съставите ред, обясняващ на Yandex на какви изисквания трябва да отговаря информацията, която ви интересува. Страничната лента показва някои от операторите на езика за заявки на Yandex.

Можете да прочетете повече за езика за заявки на Yandex в статията „Подробно описание на езика за заявки на търсачката Yandex“ (bforum.virtualave.net/yandex-request.htm).

Струва си да си припомним друга популярна руска търсачка Rambler (www.rambler.ru). Този сървър има още по-пълна база данни от URL адреси от Yandex. Отличителна черта на Rambler е, че този сървър поддържа статистика за трафика на връзки от собствената си база данни. Винаги можете да отидете в секцията „Рейтинг“ на главната страница на Rambler и да видите съдържанието на тематичния каталог, сортиран в низходящ ред според броя на посещенията на сайта и следователно тяхната популярност. Това елиминира очевидните аутсайдери и не си губите времето с тях. Rambler, подобно на Yandex, позволява освен проста заявка и заявка с език на заявката. Същите логически оператори И, ИЛИ, НЕ, мета-символът „*“ (подобен на знака „*“, който разширява обхвата на заявката в AltaVista), коефициентни символи „+“ и „-“ за увеличаване или намаляване на значимостта на думите, въведени в заявката, се поддържат.

Заслужава да се отбележат и други рускоезични търсачки Aport (www.aport.ru) и AU (www.au.ru).

Търсачките и тематичните директории днес имат много общи неща. Директориите имат възможност да търсят информация чрез низ на заявка с помощта на логически оператори, а търсачките съдържат свои собствени тематични директории. И все пак тези услуги за търсене се представят най-добре в първоначалната си категория.


Системи за метатърсене

Четейки за всички изброени услуги за търсене, неизбежно си мислите: "Ами ако една услуга за търсене не е достатъчна, за да намеря информацията, от която се нуждая? Наистина ли трябва да влизам във всички изброени тук сървъри и да повтарям една и съща заявка всеки път?!" Най-качественият резултат ще бъде постигнат именно с този подход. Но можете, въз основа на спестяване на време и пари, да използвате системи за метатърсене. Най-популярната система от този клас в света е Search.com (www.search.com), но ако работим предимно с рускоезични документи, тогава можем да използваме Savvy Search (guaraldi.cs.colostate.edu:2000/ форма?lang=russian). Това е доста мощна система, която изпраща вашата заявка до 13-те най-големи търсачки(включително руски) и връщане на отчетите им до вас. Друга руска система за метатърсене - "Следопыт" (www.medialingua.ru/www/Wwwsearc.htm) - работи само с пет англоезични търсачки и една рускоезична, но е интересна с това, че превежда вашето рускоезично запитване на английски език за търсачки на английски език.

Има и така наречените страници за многократно търсене:


Услуги за търсене на хора

Имате способността да работите с имейл, но не знаете имейл адресите на партньорите на вашата организация. Благодарение на така наречените услуги за търсене на хора в Интернет можете да въведете пълното име на опонента си и на теория можете да получите неговия имейл адрес и URL. Защо теоретично? Факт е, че търсачките за хора основно вземат информация за имейл адреси от отворени източници, като конференции на Usenet. Къде е гаранцията, че вашите партньори участват в тези конференции? Въпреки това, нека разгледаме някои услуги за търсене на хора. На първо място, традиционно, за най-популярната англоезична система Four 11 (www.four11.com). Това е наистина голям сървър - неговата база данни съдържа около 6 000 000 адреса. Сред рускоезичните услуги можем да подчертаем E-Ros (www.dubna.ru/eros) и Intermap (www.botik.ru/intermap/welcome.win0-abs.html).


Резултати

За да обобщим, няма единен оптимален модел за търсене в Интернет. В зависимост от конкретната информация, от която се нуждаете, трябва да използвате подходящи услуги за търсене, за да я намерите. По принцип, разбира се, винаги можете да използвате една търсачка, например Rambler, но колкото по-компетентно са избрани услугите за търсене и е направена заявка за търсене на информация, толкова по-добри ще бъдат резултатите от търсенето. А в бизнеса качеството на информацията играе важна роля.

Дмитрий ШЕЙКО,
Бобруйски компютърен форум,
bforum.virtualave.net ,
[имейл защитен] ,
[имейл защитен] ,
ICQ: 35325827


Синтаксис на заявка на Yandex

пространствоили & логическо И (кратко - в рамките на един абзац)

Пример: лека промишленост

Резултат: всички документи, в които думите „лека“ и „индустрия“ се появяват в един абзац.

&& логическо И (в рамките на документа)

Пример: лека&&промишленост

Резултат: всички документи, в които се появяват думите „лека“ и „индустрия“.

, или | логическо ИЛИ

Пример: леки, индустриални

Резултат: всички документи, в които се появява или думата „светлина“, или думата „индустрия“.

~ двоичен оператор И НЕ (в рамките на един параграф)

Пример: производство~вестник

Резултат: всички документи, където думата „производство“ се среща в рамките на един параграф, но не и във фразата „производство на вестници“

~~ двоичен оператор И НЕ (в рамките на документа)

Пример: production~~newspaper

Резултат: всички документи, където се появява думата „производство“, но не и във фразата „производство на вестници“

() групиране на думи

Пример: (шиене&&производство)~вестник

Резултат: всички документи, в които се появяват думите „шиене” и „производство”, но не и в комбинация с думата „вестник”

/(число)разстояние в думи, където "число" е броят на думите между думите в заявката плюс едно.

Пример: шиене/1 производство

Резултат: всички документи, в които фигурира фразата „производство на облекло“.

Лекция ОРГАНИЗАЦИЯ И ТЕХНОЛОГИЯ НА ТЪРСЕНЕ НА ИНФОРМАЦИЯ В ИНТЕРНЕТ 1. 2. Инструменти извличане на информацияТехнология за извличане на информация

Характеристиките на Интернет предоставят повече бърз начинтърсене на информация в сравнение с традиционните. Притежавайки значително количество информация, мрежата е слабо структурирана. В тази връзка активно се развива разработването на средства за търсене на информация, които автоматизират процеса на търсене на информация в дадена среда. Слайд номер 3

Инструменти за извличане на информация Услуги за търсене в Интернет (инструменти, предназначени за търсене на информация) Търсачки Директории (търсачки) (директории) Метатърсачки (метатърсачки) Слайд № 5

Класификация на инструментите за търсене по обхват информационни ресурсиСлайд № 6 ИНТЕРНЕТ Търсачки Директории Глобални Регионални Локални Специализирани Регионални метатърсачки Мрежови Локални Специализирани

Класификация на инструментите за търсене според обхвата на информационните ресурси Конкретен инструмент за търсене може едновременно да съответства на няколко от изброените типове. Видът на инструмента за търсене определя широчината на покритие на информационните ресурси в Интернет от този инструмент. Слайд номер 7

Система за търсене на информация Слайд № 8 Системата за търсене на информация (IRS) е система, която осигурява избор, индексиране и извличане на информация въз основа на индекс на документи. Индексирането на информация означава присвояване на ключови думи на всеки документ, които отразяват съдържанието на документа и контролират търсенето, което води до онези документи, чиито думи се оказват по-сходни с думите на заявката, направена от IRS, решавайки проблемите със събирането, съхранението , обработка и издаване на информация, търсене на документи, анализиране на тяхното съдържание, изграждане на изображения за търсене на документи (извличане на информация от документи, която се използва от системата като знания за документа), съхраняване на изображения за търсене, анализиране на потребителски заявки, търсене на подходящи документи ( съответстващи) на заявката и издаване на връзки към документи на потребителите.

Типична схема IPS Слайд № 9 Заявка за клиентски информационни ресурси Робот индексатор Потребителски интерфейсИндекс на документа за заявка за търсене на отговори

Характеристики на IRS Слайд № 10 Всяка конкретна система за търсене съхранява информация не за всички интернет документи, а само за онези документи, които са известни на системата (за различните системи процентът на индексираните документи е различен, но като правило не не надвишава 70%). Търсачките не съхраняват самите документи, а само информация за тях, която е достатъчна за потребителя да ги намери и в резултат на това въпросната система може да не върне някои документи, съответстващи на заявката в резултат на търсенето. . В резултат на търсенето (отговор на заявка) системата сортира документите според степента на съответствие със заявката на потребителя от гледна точка на алгоритъма на търсачката, а не от гледна точка на реалното им съответствие с запитването.

Използване на IRS Слайд № 11 Търсачките са най-обемният източник на знания за страници (документи) в Интернет. В повечето случаи търсенето на различна информация в Интернет трябва да се извършва с помощта на системи за извличане на информация. Те нямат равни по отношение на скоростта и пълнотата на получаване на информация по заявка на потребителя. Много търсачки използват търсачка и директория заедно.

Системи за извличане на информация Популярни глобални системи за извличане на информация в Интернет са: n Google (http: //www. google. com) n Bing (http: //search. msn. com/) n Ask. com (http: //www. ask. com) Руските системи за извличане на информация включват: n Yandex (http: //www. yandex. ru, http: //www. ya. ru) n Rambler (http: //www. rambler . ru) n Webalta (http: //www. aport. ru/) Слайд № 12

Каталог Слайд № 20 Каталогът е система, която предоставя класификация на информацията. Неговата отличителна черта– наличието на йерархия (схема за подреждане) на ресурсите, в която всеки ресурс принадлежи към един или повече раздели. Директориите съхраняват описания (анотации) на интернет ресурси. Те се попълват от уеб администратори (хора, които създават информационни ресурси) или специални редактори, които преглеждат мрежовите информационни ресурси. В отговор на потребителска заявка директориите търсят тези описания. Директориите не откриват автоматично промени в мрежовите информационни ресурси.

Типично оформление на каталог Слайд № 21 Заявка Информационни ресурси Технически персонал Потребителски интерфейс Отговор Хипертекстови връзки Клиентска търсачка Отговор Заявка Йерархия на информационните ресурси и техните описания

Използване на каталога Слайд № 22 Когато решавате проблем с търсенето, когато трябва да намерите група от информационни ресурси по доста широка тема, каталогът е най-добрият инструмент за извършване на търсене, например, когато търсите сайтове, които предоставят Информация за връзкаорганизации в Москва или сайтове на електронни медии. Резултатите от търсене в директории могат да бъдат по-смислени, защото информационните ресурси в тях са подготвени от хора.

Каталози Слайд № 23 Глобалните електронни каталози в Интернет са: n Yahoo (http: //www. yahoo. com) n Open Directory (http: //www. dmoz. org) n Look. Smart (http: //www. looksmart. com) Най-значимите руски електронни каталози включват: n Каталог на Yandex (http: //yaca. yandex. ru) n Каталог на пощата. ru (http: //www. list. ru/) n Каталог Rambler’s Top 100 (http: //top 100. rambler. ru)

Система за метатърсене Слайд № 28 Системата за метатърсене е надстройка на търсачките и електронните каталози, която няма собствена база данни (индекс) и при търсене според инструкциите за търсене на потребителя автоматично генерира заявки за няколко външни инструмента за търсене и след това автоматично анализира получените от тях резултати и показва списък с връзки в реда, определен от съотношението на оценките на отговорите в няколко инструмента за търсене наведнъж. Разликите в стратегията и широчината на обхвата на информационните ресурси на различните търсачки често водят до факта, че различните инструменти за търсене предоставят различни отговори на една и съща заявка. Системите за метатърсене използват потенциала на други инструменти за извличане на информация в своята работа.

Типична диаграма на система за метатърсене Слайд № 29 Заявка Клиент Потребителски интерфейс Отговор Търсачка Заявки Информационни ресурси Отговори IRS 1 Каталог 1 IRS N Каталог N

Използване на метатърсачка Слайд № 30 Метатърсачките са най-ефективни в началните етапи на търсене на информация. Те ви позволяват бързо да проверите дали необходимата информация е достъпна в интернет и да локализирате инструментите за търсене, в които тя присъства. Метатърсачките ви позволяват да намалите времето, прекарано в търсене на информация, тъй като при обработка на потребителска заявка тези системи имат достъп до няколко различни инструмента за търсене едновременно.

Видове метатърсачки Слайд № 31 Мрежа - достъпна чрез мрежата за търсене на информация Към глобална мета търсачкидостъпни чрез Интернет включват: n Meta. Crawler (http: //www. metacrawler. com) n Уеб. Crawler (http: //www. webcrawler. com) n Търсене. com (http: //www. search. com) Най-известните руски системи за метатърсене: n Meta. Бот. ru (http: //metabot. ru) n Nigma (http: //nigma. ru) Предимство руски средстватърсене е правилната обработка на заявката на националния език.

Специализирани инструменти за търсене Слайд № 33 Системи, които търсят файлове, например File. Търсене. ru (http: //www. filesearch. ru) Системи, които осигуряват търсене в новини от електронни медии, например Yandex News (http: //news. yandex. ru), Google News (http: //news. google. ru ) Търсете стоки, например Yandex Market (http: //market. yandex. ru), Търговия. ru (http: //www. torg. ru) Търсете хора, например POISKI. ru (http: //poiski. ru), Poisk 24 (http: //www. poisk 24. de), Yahoo! Търсене на хора (http://people.yahoo.com)

Специализирани инструменти за търсене Търсене на изображения, например Yandex Pictures (http: //images. yandex. ru), Google Images (http: //images. google. ru) Търсене на видео, например Yandex Video (http: //video .yandex .ru), Google Video(http: //video. google. ru) Слайд № 34

Допълнителни инструменти и методи за търсене Слайд № 36 В Интернет можете да търсите информация не само с помощта на търсачките, но и по други начини. В интернет има много различни сайтове, услуги и потребители, които могат да ви помогнат при търсенето. Такива услуги включват системи за въпроси и отговори, форуми и различни онлайн общности ( социална медия), електронна поща, чатове. всичко тези методиОбщото между вас при получаване на информация е, че на въпросите ви отговарят други хора (не програми). Системи въпрос-отговори: Отговори по пощата. ru (http: //otveti. mail. ru), Въпроси и отговори Google (http: //otvety. google. ru), Експерт. ru (http: //znatok.ru)

Допълнителни инструменти и методи за търсене Слайд № 37 Тези методи са допълнителни, защото: n не са универсални (натрупват адреси в недостатъчен обем или в тесни области); n няма точна гаранция за получаване на отговор на въпрос (въпросът може просто да бъде игнориран); получаването на отговор в такива системи понякога може да отнеме много време. Основното предимство при използване допълнителни начинитърсенето е висока точностполучена информация.

Препоръки за търсене на информация Слайд № 40 Уверете се, че думата (фраза) на вашето запитване е изписана правилно. Вашата заявка може да бъде коригирана, ако грешно изписаната дума е често използвана. Редки думи или фрази може да не бъдат намерени. Когато търсите информация с помощта на търсачките, трябва да знаете, че системите обикновено отговарят на всяка потребителска заявка (поради големия обем на интернет) (например за заявката asgr VKT 5, която на пръв поглед е безсмислен набор от знаци, търсачката Yandex намери 12 уеб страници, в които се среща тази фраза). Бъди внимателен.

Препоръки за търсене на информация Слайд № 41 Изяснете заявката си. Колкото по-точна е фразата на заявката, толкова по-голям е шансът бързо да намерите необходимата информация, например резултатите от търсенето за заявките за стихотворение на Есенин и стихотворение на Есенин от ранните му години ще бъдат различни. Използвайте синоними. Ако необходимата информация не е намерена за вашата заявка, опитайте се да изясните заявката, като замените думата с нейния синоним, напр. RAMили памет с произволен достъп или RAM. Различните думи и фрази дават различни резултати. Използвайте думи, които биха били използвани на уебсайтовете, които търсите.

Препоръки за търсене на информация Слайд № 42 Когато съставяте заявка, винаги мислено трябва да си представяте какво може да бъде очакваното съдържание на документа. Например, ако трябва да намерите информация за A.S. Пушкин, тогава не е достатъчно просто да посочите неговото фамилно име в заявката (списъкът с резултати ще съдържа много различни институции, разположени по улиците на Пушкин в различни градове). Търсенето ще бъде по-ефективно, ако добавите имената на произведенията на поета към фамилното име. За да търсите текстове на произведения, струва си да въведете отделни редове от тях (за предпочитане рядко използвани в цитати).

Препоръки за търсене на информация Слайд № 43 Не въвеждайте заявка в търсачката в обичайната разговорна форма. И така, на въпроса какво е времето сега в Нижни Новгород? ще бъдат намерени документи, които включват всички думи на заявката, а именно текстове, съдържащи този въпрос(например текстове на литературни произведения). По-ефективни в в такъв случайще въведете заявката за времето в Нижни Новгород, в първите десет връзки на отговора, на които ще има необходимата информация. Опитайте се да напишете думите на искането само с малки букви - за такова искане могат да бъдат намерени допълнителни документи.

Препоръки за търсене на информация Слайд № 44 Търсене на подобни документи. Ако някой от намерените документи е по-близо до търсената от вас тема от останалите, щракнете върху връзката „намерете подобни документи“. Търсачката ще анализира страницата и ще намери документи, подобни на посочения от вас. Но ако тази страница е била изтрита от сървъра и търсачката все още не е имала време да я премахне от индекса, тогава ще получите съобщението „Исканият документ не е намерен“.

Препоръки за търсене на информация Слайд № 45 Използвайте знаците “+” и “-”. За да изключите документи, които съдържат конкретна дума, поставете знак минус пред нея. Обратно, за да сте сигурни, че определена дума присъства в документа, поставете плюс пред нея. Моля, имайте предвид, че не трябва да има интервал между думата и знака плюс/минус. Можете също да използвате други специални команди, за да прецизирате вашата заявка. Списък с тях може да бъде намерен в системната помощ, обикновено на страницата Query Language.

Препоръки за търсене на информация Слайд № 46 Търсене на точни фрази. Ако знаете точната фраза, която трябва да присъства на страницата с резултати, посочете я в заявката, като я поставите в кавички. Например „Широко поле за мечти и за живот. Следващите години се отварят за нас“ Използвайте регионални търсачки. За да получите повече пълна информацияна език, различен от английски, можете да използвате регионални системи, които работят с този език. В много страни регионалните системи имат широко покритие на ресурсите. Най-голямата търсачка в Русия е Yandex (http: //www. yandex. ru).

Препоръки за търсене на информация Слайд № 47 Използвайте специализирани търсачки. Ако търсите снимки, видеоклипове, продукти, карти и друга информация, тогава можете да намерите цялата тази информация по-бързо с помощта на специализирани търсачки, предназначени за тези цели. Много търсачки с общо предназначениеимат специални интерфейси за търсене на този тип информация (вижте описанията на конкретни системи). Заявката за търсене в този случай може да бъде: търсене на изображение.

Препоръки за търсене на информация Слайд № 48 Ако източникът на информация е организация, опитайте да потърсите информация на уебсайта на тази организация. Търсачките може да не са запознати с цялата информация, съхранявана в интернет сайтовете. Отидете на уебсайта на организацията, от която идва тази информация, може да има подробна информация за нея. В сайтовете има локални системитърсене (извършване на търсене конкретно в този сайт) или можете да опитате да намерите информацията, от която се нуждаете, като навигирате през секции на сайта. Ако например сте чули радио програма и знаете името на тази радиостанция. Потърсете информация за тази програма на официалния уебсайт на тази радиостанция.

Препоръки за търсене на информация Слайд № 49 Помолете други хора за помощ при намирането на информация. В Интернет има специални системи (например системи за въпроси и отговори), в които някои потребители могат да помогнат на други да намерят информация. Може би хората вече са се интересували от същия въпрос като вас и знаят правилния отговор.

1. Въведение Всяка година обемът на Интернет се увеличава значително, така че вероятността да намерите необходимата информация се увеличава рязко. Интернет свързва милиони компютри, много различни мрежи, а броят на потребителите се увеличава с 15-80% годишно. И все пак все по-често при достъпа до интернет основният проблем не е липсата на информацията, която търсите, а възможността да я намерите. По правило обикновеният човек поради различни обстоятелства не може или не иска да прекара повече от 15-20 минути в търсене на отговора, от който се нуждае. Затова е особено важно правилно и компетентно да научите едно на пръв поглед просто нещо – къде и как да търсите, за да получите ЖЕЛАНИТЕ отговори. За да намерите необходимата информация, трябва да намерите нейния адрес. За тази цел съществуват специализирани сървъри за търсене (индексни роботи (търсачки), тематични интернет директории, системи за мета-търсене, услуги за търсене на хора и др.). Този майсторски клас разкрива основните технологии за търсене на информация в Интернет, предоставя общи характеристики на инструментите за търсене и разглежда структурите на заявките за търсене за най-популярните рускоезични и англоезични търсачки. 2. Технологии за търсене Уеб технологията World Wide Web (WWW) се счита за специална технология за подготовка и публикуване на документи в Интернет. WWW включва както уеб страници, така и цифрови библиотеки, каталози и дори виртуални музеи! При такова изобилие от информация възниква въпросът: „Как да се ориентираме в такова огромно и мащабно информационно пространство?“ Инструментите за търсене идват на помощ при решаването на този проблем. 2.1 Инструменти за търсене Инструментите за търсене са специални софтуер, чиято основна цел е да осигури най-оптималното и висококачествено търсене на информация за интернет потребителите. Инструментите за търсене се хостват на специални уеб сървъри, всеки от които изпълнява специфична функция:
  1. Анализ на уеб страници и записване на резултатите от анализа на едно или друго ниво на базата данни на сървъра за търсене.
  2. Търсене на информация по заявка на потребител.
  3. Осигуряване на удобен интерфейс за потребителя за търсене на информация и преглед на резултатите от търсенето.
Техниките на работа, използвани при работа с един или друг инструмент за търсене, са почти еднакви. Преди да ги обсъдим, нека разгледаме следните концепции:
  1. Интерфейсът на инструмента за търсене е представен под формата на страница с хипервръзки, ред за заявка (ред за търсене) и инструменти за активиране на заявки.
  2. Индексът на търсачката е информационна база, съдържащ резултат от анализ на уеб страници, съставен по определени правила.
  3. Заявката е ключова дума или фраза, която потребителят въвежда в лентата за търсене. За формиране на различни заявки се използват специални знаци ("", ~) и математически символи (*, +, ?).
Схемата за търсене на информация е проста. Потребителят въвежда ключова фраза и активира търсенето, като по този начин получава селекция от документи въз основа на формулираната (посочена) заявка. Този списък с документи е класиран според определени критерии, така че в горната част на списъка са тези документи, които най-точно отговарят на заявката на потребителя. Всеки от инструментите за търсене използва различни критерии за класиране на документи, както при анализиране на резултатите от търсенето, така и при създаване на индекс (попълване на индексна база данни от уеб страници). По този начин, ако зададете заявка с еднакъв дизайн в лентата за търсене за всеки инструмент за търсене, можете да получите различни резултати от търсенето. За потребителя има голямо значение, кои документи ще се появят в първите две до три дузини документа в резултатите от търсенето и доколко тези документи отговарят на очакванията на потребителя. Повечето инструменти за търсене предлагат два метода на търсене - просто търсене и разширено търсене, със или без специална форма за заявка. Нека разгледаме и двата вида търсене, като използваме примера на търсачка на английски език. Например AltaVista е удобна за използване произволни искания, „Нещо за онлайн дипломите по информационни технологии“, докато инструментът за търсене на Yahoo ви позволява да получавате световни новини, информация за обменните курсове или прогнози за времето. Овладяването на критериите за прецизиране на заявките и усъвършенстваните техники за търсене ви позволява да увеличите ефективността на търсенето и бързо да намерите необходимата информация. На първо място, можете да увеличите ефективността на вашето търсене, като използвате логически оператори (операции) Or, And, Near, Not, математически и специални символи. Използвайки оператори и/или символи, потребителят асоциира ключови думи в необходимата последователност, за да получи най-подходящия резултат от търсенето за заявката. Формулярите за заявки са показани в таблица 1. Таблица 1

Една проста заявка дава определен брой връзки към документи, защото... списъкът включва документи, съдържащи една от думите, въведени по време на заявката, или проста фраза (вижте таблица 1). Операторът and ви позволява да посочите, че всички ключови думи трябва да бъдат включени в съдържанието на документа. Броят на документите обаче все още може да е голям и прегледът им ще отнеме доста време. Следователно в някои случаи е много по-удобно да се използва контекстният оператор near, което показва, че думите трябва да бъдат разположени достатъчно близо в документа. Използването на близо значително намалява броя на намерените документи. Наличието на знака "*" в низа на заявката означава, че думата ще се търси по нейната маска. Например, ще получим списък с документи, съдържащи думи, започващи с „gov“, ако напишем „gov*“ в низа на заявката. Това могат да бъдат думите правителство, губернатор и др.


След като изучите тази тема, ще научите и повторите:

За какво са сървърите за търсене?
- предназначение на основните части на сървърите за търсене;
- какви видове търсене на информация съществуват в Интернет;
- основни правила за формиране на заявка в търсачката Yandex.

Търсене по URL

Най-бързият и надежден начин за търсене на информация в Интернет е търсенето по URL. Много от тях са представени в печатни издания, специални справочници, чуват се по популярни радиостанции и телевизионни екрани.

♦ Феновете на футболния клуб Зенит знаят наизуст адреса www.fc-zenit.ru.
♦ Феновете на групата „Кралят и шутът“ са добре запознати с официалния уебсайт на тази група www.korol.spb.ru.
♦ Феновете на канала NTV могат лесно да намерят уебсайта му на адрес www.ntv.ru. За бърз достъпЗа да получите достъп до горните ресурси, просто стартирайте програма за браузър, например Internet Explorerи наберете приятел URL адресв адресния ред.

Търсачки

Има огромно количество документи, концентрирани в Интернет. За да се улесни намирането на необходимата информация, се създават специални търсачки.

Търсачки- Това автоматични системи, анкетиращи сървъри, свързани към глобалната мрежа и съхраняващи в тяхната база данни информация за данните, налични на сървърите. Въз основа на специално формулирана заявка, търсачките предоставят информация за това къде можете да получите необходимите данни.

Обикновено търсачките се състоят от три части: робот, програма за индексиране и обработка на заявки.

Робот (паяк, робот или бот)е програма, която посещава уеб страници и чете (изцяло или частично) тяхното съдържание. Роботите на търсачките се различават по своята индивидуална схема за анализ на съдържанието на уеб страница.
Индекс на търсачкатае хранилище на изображения за търсене на страници, посетени от роботи. Изображение за търсене на документ (включително уеб страница) е описание на съдържанието на документа на специален език за извличане на информация. Това описание съдържа кодове на ключови думи на документа, които отразяват неговия смисъл и съдържание. Индексите във всяка търсачка се различават по обема и начина на организиране на съхраняваната информация. Базите данни на водещите търсачки съхраняват информация за десетки милиони документи, а индексираните им обеми възлизат на стотици гигабайти. Индексите периодично се актуализират и допълват, така че резултатите от една търсачка с една и съща заявка може да се различават, ако търсенето е извършено по различно време.

Програма за обработка на заявкие програма, която в съответствие с искането на потребителя „преглежда“ индекса за наличие на необходимата информация и връща връзки към намерените документи. Наборът от връзки на изхода на системата се разпределя от програмата в низходящ ред на релевантност, тоест от най-голямата степен на съответствие на връзката към заявката до най-малката.

В момента най-популярните за руските интернет потребители са три големи търсачки от индексен тип:

Тези системи отчитат граматическите характеристики на руския език, така че резултатите от тяхното търсене в рускоезични ресурси се различават повече високо качествоотколкото западните системи.

Търсачките се различават по обхвата на информационните ресурси:

♦ общите търсачки разполагат с база данни във всички области на знанието и се отличават с обширен индекс и голям обем натрупана информация;
♦ Търсачките със специално предназначение търсят само сайтове на конкретна тема, като музика или музеи.

Основните характеристики на търсачките са:

♦ обем документи в индекса;
♦ честота на актуализиране на информацията;
♦ информационното пространство, което роботът на търсачката покрива и разнообразието от видове документи, за които се събира информация;
♦ скорост на обработка на заявката;
♦ критерий за определяне на релевантността (съответствие на намерения документ със заявката за търсене);
♦ възможност за детайлизиране и изясняване на заявката.

Търсене по категория на търсачката

Директориите за търсене са систематична колекция (подбор) от връзки към други интернет ресурси. Връзките са организирани под формата на тематичен рубрикатор, който представлява йерархична структура, придвижвайки се по която можете да намерите необходимата информация.

Нека дадем за пример структурата на каталога за търсене в Интернет на Yandex. Това е директория с общо предназначение, тъй като съдържа връзки към интернет ресурси в почти всички възможни области. В този каталог са подчертани следващи теми:

♦ Бизнес и икономика;
♦ Директории и връзки;
♦ Общество и политика;
♦ Дом и семейство;
♦ Наука и образование;
♦ Развлечение и почивка;
♦ Компютри и комуникации;
♦ Култура и изкуство.

Всяка тема включва много подраздели, а те от своя страна съдържат заглавия и т.н.

Да предположим, че подготвяте събитие за Деня на победата и искате да намерите в интернет думите на известната военна песен на Булат Окуджава „Чуваш, че ботушите тракат“. Търсенето може да се организира по следния начин: Yandex Каталог Култура и изкуство Музика Авторска песен.

Този метод на търсене е доста бърз и ефективен. Накрая ви се предлагат само 5 връзки, сред които има връзки към сайтове с песни на известни бардове. Остава само да намерите архива с текстовете на песните на Б. Окуджава на сайта и да изберете желания текст от него.

Друг пример. Да кажем, че ще купувате мобилен телефони искате да сравните характеристиките на устройства от различни компании. Търсенето може да се извърши по следните каталожни заглавия: Yandex Каталог Компютри и комуникации мобилна връзкаМобилни телефони.

След като получите ограничен брой връзки, можете бързо да ги видите и да изберете телефон, като разгледате характеристиките на компаниите и модификациите на устройствата.

Търсене по ключови думи

Повечето търсачки имат възможност да търсят по ключова дума. Това е един от най-често срещаните видове търсене. За да търсите по ключови думи, трябва да въведете думата или няколко думи, които искате да търсите, в специален прозорец и да кликнете върху бутона Търсене. Търсачката ще намери и покаже документи, съдържащи тези думи, в своята база данни. Може да има много такива документи, но много в случая не означава непременно добри.

Нека проведем няколко експеримента с някоя от търсачките. Да приемем, че решихме да създадем аквариум и се интересуваме от всякаква информация по тази тема.

На пръв поглед най-простото нещо е да потърсите думата „аквариум“. Нека проверим това, например, в търсачката Yandex. Резултатът от търсенето ще бъде повече от 460 000 страници на 3500 сайта - огромен брой връзки. Освен това, ако се вгледате по-отблизо, сред тях ще има сайтове, които споменават групата на Б. Гребенщиков „Аквариум“, търговски центрове и неформални асоциации със същото име и много други, които нямат нищо общо с аквариумните риби.

Не е трудно да се досетите, че подобно търсене не може да задоволи и най-непретенциозния потребител. Твърде много време ще трябва да отделим за избиране сред всички предложени документи на тези, които се отнасят до темата, от която се нуждаем, и още повече за запознаване с тяхното съдържание.

Веднага можем да заключим, че търсенето по една дума като правило е непрактично, тъй като с помощта на една дума е много трудно да се определи темата, на която е посветен документ, уеб страница или сайт. Изключение правят редки думи и термини, които почти никога не се използват извън своята тематична област.

Нека се опитаме да изясним условията за търсене и да въведем фразата „аквариумни риби“. Резултатът от търсенето ще бъде малко повече от 20 000 страници и около 650 сайта. Както можете да видите, броят на връзките е намалял с повече от 20 пъти. Този резултат ни подхожда повече, но все пак сред предложените връзки може да има например руски сувенирни комплекти от етикети за кибрит с изображения на риби и колекции от скрийнсейвъри за работния плот на компютъра и каталози на аквариумни риби със снимки и аксесоари за аквариум магазини.

Очевидно е, че трябва да продължим да вървим към изясняване на условията за търсене.

За да бъде търсенето по-продуктивно, всички търсачки имат специален език за заявки със собствен синтаксис. Тези езици са сходни по много начини. Доста трудно е да ги проучите всички, но всяка търсачка го прави помощна система, което ще ви позволи да овладеете желания език.

Ето десет прости правила за формиране на заявка в търсачката Yandex.

1. Ключовите думи в заявката трябва да бъдат написани с малки (малки) букви. Това ще гарантира, че всички ще бъдат намерени ключови думи, а не само тези, които започват с главна буква.

2. При търсене се вземат предвид всички форми на думата според правилата на руския език, независимо от формата на думата в заявката. Например, ако в заявката е посочена думата „знаем“, тогава думите „знаем“, „знаете“ и т.н. също ще отговарят на условието за търсене.

3. За да намерите стабилна фраза, трябва да оградите думите в кавички, например „порцеланови чинии“.

4. За да търсите по точна дума, трябва да поставите пред думата Удивителен знак. Например, за да търсите думата „септември“ в родителен падеж, трябва да напишете „!Септември“.

5. За да търсите в едно изречение, думите в заявката се разделят с интервал или знак &: „приключенски роман“ или „приключенски роман“. Няколко думи, въведени в заявка, разделени с интервали, означават, че всички те трябва да бъдат включени в едно изречение на търсения документ.

6. Ако искате да бъдат избрани само онези документи, които съдържат всяка дума, посочена в заявката, поставете знак плюс „+“ пред всеки от тях. Ако, напротив, искате да изключите някоя дума от резултата от търсенето, поставете минус „-“ пред тази дума. Знаците “+” и “-” трябва да се пишат разделени с интервал от предходната и заедно със следващата дума. Например, заявката „Volga-car“ ще намери документи, които съдържат думата „Volga“, а не думата „автомобил“.

7. Когато търсите синоними или думи с подобно значение, можете да поставите вертикална лента „|“ между думите. Например, за заявката „дете | бебе | бебе" ще бъдат намерени документи с някоя от тези думи.

8. Вместо една дума в заявка, можете да замените цял израз. За да направите това, той трябва да бъде поставен в скоби, например „(дете | бебе | деца | бебе) + (грижи | образование).“

9. Знакът *~" (тилда) ви позволява да намирате документи с изречение, съдържащо първата дума, но не и втората. Например, заявката „книги ~ магазин“ ще намери всички документи, съдържащи думата „книги“, до която (в рамките на изречението) няма дума „магазин“.

10. Ако операторът се повтори веднъж (например & или ~), търсенето се извършва в рамките на изречението. Двойният оператор (&&, -) указва търсене в документ. Например, заявката „рак - астрология“ ще намери документи с думата „рак“, които не са свързани с астрологията.

Наличие на определен набор от най-често използвани термини в желаната област, можете да използвате разширено търсене. На фиг. Фигура 3.3 показва прозореца за разширено търсене в търсачката Yandex. В този режим възможностите на езика за заявки се реализират под формата на формуляр. Подобна услуга, включително филтри за речници, се предлага от почти всички търсачки.

Ориз. 3.3. Пример за разширено търсене в системата Yandex

Като се има предвид това правилният изборна желани и задължителни думи и изключване на нежелани термини, такова търсене може да даде добри резултати.

Да се ​​върнем на примера с аквариумните рибки. След като прочетох няколко документа, предлагани от търсачката, става ясно, че търсенето на информация в интернет не трябва да започва с избора на аквариумни рибки. Аквариумът е сложна биологична система, чието създаване и поддържане изисква специални знания, време и сериозни инвестиции.

Въз основа на получената информация човек, който търси в Интернет, може радикално да промени стратегията за по-нататъшно търсене, като реши да проучи специализирана литература, свързана с разглеждания въпрос.

За търсене на литература или документи с пълен текст е възможна следната заявка:

“+(аквариум | акварист | аквариум хоби) + за начинаещи + (съвет | литература) + (статия | теза | пълен текст) - (цена | магазин | доставка | каталог).”

След обработка на заявката от търсачката се получи следният резултат: страници - 195, сайтове - минимум 43.

Както се вижда от статистиката на търсенето, резултатът е много успешен. Вече първите линкове водят до необходимите документи:

Поставяне на аквариум > Съвети за начинаещ акварист >
Статии > Aq uascope. ru
http://aquascope.ru/modules/wfsection/article.php?page=l&articleid=49 (32KB) - стриктно съответствие.
СЪВЕТ ЗА НАЧИНАЕЩИ АКВАРИУМИСТИ. Как да изберем и инсталираме аквариум, как...
http://www.aquariums.ru/sovna.htm (2KB) 23.07.2002 г. - нестриктно съответствие.

Сега можете да обобщите резултатите от търсенето, да направите определени заключения и да вземете решение за възможни действия:

♦ Спрете по-нататъшното търсене, тъй като поради различни причини не можете да поддържате аквариум.
♦ Прочетете предложените статии и започнете да настройвате аквариум.
♦ Потърсете материали за хамстери или вълнисти папагали.

Професионално търсене

Изследователите и специалистите ще трябва да подходят по-внимателно към организирането на търсенето. При професионално търсенеИнформацията в Интернет трябва да отговаря на следните изисквания:

висока скоростизвършване на обиск;
♦ достоверност на получената информация;
♦ пълно покритие на ресурсите при търсене.

Скорост. Скоростта на търсене зависи главно от два фактора: компетентно планиране на търсенето (подбор услуги за търсенеи инструменти) и умения за работа с вече избран ресурс (способност за бързо разбиране на неговата структура и методи за навигация). Индексите за търсене не са достатъчни, за да осигурят скорост на търсене. В допълнение към тях в Интернет има редица ресурси за търсене, чието използване гарантира извършването на професионално търсене.

Достоверност. Въпросът за надеждността на информацията, получена от Интернет, е много актуален, тъй като всеки може да публикува всякаква информация там без никакъв контрол за нейното съответствие с реалността. Това от своя страна води до голям брой ненадеждни източници, като есета и курсови работи, които наводняват интернет.

Има специални услуги за търсене, които ви позволяват да оцените надеждността на източник на информация в Интернет.

Пълнота. Необходимо условиеУспешното пълномащабно събиране на информация е познаването на основните типове ресурси, съществуващи днес, и използването на различни услуги за търсене. Никоя търсачка не може да покрие всички интернет ресурси.

Като правило, за да постигне положителен резултат, потребителят трябва да прибегне до услугите на няколко търсачки. Можете да направите това сами, преминавайки от система към система, или можете да поверите тази работа на една от метатърсачките (meta е първата компонентсложни думи, обозначаващи системи за описание и изучаване на други системи).

Ориз. 3.4. Прозорци на метатърсачката

Метатърсачките нямат собствени бази данни за търсене и използват ресурсите на много други търсачки при търсене. Поради това вероятността да се намери необходимата информация е много висока. Работата в системите за метатърсене се извършва по същите правила като работата в търсачките. Това се дължи на факта, че метатърсачките са вид добавки към търсачките и използват техните индексни бази данни в работата си. Появата на метатърсачките наподобява външен видизвестни търсачки. На фиг. 3.4 показва прозорците на метатърсачките myweb.ru и metabot.ru.

Опитът показва, че в повечето случаи по-добри резултати се постигат при използване на няколко независими индекса за търсене, отколкото при използване на една метатърсачка.

Тестови въпроси и задачи

1. Каква е целта на програмата за браузър?

2. Какви програми за браузъри познавате?

3. Къде търсещият в мрежата може да намери URL адреси?

4. Каква е технологията за търсене с помощта на рубрикатора на търсачката?

5. Каква е технологията за търсене по ключови думи?

6. Какви изисквания трябва да се спазват при професионално търсене на информация в Интернет?

7. Кога в критериите за търсене трябва да се посочват знаци “+” или “-”?

8. Какви критерии за търсене в Yandex са посочени от следната фраза:

(бавачка | учител | гувернантка) ++ (грижи | образование | надзор).

9. Какво означава удвояването на знака (∼∼ или ++) при формиране на сложна заявка?

10. Какво е релевантност на търсенето?

11. Каква е целта на метатърсачките?



Свързани публикации