телевизори. Конзоли. Проектори и аксесоари. Технологии. Цифрова телевизия

Съвременни методи за извличане на информация. Но в наше време не по-малко, а в някои случаи много по-важни са методите и техниките за търсене на информация в новата информационна среда – Интернет. На първо място, това е използването на търсачките. В момента този метод


След като изучите тази тема, ще научите и повторите:

За какво са сървърите за търсене?
- предназначение на основните части на сървърите за търсене;
- какви видове търсене на информация съществуват в Интернет;
- основни правила за формиране на заявка в търсачката Yandex.

Търсене по URL

Най-бързият и надежден начин за търсене на информация в Интернет е търсенето по URL. Много от тях са представени в печатни издания, специални справочници, чуват се по популярни радиостанции и телевизионни екрани.

♦ Феновете на футболния клуб Зенит знаят наизуст адреса www.fc-zenit.ru.
♦ Феновете на групата „Кралят и шутът“ са добре запознати с официалния уебсайт на тази група www.korol.spb.ru.
♦ Феновете на канала NTV могат лесно да намерят уебсайта му на адрес www.ntv.ru. За бърз достъпЗа да получите достъп до горните ресурси, просто стартирайте програма за браузър, например Internet Explorerи наберете приятел URL адресв адресния ред.

Търсачки

В интернет има огромно количество документи. За да се улесни намирането на необходимата информация, се създават специални търсачки.

Търсачки- Това автоматични системи, анкетиращи сървъри, свързани към глобалната мрежа и съхраняващи в тяхната база данни информация за данните, налични на сървърите. Въз основа на специално формулирана заявка, търсачките предоставят информация за това къде можете да получите необходимите данни.

Обикновено търсачките се състоят от три части: робот, програма за индексиране и обработка на заявки.

Робот (паяк, робот или бот)е програма, която посещава уеб страници и чете (изцяло или частично) тяхното съдържание. Роботите на търсачките се различават по своята индивидуална схема за анализ на съдържанието на уеб страница.
Индекс търсачка е хранилище на изображения за търсене на страници, посетени от роботи. Изображение за търсене на документ (включително уеб страница) е описание на съдържанието на документа на специален език за извличане на информация. Това описание съдържа кодове на ключови думи на документа, които отразяват неговия смисъл и съдържание. Индексите във всяка търсачка се различават по обема и начина на организиране на съхраняваната информация. Водещи бази данни търсачкисъхраняват информация за десетки милиони документи, а индексираните им обеми възлизат на стотици гигабайти. Индексите се актуализират и допълват периодично, така че резултатите от една търсачка с една и съща заявка може да се различават, ако търсенето е извършено по различно време.

Програма за обработка на заявкие програма, която в съответствие с искането на потребителя „преглежда“ индекса за наличие на необходимата информация и връща връзки към намерените документи. Наборът от връзки на изхода на системата се разпределя от програмата в низходящ ред на релевантност, тоест от най-голямата степен на съответствие на връзката към заявката до най-малката.

В момента най-популярните за руските интернет потребители са три големи търсачки от индексен тип:

Тези системи отчитат граматическите характеристики на руския език, така че резултатите от тяхното търсене в рускоезични ресурси се различават повече високо качествоотколкото западните системи.

Търсачките се различават по покритие информационни ресурси:

♦ общите търсачки разполагат с база данни във всички области на знанието и се отличават с обширен индекс и голям обем натрупана информация;
♦ Търсачките със специално предназначение търсят само сайтове на конкретна тема, като музика или музеи.

Основните характеристики на търсачките са:

♦ обем документи в индекса;
♦ честота на актуализиране на информацията;
♦ информационното пространство, което роботът на търсачката покрива и разнообразието от видове документи, за които се събира информация;
♦ скорост на обработка на заявката;
♦ критерий за определяне на релевантността (съответствие на намерения документ със заявката за търсене);
♦ възможност за детайлизиране и изясняване на заявката.

Търсене по категория на търсачката

Директориите за търсене са систематична колекция (подбор) от връзки към други интернет ресурси. Връзките са организирани под формата на тематичен рубрикатор, който е йерархична структура, през която можете да навигирате, за да намерите необходимата информация.

Нека дадем за пример структурата на каталога за търсене в Интернет на Yandex. Това е директория с общо предназначение, тъй като съдържа връзки към интернет ресурси в почти всички възможни области. В този каталог са подчертани следващи теми:

♦ Бизнес и икономика;
♦ Директории и връзки;
♦ Общество и политика;
♦ Дом и семейство;
♦ Наука и образование;
♦ Развлечение и почивка;
♦ Компютри и комуникации;
♦ Култура и изкуство.

Всяка тема включва много подраздели, а те от своя страна съдържат заглавия и т.н.

Да предположим, че подготвяте събитие за Деня на победата и искате да намерите в интернет думите на известната военна песен на Булат Окуджава „Чуваш, че ботушите тракат“. Търсенето може да се организира по следния начин: Yandex Каталог Култура и изкуство Музика Авторска песен.

Този метод на търсене е доста бърз и ефективен. Накрая ви се предлагат само 5 връзки, сред които има връзки към сайтове с песни на известни бардове. Остава само да намерите архива с текстовете на песните на Б. Окуджава на сайта и да изберете желания текст от него.

Друг пример. Да предположим, че сте на път да закупите мобилен телефони искате да сравните характеристиките на устройства от различни компании. Търсенето може да се извърши по следните каталожни заглавия: Yandex Каталог Компютри и комуникации мобилна връзкаМобилни телефони.

След като получите ограничен брой връзки, можете бързо да ги видите и да изберете телефон, като разгледате характеристиките на компаниите и модификациите на устройствата.

Търсене по ключови думи

Повечето търсачки имат възможност да търсят по ключова дума. Това е един от най-често срещаните видове търсене. За да търсите по ключови думи, трябва да въведете думата или няколко думи, които искате да търсите, в специален прозорец и да кликнете върху бутона Търсене. Търсачката ще намери и покаже документи, съдържащи тези думи, в своята база данни. Може да има много такива документи, но много в в такъв случайне означава непременно добре.

Нека проведем няколко експеримента с някоя от търсачките. Да приемем, че решихме да създадем аквариум и се интересуваме от всякаква информация по тази тема.

На пръв поглед най-простото нещо е да потърсите думата „аквариум“. Нека проверим това, например, в търсачката Yandex. Резултатът от търсенето ще бъде повече от 460 000 страници на 3500 сайта - огромен брой връзки. Освен това, ако се вгледате по-отблизо, сред тях ще има сайтове, които споменават групата на Б. Гребенщиков „Аквариум“, търговски центрове и неформални асоциации със същото име и много други, които нямат нищо общо с аквариумните риби.

Не е трудно да се досетите, че подобно търсене не може да задоволи и най-непретенциозния потребител. Твърде много време ще трябва да отделим за избиране сред всички предложени документи на тези, които се отнасят до темата, от която се нуждаем, и още повече за запознаване с тяхното съдържание.

Веднага можем да заключим, че търсенето по една дума обикновено е непрактично, тъй като с помощта на една дума е много трудно да се определи темата, на която е посветен даден документ, уеб страница или сайт. Изключение правят редки думи и термини, които почти никога не се използват извън своята тематична област.

Нека се опитаме да изясним условията за търсене и да въведем фразата „аквариумни риби“. Резултатът от търсенето ще бъде малко повече от 20 000 страници и около 650 сайта. Както можете да видите, броят на връзките е намалял с повече от 20 пъти. Този резултат ни подхожда повече, но все пак сред предложените връзки може да има например руски сувенирни комплекти от етикети за кибрит с изображения на риби и колекции от скрийнсейвъри за работния плот на компютъра и каталози на аквариумни риби със снимки и аксесоари за аквариум магазини.

Очевидно е, че трябва да продължим да вървим към изясняване на условията за търсене.

За да бъде търсенето по-продуктивно, всички търсачки имат специален език за заявки със собствен синтаксис. Тези езици са сходни по много начини. Доста трудно е да ги проучите всички, но всяка търсачка го прави помощна система, което ще ви позволи да овладеете желания език.

Да дадем десет прости правилаформиране на заявка в търсачката Yandex.

1. Ключовите думи в заявката се изписват с малки (малки) букви. Това ще гарантира, че се търсят всички ключови думи, а не само тези, които започват с главна буква.

2. При търсене се вземат предвид всички форми на думата според правилата на руския език, независимо от формата на думата в заявката. Например, ако в заявката е посочена думата „знаем“, тогава думите „знаем“, „знаете“ и т.н. също ще отговарят на условието за търсене.

3. За да намерите стабилна фраза, трябва да оградите думите в кавички, например „порцеланови чинии“.

4. За да търсите по точна дума, трябва да поставите пред думата Удивителен знак. Например, за да търсите думата „септември“ в родителен падеж, трябва да напишете „!Септември“.

5. За търсене в рамките на едно изречение, думите в заявката се разделят с интервал или знак &: „приключенски роман“ или „приключенски и роман“. Няколко думи, въведени в заявка, разделени с интервали, означават, че всички те трябва да бъдат включени в едно изречение на търсения документ.

6. Ако искате да бъдат избрани само онези документи, които съдържат всяка дума, посочена в заявката, поставете знак плюс „+“ пред всеки от тях. Ако, напротив, искате да изключите някоя дума от резултата от търсенето, поставете минус „-“ пред тази дума. Знаците “+” и “-” трябва да се пишат разделени с интервал от предходната и заедно със следващата дума. Например, заявката „Volga-car“ ще намери документи, които съдържат думата „Volga“, а не думата „автомобил“.

7. Когато търсите синоними или думи с подобно значение, можете да поставите вертикална лента „|“ между думите. Например, за заявката „дете | бебе | бебе" ще бъдат намерени документи с някоя от тези думи.

8. Вместо една дума в заявка, можете да замените цял израз. За да направите това, той трябва да бъде поставен в скоби, например „(дете | бебе | деца | бебе) + (грижи | образование).“

9. Знакът *~" (тилда) ви позволява да намирате документи с изречение, съдържащо първата дума, но не и втората. Например, заявката „книги ~ магазин“ ще намери всички документи, съдържащи думата „книги“, до която (в рамките на изречението) няма дума „магазин“.

10. Ако операторът се повтори веднъж (например & или ~), търсенето се извършва в рамките на изречението. Двойният оператор (&&, -) указва търсене в документ. Например, заявката „рак - астрология“ ще намери документи с думата „рак“, които не са свързани с астрологията.

Наличието на определен набор от най-често използвани термини в желаната област, можете да използвате разширено търсене. На фиг. Фигура 3.3 показва прозореца за разширено търсене в търсачката Yandex. В този режим възможностите на езика за заявки се реализират под формата на формуляр. Подобна услуга, включително филтри за речници, се предлага от почти всички търсачки.

Ориз. 3.3. Пример за разширено търсене в системата Yandex

Като се има предвид това правилният изборна желани и задължителни думи и изключване на нежелани термини, такова търсене може да даде добри резултати.

Да се ​​върнем на примера с аквариумните рибки. След като прочетох няколко документа, предлагани от търсачката, става ясно, че търсенето на информация в интернет не трябва да започва с избора на аквариумни рибки. Аквариумът е сложна биологична система, чието създаване и поддържане изисква специални знания, време и сериозни инвестиции.

Въз основа на получената информация човек, който търси в Интернет, може радикално да промени стратегията за по-нататъшно търсене, като реши да проучи специализирана литература, свързана с разглеждания въпрос.

За търсене на литература или документи с пълен текст е възможна следната заявка:

“+(аквариум | акварист | аквариум хоби) + за начинаещи + (съвет | литература) + (статия | теза | пълен текст) - (цена | магазин | доставка | каталог).”

След обработка на заявката от търсачката се получи следният резултат: страници - 195, сайтове - минимум 43.

Както се вижда от статистиката на търсенето, резултатът е много успешен. Вече първите линкове водят до необходимите документи:

Поставяне на аквариум > Съвети за начинаещ акварист >
Статии > Aq uascope. ru
http://aquascope.ru/modules/wfsection/article.php?page=l&articleid=49 (32KB) - стриктно съответствие.
СЪВЕТ ЗА НАЧИНАЕЩИ АКВАРИУМИСТИ. Как да изберем и инсталираме аквариум, как...
http://www.aquariums.ru/sovna.htm (2KB) 23.07.2002 г. - нестриктно съответствие.

Сега можете да обобщите резултатите от търсенето, да направите определени заключения и да вземете решение за възможни действия:

♦ Спрете по-нататъшното търсене, тъй като поради различни причини не можете да поддържате аквариум.
♦ Прочетете предложените статии и започнете да настройвате аквариум.
♦ Потърсете материали за хамстери или вълнисти папагали.

Професионално търсене

Изследователите и специалистите ще трябва да подходят по-внимателно към организирането на търсенето. При професионално търсенеИнформацията в Интернет трябва да отговаря на следните изисквания:

висока скоростизвършване на обиск;
♦ достоверност на получената информация;
♦ пълно покритие на ресурсите при търсене.

Скорост. Скоростта на търсене зависи главно от два фактора: компетентно планиране на търсенето (подбор услуги за търсенеи инструменти) и умения за работа с вече избран ресурс (способност за бързо разбиране на неговата структура и методи за навигация). Индексите за търсене не са достатъчни, за да осигурят скорост на търсене. В допълнение към тях в Интернет има редица ресурси за търсене, чието използване гарантира извършването на професионално търсене.

Достоверност. Въпросът за надеждността на информацията, получена от Интернет, е много важен, тъй като всеки може да публикува всякаква информация там, без да контролира нейното съответствие с реалността. Това от своя страна води до голям брой ненадеждни източници, като есета и курсови работи, които наводняват интернет.

Има специални услуги за търсене, които ви позволяват да оцените надеждността на източник на информация в Интернет.

Пълнота. Необходимо условиеУспешното пълномащабно събиране на информация е познаването на основните типове ресурси, съществуващи днес, и използването на различни услуги за търсене. Никоя търсачка не може да покрие всички интернет ресурси.

Като правило, за да постигне положителен резултат, потребителят трябва да прибегне до услугите на няколко търсачки. Можете да направите това сами, преминавайки от система към система, или можете да поверите тази работа на една от метатърсачките (meta е първата компонентсложни думи, обозначаващи системи за описание и изучаване на други системи).

Ориз. 3.4. Прозорци на метатърсачката

Метатърсачките нямат собствени бази данни за търсене и използват ресурсите на много други търсачки при търсене. Поради това вероятността да се намери необходимата информация е много висока. Работата в системите за метатърсене се извършва по същите правила като работата в търсачките. Това се дължи на факта, че метатърсачките са вид добавки към търсачките и използват техните индексни бази данни в работата си. Появата на метатърсачките наподобява външен видизвестни търсачки. На фиг. 3.4 показва прозорците на метатърсачките myweb.ru и metabot.ru.

Опитът показва, че в повечето случаи по-добри резултати се постигат при използване на няколко независими индекса за търсене, отколкото при използване на една метатърсачка.

Тестови въпроси и задачи

1. Каква е целта на програмата за браузър?

2. Какви програми за браузъри познавате?

3. Къде търсещият в мрежата може да намери URL адреси?

4. Каква е технологията за търсене с помощта на рубрикатора на търсачката?

5. Каква е технологията за търсене по ключови думи?

6. Какви изисквания трябва да се спазват при професионално търсене на информация в Интернет?

7. Кога в критериите за търсене трябва да се посочват знаци “+” или “-”?

8. Какви критерии за търсене в Yandex са посочени от следната фраза:

(бавачка | учител | гувернантка) ++ (грижи | образование | надзор).

9. Какво означава удвояването на знака (∼∼ или ++) при формиране на сложна заявка?

10. Какво е уместност при търсене?

11. Каква е целта на метатърсачките?

Технологии за търсене

Закони за триене и пренос на топлина и маса в турбулентен граничен слой

Има няколко вида представяне на „закона на триенето“ (за референтния случай), което води до почти идентични резултати. В съответствие с концепцията за „логаритмичен“ граничен слой (при стойността на първата турбулентна константа χ = 0,4) законът за триене за изключително развита турбулентност с „изчезващ вискозитет“ е добре приближен от простата формула на Карман:

За степенно представяне на профила на скоростта следва да се предложи следната формула:

Където: ; н– степенен показател на профила на скоростта;

– полуемпиричен коефициент;

А– емпиричен коефициент;

δ – дебелина на граничния слой.

Използване на отношения за числа на Рейнолдс, изградени върху различни линейни величини:

Важно е да се отбележи, че в случай на развитие на турбулентен граничен слой от предния ръб ( x cr = 0) законът на триенето също трябва да бъде представен във формата:

Стойностите на параметричните величини на представените формули за различни профили на скоростта са обобщени в таблицата

Параметър н
1/7 1/8 1/9 1/10
А 8,74 9,71 10,6 11,5
0,0975 0,089 0,0818 0,0757
1,28 1,25 1,22 1,20
м 0,250 0,222 0,200 0,182
б 0,0252 0,0206 0,0190 0,0148
м 1 0,200 0,182 0,167 0,154
Б 1 0,0576 0,0450 0,0362 0,0308

Други форми на представяне на закона на триенето също са известни и използвани, което води до почти същите резултати. Така V.M. Ievlev предложи приближение:

Формулите за законите на преноса на топлина и маса се получават от „законите на триенето“ за стандартни условия (референтен случай) с помощта на добре известния принцип на тройната аналогия на Рейнолдс.

Където: С– коефициент на корекция – коефициент на аналогия на Рейнолдс за несъответствие с условията на стандарта (и), коефициент Скато първо приближение, то се апроксимира задоволително от връзката:

Важно е да се отбележи, че в случай на използване на интегрални параметри, „законите“ на преноса на топлина и маса са добре описани от зависимостите:

Уеб технологията World Wide Web (WWW) се счита за специална технология за подготовка и публикуване на документи в Интернет. WWW включва както уеб страници, така и цифрови библиотеки, каталози и дори виртуални музеи! При такова изобилие от информация възниква въпросът: „Как да се ориентираме в такова огромно и мащабно информационно пространство -“ Инструментите за търсене идват на помощ при решаването на този проблем.

Инструментите за търсене са специални софтуер, чиято основна цел е да осигури най-оптималното и висококачествено търсене на информация за интернет потребителите. Инструментите за търсене се хостват на специални уеб сървъри, всеки от които изпълнява специфична функция:

1. Анализ на уеб страници и въвеждане на резултатите от анализа на едно или друго ниво на базата данни на сървъра за търсене.

2. Търсене на информация по заявка на потребителя.

3. Осигуряване на удобен интерфейс за търсене на информация и преглед на резултатите от търсенето от потребителя.

Техниките на работа, използвани при работа с един или друг инструмент за търсене, са почти еднакви. Преди да ги обсъдим, нека разгледаме следните концепции:

1. Интерфейсът на инструмента за търсене е представен под формата на страница с хипервръзки, ред за заявка (ред за търсене) и инструменти за активиране на заявки.

2. Индекс на търсачката - ϶ᴛᴏ информационна база, съдържащ резултат от анализ на уеб страници, компилиран по определени правила.

3. Заявка - ϶ᴛᴏ ключова думаили фраза, която потребителят въвежда в лентата за търсене. За генериране на различни заявки се използват те Специални символи("", ~), математически символи (*, +, -).

Схемата за търсене на информация е проста. Потребителят въвежда ключова фраза и активира търсенето, като по този начин получава селекция от документи въз основа на формулираната (посочена) заявка. Този списък с документи е класиран по определени критерии, така че в горната част на списъка са тези документи, които най-точно отговарят на заявката на потребителя. Всеки от инструментите за търсене използва различни критерии за класиране на документи, както при анализиране на резултатите от търсенето, така и при създаване на индекс (попълване на индексна база данни от уеб страници).

Въпреки това, ако зададете заявка с еднакъв дизайн в лентата за търсене за всеки инструмент за търсене, можете да получите различни резултати от търсенето. За потребителя има голямо значение, кои документи ще се появят в първите две до три дузини документа в резултатите от търсенето и доколко тези документи отговарят на очакванията на потребителя.

Повечето инструменти за търсене предлагат два метода за търсене − просто търсене(просто търсене) и подробно търсене(разширено търсене) със или без специална форма за заявка. Нека разгледаме и двата вида търсене, като използваме примера на търсачка на английски език.

Например AltaVista е удобна за използване произволни искания, ʼʼНещо за онлайн дипломи по информационни технологииʼʼ, докато инструментът за търсене на Yahoo ви позволява да получавате световни новини, информация за обменни курсове или прогнози за времето.

Овладяването на критериите за прецизиране на заявката и усъвършенстваните техники за търсене ви позволява да увеличите ефективността на търсенето и бързото намиране необходимата информация. На първо място, можете да увеличите ефективността на вашето търсене, като използвате логически оператори (операции) Or, And, Near, Not, математически и специални символи във вашите заявки. Използвайки оператори и/или символи, потребителят асоциира ключови думи в необходимата последователност, за да получи най-подходящия резултат от търсенето за заявката. Простата заявка не дава голям брой връзки към документи, т.к списъкът включва документи, съдържащи една от думите, въведени по време на заявката, или проста фраза (вижте таблица 1). Операторът and ви позволява да посочите, че всички ключови думи трябва да бъдат включени в съдържанието на документа. Броят на документите обаче все още трябва да е голям и прегледът им ще отнеме доста време. Поради тази причина в някои случаи е много по-удобно да се използва контекстният оператор near, който показва, че думите трябва да са разположени достатъчно близо в документа. Използването на близо значително намалява броя на намерените документи. Наличието на знака "*" в низа на заявката означава, че думата ще се търси по нейната маска. Например, ще получим списък с документи, съдържащи думи, започващи с „gov“, ако напишем „gov*“ в низа на заявката. Това са думите правителство, губернатор и др.

Най-развитата услуга за търсене на рускоезична информация се предоставя от сървъра за търсене Yandex. В Yandex можете просто да напишете фраза на руски, която описва това, което искате да намерите, и системата ще анализира и обработи вашата заявка, след което ще се опита да намери всичко, което е свързано с дадена тема. Използвайки специални оператори, можете да създадете низ, който обяснява на търсачката какви трябва да бъдат вашите изисквания за информацията, която ви интересува. Някои от операторите на езика за заявки на Yandex можете да видите тук: http://help.yandex.ru/search/ -id=481939

Не по-малко популярната търсачка Rambler поддържа статистика за трафика на връзки от собствената си база данни; се поддържат, за да увеличите или намалите значението на думите, въведени в заявката.

Нека да разгледаме най-популярните технологии за търсене на информация в Интернет.

Тема 3 Работа с интернет търсачки

IRS (система за извличане на информация)е система, която осигурява търсене и избор на необходимите данни в специална база данни с описания на източниците на информация (индекс) въз основа на езика за търсене на информация и съответните правила за търсене.

Уместност– това е съответствието на резултатите от търсенето с формулираната заявка.

Уместностизвличане на информация) - съответствие на получената информация с информационните нужди на потребителя.

Релевантността се измерва чрез степента на съответствие между очакванията на потребителите и резултатите от търсенето (сравнете с релевантността), което се определя като съотношението на количеството информация, полезна за потребителя, към общото количество информация, извлечена от търсачката.

Постигането на висока степен на постоянство е основното поле на конкуренция за съвременните търсачки. За максимално удовлетворение информационни нуждипотребители, теориите и методите на семантичните мрежи, анализ на съдържанието и задълбочен анализ на текстове (извличане на текст, копаене на текст).

За да намерите необходимата информация в Интернет, използвайте адрес на ресурс (Английски . УниформаРесурсЛокатор (URL адрес) адрес),съдържащ името на протокола, по който се осъществява достъп до необходимата информация, адреса на сървъра и името на файла на този сървър (фиг. 2).

Ориз. 2. Пример за адрес на ресурс

Система за търсене- софтуерно-хардуерен комплекс с уеб интерфейс, който предоставя възможност за търсене на информация в Интернет. Търсачката обикновено означава уебсайт, на който се намира системният интерфейс. Софтуерната част на системата за търсене е търсачка (търсачка) - набор от програми, които осигуряват функционалността на система за търсене и обикновено са търговска тайна на компанията разработчик на търсачката

Търсенето на информация в Интернет се извършва с помощта на специални програми, които обработват заявки - системи за извличане на информация (IRS). Има няколко модела, на които се основава работата на търсачките, но исторически два модела са придобили най-голяма популярност - този директории за търсене и индекси за търсене.

Каталозите за търсене са организирани на същия принцип като предметните каталози на големите библиотеки. Обикновено те представляват йерархични хипертекстови менюта с елементи и подточки, които определят темите на сайтове, чиито адреси се съдържат в тази директория, с постепенно изясняване на темата от ниво на ниво. Директориите за търсене се създават ръчно. Висококвалифицирани редактори лично преглеждат информационното пространство на WWW, избират това, което считат за обществено интересно, и го въвеждат в каталога.

Основният проблем на директориите за търсене е изключително ниската степен на покритие на WWW ресурсите. Многократно увеличаване на процента на покритие Уеб ресурси, е необходимо да се изключи от процеса на попълване на базата данни на търсачката човешки фактор- работата трябва да е автоматизирана.

Извършва се автоматично каталогизиране на уеб ресурси и задоволяване на клиентските заявки индекси за търсене. Работата на индекса за търсене може да бъде разделена на три етапа:

    събиране на първичната база данни. За сканиране на информационното пространство на WWW се използват специални програми-агенти - червеи, чиято задача е да търсят неизвестни ресурси и да ги регистрират в базата данни;

    индексиране на бази данни - първична обработка с цел оптимизация при търсене. На етапа на индексиране се създават специализирани документи - същинските индекси за търсене;

    прецизиране на получения списък. На този етап се създава списък с връзки, които ще бъдат предадени на потребителя като резултат. Прецизирането на получения списък включва филтриране и класиране на резултатите от търсенето.

Филтрирането означава филтриране на връзки, които не са подходящи за предоставяне на потребителя (например проверка за дубликати). Класирането се състои в създаване на специален ред за представяне на получения списък (по брой ключови думи, свързани думи и т.н.).

Основната задача на всяка информационна система е да търси информация, съответстваща на информационните нужди на потребителя. Много е важно да не загубите нищо в резултат на търсенето, тоест да намерите всички документи, свързани с искането, и да не намерите нищо излишно. Затова се въвежда качествена характеристика на процедурата по търсене – релевантност.

Уместност– това е съответствието на резултатите от търсенето с формулираната заявка.

1 Инструменти за търсене

Инструментите за търсене са специален софтуер, чиято основна цел е да осигури най-оптималното и висококачествено търсене на информация за интернет потребителите. Инструментите за търсене се хостват на специални уеб сървъри, всеки от които изпълнява специфична функция:

Уеб търсачките са сървъри с огромна база URL данни, които автоматично осъществяват достъп до WWW страници на всички тези адреси, разглеждат съдържанието на тези страници, формират и въвеждат ключови думи от страниците в тяхната база данни (индексират страниците).

Освен това роботите на търсачките следват връзки, намерени на страници, и ги индексират повторно. Тъй като почти всяка WWW страница има много връзки към други страници, когато подобна работаедна търсачка теоретично може да обходи всички сайтове в интернет като краен резултат.

Този тип инструменти за търсене са най-известните и популярни сред всички интернет потребители. Всеки е чувал имената на добре познати уеб търсачки (търсачки) - Yandex, Rambler, Aport.

Начинът, по който работят уеб търсачките, е следният:

    Анализ на уеб страници и записване на резултатите от анализа на едно или друго ниво на базата данни на сървъра за търсене.

    Търсене на информация по заявка на потребител.

    Предоставяне на удобен интерфейс за търсене на информация и преглед на резултатите от търсенето от потребителя.

Техниките на работа, използвани при работа с един или друг инструмент за търсене, са почти еднакви. При описанието им се използват следните понятия:

    Интерфейсът на инструмента за търсене е представен под формата на страница с хипервръзки, ред за заявка (ред за търсене) и инструменти за активиране на заявки.

    Индексът на търсачката е информационна база, съдържаща резултат от анализ на уеб страници, съставена по определени правила.

    Заявката е ключова дума или фраза, която потребителят въвежда в лентата за търсене. За формиране на различни заявки се използват специални знаци ("", ~) и математически символи (*, +, ?).

Схемата за търсене на информация е проста. Потребителят въвежда ключова фраза и активира търсенето, като по този начин получава селекция от документи въз основа на формулираната (посочена) заявка. Този списък с документи е класиран по определени критерии, така че в горната част на списъка са тези документи, които най-точно отговарят на заявката на потребителя. Всеки от инструментите за търсене използва различни критерии за класиране на документи, както при анализиране на резултатите от търсенето, така и при създаване на индекс (попълване на индексна база данни от уеб страници).

В Русия най-големите и популярни индекси за търсене са:

    "Яндекс" (www.yandex.ru)

    "Rambler" (www.rambler.ru)

    "Google" (www.google.ru)

    "Апорт2000" (www.aport.ru)

2 Механизма за търсене

Обобщената технология за търсене се състои от следните етапи:

    Потребителят формулира заявка

    Системата търси документи (или техните изображения за търсене)

    Потребителят получава резултата (информация за документи)

    Потребителят подобрява или реформира заявката

    Организира се ново търсене...

Обикновено търсачките поддържат два режима: режим на просто търсене и режим на разширено търсене. Нека разгледаме обобщените възможности.

Формиране на заявка в режим на просто търсене.Можете просто да въведете една или повече думи, разделени с интервал; търсенето на думи с всички възможни окончания се моделира със символа * в края на думата. Много системи ви позволяват да търсите фрази или фрази, трябва да ги поставите в кавички. Може да се изисква задължително включване или изключване на определени думи.

Основният проблем при търсене с помощта на примитивно съставена заявка (под формата на списък с ключови думи) е, че търсачката ще намери всички страници, на които посочените думи се появяват във всяка част от документа. Обикновено броят на намерените страници ще бъде твърде голям.

За да подобрите качеството на търсенето в режим на просто търсене, е допустимо да използвате логически оператори и оператори, които ви позволяват да ограничите областта за търсене, както и да изберете конкретна категория документи от представения списък.

Много търсачки включват специални оператори в своя език за заявки, които ви позволяват да търсите в определени области на документ, например в заглавието му, или да търсите документ по известна част от неговия адрес.

Разширен или подробен режим на заявка V различни системиимплементирани индивидуално, но най-често това е форма, в която споменатите оператори и ключови елементи се имплементират чрез просто поставяне на отметки в съответните квадратчета или избиране на параметри от списък.

По-долу, като пример, е дадена информация от раздела помогне Yandex търсачка: прозорец за разширено търсене, език за заявки, търсене в това, което е намерено.

Търсене V намерениАко Vрезултат от заявка на Yandex намеренимного документи, но по по-широка тема, отколкото искате, можете да стесните този списък, като посочите вашето запитване. Друга възможност е да активирате квадратчето за отметка V намерени Vформуляр за търсене, задайте допълнителни ключови думи и следващото търсене ще се извърши само върху избраните документи Vпредишно търсене.

Cheat Sheet за използване на език за заявки

Пример

Значение

„Елате при нас за сутрешна туршия“

Думите се подреждат в точната форма

„*Посланикът пристигна“

Липсваща дума в цитата

половин резен и царевица

Думи в едно изречение

оборудвам && получавам

Думи в един документ

глухар | яребица | някой

Потърсете някоя от думите

не можеш<< винить

Некласирано "и": изразът след оператора не влияе на позицията на документа в резултатите от търсенето

Трябва /2 да изпълня

Разстояние в рамките на две думи във всяка посока (т.е. една дума може да се появи между дадени думи)

нещо, което ~~ разбирам

Премахване на дума ще разбераот търсене

с моя /+2 интелект

Разстояние в рамките на две думи в пряк ред

чай ~ лаптем

Потърсете изречение, където е думата чайсреща безмълвно ликова обувка

зелева чорба /(-1 +2) сърбане

Разстояние от една дума в обратен ред до две думи в преден ред

Разбрах какво!

Думи в точна форма с указан падеж

оказва се && (+на | !me)

Скобите образуват групи в сложни заявки

Политика

Речникова форма на думата

заглавие: (в страната)

Търсене по заглавия на документи

url:ptici.narod.ru/ptici/kuropatka.htm

Търсене по URL

със сигурност inurl:vojne

Търсене въз основа на URL фрагмент

Търсене по хост

Търсене по хост при обратно въвеждане

сайт: http://www.lib.ru/PXESY/FILATOW

Търсете във всички поддомейни и страници на даден сайт

Търсене по един тип файл

Търсенето е ограничено по език

Търсене с ограничен домейн

Търсене с ограничения по дата

държавен бизнес && /3 хващаш нишката

Разстояние 3 изречения във всяка посока

нещо, което ~~ разбирам

Премахване на дума ще разбераот търсене

Интересна опция е да търсите документи в мрежата, които препращат към страница с URL адрес, който сте посочили. По този начин можете да намерите страници в мрежата, които имат връзки към вашия уеб сайт. Някои системи ще ви позволят да ограничите търсенето си в определен домейн.

Допълнителните специални оператори включват:

    Оператори за търсене на документи с определен графичен файл;

    Оператори, ограничаващи датата на търсените страници;

    Оператори за близост между думите;

    Word form счетоводни оператори;

    Оператори за сортиране на резултатите (по релевантност, свежест, старост).

Трябва да се отбележи, че за съжаление днес няма стандарт за броя и синтаксиса на поддържаните оператори за различни търсачки. Полагат се усилия за разработване на стандарт за синтаксиса на поддържаните оператори, така че се надяваме, че разработчиците на търсачки ще се погрижат за потребителското изживяване. На този етап от развитието на инструментите за търсене потребителят, когато влиза в определена търсачка, трябва преди всичко да се запознае с нейните правила за съставяне на заявки. По правило ще има връзка на началната страница Помогнекойто ще ви отведе до справочна информация.

Различните търсачки описват различен брой източници на информация в Интернет. Следователно не можете да ограничите търсенето си само до една търсачка.

Нека разгледаме начини представяне на резултати от търсене в търсачките.

Най-често броят на намерените документи надхвърля няколко десетки, а в някои случаи може да достигне стотици хиляди! Следователно, като форма на издаване, се съставя списък с документи от 5-10-15 единици на страница с възможност за преминаване към следващата част в долната част на страницата. Заглавието и URL (адресът) на намерения документ трябва да бъдат посочени; понякога системата показва степента на релевантност на документа като процент.

Описанието на документа най-често съдържа първите няколко изречения или откъси от текста на документа с подчертани ключови думи. По правило се посочва датата на актуализация (проверка) на документа, неговият размер в килобайти; някои системи определят езика на документа и неговото кодиране (за рускоезични документи).

Какво можете да направите с получените резултати? Ако заглавието и описанието на документа отговарят на вашите изисквания, можете незабавно да отидете до неговия оригинален източник, като използвате връзката. По-удобно е да направите това в нов прозорец, за да можете допълнително да анализирате резултатите от търсенето. Много търсачки ви позволяват да търсите в намерените документи и можете да прецизирате заявката си, като въведете допълнителни термини.

Ако интелигентността на системата е висока, може да ви бъде предложена услугата за търсене на подобни документи. За да направите това, избирате документ, който особено харесвате, и го насочвате към системата като модел за следване.

Автоматизирането на определянето на сходство обаче е много нетривиална задача и често тази функция не работи според очакванията. Някои търсачки ви позволяват да пресортирате резултатите. За да ви спести време, можете да запазите резултатите от търсенето като файл на вашия локален диск за по-късно офлайн проучване.

Изпратете добрата си работа в базата знания е лесно. Използвайте формата по-долу

Студенти, докторанти, млади учени, които използват базата от знания в обучението и работата си, ще ви бъдат много благодарни.

публикувано на http://www.allbest.ru/

Съвременни методи за извличане на информация

Въведение

Точно както да можеш да четеш, пишеш или говориш публично, днес в информационното общество способността за компетентно извършване на професионално търсене е незаменимо умение на интелектуалния специалист.

Бързият растеж и динамичното развитие на информационните ресурси (предимно представените в Интернет) задължава всеки човек да притежава разнообразни и сложни умения за търсене. Възможността за бързо и правилно търсене в Интернет означава спестяване на време, притежаване на достоверна и актуална информация, което означава правене на правилни изводи и вземане на правилни решения.

Информационните евристики са предназначени да помогнат на специалиста бързо да извърши селективно и ефективно търсене при решаване на специфични интелектуални проблеми.

Проблемът с търсенето и използването на информация е един от най-актуалните в съвременната наука. Разбира се, Интернет е незаменим за ефективното и качествено търсене на информация. Въпреки това, самият факт на съхраняване на огромен слой от човешки знания в Интернет не показва високата ефективност на търсенето и използването на информация. Дори ако информацията е представена в удобна форма, човек в крайна сметка трябва да я овладее. А ефективността и качеството на работата му ще зависи от неговото владеене на методите и техниките за търсене.

Следователно в основата на използването на информацията е проблемът за търсенето и трансформирането й в такова съдържание и форма, които създават възможност за по-удобно и ефективно усвояване на информацията и нейното ефективно използване в социални дейности.

В тази връзка целта на тази работа е да се проучат характеристиките на развитието и разпространението на информация, да се разгледат основните цели и методи за извличане на информация, да се анализират правилата за изграждане на стратегия за търсене и формулиране на заявка за търсене.

Главна част

Евристиката в общ смисъл е изкуството и науката за откриване и творческо търсене в сложна предметна област.

В същото време евристиката има много значения.

По този начин евристиката е система за обучение, която насърчава развитието на находчивостта на учениците, способността за самостоятелно получаване на знания, когнитивната активност и нуждата от знания.

Също така, евристиката е наука за моделите и методите за откриване и изучаване на нови неща в човешката творческа и познавателна дейност; психология на творчеството.

Евристиката се отнася до методология за решаване на проблеми, която използва опити и грешки и експериментални резултати, за да намери директен път към решение.

Евристиките са специални методи за решаване на проблеми (евристични методи), които обикновено се противопоставят на формалните методи за решаване, базирани на точни математически модели. Използването на евристични методи (евристика) намалява времето за решаване на проблем в сравнение с метода на пълното ненасочено изброяване на възможните алтернативи; получените решения по правило не са най-добрите, а се отнасят само до набора от възможни решения.

Евристиката е набор от механизми, присъщи на дадено лице, с помощта на които се генерират процедури, насочени към решаване на творчески проблеми (например механизми за установяване на ситуационни връзки в проблемна ситуация, отрязване на неперспективни клонове в дърво от опции, генериране на опровержения с помощта на контрапримери и др.). Тези механизми, които заедно определят метатеорията за решаване на творчески проблеми, са универсални по природа и не зависят от конкретния проблем, който се решава.

Евристиката е наука, която изучава евристична дейност; специален клон на науката за мисленето. Основният му обект е творческата дейност; най-важните проблеми са задачи, свързани с модели за вземане на решения (в условия на нестандартни проблемни ситуации), търсене на нещо ново за субект или общество, структуриране на описания на външния свят (въз основа на класификации като периодичната система или таксономия на К. Линей). Евристиката като наука се развива в пресечната точка на психологията, теорията за изкуствения интелект, структурната лингвистика и теорията на информацията.

По този начин централната дума на евристиката е търсене (информация).

Няма съмнение, че разработването на методи за получаване и използване на различна социална информация традиционно е централният проблем на научната организация на работата на специалистите.

За да вземе решение във всяка конкретна ситуация, специалистът трябва да получи най-пълната и актуална информация, свързана с конкретния случай.

Изборът на източници на информация, стратегии за нейното търсене, методи за проверка на надеждността и съответствието със съществуващата информация, методи за оценка на полезността на намерената информация за решаване на проблеми - всички тези фактори са характеристики на човешкото информационно поведение.

Критериите за информационна култура на дадено лице могат да се считат за способността му да формулира адекватно своята нужда от информация в целия набор от информационни ресурси, да обработва информация и да създава качествено нова информация, да поддържа индивидуални системи за търсене на информация и адекватно да подбира и оценява информация.

Интернет отвори достъп до много информационни ресурси, които в момента е невъзможно за читателите на руските библиотеки да получат по друг начин. Съчетавайки локални, национални и глобални мрежи, той се превърна в огромен информационен ресурс, най-динамичният от всички съществуващи в момента.

Много важна характеристика на Интернет е, че потребителят не само получава достъп до информация, но и сам я произвежда. Освен това търсенето на информация в нови условия и в нова информационна среда се оставя на самия специалист.

В това отношение могат да се подчертаят два положителни момента:

-увеличава вероятността за идентифициране на информация, която е полезна по същество, но не отговаря строго формално на заявката. За разлика от посредника, специалистът не е принуден да се придържа стриктно към формулировката на заявката. Самият той води диалог с търсачката, като променя тактиката на търсене в зависимост от получените резултати;

- формират се основите на научното мислене и уменията за изследователска работа. Специалистът се научава да навигира в мрежовото пространство, да избира от голям брой документи това, което наистина е необходимо и накрая да променя заявката си в зависимост от анализа на вече идентифицирани документи.

Потребителите обаче често не се чувстват доволни от резултатите от търсенето в нова информационна среда. Това обикновено се случва поради следните причини:

По правило потребителите използват или търсачки (AltaVista, HotBot), или директории с ресурси (Yahoo) като инструмент за търсене. Въпреки редица предимства, гореспоменатите търсачки не осигуряват научен контрол на качеството (т.е. процесът на включване на информация в базата данни на тези търсачки не е под контрола на експерти по темата), което може да доведе до ненадеждни информация, получена в резултат на търсенето;

-липса на знания и умения за съставяне на заявка към търсачка води до получаване на голямо количество информация шум;

- потребителят често не осъзнава факта, че въпреки факта, че информацията съществува в Интернет, тя е извън полезрението на търсачките. Липсата на основни познания за извършване на търсене води до намаляване на пълнотата на получената информация.

По този начин може да се твърди, че в Интернет има повече възможности, отколкото се използват в момента. И следователно проблемът не е липсата на качествена информация в интернет, а невъзможността на специалист да я намери.

В рамките на библиографските изследвания е натрупан, теоретично и методически обобщен богат исторически опит в търсенето и използването на информационни източници. Именно в библиографската наука се формира и сега целенасочено се развива специална научна дисциплина - библиографската евристика.

Библиографската евристика е една от най-важните и активно развиващи се части на общата наука за библиографията и библиографознанието. В съвременните условия на ускорение и усложняване на информационните процеси в обществото, на него се обръща специално внимание.

Под библиографска евристика се разбира библиографска дисциплина, която развива историята, теорията и методологията на търсенето на информация.

Категорията „информация“ включва и понятието „библиографска информация“, което е един от най-важните й компоненти. Това се обяснява с функционалната роля, т.е. социалната задача, която обществото решава чрез библиографска информация в процеса на производство, разпространение и използване на социална информация и знания.

Обективният характер на съществуването и използването на такава информация предопределя разнообразни задачи при нейното търсене. Като цяло, реалното разнообразие от такива задачи може да се сведе до три основни цели на извличане на информация:

- търсене на необходимата информация за източника и установяване на присъствието му в системата от други източници. Провежда се чрез търсене на библиографска информация и библиографски помагала (информационни издания), специално създадени за по-ефективно търсене и използване на информация (литература, книги);

-търсене на самите информационни източници (документи и публикации), които съдържат или могат да съдържат необходимата информация;

- търсене на фактическа информация, съдържаща се в литература, книги, например за исторически факти и събития, за техническите характеристики на машини и процеси, за свойствата на веществата и материалите, за биографични данни от живота и работата на писател, учен и т.н.

Тези цели определят и три основни типа извличане на информация: библиографско, документално и фактографско, които са тясно свързани помежду си.

Например, за да намерите източник на информация (документ или публикация), трябва да знаете определен набор от библиографска информация (факти), която го характеризира и отличава от много други: поне от тези, написани от същия автор, на същата тема, издадена от същото издателство, през същата година и т.н. Следователно първо трябва да направите библиографско търсене. И обратно, за да проведем фактологично търсене в която и да е област на знанието или практиката, първо трябва да намерим онези литературни източници (документи, публикации), които могат да съдържат интересни за нас факти. Следователно първо трябва да извършите библиографско и документално търсене.

Търсенето и използването на мощни потоци от информация става все по-трудно.

И за това библиографската евристика разполага с редица методи за търсене на информация: непрекъсната, селективна, интуитивна, типологична („рецепта“), индуктивна, дедуктивна, методът на библиографските препратки, методът на издигане от абстрактното към конкретното.

Нека ги разгледаме накратко.

И така, солиден метод. Това проучване е пълно и без пропуски, всички налични помощни средства и източници. Очевидно е, че в съвременните условия тази техника е трудно приложима дори за тясна тема. Поради това често се разглежда само като чисто теоретично.

Извадковият метод е по-рационален и реалистичен начин за търсене на информация, който се свежда до подбор и проучване на определен набор от източници.

Интуитивен метод. Отнася се до способността за намиране на необходимия материал чрез библиографски усет и дългогодишен опит.

Типологичен или метод на рецепта, когато използването на задачи за извличане на информация позволява за всяко конкретно извличане на информация да очертае конкретен път и документални средства (наръчници, източници) на решение, т.е. да предостави вид модел, рецепта за решаване тази задача за търсене. По този начин оптималният стандартен модел за разработване на различни „рецепти“ за извличане на информация е библиографското описание.

Индуктивен метод за търсене на информация. Процесът на познание с помощта на индукция протича от отделни преценки и факти до общи правила и обобщения, които изразяват общ модел.

Дедуктивен метод за извличане на информация. Обратната картина ще се развие, ако търсим по дедуктивния метод. Такава ориентация на мисълта може да възникне при изучаване на определена област от явления, създаване на подробна научна теория и др.

Метод за търсене на информация чрез библиографски препратки. Възможността за използването му се крие в самата природа на литературата, състояща се от определена връзка между факти, произведения, документи и публикации. Всяко ново литературно произведение е до известна степен анализ, оценка и обобщение на вече наличната в литературата социална информация. Специфична форма за отразяване на тази връзка и приемственост на литературното развитие е библиографската справка (бележка под линия).

Представените методи ви позволяват да намерите необходимата информация в традиционната информационна среда.

Но в наше време не по-малко, а в някои случаи много по-важни са методите и техниките за търсене на информация в новата информационна среда – Интернет.

Търсенето на информация може да се извърши чрез няколко метода, които се различават значително както по отношение на ефективността и качеството на търсенето, така и по вида на извличаната информация.

Нека разгледаме основните методи за търсене на информация в Интернет, използвани поотделно или в комбинация един с друг.

На първо място, това е използването на търсачките. В момента този метод е един от основните и всъщност единственият метод при извършване на предварително търсене. В резултат на търсенето ще се появи списък с интернет ресурси, които трябва да разгледате подробно.

Използването на търсачките се основава на използването на ключови думи, предадени на сървърите за търсене като аргументи за търсене.

Директното търсене с помощта на хипертекстови връзки също се счита за методи. Тъй като всички сайтове в световната мрежа всъщност са взаимосвързани, информацията може да се търси чрез последователно разглеждане на свързани страници с помощта на браузър.

На пръв поглед този напълно ръчен метод за търсене изглежда като пълен анахронизъм, в същото време този метод на уеб страници често се оказва единственият възможен в последните етапи на търсене на информация, когато механичното изследване отстъпва място на по- задълбочен анализ.

В същото време използването на каталози, класифицирани и тематични списъци и всякакъв вид справочници се отнася и за този тип търсене.

Търсенето със специални инструменти е напълно автоматизиран метод, който е много ефективен за извършване на първоначално търсене.

Същността на този метод се състои в използването на специализирани програми - паяци, които автоматично сканират уеб страници, търсейки необходимата информация за тях.

Тоест можем да говорим за опция за автоматизирано сърфиране с помощта на хипертекстови връзки (търсачките използват подобни методи).

Този метод е особено ефективен, ако използването на търсачките не дава необходимите резултати поради нестандартния характер на заявката или други причини.

Друг метод е анализът на нови ресурси, търсенето на които може да е необходимо при провеждане на повтарящи се цикли на търсене, търсене на най-новата информация или за анализиране на тенденциите в развитието на обекта на изследване във времето.

Друга причина за това търсене е, че повечето търсачки актуализират своите индекси със значително забавяне, причинено от огромните обеми данни, които се обработват, и този пропуск обикновено е по-голям, колкото по-малко популярна е темата, която ви интересува. Това съображение е много важно, когато извършвате търсене в силно специализирана предметна област.

Очевидно е, че търсенето на информация в Интернет се разглежда повече като процес на решаване на проблема с търсенето, пред който е изправен потребителят, а не като просто намиране на информация, подходяща за заявката.

Основните етапи на методологията на търсене са:

-формулиране и изясняване на искането за информация. На този етап има целенасочено ограничаване и конкретизиране на общата цел на търсенето;

-планиране на процедурата по търсене. Основната цел на този процес е да се определят начини и средства за рационално решаване на проблема с търсенето. Този етап включва разработването на стратегии за търсене, които отговарят на идентифицираните набори от изисквания;

- осъществяване на търсене. Окончателното решение на проблема с търсенето.

Техниката за търсене на информация включва няколко етапа.

Първият етап е формулиране и изясняване на искането за информация. Този етап традиционно играе водеща роля. Последващият избор на информационни ресурси ще зависи от това колко правилно е формулирана заявката. „Искане за разяснение“ в библиотечната практика е поредица от критерии или въпроси, необходими за изясняване на потребността на потребителя от информация. По време на интервюто се изяснява вида на източника, в който ще се търси, съдържанието на темата и дълбочината на ретроспективното търсене. На този етап е препоръчително:

-формулиране на заявка на естествен език;

- определяне на вида на информационната потребност;

- определяне на целта на търсене на информация;

- определяне на необходимите ограничения за търсене;

- окончателно формулиране на искането за информация.

Целта на стъпка 1 е да създадете представа за информацията, която търсите. За да получи тази идея, собственикът на информационната потребност трябва да я изрази възможно най-точно на естествен език.

Дори една доста груба представа за вида на информационната нужда ни позволява да изясним изискванията, определени от нея, които трябва да се вземат предвид при търсене. Традиционно се разграничават два вида информационни потребности: 1) когато най-добрата метаинформация (информация за информация) се признава за тази, която най-пълно и точно описва конкретната информационна потребност на даден потребител и позволява да се получи точен отговор. ; 2) когато границите не са ясно определени и могат също да се променят с времето.

Процесите на извличане на информация, с помощта на които се задоволяват информационни потребности от различни видове, като цяло се различават един от друг, поради което можем да говорим за различни видове извличане на информация. Търсенето на информация, което задоволява информационни нужди от първия тип, се нарича фактологично. За информационното търсене, задоволяващо нуждите от втория вид - като документално. Често обаче, за да намерите някои факти в Интернет, първо трябва да потърсите документи (уеб страници), съдържащи тези факти. В този случай може да се говори за документално фактологично издирване.

Следващата стъпка е да се определи целта на търсене на информация, което ни позволява да идентифицираме степента на необходимата пълнота на информацията, което също влияе върху избора на търсачки. Целите на извличането на информация традиционно са противоположни една на друга:

-предварително запознаване с проблема;

- задълбочено проучване на проблема.

По правило обичайната цел на търсенето на информация е някъде между тези две крайности, тоест потребителят се нуждае от известна информация, но не се нуждае от абсолютна пълнота на информацията.

Основните ограничения традиционно включват: ограничения за видове публикации, езици на публикациите, географски и хронологичен обхват на търсене. Следователно е необходимо ясно да се изясни:

- информация от кои източници интересува потребителя (статии, монографии, материали от конференции и др.);

-на какъв език;

-какъв е географският обхват на търсенето;

-какъв е хронологичният обхват на търсенето.

За финализиране на заявката за информация е необходимо да се извърши цялостен лексикален анализ на информацията, която ще се търси. Необходимо е да се получи от някакъв източник прецедент за подробно и компетентно описание на разглеждания въпрос. Такъв източник може да бъде както високоспециализиран справочник, така и обща енциклопедия. Въз основа на изучения материал е необходимо да се формулира възможно най-широк набор от ключови думи под формата на отделни термини, фрази, професионална лексика и клишета, ако е необходимо на няколко езика.

Основната цел на етапа на планиране на процедурата за търсене е да се определят начини и средства за рационално решаване на проблема с търсенето. Включва разработването на обща програма за търсене. В същото време се извършва подбор и оценка на качеството на търсачките и се извършва търсене на липсваща информация.

На този етап говорим за следните стъпки:

-подбор и оценка на качеството на търсачките;

-разработване на обща програма за търсене.

Изборът и оценката на качеството на търсачките трябва да се извършва от гледна точка на съответствието им с реалните информационни потребности и спецификата на заявката. Всеки потребител има специфични изисквания, които влияят върху избора на търсачка, нейното съдържание и възможности. Когато избирате търсачка, трябва да обърнете внимание на следните параметри: обем на индекса на търсачката, контрол на качеството на информацията, която съдържа, както и възможностите на езиците за заявки.

Разработването на обща програма за търсене се състои в идентифициране на обекти, методи и възможни посоки на търсене (маршрути) въз основа на идентифицирани ограничения на търсенето (тематични, хронологични, езикови, географски), както и степента на пълнота на търсенето.

Тактиките и инструментите за търсене могат да варират значително в зависимост не само от темата, но и от други параметри на заявката. Тук трябва да се ръководите от редица общи насоки.

Например естеството на търсенето се определя изцяло от съдържанието на поставената от потребителя задача за търсене. И в тази връзка е важно да се отбележи, че първоначално търсенето е, така да се каже, обвързано с темата и с целта за подробно, цялостно развитие на нейния план, когато е особено необходимо широко покритие на източниците на информация.

Следователно, първо има по-голямо търсене на информационни ресурси (тоест набори от документи). И едва тогава търсенето на информация се уточнява и ограничава до непосредственото съдържание на решавания проблем за търсене. На този етап преобладава търсенето на самите документи.

Разбира се, по време на целия процес на търсене, различните видове и методи на търсене трябва да се комбинират в две основни посоки: от една страна, от търсачки с обща класификация до предметно-специфични ресурсни индекси, след това до конкретни документи и фактите, които те съдържат; от друга страна, от уникални думи и фрази за заявка до локатори на ресурси по темата и/или конкретни документи.

Целта на последния етап е окончателното решение на задачата за търсене. Той също така включва създаване на инструментите, необходими за решаването му.

На този етап трябва да изпълните следните стъпки:

-избор на набор от информационни ресурси по темата за търсене;

-провеждане на търсене в информационни ресурси;

-оценка на пълнотата на информацията;

-разширяване на обхвата на информационните ресурси.

На етапа на избор на набор от информационни ресурси по темата за търсене се извършва търсене в набор от търсачки, избрани на етапа на планиране. Търсенето може да се извършва както от конкретно към общо, така и от общо към конкретно. В резултат на това се формира списък с информационни ресурси, които могат да съдържат информация по въпроса.

Списъкът с информационни ресурси е планиран по такъв начин, че ресурсите, допълващи се взаимно, да покриват максимално информацията по дадена тема в съответствие с предварително зададени ограничения за търсене. Ако кръгът им е твърде тесен, резултатите от търсенето може да са незадоволителни, а ако са твърде широки, усилията за търсене ще се увеличат.

На този етап е необходимо ясно да се определи какво се знае за търсената информация и какво е неизвестно, но трябва да се открие. Например, името на интересуващия ни информационен център може да е известно, но URL адресът му да е неизвестен. Следователно е необходимо да се генерира списък със заявки за намиране на липсващата информация. Този списък се генерира въз основа на идентифицирани ключови думи и налична информация за ресурси.

Препоръчително е да търсите липсващи връзки в описанието на ресурса (метаданни) с помощта на търсачки и метатърсачки. Въпреки това, ако нищо не се знае за ресурсите, които търсите, препоръчително е да се обърнете към търсачки за класификация или специализирани системи за търсене в речници. Ако потребителят не е експерт в тази област, той трябва да се свърже с търсачки за класификация с научен контрол на качеството (информационни портали).

При извършване на търсене се препоръчва използването на следните методи: метод на предположение, метод на търсене от общо към конкретно, метод на търсене от конкретно към общо. Методът на отгатване е, че след това можете да опитате да напишете името на желаната организация или нейното съкращение. Методът за търсене от общо към специфично обикновено се използва при извършване на търсения в търсачки за класификация. Тъй като търсенето в тях се извършва само по тематични категории и описания на ресурси, препоръчително е първоначално заявката да се разшири колкото е възможно повече. Методът за търсене от конкретно към общо обикновено се използва при извършване на търсения в търсачки с речници.

В резултат на това се формира списък с информационни ресурси. Тази стъпка ви позволява да създадете лична информационна система, насочена към решаване на конкретен проблем при търсене.

Когато извършвате търсене на документи, трябва да сте в състояние както да стесните, така и да разширите заявката си. По правило търсенето на информация, от която потребителят наистина се нуждае, е дейност, състояща се от няколко стъпки, по време на които потребителят формулира някои заявки, анализира получената извадка (резултатът от заявката), въз основа на анализа изяснява своите разбира структурата на базата данни и възможностите на търсачката на информационната система, неговите информационни нужди и формулира нова заявка (изяснява старата). И отново редува стъпки на вземане на проби и анализ, като постепенно прецизира заявката и се придвижва към целта.

Традиционно има две основни стратегии за търсене: търсене в индустрията и търсене по предмет. Те отразяват две противоположни тенденции в отношенията между науките и отраслите на знанието: диференциация на науките и тяхната интеграция. Стратегията за търсене в индустрията се извършва от общото към конкретното чрез разглеждане на йерархични класификатори, а стратегията за търсене по предмета се извършва от специфичното към общото чрез вземане на проби от данни според стойностите на дескриптори и ключови думи (т.е. данните се разглеждат от гледна точка на техните „предметни“ свойства).

Изборът на конкретна стратегия за търсене зависи от конкретната задача за търсене. Например, при равни други условия търсенето с ключови думи е за предпочитане пред търсенето с класификатор, толкова по-конкретна е заявката. Както при търсене на информационни ресурси, при търсене на документи е необходимо да се вземат предвид възможностите на езиците за заявки, предлагани от различни СУБД.

След идентифициране на някои от документите чрез търсене в основния кръг от информационни ресурси е препоръчително да се прегледа и оцени пълнотата на получената информация.

Потребителят не винаги се нуждае от цялата информация по посочената тема. Често всичко, от което се нуждае, са няколко уважавани източника.

На този етап се генерира списък с документи и се извършва проверка за дублиране. Въпреки това, ако пълнотата на получената информация е недостатъчна, трябва да се извърши допълнително търсене на информационни ресурси.

Когато извършвате търсене на информация в Интернет, при което пълнотата играе важна роля, трябва да запомните, че никоя търсачка не индексира всичко, което е в Интернет.

Можете да разширите списъка с информационни ресурси по следните начини:

- извършване на търсене в чужди системи за метатърсене, за да се идентифицират бази данни, посветени конкретно на търсената тема;

-търсене чрез хипертекстови връзки, преминаване от вече намерени документи;

-търсене в бази данни въз основа на URL структурата на вече намерени документи.

Използването на изследваните методи позволява на потребителя самостоятелно да търси информация в нова информационна среда. Това дава възможност не само да се подобри качеството на информацията, получена в резултат на търсене, но и да се увеличи нейната пълнота.

И в заключение, бих искал да обърна внимание и на някои съвети от участниците в Купата на Русия за търсене в Интернет:

1. Опитайте се да разберете смисъла на въпроса. Може би вече знаете отговора. За да намерите правилния адрес на страницата, потърсете както ключовите думи във въпроса, така и отговора, който знаете.

2. Броят на документите, получени в резултат на претърсване, може да бъде огромен. Следователно правилният набор от ключови думи е от решаващо значение за оптималното търсене на информация.

3. Проверете правописа на думите. Използвайте синоними, ако списъкът с намерени страници е твърде малък.

4. Търсете повече от една дума наведнъж. Стеснете търсенето си възможно най-много.

5. Използвайте настройките за търсене в търсачките, за да зададете удобни параметри за описанията на документите и структурата на страницата с резултати от търсенето.

Заключение

В изследването са представени и дискутирани въпроси от теорията, методите и методологията на библиографската и информационната евристика.

Очевидно е, че овладяването на основите на тази област е необходимо за формирането на професионалните звания и умения на всеки специалист.

Тъй като образованието на съвременния специалист трябва да гарантира не толкова неговите професионални умения и способности, а по-скоро способността за социална адаптация и конкурентоспособността на личността, информационната грамотност на специалиста е основата на неговата професионална компетентност и фактор за нейното развитие. развитие.

В процеса на търсене на информация трябва да се ръководите от редица общи методически препоръки.

Няма съмнение, че характерът на търсенето се определя изцяло от съдържанието на поставената задача. Формулирането на проблем за търсене ви позволява да определите областта и характеристиките на използваните източници и да улесните създаването на програма за търсене.

Първоначално търсенето е обвързано с темата и целта за подробно, цялостно развитие на нейния план, когато е особено необходимо широко покритие на източниците. След това търсенето на информация се конкретизира и ограничава до непосредственото съдържание на задачата.

В най-общ вид процесът на търсене на информация може да бъде разделен на етапи: формулиране на проблема за търсене, разработване на работеща програма за търсене, осъществяване на търсенето и обработка на резултатите от него.

И в заключение посочваме, че във всеки случай само със систематично и целенасочено обучение, знания и способност за рационално прилагане на система за търсене на информация, съвременният специалист може да бъде уверен в ефективността и качеството на своята работа.

Списък на източниците

1. Бородкин Л.И., Владимиров В.Н., Гарскова И.М. ABC на Интернет. Интернет адресиране. Търсене на информационни ресурси в мрежата. В тетрадката//Нова и най-нова история. 1999. № 1.

2. Брайчевски С.М. Съвременни информационни потоци: актуални проблеми//Научно-техническа информация. Сер.1. 2005. № 11.

3. Гречихин А.А. Библиографска евристика. - М.: 1984 г.

4. Комер Д. Принципи на интернет. Курс на обучение. - Санкт Петербург: 2002.

5. Кузнецов I.N. Информация: търсене, анализ, защита. - М.: 2004 г.

6. Ланде Д.В. Търсене на знания в Интернет. Професионална работа. - М.: 2005 г.

7. Паршукова Г.Б. Информационната грамотност като фактор за развитие на професионалната компетентност. Технологии на информационното общество - Интернет и съвременното общество: Сборник на VIII общоруска съвместна конференция (Санкт Петербург, 8-11 ноември 2005 г.). - Санкт Петербург: Филологически факултет на Санкт Петербургския държавен университет, 2005 г.

8. Прохоров А. Ефективно търсене в Интернет // Computer Press. 2006. № 2.

9. Степанов В.К. Библиографско търсене в Интернет//Библиография. 1998. № 1.

10. Талантов М. Професионално търсене в Интернет: планиране на процедурата за търсене // Computer-press. 1999. № 8.

11. Татарников О. Нови технологии за търсене в Интернет//КомпютърПрес. 2005. № 10.

12. Toffler B.E., Imber J. Речник на маркетинговите термини. - М.: 2000.

13. Яценко Н.Е. Тълковен речник на социалните термини. - Санкт Петербург: 1999.

Публикувано на Allbest.ru

Подобни документи

    Характеристики на търсене на информация в Интернет: стратегия и методология. Търсачки, каталози и портали на информационни ресурси. Подбор и въвеждане на ключови думи. Използвайки режима "разширено търсене", който има всяка една от интернет търсачките.

    резюме, добавено на 08/06/2014

    Концепция и принципи на работа, вътрешна структура и елементи, история на формирането и развитието на търсачката "Rambler". Проучване и анализ, както и оценка на ефективността на тази търсачка за търсене на икономическа информация в Интернет.

    курсова работа, добавена на 05/10/2015

    Изучаване на класификацията на инструментите за търсене според V.V. Дудихин. Намиране на информация с помощта на ресурси за търсене. Формиране на заявки. Използване на ключови думи. Индексиране на документи, хоствани на различни сървъри. Чуждестранни лидери на търсачките.

    презентация, добавена на 03/10/2015

    Характеристики на основните патентни бази данни, използвани при търсене на патентна информация в Интернет. Стратегия за търсене на патенти и системи за патентна класификация. Използване на логически оператори и ключови думи при търсене.

    презентация, добавена на 15.09.2011 г

    История на търсачките. Класификация на информационните системи по степен на автоматизация. Три основни начина за търсене на информация в Интернет. Разлика между търсачки и директории. Предназначение и видове информационни системи на държавни институции.

    курсова работа, добавена на 13.05.2015 г

    Техники за търсене на информация в Интернет. Търсене по известен адрес, потребителска конструкция на адреса. Специални системи за търсене на информация: класификация (рубикатори) и речници. Търсене на информационни ресурси в различни области.

    резюме, добавено на 03.04.2010 г

    Нарастването на количеството информация в света, увеличаването му в Интернет в геометрична прогресия. Броят на сайтовете, регистрирани в търсачката Yandex. Характеристики на ефективното търсене на информация в Интернет. Диаграма на информационния поток.

    презентация, добавена на 27.08.2013 г

    Характеристики на методите за търсене на информация в Интернет, а именно с помощта на хипертекстови връзки, търсачки и специални инструменти. Анализ на нови Интернет ресурси. История на появата и описание на западни и рускоезични търсачки.

    резюме, добавено на 05/12/2010

    Обосновка за избор на метод за извличане на ключови думи. Анализ на предметната област, проектиране на информационна система за търсене на релевантни документи. Изпълнение на заявки към цифрови библиотеки. Внедряване на системния интерфейс за търсене на релевантни документи.

    дисертация, добавена на 21.09.2016 г

    Световната мрежа е колекция от информационни ресурси, свързани чрез телекомуникации и базирани на хипертекстово представяне на данни. Търсене на информация в интернет. Посочване на областта за търсене чрез маркиране на ключови думи.

Видео урок: Как да създадете заявки в Microsoft Access за 10 минути

Лекция: Използване на инструменти за търсачки (формиране на заявки)

Най-важните функции при работа с бази данни са филтриране на информация, търсене и заявки.


Сортиранее процес на организиране на информация според определени критерии. Има възходящо и низходящо сортиране. Ако базата данни има цифрова информация, тогава класирането се използва като сортиране, а ако говорим за текстова информация, тогава се използва сортиране по азбучен ред.


Когато обмисляте сортиране по системи за управление на бази данни в MS Access, сортирането се извършва в рамките на едно поле. Ако се използва ново сортиране, предишните му резултати се губят. Ако сортирането е вложено, тогава можете да го извършите с помощта на заявка.


Филтър– това е подборът на необходимата за потребителя информация. Можете да зададете сложни условия за избор.

За да намерите някои данни, можете да използвате специални знаци, наречени маска:


* – означава, че можете да изберете произволен брой знаци.

? – вместо този знак може да има произволен символ, който може да се използва.

# – този символ може да бъде заменен с произволно число.

– всякакви знаци в скоби.

- – всеки символ, съответстващ на избрания диапазон.

! – всеки знак с изключение на тези, оградени в квадратни скоби.

Този символен филтър може да се използва за цялата таблица или за част от данните, вече избрани по определени критерии.

Заявка– тази функция е мащабна и може да включва както сортиране, така и филтриране. Тази функция ви позволява да избирате данни в няколко полета и таблици. Можете да създадете библиотека от заявки, които се запазват за бъдеща употреба. Има специален език за заявки SQL – структуриран.



Свързани публикации