телевизори. Конзоли. Проектори и аксесоари. Технологии. Цифрова телевизия

Технологии за търсене на информация в Интернет. Започнете в науката


След като изучите тази тема, ще научите и повторите:

За какво са сървърите за търсене?
- предназначение на основните части на сървърите за търсене;
- какви видове търсене на информация съществуват в Интернет;
- основни правила за формиране на заявка в търсачката Yandex.

Търсене по URL

Най-бързият и надежден начин за търсене на информация в Интернет е търсенето по URL. Много от тях са представени в печатни издания, специални справочници, чуват се по популярни радиостанции и телевизионни екрани.

♦ Феновете на футболния клуб Зенит знаят наизуст адреса www.fc-zenit.ru.
♦ Феновете на групата „Кралят и шутът“ са добре запознати с официалния уебсайт на тази група www.korol.spb.ru.
♦ Феновете на канала NTV могат лесно да намерят уебсайта му на адрес www.ntv.ru. За бърз достъп до горните ресурси, просто стартирайте програма за браузър, като Internet Explorer, и въведете познат URL адрес в адресната лента.

Търсачки

Има огромно количество документи, концентрирани в Интернет. За да се улесни намирането на необходимата информация, се създават специални търсачки.

Търсачки- това са автоматични системи, които анкетират сървъри, свързани към глобалната мрежа и съхраняват в тяхната база данни информация за данните, налични на сървърите. Въз основа на специално формулирана заявка, търсачките предоставят информация за това къде можете да получите необходимите данни.

Обикновено търсачките се състоят от три части: робот, програма за индексиране и обработка на заявки.

Робот (паяк, робот или бот)е програма, която посещава уеб страници и чете (изцяло или частично) тяхното съдържание. Роботите на търсачките се различават по своята индивидуална схема за анализ на съдържанието на уеб страница.
Индекс на търсачкатае хранилище на изображения за търсене на страници, посетени от роботи. Изображение за търсене на документ (включително уеб страница) е описание на съдържанието на документа на специален език за извличане на информация. Това описание съдържа кодове на ключови думи на документа, които отразяват неговия смисъл и съдържание. Индексите във всяка търсачка се различават по обема и начина на организиране на съхраняваната информация. Базите данни на водещите търсачки съхраняват информация за десетки милиони документи, а индексираните им обеми възлизат на стотици гигабайти. Индексите периодично се актуализират и допълват, така че резултатите от една търсачка с една и съща заявка може да се различават, ако търсенето е извършено по различно време.

Програма за обработка на заявкие програма, която в съответствие с искането на потребителя „преглежда“ индекса за наличие на необходимата информация и връща връзки към намерените документи. Наборът от връзки на изхода на системата се разпределя от програмата в низходящ ред на релевантност, тоест от най-голямата степен на съответствие на връзката към заявката до най-малката.

В момента най-популярните за руските интернет потребители са три големи търсачки от индексен тип:

Тези системи отчитат граматическите особености на руския език, така че техните резултати от търсене в рускоезични ресурси са с по-високо качество от тези на западните системи.

Търсачките се различават по обхвата на информационните ресурси:

♦ общите търсачки разполагат с база данни във всички области на знанието и се отличават с обширен индекс и голям обем натрупана информация;
♦ Търсачките със специално предназначение търсят само сайтове на конкретна тема, като музика или музеи.

Основните характеристики на търсачките са:

♦ обем документи в индекса;
♦ честота на актуализиране на информацията;
♦ информационното пространство, което роботът на търсачката покрива и разнообразието от видове документи, за които се събира информация;
♦ скорост на обработка на заявката;
♦ критерий за определяне на релевантността (съответствие на намерения документ със заявката за търсене);
♦ възможност за детайлизиране и изясняване на заявката.

Търсене по категория на търсачката

Директориите за търсене са систематична колекция (подбор) от връзки към други интернет ресурси. Връзките са организирани под формата на тематичен рубрикатор, който представлява йерархична структура, придвижвайки се по която можете да намерите необходимата информация.

Нека дадем за пример структурата на каталога за търсене в Интернет на Yandex. Това е директория с общо предназначение, тъй като съдържа връзки към интернет ресурси в почти всички възможни области. Следните теми са подчертани в този каталог:

♦ Бизнес и икономика;
♦ Директории и връзки;
♦ Общество и политика;
♦ Дом и семейство;
♦ Наука и образование;
♦ Развлечение и почивка;
♦ Компютри и комуникации;
♦ Култура и изкуство.

Всяка тема включва много подраздели, а те от своя страна съдържат заглавия и т.н.

Да предположим, че подготвяте събитие за Деня на победата и искате да намерите в интернет думите на известната военна песен на Булат Окуджава „Чуваш, че ботушите тракат“. Търсенето може да се организира по следния начин: Yandex Каталог Култура и изкуство Музика Авторска песен.

Този метод на търсене е доста бърз и ефективен. Накрая ви се предлагат само 5 връзки, сред които има връзки към сайтове с песни на известни бардове. Остава само да намерите архива с текстовете на песните на Б. Окуджава на сайта и да изберете желания текст от него.

Друг пример. Да предположим, че ще купувате мобилен телефон и искате да сравните характеристиките на устройства от различни компании. Търсенето може да се извърши по следните каталожни заглавия: Yandex Каталог Компютри и комуникации Мобилни комуникации Мобилни телефони.

След като получите ограничен брой връзки, можете бързо да ги видите и да изберете телефон, като разгледате характеристиките на компаниите и модификациите на устройствата.

Търсене по ключови думи

Повечето търсачки имат възможност да търсят по ключова дума. Това е един от най-често срещаните видове търсене. За да търсите по ключови думи, трябва да въведете думата или няколко думи, които искате да търсите, в специален прозорец и да кликнете върху бутона Търсене. Търсачката ще намери и покаже документи, съдържащи тези думи, в своята база данни. Може да има много такива документи, но много в случая не означава непременно добри.

Нека проведем няколко експеримента с някоя от търсачките. Да приемем, че решихме да създадем аквариум и се интересуваме от всякаква информация по тази тема.

На пръв поглед най-простото нещо е да потърсите думата „аквариум“. Нека проверим това, например, в търсачката Yandex. Резултатът от търсенето ще бъде повече от 460 000 страници на 3500 сайта - огромен брой връзки. Освен това, ако се вгледате по-отблизо, сред тях ще има сайтове, които споменават групата на Б. Гребенщиков „Аквариум“, търговски центрове и неформални асоциации със същото име и много други, които нямат нищо общо с аквариумните риби.

Не е трудно да се досетите, че подобно търсене не може да задоволи и най-непретенциозния потребител. Твърде много време ще трябва да отделим за избиране сред всички предложени документи на тези, които се отнасят до темата, от която се нуждаем, и още повече за запознаване с тяхното съдържание.

Веднага можем да заключим, че търсенето по една дума като правило е непрактично, тъй като с помощта на една дума е много трудно да се определи темата, на която е посветен документ, уеб страница или сайт. Изключение правят редки думи и термини, които почти никога не се използват извън своята тематична област.

Нека се опитаме да изясним условията за търсене и да въведем фразата „аквариумни риби“. Резултатът от търсенето ще бъде малко повече от 20 000 страници и около 650 сайта. Както можете да видите, броят на връзките е намалял с повече от 20 пъти. Този резултат ни подхожда повече, но все пак сред предложените връзки може да има например руски сувенирни комплекти от етикети за кибрит с изображения на риби и колекции от скрийнсейвъри за работния плот на компютъра и каталози на аквариумни риби със снимки и аксесоари за аквариум магазини.

Очевидно е, че трябва да продължим да вървим към изясняване на условията за търсене.

За да бъде търсенето по-продуктивно, всички търсачки имат специален език за заявки със собствен синтаксис. Тези езици са сходни по много начини. Доста е трудно да ги изучавате всички, но всяка търсачка има помощна система, която ще ви позволи да овладеете желания език.

Ето десет прости правила за формиране на заявка в търсачката Yandex.

1. Ключовите думи в заявката трябва да бъдат написани с малки (малки) букви. Това ще гарантира, че се търсят всички ключови думи, а не само тези, които започват с главна буква.

2. При търсене се вземат предвид всички форми на думата според правилата на руския език, независимо от формата на думата в заявката. Например, ако в заявката е посочена думата „знаем“, тогава думите „знаем“, „знаете“ и т.н. също ще отговарят на условието за търсене.

3. За да намерите стабилна фраза, трябва да оградите думите в кавички, например „порцеланови чинии“.

4. За да търсите по точна дума, трябва да поставите удивителен знак пред думата. Например, за да търсите думата „септември“ в родителен падеж, трябва да напишете „!Септември“.

5. За да търсите в едно изречение, думите в заявката се разделят с интервал или знак &: „приключенски роман“ или „приключенски роман“. Няколко думи, въведени в заявка, разделени с интервали, означават, че всички те трябва да бъдат включени в едно изречение на търсения документ.

6. Ако искате да бъдат избрани само онези документи, които съдържат всяка дума, посочена в заявката, поставете знак плюс „+“ пред всеки от тях. Ако, напротив, искате да изключите някоя дума от резултата от търсенето, поставете минус „-“ пред тази дума. Знаците “+” и “-” трябва да се пишат разделени с интервал от предходната и заедно със следващата дума. Например, заявката „Volga-car“ ще намери документи, които съдържат думата „Volga“, а не думата „автомобил“.

7. Когато търсите синоними или думи с подобно значение, можете да поставите вертикална лента „|“ между думите. Например, за заявката „дете | бебе | бебе" ще бъдат намерени документи с някоя от тези думи.

8. Вместо една дума в заявка, можете да замените цял израз. За да направите това, той трябва да бъде поставен в скоби, например „(дете | бебе | деца | бебе) + (грижи | образование).“

9. Знакът *~" (тилда) ви позволява да намирате документи с изречение, съдържащо първата дума, но не и втората. Например, заявката „книги ~ магазин“ ще намери всички документи, съдържащи думата „книги“, до която (в рамките на изречението) няма дума „магазин“.

10. Ако операторът се повтори веднъж (например & или ~), търсенето се извършва в рамките на изречението. Двойният оператор (&&, -) указва търсене в документ. Например, заявката „рак - астрология“ ще намери документи с думата „рак“, които не са свързани с астрологията.

Имайки определен набор от най-често срещаните термини в желаната област, можете да използвате разширено търсене. На фиг. Фигура 3.3 показва прозореца за разширено търсене в търсачката Yandex. В този режим възможностите на езика за заявки се реализират под формата на формуляр. Подобна услуга, включително филтри за речници, се предлага от почти всички търсачки.

Ориз. 3.3. Пример за разширено търсене в системата Yandex

При условие, че желаните и необходимите думи са избрани правилно и са изключени нежелани термини, такова търсене може да даде добри резултати.

Да се ​​върнем на примера с аквариумните рибки. След като прочетох няколко документа, предлагани от търсачката, става ясно, че търсенето на информация в интернет не трябва да започва с избора на аквариумни рибки. Аквариумът е сложна биологична система, чието създаване и поддържане изисква специални знания, време и сериозни инвестиции.

Въз основа на получената информация човек, който търси в Интернет, може радикално да промени стратегията за по-нататъшно търсене, като реши да проучи специализирана литература, свързана с разглеждания въпрос.

За търсене на литература или документи с пълен текст е възможна следната заявка:

“+(аквариум | акварист | аквариум хоби) + за начинаещи + (съвет | литература) + (статия | теза | пълен текст) - (цена | магазин | доставка | каталог).”

След обработка на заявката от търсачката се получи следният резултат: страници - 195, сайтове - минимум 43.

Както се вижда от статистиката на търсенето, резултатът е много успешен. Вече първите линкове водят до необходимите документи:

Поставяне на аквариум > Съвети за начинаещ акварист >
Статии > Aq uascope. ru
http://aquascope.ru/modules/wfsection/article.php?page=l&articleid=49 (32KB) - стриктно съответствие.
СЪВЕТ ЗА НАЧИНАЕЩИ АКВАРИУМИСТИ. Как да изберем и инсталираме аквариум, как...
http://www.aquariums.ru/sovna.htm (2KB) 23.07.2002 г. - нестриктно съответствие.

Сега можете да обобщите резултатите от търсенето, да направите определени заключения и да вземете решение за възможни действия:

♦ Спрете по-нататъшното търсене, тъй като поради различни причини не можете да поддържате аквариум.
♦ Прочетете предложените статии и започнете да настройвате аквариум.
♦ Потърсете материали за хамстери или вълнисти папагали.

Професионално търсене

Изследователите и специалистите ще трябва да подходят по-внимателно към организирането на търсенето. При професионално търсене на информация в Интернет трябва да бъдат изпълнени следните изисквания:

♦ висока скорост на търсене;
♦ достоверност на получената информация;
♦ пълно покритие на ресурсите при търсене.

Скорост. Скоростта на търсене зависи главно от два фактора: компетентно планиране на търсенето (избор на услуги и инструменти за търсене) и умения за работа с вече избран ресурс (способност за бързо разбиране на неговата структура и методи за навигация). Индексите за търсене не са достатъчни, за да осигурят скорост на търсене. В допълнение към тях в Интернет има редица ресурси за търсене, чието използване гарантира професионално търсене.

Достоверност. Въпросът за надеждността на информацията, получена от Интернет, е много важен, тъй като всеки може да публикува всякаква информация там, без да контролира нейното съответствие с реалността. Това от своя страна води до голям брой ненадеждни източници, като есета и курсови работи, които наводняват интернет.

Има специални услуги за търсене, които ви позволяват да оцените надеждността на източник на информация в Интернет.

Пълнота. Необходимо условие за успешно пълномащабно събиране на информация е познаването на основните типове ресурси, съществуващи днес и използването на различни услуги за търсене. Никоя търсачка не може да покрие всички интернет ресурси.

Като правило, за да постигне положителен резултат, потребителят трябва да прибегне до услугите на няколко търсачки. Можете да направите това сами, преминавайки от система към система, или можете да поверите тази работа на една от системите за метатърсене (meta е първият компонент на сложни думи, обозначаващи системи за описание и изследване на други системи).

Ориз. 3.4. Прозорци на метатърсачката

Метатърсачките нямат собствени бази данни за търсене и използват ресурсите на много други търсачки при търсене. Поради това вероятността да се намери необходимата информация е много висока. Работата в системите за метатърсене се извършва по същите правила като работата в търсачките. Това се дължи на факта, че метатърсачките са вид добавки към търсачките и използват техните индексни бази данни в работата си. Външният вид на метатърсачките наподобява външния вид на известните търсачки. На фиг. 3.4 показва прозорците на метатърсачките myweb.ru и metabot.ru.

Опитът показва, че в повечето случаи по-добри резултати се постигат при използване на няколко независими индекса за търсене, отколкото при използване на една метатърсачка.

Тестови въпроси и задачи

1. Каква е целта на програмата за браузър?

2. Какви програми за браузъри познавате?

3. Къде търсещият в мрежата може да намери URL адреси?

4. Каква е технологията за търсене с помощта на рубрикатора на търсачката?

5. Каква е технологията за търсене по ключови думи?

6. Какви изисквания трябва да се спазват при професионално търсене на информация в Интернет?

7. Кога в критериите за търсене трябва да се посочват знаци “+” или “-”?

8. Какви критерии за търсене в Yandex са посочени от следната фраза:

(бавачка | учител | гувернантка) ++ (грижи | образование | надзор).

9. Какво означава удвояването на знака (∼∼ или ++) при формиране на сложна заявка?

10. Какво е релевантност на търсенето?

11. Каква е целта на метатърсачките?

Технологии за търсене

Закони за триене и пренос на топлина и маса в турбулентен граничен слой

Има няколко вида представяне на „закона на триенето“ (за референтния случай), което води до почти идентични резултати. В съответствие с концепцията за „логаритмичен“ граничен слой (при стойността на първата турбулентна константа χ = 0,4) законът за триене за изключително развита турбулентност с „изчезващ вискозитет“ е добре приближен от простата формула на Карман:

За степенно представяне на профила на скоростта следва да се предложи следната формула:

Където: ; н– степенен показател на профила на скоростта;

– полуемпиричен коефициент;

А– емпиричен коефициент;

δ – дебелина на граничния слой.

Използване на отношения за числа на Рейнолдс, изградени върху различни линейни величини:

Важно е да се отбележи, че в случай на развитие на турбулентен граничен слой от предния ръб ( x cr = 0) законът на триенето също трябва да бъде представен във формата:

Стойностите на параметричните величини на представените формули за различни профили на скоростта са обобщени в таблицата

Параметър н
1/7 1/8 1/9 1/10
А 8,74 9,71 10,6 11,5
0,0975 0,089 0,0818 0,0757
1,28 1,25 1,22 1,20
м 0,250 0,222 0,200 0,182
б 0,0252 0,0206 0,0190 0,0148
m 1 0,200 0,182 0,167 0,154
Б 1 0,0576 0,0450 0,0362 0,0308

Други форми на представяне на закона на триенето също са известни и използвани, което води до практически същите резултати. Така V.M. Ievlev предложи приближение:

Формулите за законите на преноса на топлина и маса се получават от „законите на триенето“ за стандартни условия (референтен случай) с помощта на добре известния принцип на тройната аналогия на Рейнолдс.

Където: С– коефициент на корекция – коефициент на аналогия на Рейнолдс за несъответствие с условията на стандарта (и), коефициент Скато първо приближение, то се апроксимира задоволително от връзката:

Важно е да се отбележи, че в случай на използване на интегрални параметри, "законите" на преноса на топлина и маса са добре описани от зависимостите:

Уеб технологията World Wide Web (WWW) се счита за специална технология за подготовка и публикуване на документи в Интернет. WWW включва уеб страници, електронни библиотеки, каталози и дори виртуални музеи! При такова изобилие от информация възниква въпросът: „Как да се ориентираме в такова огромно и мащабно информационно пространство -“ Инструментите за търсене идват на помощ при решаването на този проблем.

Инструментите за търсене са специален софтуер, чиято основна цел е да осигури най-оптималното и висококачествено търсене на информация за интернет потребителите. Инструментите за търсене се хостват на специални уеб сървъри, всеки от които изпълнява специфична функция:

1. Анализ на уеб страници и въвеждане на резултатите от анализа на едно или друго ниво на базата данни на сървъра за търсене.

2. Търсене на информация по заявка на потребителя.

3. Осигуряване на удобен интерфейс за търсене на информация и преглед на резултатите от търсенето от потребителя.

Техниките на работа, използвани при работа с един или друг инструмент за търсене, са почти еднакви. Преди да ги обсъдим, нека разгледаме следните концепции:

1. Интерфейсът на инструмента за търсене е представен под формата на страница с хипервръзки, ред за заявка (ред за търсене) и инструменти за активиране на заявки.

2. Индекс на търсачката - информационна база, съдържаща резултат от анализ на уеб страници, съставен по определени правила.

3. Заявка - ключова дума или фраза, която потребителят въвежда в лентата за търсене. За формиране на различни заявки се използват специални знаци ("", ~) и математически символи (*, +, -).

Схемата за търсене на информация е проста. Потребителят въвежда ключова фраза и активира търсенето, като по този начин получава селекция от документи въз основа на формулираната (посочена) заявка. Този списък с документи е класиран според определени критерии, така че в горната част на списъка са тези документи, които най-точно отговарят на заявката на потребителя. Всеки от инструментите за търсене използва различни критерии за класиране на документи, както при анализиране на резултатите от търсенето, така и при създаване на индекс (попълване на индексна база данни от уеб страници).

Въпреки това, ако зададете заявка с еднакъв дизайн в лентата за търсене за всеки инструмент за търсене, можете да получите различни резултати от търсенето. За потребителя е от голямо значение кои документи ще се появят в първите две до три дузини документа в резултатите от търсенето и доколко тези документи отговарят на очакванията на потребителя.

Повечето инструменти за търсене предлагат два метода за търсене − просто търсене(просто търсене) и подробно търсене(разширено търсене) с или без специален формуляр за заявка. Нека разгледаме и двата вида търсене, използвайки примера на търсачка на английски език.

Например AltaVista е удобна за използване за произволни заявки, ʼʼНещо за онлайн дипломи по информационни технологииʼʼ, докато инструментът за търсене на Yahoo ви позволява да получавате новини от света, информация за обменни курсове или прогнози за времето.

Овладяването на критериите за прецизиране на заявките и усъвършенстваните техники за търсене ви позволява да увеличите ефективността на търсенето и бързо да намерите необходимата информация. На първо място, можете да увеличите ефективността на вашето търсене, като използвате логически оператори (операции) Or, And, Near, Not, математически и специални символи във вашите заявки. Използвайки оператори и/или символи, потребителят асоциира ключови думи в необходимата последователност, за да получи най-подходящия резултат от търсенето за заявката. Простата заявка не дава голям брой връзки към документи, т.к списъкът включва документи, съдържащи една от думите, въведени по време на заявката, или проста фраза (вижте таблица 1). Операторът and ви позволява да посочите, че всички ключови думи трябва да бъдат включени в съдържанието на документа. Броят на документите обаче все още трябва да е голям и прегледът им ще отнеме доста време. Поради тази причина в някои случаи е много по-удобно да се използва контекстният оператор near, който показва, че думите трябва да са разположени достатъчно близо в документа. Използването на близо значително намалява броя на намерените документи. Наличието на знака "*" в низа на заявката означава, че думата ще се търси по нейната маска. Например, ще получим списък с документи, съдържащи думи, започващи с „gov“, ако напишем „gov*“ в низа на заявката. Това са думите правителство, губернатор и др.

Най-развитата услуга за търсене на рускоезична информация се предоставя от сървъра за търсене Yandex. В Yandex можете просто да напишете фраза на руски, която описва това, което искате да намерите, и системата ще анализира и обработи вашата заявка, след което ще се опита да намери всичко, което е свързано с дадена тема. Използвайки специални оператори, можете да създадете низ, който обяснява на търсачката какви трябва да бъдат вашите изисквания за информацията, която ви интересува. Някои от операторите на езика за заявки на Yandex можете да видите тук: http://help.yandex.ru/search/ -id=481939

Не по-малко популярната търсачка Rambler поддържа статистика за трафика на връзки от собствената си база данни; същите логически оператори И, ИЛИ, НЕ, метасимволът * (подобен на знака * в AltaVista, който разширява обхвата на заявката), коефициент символи + и - се поддържат, за да увеличите или намалите значението на думите, въведени в заявката.

Нека да разгледаме най-популярните технологии за търсене на информация в Интернет.

Тема 3 Работа с интернет търсачки

Инструменти за търсене

Инструментите за търсене са специален софтуер, чиято основна цел е да осигури най-оптималното и висококачествено търсене на информация за интернет потребителите. Инструментите за търсене се хостват на специални уеб сървъри, всеки от които изпълнява специфична функция:

1. Анализ на уеб страници и въвеждане на резултатите от анализа на едно или друго ниво на базата данни на сървъра за търсене.

2. Търсене на информация по заявка на потребителя.

3. Осигуряване на удобен интерфейс за търсене на информация и преглед на резултата от търсенето от потребителя.

Техниките на работа, използвани при работа с един или друг инструмент за търсене, са почти еднакви. Преди да ги обсъдим, нека разгледаме следните концепции:

1. Интерфейсът на инструмента за търсене е представен под формата на страница с хипервръзки, ред за заявка (ред за търсене) и инструменти за активиране на заявки.

2. Индексът на търсачката е информационна база, съдържаща резултат от анализ на уеб страници, съставена по определени правила.

3. Заявката е ключова дума или фраза, която потребителят въвежда в лентата за търсене. За формиране на различни заявки се използват специални знаци ("", ~) и математически символи (*, +, ?).

Схемата за търсене на информация е проста. Потребителят въвежда ключова фраза и активира търсенето, като по този начин получава селекция от документи въз основа на формулираната (посочена) заявка. Този списък с документи е класиран според определени критерии, така че в горната част на списъка са тези документи, които най-точно отговарят на заявката на потребителя. Всеки от инструментите за търсене използва различни критерии за класиране на документи, както при анализиране на резултатите от търсенето, така и при създаване на индекс (попълване на индексна база данни от уеб страници).

По този начин, ако зададете заявка с еднакъв дизайн в лентата за търсене за всеки инструмент за търсене, можете да получите различни резултати от търсенето. За потребителя е от голямо значение кои документи ще се появят в първите две до три дузини документа в резултатите от търсенето и доколко тези документи отговарят на очакванията на потребителя.

Повечето инструменти за търсене предлагат два метода за търсене − просто търсене(просто търсене) и подробно търсене(разширено търсене) с или без специален формуляр за заявка. Нека разгледаме и двата вида търсене, използвайки примера на търсачка на английски език.

Например AltaVista е полезна за произволни заявки „Нещо за онлайн дипломи по информационни технологии“, докато инструментът за търсене на Yahoo ви позволява да получавате новини от света, информация за обменния курс или прогноза за времето.

Овладяването на критериите за прецизиране на заявките и усъвършенстваните техники за търсене ви позволява да увеличите ефективността на търсенето и бързо да намерите необходимата информация. На първо място, можете да увеличите ефективността на вашето търсене, като използвате логически оператори (операции) Or, And, Near, Not, математически и специални символи във вашите заявки. Използвайки оператори и/или символи, потребителят асоциира ключови думи в необходимата последователност, за да получи най-подходящия резултат от търсенето за заявката. Формулярите за заявки са показани в таблица 1.

маса 1

Една проста заявка дава определен брой връзки към документи, защото... списъкът включва документи, съдържащи една от думите, въведени по време на заявката, или проста фраза (вижте таблица 1). Операторът and ви позволява да посочите, че всички ключови думи трябва да бъдат включени в съдържанието на документа. Броят на документите обаче все още може да е голям и прегледът им ще отнеме доста време. Следователно в някои случаи е много по-удобно да се използва контекстният оператор near, което показва, че думите трябва да бъдат разположени достатъчно близо в документа. Използването на близо значително намалява броя на намерените документи. Наличието на знака "*" в низа на заявката означава, че думата ще се търси по нейната маска. Например, ще получим списък с документи, съдържащи думи, започващи с „gov“, ако напишем „gov*“ в низа на заявката. Това могат да бъдат думите правителство, губернатор и др.

Най-развитата услуга за търсене на рускоезична информация се предоставя от сървъра за търсене Yandex. В Yandex можете просто да напишете фраза на руски, която описва това, което искате да намерите, и системата ще анализира и обработи вашата заявка, след което ще се опита да намери всичко, което е свързано с дадена тема. Използвайки специални оператори, можете да създадете низ, който обяснява на търсачката какви трябва да бъдат вашите изисквания за информацията, която ви интересува.

Еднакво популярната търсачка Rambler поддържа статистика за трафика на връзки от собствената си база данни; същите логически оператори И, ИЛИ, НЕ, метасимволът * (подобен на знака * в AltaVista, който разширява обхвата на заявката), коефициентните символи + и - са поддържа се за увеличаване или намаляване на значимите думи, въведени в заявката.

Нека да разгледаме най-популярните технологии за търсене на информация в Интернет.

Видео урок: Как да създадете заявки в Microsoft Access за 10 минути

Лекция: Използване на инструменти за търсачки (формиране на заявки)

Най-важните функции при работа с бази данни са филтриране на информация, търсене и заявки.


Сортиранее процес на организиране на информация според определени критерии. Има възходящо и низходящо сортиране. Ако базата данни има цифрова информация, тогава класирането се използва като сортиране, а ако говорим за текстова информация, тогава се използва сортиране по азбучен ред.


Когато обмисляте сортиране по системи за управление на бази данни в MS Access, сортирането се извършва в рамките на едно поле. Ако се използва ново сортиране, предишните му резултати се губят. Ако сортирането е вложено, тогава можете да го извършите с помощта на заявка.


Филтър– това е подборът на необходимата за потребителя информация. Можете да зададете сложни условия за избор.

За да намерите някои данни, можете да използвате специални знаци, наречени маска:


* – означава, че можете да изберете произволен брой знаци.

? – вместо този знак може да има произволен символ, който може да се използва.

# – този символ може да бъде заменен с произволно число.

– всякакви знаци в скоби.

- – всеки символ, съответстващ на избрания диапазон.

! – всеки знак с изключение на тези, оградени в квадратни скоби.

Този символен филтър може да се използва за цялата таблица или за част от данните, вече избрани по определени критерии.

Заявка– тази функция е мащабна и може да включва както сортиране, така и филтриране. Тази функция ви позволява да избирате данни в няколко полета и таблици. Можете да създадете библиотека от заявки, които се запазват за бъдеща употреба. Има специален език за заявки SQL – структуриран.

Изпратете добрата си работа в базата знания е лесно. Използвайте формата по-долу

Студенти, докторанти, млади учени, които използват базата от знания в обучението и работата си, ще ви бъдат много благодарни.

Публикувано на http://www.allbest.ru/

Планирайте

  • Въведение
  • Търсене в директории
  • Технология за извличане на информация
    • Търсачки
    • Колекции от връзки
    • Адресни бази данни
  • Заключение
  • Библиография

Въведение

Днес Интернет свързва много различни мрежи, милиони компютри, около 300 милиона потребители на всички континенти и според различни оценки броят на тези потребители нараства с 15-80% годишно. Има две основни посоки при използването на Интернет в бизнеса. Това е бърз достъп до наистина огромни съкровища от информация по всяка тема (на стотици хиляди информационни сървъри), търсене и интерактивна комуникация с партньори в почти всяка специализация и географско местоположение. Как да се ориентираме в такова мащабно информационно пространство? За това има специализирани сървъри за търсене. Те могат да бъдат разделени на тематични директории, индексиращи роботи (търсачки) и системи за мета търсене.

информация каталог за търсене в интернет

Търсене в директории

Основната задача на интернет е да предоставя необходимата информация. За да намерите информацията, от която се нуждаете, трябва да знаете адреса на уеб страницата, на която се намира тази информация. Най-добре е да търсите необходимата информация в интернет с помощта на търсачки. Търсачката е специализиран уеб сайт. Търсачките се класифицират по методи на търсене.

Директориите за търсене са предназначени за търсене по тема. Те обикновено се изграждат на йерархичен принцип, т.е. Всяка стъпка на търсене включва избор на подсекция с по-конкретна тема от информацията, която търсите. На най-ниското ниво на търсене потребителят получава сравнително малък списък от връзки към информацията, която търси.

Директорията с интернет ресурси е постоянно актуализирана и разширявана йерархична директория, съдържаща много категории и отделни уеб сървъри с кратко описание на тяхното съдържание. Методът за търсене в каталога включва „движене надолу по стъпалата“, тоест преминаване от по-общи категории към по-специфични. Едно от предимствата на тематичните директории е, че обясненията за връзките са дадени от създателите на директорията и напълно отразяват нейното съдържание, тоест ви дава възможност да определите по-точно доколко съдържанието на сървъра отговаря на целта на вашия Търсене.

Пример за тематичен рускоезичен каталог е ресурсът http://www.ulitka.ru/.

На главната страница на този сайт има тематичен рубрикатор, с помощта на който потребителят се намира в категория с връзки към продукти, които го интересуват. В допълнение, някои тематични директории ви позволяват да търсите по ключови думи. Потребителят въвежда необходимата ключова дума в лентата за търсене и получава списък с връзки с описания на сайтове, които най-точно отговарят на неговата заявка. Заслужава да се отбележи, че това търсене не се извършва в съдържанието на WWW сървърите, а в техните кратки описания, съхранени в директорията.

Тематичният каталог е признат за най-популярен в целия свят Yahoo!(http://www.yahoo.com). Това е огромна база данни от URL адреси за уебсайтове на голямо разнообразие от теми. Yahoo!ви кани да използвате йерархично дърво, когато търсите информация. Тези. Първо избирате обща тема, която отговаря на искането за информация, и след това я уточнявате, следвайки указанията на каталога. Като краен резултат получавате списък със сайтове, съдържащи информация, която отговаря на вашето запитване. На Yahoo!можете да отидете и в другата посока. Анализирайте очакваното съдържание на исканата информация и изберете ключови думи, които със сигурност ще се появят в материалите, които ви интересуват, или в техните заглавия. Въведете тези думи, разделени с интервал в реда за въвеждане на главната страница Yahoo!и натиснете Enter. Системата ще се опита да избере информацията, която ви интересува. защото Yahoo!Тъй като системата е английска, е доста удобно да използвате интернет преводач, като напр "Сократов интернет"(http://www.arsenal.ru).

Ако търсите информация, която очевидно е руска, тогава има смисъл да използвате руски и местни беларуски каталози. Принципът на работа с тях е идентичен с този, който разгледахме в примера с Yahoo!. Тук си струва да се отбележи първият руски каталог Русия в мрежата(http://www.ru), един от най-големите рускоезични каталози List.RU(http://www.list.ru/), руска версия Yahoo!(http://www.yahoo.ru). Има и каталог "Съзвездие Интернет"съдържащи само избрани (декларирани като най-интересни) ресурси. Сред беларуските каталози си струва да се отбележи нашият национален Yahoo!(http://unclesam.hypermart.net), нов бързо развиващ се услуга 09(http://www.09.open.by), сървър Унибел(http://www.unibel.by) и малка база данни без възможност за търсене Данни(http://www.data.minsk.by). Говорейки за бази данни, не може да не си спомним прекрасния руски проект Интернет жълти страници(http://www.piter-press.ru/yp), където, както в книгата със същото име, е представена подробна информация за различни интернет ресурси.

Бизнесът също ще се нуждае от бизнес каталози и каталози на стоки и услуги. Може би най-големият каталог на компании от ОНД е Partner (http://trifle.net/cis).

Технология за извличане на информация

Интернет се разраства с невероятни темпове и намирането на необходимата информация за конкретен потребител не е много лесно. Но е възможно, тъй като в Интернет има ресурси, които ще помогнат както на начинаещите, така и на професионалистите да не се удавят в океана от информация.

Появата на World Wide Web се ​​превърна в количествен и качествен скок в областта на информационните технологии. Броят на новите ресурси и количеството информация, която те съдържат, расте лавинообразно, броят на игличките в информационната „купа сено“ и съответно размерът на самата нея се увеличават. За търсене на информация в Интернет са налични следните видове ресурси:

- информационни портали;

- каталози на интернет ресурси;

- търсачки.

Самият интернет постепенно се превърна в масмедия с огромна аудитория от потребители по целия свят и невероятно количество информация. Тя се превърна в глобално средство за информация, оплитайки цялото земно кълбо с комуникационни канали, но не погълна медиите, с които сме свикнали, те органично се присъединиха към мрежата като независими информационни ресурси. Почти всеки вестник, радиостанция или телевизионен канал във всяка страна по света има собствено представителство в Интернет.

Електронната версия на вестник може и като правило се различава значително от хартиената версия, като значително я надвишава по обем - форматът на данните, публикувани в интернет сайтове, е по-гъвкав, не се ограничава до страници, разпределени колони за вестници и списания за материала. Появява се елемент на интерактивност - читателите могат да оставят своите коментари и отзиви за прочетената статия, новина или аналитичен преглед.

Някои периодични издания, например TIMES, дори са дигитализирали архивите на вестника за целия период на неговото съществуване, включително годините, когато не е имало компютри или компютърни мрежи, въпреки че търсенето в такива архиви е платено и доста скъпо.

Най-авторитетният и професионален източник на оперативна информация за интернет потребителите и медиите са уеб ресурсите на информационните агенции. Притежавайки широка кореспондентска мрежа, те ежедневно и ежечасно разпространяват обществено-политическа, икономическа, научна и финансова информация в Интернет и по електронни комуникационни канали.

Инструменти за търсене

Инструментите за търсене са специален софтуер, чиято основна цел е да осигури най-оптималното и висококачествено търсене на информация за интернет потребителите. Инструментите за търсене се хостват на специални уеб сървъри, всеки от които изпълнява специфична функция:

1. Анализ на уеб страници и въвеждане на резултатите от анализа на едно или друго ниво на базата данни на сървъра за търсене.

2. Търсене на информация по заявка на потребителя.

3. Осигуряване на удобен интерфейс за търсене на информация и преглед на резултата от търсенето от потребителя.

Техниките на работа, използвани при работа с един или друг инструмент за търсене, са почти еднакви. Преди да ги обсъдим, нека разгледаме следните концепции:

1. Интерфейсът на инструмента за търсене е представен под формата на страница с хипервръзки, ред за заявка (ред за търсене) и инструменти за активиране на заявки.

2. Индексът на търсачката е информационна база, съдържаща резултат от анализ на уеб страници, съставена по определени правила.

3. Заявката е ключова дума или фраза, която потребителят въвежда в лентата за търсене. За формиране на различни заявки се използват специални знаци ("", |, ~) и математически символи (*, +, ?).

Схемата за търсене на информация е проста. Потребителят въвежда ключова фраза и активира търсенето, като по този начин получава селекция от документи въз основа на формулираната (посочена) заявка. Този списък с документи е класиран според определени критерии, така че в горната част на списъка са тези документи, които най-точно отговарят на заявката на потребителя. Всеки от инструментите за търсене използва различни критерии за класиране на документи, както при анализиране на резултатите от търсенето, така и при създаване на индекс (попълване на индексна база данни от уеб страници).

По този начин, ако зададете заявка с еднакъв дизайн в лентата за търсене за всеки инструмент за търсене, можете да получите различни резултати от търсенето. За потребителя е от голямо значение кои документи ще се появят в първите две до три дузини документа в резултатите от търсенето и доколко тези документи отговарят на очакванията на потребителя.

Повечето инструменти за търсене предлагат два метода за търсене - просто търсене(просто търсене) и подробно търсене(разширено търсене) с или без специален формуляр за заявка. Нека разгледаме и двата вида търсене, използвайки примера на търсачка на английски език.

Например AltaVista е полезна за произволни заявки „Нещо за онлайн дипломи по информационни технологии“, докато инструментът за търсене на Yahoo ви позволява да получавате новини от света, информация за обменния курс или прогноза за времето.

Овладяването на критериите за прецизиране на заявките и усъвършенстваните техники за търсене ви позволява да увеличите ефективността на търсенето и бързо да намерите необходимата информация. На първо място, можете да увеличите ефективността на вашето търсене, като използвате логически оператори (операции) Or, And, Near, Not, математически и специални символи във вашите заявки. Използвайки оператори и/или символи, потребителят асоциира ключови думи в необходимата последователност, за да получи най-подходящия резултат от търсенето за заявката.

Една проста заявка дава определен брой връзки към документи, защото... списъкът включва документи, съдържащи една от думите, въведени по време на заявката, или проста фраза (вижте таблица 1). Операторът and ви позволява да посочите, че всички ключови думи трябва да бъдат включени в съдържанието на документа. Броят на документите обаче все още може да е голям и прегледът им ще отнеме доста време. Следователно в някои случаи е много по-удобно да се използва контекстният оператор near, което показва, че думите трябва да бъдат разположени достатъчно близо в документа. Използването на близо значително намалява броя на намерените документи. Наличието на знака "*" в низа на заявката означава, че думата ще се търси по нейната маска. Например, ще получим списък с документи, съдържащи думи, започващи с „gov“, ако напишем „gov*“ в низа на заявката. Това могат да бъдат думите правителство, губернатор и др.

Най-развитата услуга за търсене на рускоезична информация се предоставя от сървъра за търсене Yandex. В Yandex можете просто да напишете фраза на руски, която описва това, което искате да намерите, и системата ще анализира и обработи вашата заявка, след което ще се опита да намери всичко, което е свързано с дадена тема. Използвайки специални оператори, можете да създадете низ, който обяснява на търсачката какви трябва да бъдат вашите изисквания за информацията, която ви интересува.

Еднакво популярната търсачка Rambler поддържа статистика за трафика на връзки от собствената си база данни; същите логически оператори И, ИЛИ, НЕ, метасимволът * (подобен на знака * в AltaVista, който разширява обхвата на заявката), коефициентните символи + и - са поддържа се за увеличаване или намаляване на значимите думи, въведени в заявката.

Повечетопопулярни технологии за търсене на информация в интернет.

Търсачки

Уеб търсачките са сървъри с огромна база данни от URL адреси, които автоматично осъществяват достъп до WWW страници на всички тези адреси, изследват съдържанието на тези страници, формират и записват ключови думи от страниците в своята база данни (индексират страниците).

Освен това роботите на търсачките следват връзки, намерени на страници, и ги индексират повторно. Тъй като почти всяка WWW страница има много връзки към други страници, с такава работа търсачката може теоретично да обходи всички сайтове в Интернет като краен резултат.

Този тип инструменти за търсене са най-известните и популярни сред всички интернет потребители. Всеки е чувал имената на добре познати уеб търсачки (търсачки) - Yandex, Rambler, Aport.

За да използвате този тип инструмент за търсене, трябва да отидете до него и да въведете ключовата дума, която ви интересува, в лентата за търсене. След това ще получите резултати от връзки, съхранени в базата данни на търсачката, които са най-близки до вашата заявка. За да направите търсенето си по-ефективно, обърнете внимание предварително на следните точки:

· вземете решение относно темата на заявката. Какво точно искате да намерите в крайна сметка?

· обърнете внимание на езика, граматиката, използването на различни небуквални символи, морфология. Също така е важно правилно да формулирате и въведете ключови думи. Всяка търсачка има своя собствена форма на конструиране на заявка - принципът е един и същ, но използваните символи или оператори може да се различават. Необходимите формуляри за заявки също варират в зависимост от сложността на софтуера на търсачката и услугите, които предоставят. По един или друг начин всяка търсачка има раздел „Помощ“, където всички правила за синтаксис, както и препоръки и съвети за търсене са ясно обяснени (екранна снимка на страниците на търсачката).

· използване на възможностите на различни търсачки. Ако не го намерите в Yandex, опитайте в Google. Използвайте услуги за разширено търсене.

· За да изключите документи, съдържащи определени термини, използвайте знак "-" преди всяка такава дума. Например, ако имате нужда от информация за произведенията на Шекспир, с изключение на "Хамлет", въведете заявка във формата: "Шекспир-Хамлет". И за да сте сигурни, че определени връзки са включени в резултатите от търсенето, използвайте символа „+“. Така че, за да намерите връзки за продажбата на автомобили конкретно, имате нужда от заявката „продажба + кола“. За да увеличите ефективността и точността на вашето търсене, използвайте комбинации от тези символи.

· всяка връзка в списъка с резултати от търсенето съдържа фрагмент - няколко реда от намерения документ, сред които се появяват вашите ключови думи. Преди да щракнете върху връзката, оценете уместността на фрагмента спрямо темата на заявката. След като следвате връзка към определен сайт, внимателно погледнете главната страница. По правило първата страница е достатъчна, за да разберете дали сте попаднали на правилния адрес или не. Ако да, извършете допълнителни търсения за необходимата информация на избрания сайт (в раздели на сайта); ако не, върнете се към резултатите от търсенето и опитайте следващата връзка.

· не забравяйте, че търсачките не произвеждат собствена информация (с изключение на обяснения за себе си). Търсачката е само посредник между собственика на информацията (сайта) и вас. Базите данни непрекъснато се актуализират, към тях се добавят нови адреси, но изоставането от информацията, която реално съществува в света, все още остава. Просто защото търсачките не работят със скоростта на светлината.

Най-известните уеб търсачки включват Google, Yahoo, Alta Vista, Excite, Hot Bot, Lycos. Сред рускоезичните може да се подчертае Yandex, Rambler, Aport.

Търсачките са най-големите и ценни, но далеч не единствените източници на информация в Интернет.

Колекции от връзки

Колекциите от връзки са връзки, сортирани по теми. Те са доста различни един от друг по съдържание, така че за да намерите селекция, която най-добре отговаря на вашите интереси, трябва сами да ги прегледате, за да си съставите собствено мнение.

База данни с адреси

Базите данни с адреси са специални сървъри за търсене, които обикновено използват класификации по вид дейност, по предлагани продукти и услуги и по география. Понякога те се допълват с търсене по азбучен ред. Записите в базата данни съхраняват информация за сайтове, които предоставят информация за имейл, организация и пощенски адрес срещу заплащане.

Най-голямата англоезична адресна база данни може да се нарече: http://www.lookup.com/ - това е категорийна директория с много поддиректории, като например: Find Person, Phone Numbers, Name Search и други.

Веднъж в тези поддиректории, потребителят намира връзки към сайтове, които предлагат информация, която го интересува.

Заключение

Разгледахме основните технологии за търсене на информация в Интернет и представихме в общи линии инструментите за търсене, които в момента съществуват в Интернет, както и структурата на заявките за търсене за най-популярните рускоезични и англоезични търсачки и, обобщавайки гореизложеното, бихме искали да отбележим, че няма единна оптимална схема Няма търсене на информация в Интернет. В зависимост от спецификата на информацията, от която се нуждаете, можете да използвате подходящите инструменти и услуги за търсене. И качеството на резултатите от търсенето зависи от това колко добре са избрани услугите за търсене.

За да обобщим, можем да кажем, че няма една единствена оптимална схема за търсене в Интернет. В зависимост от конкретната информация, от която се нуждаете, трябва да използвате подходящи услуги за търсене, за да я намерите. По принцип, разбира се, винаги можете да използвате една търсачка, например Rambler, но колкото по-компетентно са избрани услугите за търсене и е съставена заявката за търсене на информация, толкова по-добри ще бъдат резултатите от търсенето. А в бизнеса качеството на информацията играе важна роля.

Библиография

1. Барабанов С. Интранет: стъпка по стъпка // Компютърна преса. - 1997. - № 6. - с.148-154.

2. Барабанов С. и др.. Компютърни системи: вчера, днес, утре // Computer pres. - 2007. - № 2. - С. 152-158.

3. Интернет - ресурси.

Публикувано на Allbest.ru

Подобни документи

    Характеристики на търсене на информация в Интернет: стратегия и методология. Търсачки, каталози и портали на информационни ресурси. Подбор и въвеждане на ключови думи. Използвайки режима "разширено търсене", който има всяка една от интернет търсачките.

    резюме, добавено на 08/06/2014

    Инструменти за търсене на информация в Интернет. Основни изисквания и методи за извличане на информация. Структура и характеристики на услугите за търсене. Глобални търсачки WWW (World Wide Web). Планиране на търсене и събиране на информация в Интернет.

    резюме, добавено на 11/02/2010

    Информационната революция, която обществото преживява в момента. Извършване на структурен анализ на документи. Търсете аналогова информация в системните области. Търсене на информация чрез интернет. Видове ресурси за търсене: каталози и роботи за търсене.

    курсова работа, добавена на 16.12.2012 г

    Характеристика на методите за търсене на информация в Интернет, а именно с помощта на хипертекстови връзки, търсачки и специални инструменти. Анализ на нови интернет ресурси. История на появата и описание на западни и рускоезични търсачки.

    резюме, добавено на 05/12/2010

    Интернет и неговите възможности. Често срещан и евтин начин за свързване с интернет. Схема за предаване на информация по TCP/IP протокола. Характеристики на адреси от различни класове. Търсачки, начини за търсене и изтегляне на информация в глобалната мрежа.

    курсова работа, добавена на 25.09.2013 г

    Основни протоколи, използвани в Интернет. Инструменти за търсене в Интернет. Популярни търсачки. Как работят търсачките. Инструменти за търсене и структуриране. Автоматизирана уеб навигация. Критерии за качество на работата на търсачката.

    резюме, добавено на 14.02.2012 г

    Предистория на появата на интернет. Уеб страници, сайтове, портали. Основни интернет ресурси: местоположение и съдържание. Библиотеки, вестници, списания и други информационни ресурси. Търсачки, каталози, архиви. Комуникация през интернет.

    курсова работа, добавена на 05/09/2012

    Теоретични основи на интернет технологиите и основните интернет услуги. Запознаване с възможностите за свързване с интернет. Основни мрежови услуги. Принципи на търсене на информация в WWW. Преглед на съвременните интернет браузъри. Програми за онлайн комуникация.

    курсова работа, добавена на 18.06.2010 г

    Лесно търсене на информация в системата Google.ru, нейните технологии и функции. История на термина и неговото приложение. Изберете думи за търсене, автоматично изключете общи думи. Калкулатор и конвертиране на валута. Свързани страници и проверка на правописа.

    резюме, добавено на 21.02.2011 г

    Търсене на информация в Интернет: стратегия и методология. Световни и руски каталози и търсачки: принципи на работа, предимства и недостатъци. Аналитичен преглед на открити документи по темата "Отчитане на средства, документи и преводи в движение".



Свързани публикации