телевизори. Конзоли. Проектори и аксесоари. Технологии. Цифрова телевизия

Технологии за търсене на информация в Интернет. провеждайте търсене с помощта на хипертекстови връзки, движейки се от вече намерени документи. Дедуктивен метод за извличане на информация. Обратната картина ще се развие, ако търсим по дедуктивния метод. Такава загуба

1. Въведение

Всяка година обемът на Интернет се увеличава значително, така че вероятността за намиране необходимата информациянараства рязко. Интернет свързва милиони компютри, много различни мрежи, а броят на потребителите се увеличава с 15-80% годишно. И все пак все по-често при достъпа до интернет основният проблем не е липсата на информацията, която търсите, а възможността да я намерите. По правило обикновеният човек поради различни обстоятелства не може или не иска да прекара повече от 15-20 минути в търсене на отговора, от който се нуждае. Затова е особено важно правилно и компетентно да научите едно на пръв поглед просто нещо – къде и как да търсите, за да получите ЖЕЛАНИТЕ отговори.

За да намерите необходимата информация, трябва да намерите нейния адрес. За тази цел съществуват специализирани сървъри за търсене (индексни роботи (търсачки), тематични интернет директории, системи за мета-търсене, услуги за търсене на хора и др.). Този майсторски клас разкрива основните технологии за търсене на информация в Интернет, предоставя общи характеристики на инструментите за търсене и разглежда структурите на заявките за търсене за най-популярните рускоезични и англоезични търсачки.

2. Технологии за търсене

Уеб технологията World Wide Web (WWW) се счита за специална технология за подготовка и публикуване на документи в Интернет. WWW включва уеб страници, електронни библиотеки, каталози и дори виртуални музеи! При такова изобилие от информация възниква въпросът: „Как да се ориентираме в такова огромно и мащабно информационно пространство?“
Инструментите за търсене идват на помощ при решаването на този проблем.

2.1 Инструменти за търсене

Инструментите за търсене са специални софтуер, чиято основна цел е да осигури най-оптималното и висококачествено търсене на информация за интернет потребителите. Инструментите за търсене се хостват на специални уеб сървъри, всеки от които изпълнява специфична функция:

  1. Анализ на уеб страници и записване на резултатите от анализа на едно или друго ниво на базата данни на сървъра за търсене.
  2. Търсене на информация по заявка на потребител.
  3. Осигуряване на удобен интерфейс за потребителя за търсене на информация и преглед на резултатите от търсенето.

Техниките на работа, използвани при работа с един или друг инструмент за търсене, са почти еднакви. Преди да ги обсъдим, нека разгледаме следните концепции:

  1. Интерфейсът на инструмента за търсене е представен под формата на страница с хипервръзки, ред за заявка (ред за търсене) и инструменти за активиране на заявки.
  2. Индексът на търсачката е информационна база, съдържаща резултат от анализ на уеб страници, съставена по определени правила.
  3. Заявката е ключова дума или фраза, която потребителят въвежда в лентата за търсене. За формиране на различни заявки се използват специални знаци ("", ~) и математически символи (*, +, ?).

Схемата за търсене на информация в интернет е проста. Потребителят въвежда ключова фраза и активира търсенето, като по този начин получава селекция от документи въз основа на формулираната (посочена) заявка. Този списък с документи е класиран според определени критерии, така че в горната част на списъка са тези документи, които най-точно отговарят на заявката на потребителя. Всеки от инструментите за търсене използва различни критерии за класиране на документи, както при анализиране на резултатите от търсенето, така и при създаване на индекс (попълване на индексна база данни от уеб страници).

По този начин, ако зададете заявка с еднакъв дизайн в лентата за търсене за всеки инструмент за търсене, можете да получите различни резултати от търсенето. За потребителя има голямо значение, кои документи ще се появят в първите две до три дузини документа в резултатите от търсенето и доколко тези документи отговарят на очакванията на потребителя.

Повечето инструменти за търсене предлагат два метода за търсене − просто търсене(просто търсене) и подробно търсене(разширено търсене) с или без специален формуляр за заявка. Нека разгледаме и двата вида търсене, като използваме примера на търсачка на английски език.

Например AltaVista е удобна за използване произволни искания, „Нещо за онлайн дипломите по информационни технологии“, докато инструментът за търсене на Yahoo ви позволява да получавате световни новини, информация за обменните курсове или прогнози за времето.

Овладяването на критериите за прецизиране на заявките и усъвършенстваните техники за търсене ви позволява да увеличите ефективността на търсенето и бързо да намерите необходимата информация. На първо място, можете да увеличите ефективността на вашето търсене, като използвате логически оператори (операции) Or, And, Near, Not, математически и специални символи. Използвайки оператори и/или символи, потребителят асоциира ключови думи в необходимата последователност, за да получи най-подходящия резултат от търсенето за заявката. Формулярите за заявки са показани в таблица 1.

маса 1

Една проста заявка дава определен брой връзки към документи, защото... списъкът включва документи, съдържащи една от думите, въведени по време на заявката, или проста фраза (вижте таблица 1). Операторът and ви позволява да посочите, че всички ключови думи трябва да бъдат включени в съдържанието на документа. Броят на документите обаче все още може да е голям и прегледът им ще отнеме доста време. Следователно в някои случаи е много по-удобно да се използва контекстният оператор near, което показва, че думите трябва да бъдат разположени достатъчно близо в документа. Използването на близо значително намалява броя на намерените документи. Наличието на знака "*" в низа на заявката означава, че думата ще се търси по нейната маска. Например, ще получим списък с документи, съдържащи думи, започващи с „gov“, ако напишем „gov*“ в низа на заявката. Това могат да бъдат думите правителство, губернатор и др.

Еднакво популярната търсачка Rambler поддържа статистика за трафика на връзки от собствената си база данни; същите логически оператори И, ИЛИ, НЕ, метасимволът * (подобен на знака * в AltaVista, който разширява обхвата на заявката), коефициентните символи + и - са поддържа се за увеличаване или намаляване на значимите думи, въведени в заявката.

Нека да разгледаме най-популярните технологии за търсене на информация в Интернет.

2.2 Търсачки

Уеб търсачките са сървъри с огромна база URL данни, които автоматично осъществяват достъп до WWW страници на всички тези адреси, разглеждат съдържанието на тези страници, формират и въвеждат ключови думи от страниците в тяхната база данни (индексират страниците).

Освен това роботите на търсачките следват връзки, намерени на страници, и ги индексират повторно. Тъй като почти всяка WWW страница има много връзки към други страници, когато подобна работатърсачката теоретично може да обходи всички сайтове в интернет като краен резултат.

Този тип инструменти за търсене са най-известните и популярни сред всички интернет потребители. Всеки е чувал имената на добре познати уеб търсачки (търсачки) - Yandex, Rambler, Aport.

За да използвате този тип инструмент за търсене, трябва да отидете до него и да въведете ключовата дума, която ви интересува, в лентата за търсене. След това ще получите резултати от връзки, съхранени в базата данни на търсачката, които са най-близки до вашата заявка. За да направите търсенето си по-ефективно, обърнете внимание предварително на следните точки:

  • вземете решение за темата на заявката. Какво точно искате да намерите в крайна сметка?
  • обърнете внимание на езика, граматиката, използването на различни небуквални символи, морфология.Важно е и правилното формулиране и въвеждане на ключови думи. Всяка търсачка има своя собствена форма на конструиране на заявка - принципът е един и същ, но използваните символи или оператори може да се различават. Необходимите формуляри за заявки също варират в зависимост от сложността на софтуера на търсачката и услугите, които предоставят. По един или друг начин всяка търсачка има раздел „Помощ“, където всички правила за синтаксис, както и препоръки и съвети за търсене са ясно обяснени (екранна снимка на страниците на търсачката).
  • използвайте възможностите на различни търсачки. Ако не го намерите в Yandex, опитайте в Google. Използвайте услуги за разширено търсене.
  • За да изключите документи, съдържащи определени термини, използвайте знак "-" преди всяка такава дума. Например, ако имате нужда от информация за произведенията на Шекспир, с изключение на "Хамлет", въведете заявка във формата: "Шекспир-Хамлет". И за да сте сигурни, че определени връзки са включени в резултатите от търсенето, използвайте символа „+“. Така че, за да намерите връзки за продажбата на автомобили конкретно, имате нужда от заявката „продажба + кола“. За да увеличите ефективността и точността на вашето търсене, използвайте комбинации от тези символи.
  • Всяка връзка в списъка с резултати от търсенето съдържа няколко реда от намерения документ, сред които се появяват вашите ключови думи. Преди да щракнете върху връзката, оценете уместността на фрагмента спрямо темата на заявката. След като следвате връзка към определен сайт, внимателно погледнете главната страница. По правило първата страница е достатъчна, за да разберете дали сте попаднали на правилния адрес или не. Ако да, извършете допълнителни търсения за необходимата информация на избрания сайт (в раздели на сайта); ако не, върнете се към резултатите от търсенето и опитайте следващата връзка.
  • Не забравяйте, че търсачките не произвеждат собствена информация (с изключение на обяснения за себе си). Търсачката е само посредник между собственика на информацията (сайта) и вас. Базите данни непрекъснато се актуализират, към тях се добавят нови адреси, но изоставането от информацията, която реално съществува в света, все още остава. Просто защото търсачките не работят със скоростта на светлината.

Най-известните уеб търсачки включват Google, Yahoo, Alta Vista, Excite, Hot Bot, Lycos. Сред рускоезичните може да се подчертае Yandex, Rambler, Aport.

Търсачките са най-големите и ценни, но далеч не са единствените източници на информация в интернет, защото освен тях има и други начини за търсене в интернет.

2.3 Справочници

Каталогът на интернет ресурсите е постоянно актуализиран и разширен йерархичен каталог, съдържащ много категории и отделни уеб сървъри с кратко описание на тяхното съдържание.Методът за търсене в каталога включва „движене надолу по стъпалата“, тоест преминаване от по-общи категории към по- конкретни такива. Едно от предимствата на тематичните директории е, че обясненията за връзките са дадени от създателите на директорията и напълно отразяват нейното съдържание, тоест ви дава възможност да определите по-точно доколко съдържанието на сървъра отговаря на целта на вашия Търсене.

Пример за тематичен рускоезичен каталог е ресурсът http://www.ulitka.ru/.

На начална страницаТози сайт съдържа тематичен рубрикатор,

с помощта на които потребителят попада в раздел с връзки към интересуващи го продукти.

В допълнение, някои тематични директории ви позволяват да търсите по ключови думи. Потребителят въвежда желаната ключова дума в лентата за търсене

и получава списък с връзки с описания на сайтове, които най-точно отговарят на заявката му. Заслужава да се отбележи, че това търсене не се случва в съдържанието на WWW сървърите, а в техните Кратко описание, съхранявани в указателя.

В нашия пример каталогът има и възможност за сортиране на сайтове по брой посещения, по азбучен ред и по дата на влизане.

Други примери за рускоезични директории:
Каталог@Mail.ru
Уеб списък
Vsego.ru
Сред англоезичните каталози можем да подчертаем:
http://www.DMOS.org
http://www.yahoo.com/
http://www.looksmart.com

2.4 Колекции от връзки

Колекциите от връзки са връзки, сортирани по теми. Те са доста различни един от друг по съдържание, така че за да намерите селекция, която най-добре отговаря на вашите интереси, трябва сами да ги прегледате, за да си съставите собствено мнение.

Като пример, нека вземем селекция от връзки "Интернет съкровища" на JSC "Relcom"

Потребителят кликва върху някоя от секциите, които го интересуват

  • СЪДЪРЖАНИЕ

    Автомобилистите

    • Астрономия и астрология
    • Твоят дом
    • Вашите домашни любимци
    • Децата са цветята на живота
    • свободно време
    • Градове в Интернет
    • Здраве и медицина
    • Информационни агенции и услуги
    • Местен исторически музей и др.
    • Автомобилна електроника.
    • Музей на античните автомобили.
    • Колегия по правна защита на собствениците на автомобили.
    • Спортно шофиране.

    Предимството на този тип инструменти за търсене е тяхната насоченост; обикновено изборът включва редки интернет ресурси, избрани от конкретен уеб администратор или собственик на интернет страница.

    2.5 База данни с адреси

    Базите данни с адреси са специални сървъри за търсене, които обикновено използват класификации по вид дейност, по предлагани продукти и услуги и по география. Понякога те се допълват с търсене по азбучен ред. Записите в базата данни съхраняват информация за сайтове, които предоставят информация за имейл адрес, организации и пощенски адрессрещу такса.

    Най-голямата адресна база данни на английски език е: http://www.lookup.com/ -

    Веднъж в тези поддиректории, потребителят намира връзки към сайтове, които предлагат информация, която го интересува.

    Не знаем за широко достъпни и официални бази данни с адреси в Руската федерация.

    2.6 Търсене в архиви на Gopher

    Gopher е взаимосвързана система от сървъри (Gopher пространство), разпространени в Интернет.

    Пространството Gopher съдържа богата литературна библиотека, но материалите не са достъпни за разглеждане отдалечен режим: Потребителят може само да преглежда йерархично организираното съдържание и да избира файл по име. Като се използва специална програма(Вероника) такова търсене може да се извърши автоматично с помощта на изградени заявки ключови думио

    До 1995 г. Gopher беше най-динамичната интернет технология: темпът на растеж на броя на съответните сървъри изпревари темпа на растеж на сървърите на всички други видове Интернет. Gopher сървърите не получиха активно развитие в мрежата EUnet/Relcom и днес почти никой не си спомня за тях.

    2.7 FTP система за търсене

    Инструментът за търсене на FTP файлове е специален тип инструмент за търсене в Интернет, който ви позволява да намирате налични файлове на „анонимни“ FTP сървъри. FTP протоколът е предназначен за прехвърляне на файлове по мрежа и в този смисъл функционално е своеобразен аналог на Gopher.

    Основният критерий за търсене е посоченото име на файл различни начини(точно съвпадение, подниз, регулярен изрази т.н.). Този видтърсенето, разбира се, не може да се конкурира по възможности с търсачки, тъй като съдържанието на файловете не се взема предвид по никакъв начин по време на търсенето и, както знаете, на файловете могат да се дават произволни имена. Въпреки това, ако трябва да намерите добре позната програма или стандартно описание, тогава най-вероятно файлът, който я съдържа, ще има подходящото име и можете да го намерите с помощта на един от FTP сървърите за търсене:

    FileSearch търси файлове на FTP сървъри въз основа на имената на самите файлове и директории. Ако търсите някаква програма или нещо друго, тогава на WWW сървърите най-вероятно ще намерите тяхното описание, а от FTP сървърите можете да ги изтеглите на себе си.

    2.8 Система за търсене в Usenet Новинарски конференции

    USENET NEWS е система за телеконференции за интернет общността. На Запад тази услуга обикновено се нарича новини. Близък аналог на телеконференциите са така наречените „ехо“ в мрежата FIDO.

    От гледна точка на абонат на дискусионна група, USENET е табло за обяви със секции, където можете да намерите статии за всичко - от политика до градинарство. Това табло за обяви е достъпно чрез компютър, подобно на имейл. Без да напускате компютъра си, можете да четете или публикувате статии в определена конференция, намерете полезен съветили участвайте в дискусии. Естествено, статиите заемат място в компютрите, така че не се съхраняват завинаги, а периодично се унищожават, за да се освободи място за нови. В световен мащаб най-доброто обслужванеза търсене на информация в конференции на Usenet е сървър на GoogleГрупи (Google Inc.).

    Google Групи е безплатна онлайн общност и услуга за дискусионни групи, която предлага най-големия в Интернет архив от съобщения в Usenet (над един милиард съобщения). За повече информация относно условията за използване на услугата посетете http://groups.google.com/intl/ bg /googlegroups/tour/index.html

    Сред рускоезичните се открояват сървърът на USENET World System и телеконференциите Relcom. Точно както при други услуги за търсене, потребителят въвежда низ за заявка и сървърът генерира списък с конференции, съдържащ ключови думи. След това трябва да се абонирате за избрани конференции в новинарската програма. Има и подобен руски сървър FidoNet Online: Fido конференции на WWW.

    2.9 Мета търсачки

    За бързо търсенеВ базите данни на няколко търсачки наведнъж е по-добре да се обърнете към системи за мета-търсене.

    Мета търсачките са търсачки, които изпращат вашата заявка до огромен брой различни търсачки, след което обработват резултатите, премахват дублиращи се адреси на ресурси и представят още широк обхваттова, което е представено в интернет.

    Най-популярната мета търсачка в света е Search.com.

    Обединената търсачка Search.com на CNET, Inc включва почти две дузини търсачки, връзките към които са пълни с връзки в целия Интернет.

    Въпреки това, използвайки този тип инструменти за търсене, потребителят може да търси информация в различни търсачки отрицателна странаТези системи могат да бъдат наречени тяхната нестабилност.

    2.10 Системи за търсене на хора

    Системите за търсене на хора са специални сървъри, които ви позволяват да търсите хора в Интернет, като потребителят може да посочи пълното им име. човек и вземете адреса му електронна пощаи URL. Все пак трябва да се отбележи, че търсачките за хора получават информация за имейл адреси предимно от публични източници като форумите на Usenet. Сред най-известните системи за търсене на хора са:

    Търсене на имейл адреси

    В специални колони за търсене с информация за контакт (Име. Град, Фамилия, Телефонен номер) можете да намерите информацията, която ви интересува.

    Системите за търсене на хора са наистина големи сървъри; техните бази данни съдържат около 6 000 000 адреса.

    3. Заключение

    Разгледахме основните технологии за търсене на информация в Интернет и представихме в общи линии инструментите за търсене, които в момента съществуват в Интернет, както и структурата на заявките за търсене за най-популярните рускоезични и англоезични търсачки и, обобщавайки гореизложеното, бихме искали да отбележим, че няма единна оптимална схема Няма търсене на информация в Интернет. В зависимост от спецификата на информацията, от която се нуждаете, можете да използвате подходящите инструменти и услуги за търсене. И качеството на резултатите от търсенето зависи от това колко добре са избрани услугите за търсене.

  • Лекция 4. Средства за извличане на информация

    Постоянното актуализиране на информационния масив, съчетано с увеличаване на обема на данните, прави изключително трудно отчитането на съществуващите документи и съответно търсенето, което може да се раздели на:

    • търсене на факти:в енциклопедии, справочници, речници,
    • библиографско търсене:библиотеки, каталози, програми.
    • документално търсене: електронни документи, електронни библиотеки, електронни дневници.

    Важността на проблема за извличане на информация доведе до формирането на цяла индустрия, чиято задача е именно да подпомага потребителя при навигация в киберпространството. Тази индустрия се състои от специалниуслуги за търсенеили услуги. Те традиционно се разделят на:

    • указатели или каталози
    • търсачки

    Тези сортове са визуално много сходни, защото„всяка директория има своя собствена търсачка и всяка търсачка има своя собствена директория“. Принципите на тяхната работа обаче се основават на напълно различни подходи и технологии. Освен това всеки сорт услуги за търсенеизползвани при решаването на определен тип проблеми. Извличането на информация включва използването на определени стратегии, методи, механизми и средства. Поведението на потребителя, който управлява процеса на търсене, се определя не само от информационната потребност, но и от инструменталното разнообразие на системата - технологиите и инструментите, предоставени от системата. Изборът на инструмент до голяма степен се определястратегия за търсене и технологии за търсене.

    Технологии за търсене- унифицирани (оптимизирани в рамките на конкретна система за търсене на информация) последователности за ефективно използване на отделни инструменти за търсене в процеса на взаимодействие на потребителя със системата.

    По използвани технологии за търсенеИнформационните системи могат да бъдат разделени на 3 категории:

    • тематични каталози и специализирани каталози (онлайн указатели);
    • търсачки (пълнотекстово търсене);
    • инструменти за мета търсене.

    Предметни каталозиосигуряват обработка на документи и тяхното причисляване към една от няколко категории, чийто списък е предварително определен. Всъщност това е познато на всички библиотекарииндексиране, базирано на класификация. Специализирани каталозиили справочници са създадени за конкретни отрасли и теми.Търсачки(най-модерният инструмент за търсене в Интернет) прилагат технология за пълнотекстово търсене. Текстовете, разположени на заявените сървъри, се индексират.При използване на средстваметатърсене заявката се изпълнява едновременно от няколко търсачки. Резултатът от търсенето се комбинира в общ списък, подреден по уместност.

    Инструменти за търсене - взаимозависим комплекс от езици за извличане на информация и езици за дефиниране/управление на данни, осигуряващи структурни и семантични трансформации на обработващи обекти (документи, речници, набори от резултати от търсене).

    1. Справочници

    Средствата за търсене от първата група са електронни указатели, които имат ясна йерархична систематична или логико-тематична структура,подобно на структурата на систематичен библиотечен каталог. Работата със справочници ви позволява да навигирате в интернет ресурси в рамките на отделни клонове на знанието, навлизайки по-дълбоко от общото към специфичното, променяйки йерархичните клонове, връщайки се няколко стъпки назад и т.н.

    Сред руските разработки в тази област са:

    • Апорт (адрес: www.aport.ru),
    • List.ru (адрес: list.mail.ru),
    • Weblist (адрес: www.weblist.ru),
    • Иван Сусанин (адрес: www.susanin.net)
    • Охлюв (адрес: www.ulitka.ru).

    У дома отличителна чертасправочници е, че се правят на ръка. Редакционните колегии на всеки от справочниците, коитоестеството на работата наподобява отделите за каталогизация и систематизация на големите библиотеки, редовно преглеждайте съдържанието на новопоявилите се сървъри и наблюдавайте промените на съществуващите. Идентифицираните данни се анализират и въвеждат в раздели на справочника в съответствие с приетата класификация. Описанието на сървъра като цяло (или раздел, ако изглежда като напълно независим блок) е снабдено с кратка анотация, съдържаща обща информация за естеството на наличната информация. В някои случаи се въвежда допълнителна информация за езика на документите, трафика на ресурса, физическото му местоположение и др.

    Основните параметри, характеризиращи предимствата на справочниците са:

    • сила на звука;
    • ефективност на отразяване на нови или променени ресурси;
    • последователност и последователност на йерархичната класификационна схема;
    • кръстосана структура.

    Обемът на указателя се определя от степента на неговата надеждност или „информационна сила". В някои системи има специален механизъм, който периодично проверява наличността на даден сайт и го изключва от списъка, ако той „отсъства“ в интернет за дълго време. Логическият (научен) характер на използваната класификационна схема определя степента на лекота, с която потребителите намират необходимата информация. Системакръстосани препраткиви позволява да идентифицирате информация, като използвате различни подходи (например териториални или секторни). В този случай класификационната схема трябва автоматично да води потребителя до желания обект, независимо кой път за търсене е избран.

    Възможността за съставяне на заявка за този тип инструменти за търсене не играе специална роля. Сложни търсения, които изискват подробна заявка, не се извършват с каталози.

    Директориите са предназначени да решаваттри вида задачи:

    • ориентация в непознат клон на знанието;
    • търсене на големи обекти, като например сървъри на организации или значими проекти;
    • получаване на готов списък с ресурси, които имат замъглено изображение за търсене (библиотеки от определен тип, транспортни разписания или уебсайтове на политически партии и др.)

    Друг пример е сравнение на директория с ресурси със систематичен библиотечен каталог, в който остават само описание и анотация на книга (в този случай цял уебсайт).

    2. Търсачки

    Основата на работата на търсачките ( търсачки) са заложени съвсем различни технологични принципи. Задачата на търсачките е да предоставят подробно търсене на информация, което може да се постигне само чрез счетоводство (индексиране ) съдържание на максималния възможен брой уеб страници. За разлика от директориите, търсачките работят в автоматизиран режим и имат единен принцип на работа.

    Търсачките имат два основни компонента. Първият компонент епрограма за роботи , чиято задача е да се движи от сървър на сървър и да намира там нови (или променени) документи, като ги изтегля на главния компютър на системата. Роботът сканира съдържанието на документа, намира нови връзки, както към други документи на сървъра, така и към външни сайтове. След това програмата самостоятелно следва посочените връзки, намира нови документи, след което процесът се повтаря отново,напомня на „метода на снежната топка“, добре познат в библиографията. Идентифицираните документи се обработват (индексират) от втория компонент на търсачката. В този случай по правило се взема предвид цялото съдържание на страницата, включително текст, илюстрации, аудио и видео файлове. Всички думи в документа са индексирани, което дава възможност да се използват търсачките за детайлно търсене по най-тесните теми. Образованиндексни файлове , съхраняващи информация за това коя ключова дума е използвана, колко пъти, в кой документ и на кой сървър, съставляват базата данни, до която има достъп библиотекарят, който въвежда комбинации от ключови думи в низа на заявката.

    Резултатите се извеждат с помощта на специален модул, който произвеждаинтелигентно класиране на резултатите . В този случай се взема предвид следното:

    • местоположение на термина в документа (заглавие, заглавие, основен текст), честота на неговото повторение,
    • процент на думата за търсене към текста на страницата,
    • номер и авторитет външни връзкиНа тази страницаот други сайтове.

    ДА СЕ основни параметри на търсачкитеотнасям се:

    • брой индексирани сървъри и индивидуални документи(обем на индексни файлове);
    • степента на ефективност на актуализиране на базата данни чрез включване на информация за нови материали и премахване на остарели;
    • възможности за заявка;
    • интелигентност на системата за класиране на резултатите от търсенето;
    • наличието на допълнителни сервизни функции, които улесняват работата на потребителя.

    Способността на търсачката да изрази възможно най-точно дадена заявка до голяма степен определя качеството на получените резултати. Всяка машина има свой собствен речник, който позволява детайлизиране по различни начини.спецификация за търсене.

    Всички търсачки иматмодул за класиране на резултатите от търсенето. Това е вторият основен компонент на всички системи. Списъкът от фактори, които се вземат предвид при определяне на мястото на даден документ в списъка с връзки, е необичайно широк: от местоположението на думата на страницата до рейтинга (авторитета) на страниците, които имат връзки към намерения документ.

    • Google (адрес: www.google.com),
    • AlltheWeb (адрес: www.alltheweb.com),
    • Alta Vista (адрес: www.altavista.com).

    Подобни инструменти за търсене съществуват в Русия. Всички те са проектирани да работят с рускоезични документи и имат мощни функции http://www.metabot.ru).

    Заключения по темата на лекционния блок

    Търсачката избира страници от базата данни в съответствие със заявката, след което страниците се подреждат в низходящ ред на съвпадения (бележка от A.A.)

    В този случай е налице пряка аналогия с принципите на работа на разпределените библиотечни каталози. Ключова възможностмета търсене е възможността за изпращане на потребителски заявки едновременно до различни търсачки - с последващо сумиране на резултатите. (бележка на A.A.)

    Когато се обръща към справочници, библиотекарят може да очаква да получи само много Главна информацияпо тема и никога подробни данни: от сървър на голяма корпорация, съдържащ хиляди страници, директорията ще съдържа само името и няколко реда анотация.

    Изпратете добрата си работа в базата знания е лесно. Използвайте формата по-долу

    Добра работакъм сайта">

    Студенти, докторанти, млади учени, които използват базата от знания в обучението и работата си, ще ви бъдат много благодарни.

    Публикувано на http://www.allbest.ru/

    Планирайте

    • Въведение
    • Търсене в директории
    • Технология за извличане на информация
      • Търсачки
      • Колекции от връзки
      • Адресни бази данни
    • Заключение
    • Библиография

    Въведение

    Днес Интернет свързва много различни мрежи, милиони компютри, около 300 милиона потребители на всички континенти и според различни оценки броят на тези потребители нараства с 15-80% годишно. Има две основни посоки при използването на Интернет в бизнеса. Това е бърз достъп до наистина огромни съкровища от информация по всяка тема (на стотици хиляди информационни сървъри), търсене и интерактивна комуникация с партньори в почти всяка специализация и географско местоположение. Как да се ориентираме в такова мащабно информационно пространство? За това има специализирани сървъри за търсене. Те могат да бъдат разделени на тематични директории, индексиращи роботи (търсачки) и системи за мета търсене.

    информация каталог за търсене в интернет

    Търсене в директории

    Основната задача на интернет е да предоставя необходимата информация. За да намерите информацията, от която се нуждаете, трябва да знаете адреса на уеб страницата, на която се намира тази информация. Най-добре е да търсите необходимата информация в интернет с помощта на търсачки. Търсачката е специализиран уеб сайт. Търсачките се класифицират по методи на търсене.

    Директориите за търсене са предназначени за търсене по тема. Те обикновено се изграждат на йерархичен принцип, т.е. Всяка стъпка на търсене включва избор на подсекция с по-конкретна тема от информацията, която търсите. На най-ниското ниво на търсене потребителят получава сравнително малък списък от връзки към информацията, която търси.

    Директорията с интернет ресурси е постоянно актуализирана и разширявана йерархична директория, съдържаща много категории и отделни уеб сървъри с кратко описание на тяхното съдържание. Методът за търсене в каталога включва „движене надолу по стъпалата“, тоест преминаване от по-общи категории към по-специфични. Едно от предимствата на тематичните директории е, че обясненията за връзките са дадени от създателите на директорията и напълно отразяват нейното съдържание, тоест ви дава възможност да определите по-точно доколко съдържанието на сървъра отговаря на целта на вашия Търсене.

    Пример за тематичен рускоезичен каталог е ресурсът http://www.ulitka.ru/.

    На главната страница на този сайт има тематичен рубрикатор, с помощта на който потребителят се намира в категория с връзки към продукти, които го интересуват. В допълнение, някои тематични директории ви позволяват да търсите по ключови думи. Потребителят въвежда необходимата ключова дума в лентата за търсене и получава списък с връзки с описания на сайтове, които най-точно отговарят на неговата заявка. Заслужава да се отбележи, че това търсене не се извършва в съдържанието на WWW сървърите, а в техните кратки описания, съхранени в директорията.

    Тематичният каталог е признат за най-популярен в целия свят Yahoo!(http://www.yahoo.com). Това е огромна база данни от URL адреси за уебсайтове на голямо разнообразие от теми. Yahoo!ви кани да използвате йерархично дърво, когато търсите информация. Тези. Първо избирате обща тема, която отговаря на искането за информация, и след това я уточнявате, следвайки указанията на каталога. Като краен резултат получавате списък със сайтове, съдържащи информация, която отговаря на вашето запитване. На Yahoo!можете да отидете и в другата посока. Анализирайте очакваното съдържание на исканата информация и изберете ключови думи, които със сигурност ще се появят в материалите, които ви интересуват, или в техните заглавия. Въведете тези думи, разделени с интервал в реда за въвеждане на главната страница Yahoo!и натиснете Enter. Системата ще се опита да избере информацията, която ви интересува. защото Yahoo!Тъй като системата е английска, е доста удобно да използвате интернет преводач, като напр "Сократов интернет"(http://www.arsenal.ru).

    Ако търсите информация, която очевидно е руска, тогава има смисъл да използвате руски и местни беларуски каталози. Принципът на работа с тях е идентичен с този, който разгледахме в примера с Yahoo!. Тук си струва да се отбележи първият руски каталог Русия в мрежата(http://www.ru), един от най-големите рускоезични каталози List.RU(http://www.list.ru/), руска версия Yahoo!(http://www.yahoo.ru). Има и каталог "Съзвездие Интернет"съдържащи само избрани (декларирани като най-интересни) ресурси. Сред беларуските каталози си струва да се отбележи нашият национален Yahoo!(http://unclesam.hypermart.net), нов бързо развиващ се услуга 09(http://www.09.open.by), сървър Унибел(http://www.unibel.by) и малка база данни без възможност за търсене Данни(http://www.data.minsk.by). Говорейки за бази данни, не може да не си припомним прекрасния руски проект Интернет жълти страници(http://www.piter-press.ru/yp), където, както и в едноименната книга, е представен подробна информацияза различни интернет ресурси.

    Бизнесът също ще се нуждае от бизнес каталози и каталози на стоки и услуги. Може би най-големият каталог на компании от ОНД е Partner (http://trifle.net/cis).

    Технология за извличане на информация

    Интернет се разраства с гигантски темповеи намирането на необходимата информация за конкретен потребител не е много лесно. Но е възможно, тъй като в Интернет има ресурси, които ще помогнат както на начинаещите, така и на професионалистите да не се удавят в океана от информация.

    Появата на World Wide Web беше количествен и качествен скок в тази област информационни технологии. Броят на новите ресурси и количеството информация, която те съдържат, расте лавинообразно, броят на игличките в информационната „купа сено“ и съответно размерът на самата нея се увеличават. За търсене на информация в Интернет са налични следните видове ресурси:

    - информационни портали;

    - каталози на интернет ресурси;

    - търсачки.

    Самият интернет постепенно се превърна в масмедия с огромна аудитория от потребители по целия свят и невероятно количество информация. Тя се превърна в глобално средство за информация, оплитайки цялото земно кълбо с комуникационни канали, но не пое медиите, с които сме свикнали; те органично се присъединиха към мрежата като независими информационни ресурси. Почти всеки вестник, радиостанция или телевизионен канал във всяка страна по света има собствено представителство в Интернет.

    Електронната версия на вестник може и като правило се различава значително от хартиената версия, като значително я надвишава по обем - форматът на данните, публикувани в интернет сайтове, е по-гъвкав, не се ограничава до страници, разпределени колони за вестници и списания за материала. Появява се елемент на интерактивност - читателите могат да оставят своите коментари и отзиви за прочетената статия, новина или аналитичен преглед.

    Някои периодични издания, като TIMES, дори са дигитализирали архивите на вестника през цялото му съществуване, включително години преди компютрите или компютърни мрежиТърсенето в такива архиви обаче е платено и доста скъпо.

    Най-авторитетният и професионален източник на оперативна информация за интернет потребителите и медиите са уеб ресурсите информационни агенции. Притежавайки широка кореспондентска мрежа, те ежедневно и ежечасно разпространяват обществено-политическа, икономическа, научна и финансова информация в Интернет и по електронни комуникационни канали.

    Инструменти за търсене

    Инструментите за търсене са специален софтуер, чиято основна цел е да осигури най-оптималното и висококачествено търсене на информация за интернет потребителите. Инструментите за търсене се хостват на специални уеб сървъри, всеки от които изпълнява специфична функция:

    1. Анализ на уеб страници и въвеждане на резултатите от анализа на едно или друго ниво на базата данни на сървъра за търсене.

    2. Търсене на информация по заявка на потребителя.

    3. Осигуряване на удобен интерфейс за търсене на информация и преглед на резултата от търсенето от потребителя.

    Техниките на работа, използвани при работа с един или друг инструмент за търсене, са почти еднакви. Преди да ги обсъдим, нека разгледаме следните концепции:

    1. Интерфейсът на инструмента за търсене е представен под формата на страница с хипервръзки, ред за заявка (ред за търсене) и инструменти за активиране на заявки.

    2. Индексът на търсачката е информационна база, съдържаща резултат от анализ на уеб страници, съставена по определени правила.

    3. Заявката е ключова дума или фраза, която потребителят въвежда в лентата за търсене. За формиране на различни заявки се използват специални знаци ("", |, ~) и математически символи (*, +, ?).

    Схемата за търсене на информация е проста. Потребителят въвежда ключова фраза и активира търсенето, като по този начин получава селекция от документи въз основа на формулираната (посочена) заявка. Този списък с документи е класиран според определени критерии, така че в горната част на списъка са тези документи, които най-точно отговарят на заявката на потребителя. Всеки от инструментите за търсене използва различни критерии за класиране на документи, както при анализиране на резултатите от търсенето, така и при създаване на индекс (попълване на индексна база данни от уеб страници).

    По този начин, ако зададете заявка с еднакъв дизайн в лентата за търсене за всеки инструмент за търсене, можете да получите различни резултати от търсенето. За потребителя е от голямо значение кои документи ще се появят в първите две до три дузини документа в резултатите от търсенето и доколко тези документи отговарят на очакванията на потребителя.

    Повечето инструменти за търсене предлагат два метода за търсене - просто търсене(просто търсене) и подробно търсене(разширено търсене) с или без специален формуляр за заявка. Нека разгледаме и двата вида търсене, като използваме примера на търсачка на английски език.

    Например AltaVista е полезна за произволни заявки „Нещо за онлайн дипломи по информационни технологии“, докато инструментът за търсене на Yahoo ви позволява да получавате новини от света, информация за обменния курс или прогноза за времето.

    Овладяването на критериите за прецизиране на заявките и усъвършенстваните техники за търсене ви позволява да увеличите ефективността на търсенето и бързо да намерите необходимата информация. На първо място, можете да увеличите ефективността на вашето търсене, като използвате логически оператори (операции) Or, And, Near, Not, математически и специални символи във вашите заявки. Използвайки оператори и/или символи, потребителят асоциира ключови думи в необходимата последователност, за да получи най-подходящия резултат от търсенето за заявката.

    Една проста заявка дава определен брой връзки към документи, защото... списъкът включва документи, съдържащи една от думите, въведени по време на заявката, или проста фраза (вижте таблица 1). Операторът and ви позволява да посочите, че всички ключови думи трябва да бъдат включени в съдържанието на документа. Броят на документите обаче все още може да е голям и прегледът им ще отнеме доста време. Следователно в някои случаи е много по-удобно да се използва контекстният оператор near, което показва, че думите трябва да бъдат разположени достатъчно близо в документа. Използването на близо значително намалява броя на намерените документи. Наличието на знака "*" в низа на заявката означава, че думата ще се търси по нейната маска. Например, ще получим списък с документи, съдържащи думи, започващи с „gov“, ако напишем „gov*“ в низа на заявката. Това могат да бъдат думите правителство, губернатор и др.

    Най-развитата услуга за търсене на рускоезична информация се предоставя от сървъра за търсене Yandex. В Yandex можете просто да напишете фраза на руски, която описва това, което искате да намерите, и системата ще анализира и обработи вашата заявка, след което ще се опита да намери всичко, което е свързано с дадена тема. Можете да използвате специални оператори, за да създадете низ, който обяснява търсачка, на какви изисквания трябва да отговаря информацията, която ви интересува.

    Еднакво популярната търсачка Rambler поддържа статистика за трафика на връзки от собствената си база данни; същите логически оператори И, ИЛИ, НЕ, метасимволът * (подобен на знака * в AltaVista, който разширява обхвата на заявката), коефициентните символи + и - са поддържа се за увеличаване или намаляване на значимите думи, въведени в заявката.

    Повечетопопулярни технологии за търсене на информация в интернет.

    Търсачки

    Уеб търсачките са сървъри с огромна база данни от URL адреси, които автоматично осъществяват достъп до WWW страници на всички тези адреси, изследват съдържанието на тези страници, формират и записват ключови думи от страниците в своята база данни (индексират страниците).

    Освен това роботите на търсачките следват връзки, намерени на страници, и ги индексират повторно. Тъй като почти всяка WWW страница има много връзки към други страници, с такава работа търсачката може теоретично да обходи всички сайтове в Интернет като краен резултат.

    Този тип инструменти за търсене са най-известните и популярни сред всички интернет потребители. Всеки е чувал имената на добре познати уеб търсачки (търсачки) - Yandex, Rambler, Aport.

    За да използвате този тип инструмент за търсене, трябва да отидете до него и да въведете ключовата дума, която ви интересува, в лентата за търсене. След това ще получите резултати от връзки, съхранени в базата данни на търсачката, които са най-близки до вашата заявка. За да направите търсенето си по-ефективно, обърнете внимание предварително на следните точки:

    · вземете решение относно темата на заявката. Какво точно искате да намерите в крайна сметка?

    · обърнете внимание на езика, граматиката, използването на различни небуквални символи, морфология. Също така е важно правилно да формулирате и въведете ключови думи. Всяка търсачка има своя собствена форма на конструиране на заявка - принципът е един и същ, но използваните символи или оператори може да се различават. Необходимите формуляри за заявки също варират в зависимост от сложността на софтуера на търсачката и услугите, които предоставят. По един или друг начин всяка търсачка има раздел „Помощ“, където всички правила за синтаксис, както и препоръки и съвети за търсене са ясно обяснени (екранна снимка на страниците на търсачката).

    · използване на възможностите на различни търсачки. Ако не го намерите в Yandex, опитайте в Google. Използвайте услуги за разширено търсене.

    · За да изключите документи, съдържащи определени термини, използвайте знак "-" преди всяка такава дума. Например, ако имате нужда от информация за произведенията на Шекспир, с изключение на "Хамлет", въведете заявка във формата: "Шекспир-Хамлет". И за да сте сигурни, че определени връзки са включени в резултатите от търсенето, използвайте символа „+“. Така че, за да намерите връзки за продажбата на автомобили конкретно, имате нужда от заявката „продажба + кола“. За да увеличите ефективността и точността на вашето търсене, използвайте комбинации от тези символи.

    · всяка връзка в списъка с резултати от търсенето съдържа фрагмент - няколко реда от намерения документ, сред които се появяват вашите ключови думи. Преди да щракнете върху връзката, оценете уместността на фрагмента спрямо темата на заявката. След като следвате връзка към определен сайт, внимателно погледнете главната страница. По правило първата страница е достатъчна, за да разберете дали сте попаднали на правилния адрес или не. Ако да, извършете допълнителни търсения за необходимата информация на избрания сайт (в раздели на сайта); ако не, върнете се към резултатите от търсенето и опитайте следващата връзка.

    · не забравяйте, че търсачките не произвеждат собствена информация (с изключение на обяснения за себе си). Търсачката е само посредник между собственика на информацията (сайта) и вас. Базите данни непрекъснато се актуализират, към тях се добавят нови адреси, но изоставането от информацията, която реално съществува в света, все още остава. Просто защото търсачките не работят със скоростта на светлината.

    Най-известните уеб търсачки включват Google, Yahoo, Alta Vista, Excite, Hot Bot, Lycos. Сред рускоезичните може да се подчертае Yandex, Rambler, Aport.

    Търсачките са най-големите и ценни, но далеч не единствените източници на информация в Интернет.

    Колекции от връзки

    Колекциите от връзки са връзки, сортирани по теми. Те са доста различни един от друг по съдържание, така че за да намерите селекция, която най-добре отговаря на вашите интереси, трябва сами да ги прегледате, за да си съставите собствено мнение.

    База данни с адреси

    Базите данни с адреси са специални сървъри за търсене, които обикновено използват класификации по вид дейност, по предлагани продукти и услуги и по география. Понякога те се допълват с търсене по азбучен ред. Записите в базата данни съхраняват информация за сайтове, които предоставят информация за имейл, организация и пощенски адрес срещу заплащане.

    Най-голямата англоезична адресна база данни може да се нарече: http://www.lookup.com/ - това е категорийна директория с много поддиректории, като например: Find Person, Phone Numbers, Name Search и други.

    Веднъж в тези поддиректории, потребителят намира връзки към сайтове, които предлагат информация, която го интересува.

    Заключение

    Разгледахме основните технологии за търсене на информация в Интернет и представихме в общи линии инструментите за търсене, които в момента съществуват в Интернет, както и структурата на заявките за търсене за най-популярните рускоезични и англоезични търсачки и, обобщавайки гореизложеното, бихме искали да отбележим, че няма единна оптимална схема Няма търсене на информация в Интернет. В зависимост от спецификата на информацията, от която се нуждаете, можете да използвате подходящите инструменти и услуги за търсене. И качеството на резултатите от търсенето зависи от това колко добре са избрани услугите за търсене.

    За да обобщим, можем да кажем, че няма една единствена оптимална схема за търсене в Интернет. В зависимост от конкретната информация, от която се нуждаете, трябва да използвате подходящи услуги за търсене, за да я намерите. По принцип, разбира се, винаги можете да използвате една търсачка, например Rambler, но колкото по-компетентно са избрани услугите за търсене и е съставена заявката за търсене на информация, толкова по-добри ще бъдат резултатите от търсенето. А в бизнеса качеството на информацията играе важна роля.

    Библиография

    1. Барабанов С. Интранет: стъпка по стъпка // Компютърна преса. - 1997. - № 6. - с.148-154.

    2. Барабанов С. и др. Компютърни системи: вчера, днес, утре // Computer pres. - 2007. - № 2. - С. 152-158.

    3. Интернет - ресурси.

    Публикувано на Allbest.ru

    Подобни документи

      Характеристики на търсене на информация в Интернет: стратегия и методология. Търсачки, каталози и портали на информационни ресурси. Подбор и въвеждане на ключови думи. Използвайки режима "разширено търсене", който има всяка една от интернет търсачките.

      резюме, добавено на 08/06/2014

      Инструменти за търсене на информация в Интернет. Основни изисквания и методи за извличане на информация. Структура и характеристики на услугите за търсене. Глобални търсачки WWW (World Wide Web). Планиране на търсене и събиране на информация в Интернет.

      резюме, добавено на 11/02/2010

      Информационната революция, която обществото преживява в момента. Извършване на структурен анализ на документи. Търсете аналогова информация в системните области. Търсене на информация чрез интернет. Видове ресурси за търсене: каталози и роботи за търсене.

      курсова работа, добавена на 16.12.2012 г

      Характеристика на методите за търсене на информация в Интернет, а именно с помощта на хипертекстови връзки, търсачки и специални инструменти. Анализ на нови интернет ресурси. История на появата и описание на западни и рускоезични търсачки.

      резюме, добавено на 05/12/2010

      Интернет и неговите възможности. Често срещан и евтин начин за свързване с интернет. Схема за предаване на информация по TCP/IP протокола. Характеристики на адреси от различни класове. Търсачки, начини за търсене и изтегляне на информация в глобалната мрежа.

      курсова работа, добавена на 25.09.2013 г

      Основни протоколи, използвани в Интернет. Инструменти за търсене в Интернет. Популярни търсачки. Как работят търсачките. Инструменти за търсене и структуриране. Автоматизирана уеб навигация. Критерии за качество на работата на търсачката.

      резюме, добавено на 14.02.2012 г

      Предистория на появата на интернет. Уеб страници, сайтове, портали. Основни интернет ресурси: местоположение и съдържание. Библиотеки, вестници, списания и други информационни ресурси. Търсачки, каталози, архиви. Комуникация през интернет.

      курсова работа, добавена на 05/09/2012

      Теоретични основи на интернет технологиите и основните интернет услуги. Запознаване с възможностите за свързване с интернет. Основни мрежови услуги. Принципи на търсене на информация в WWW. Преглед модерен интернетбраузъри. Програми за онлайн комуникация.

      курсова работа, добавена на 18.06.2010 г

      Лесно търсене на информация в системата Google.ru, нейните технологии и функции. История на термина и неговото приложение. Изберете думи за търсене, автоматично изключете общи думи. Калкулатор и конвертиране на валута. Свързани страници и проверка на правописа.

      резюме, добавено на 21.02.2011 г

      Търсене на информация в Интернет: стратегия и методология. Световни и руски каталози и търсачки: принципи на работа, предимства и недостатъци. Аналитичен преглед на намерени документи по темата „Счетоводство Пари, документи и преводи на път."

    Технологии за търсене

    Закони за триене и пренос на топлина и маса в турбулентен граничен слой

    Има няколко вида представяне на „закона на триенето“ (за референтния случай), което води до почти идентични резултати. В съответствие с концепцията за „логаритмичен“ граничен слой (при стойността на първата турбулентна константа χ = 0,4) законът за триене за изключително развита турбулентност с „изчезващ вискозитет“ е добре приближен от простата формула на Карман:

    За степенно представяне на профила на скоростта следва да се предложи следната формула:

    Където: ; н– степенен показател на профила на скоростта;

    – полуемпиричен коефициент;

    А– емпиричен коефициент;

    δ – дебелина на граничния слой.

    Използване на отношения за числа на Рейнолдс, изградени върху различни линейни величини:

    Важно е да се отбележи, че в случай на развитие на турбулентен граничен слой от предния ръб ( x cr = 0) законът на триенето също трябва да бъде представен във формата:

    Стойностите на параметричните величини на представените формули за различни профили на скоростта са обобщени в таблицата

    Параметър н
    1/7 1/8 1/9 1/10
    А 8,74 9,71 10,6 11,5
    0,0975 0,089 0,0818 0,0757
    1,28 1,25 1,22 1,20
    м 0,250 0,222 0,200 0,182
    б 0,0252 0,0206 0,0190 0,0148
    m 1 0,200 0,182 0,167 0,154
    Б 1 0,0576 0,0450 0,0362 0,0308

    Други форми на представяне на закона за триенето също са известни и използвани, което води до почти същите резултати. Така V.M. Ievlev предложи приближение:

    Формулите за законите за пренос на топлина и маса се получават от „законите на триенето“ за стандартни условия (референтен случай), като се използва добре известният принцип на тройната аналогия на Рейнолдс.

    Където: С– коефициент на корекция – коефициент на аналогия на Рейнолдс за несъответствие с условията на стандарта (и), коефициент Скато първо приближение, то се апроксимира задоволително от връзката:

    Важно е да се отбележи, че в случай на използване на интегрални параметри, "законите" на преноса на топлина и маса са добре описани от зависимостите:

    Уеб технологията World Wide Web (WWW) се счита за специална технология за подготовка и публикуване на документи в Интернет. WWW включва уеб страници, електронни библиотеки, каталози и дори виртуални музеи! При такова изобилие от информация възниква въпросът: „Как да се ориентираме в такова огромно и мащабно информационно пространство -“ Инструментите за търсене идват на помощ при решаването на този проблем.

    Инструментите за търсене са специален софтуер, чиято основна цел е да осигури най-оптималното и висококачествено търсене на информация за интернет потребителите. Инструментите за търсене се хостват на специални уеб сървъри, всеки от които изпълнява специфична функция:

    1. Анализ на уеб страници и въвеждане на резултатите от анализа на едно или друго ниво на базата данни на сървъра за търсене.

    2. Търсене на информация по заявка на потребителя.

    3. Осигуряване на удобен интерфейс за търсене на информация и преглед на резултатите от търсенето от потребителя.

    Техниките на работа, използвани при работа с един или друг инструмент за търсене, са почти еднакви. Преди да ги обсъдим, нека разгледаме следните концепции:

    1. Интерфейсът на инструмента за търсене е представен под формата на страница с хипервръзки, ред за заявка (ред за търсене) и инструменти за активиране на заявки.

    2. Индекс на търсачката - информационна база, съдържаща резултат от анализ на уеб страници, съставен по определени правила.

    3. Заявка - ключова дума или фраза, която потребителят въвежда в лентата за търсене. За формиране на различни заявки се използват специални знаци ("", ~) и математически символи (*, +, -).

    Схемата за търсене на информация е проста. Потребителят въвежда ключова фраза и активира търсенето, като по този начин получава селекция от документи въз основа на формулираната (посочена) заявка. Този списък с документи е класиран според определени критерии, така че в горната част на списъка са тези документи, които най-точно отговарят на заявката на потребителя. Всеки от инструментите за търсене използва различни критерии за класиране на документи, както при анализиране на резултатите от търсенето, така и при създаване на индекс (попълване на индексна база данни от уеб страници).

    Въпреки това, ако зададете заявка с еднакъв дизайн в лентата за търсене за всеки инструмент за търсене, можете да получите различни резултати от търсенето. За потребителя е от голямо значение кои документи ще се появят в първите две до три дузини документа в резултатите от търсенето и доколко тези документи отговарят на очакванията на потребителя.

    Повечето инструменти за търсене предлагат два метода за търсене − просто търсене(просто търсене) и подробно търсене(разширено търсене) с или без специален формуляр за заявка. Нека разгледаме и двата вида търсене, като използваме примера на търсачка на английски език.

    Например AltaVista е удобна за използване за произволни заявки, ʼʼНещо за онлайн дипломи по информационни технологииʼʼ, докато инструментът за търсене на Yahoo ви позволява да получавате новини от света, информация за обменни курсове или прогнози за времето.

    Овладяването на критериите за прецизиране на заявките и усъвършенстваните техники за търсене ви позволява да увеличите ефективността на търсенето и бързо да намерите необходимата информация. На първо място, можете да увеличите ефективността на вашето търсене, като използвате логически оператори (операции) Or, And, Near, Not, математически и специални символи във вашите заявки. Използвайки оператори и/или символи, потребителят асоциира ключови думи в необходимата последователност, за да получи най-подходящия резултат от търсенето за заявката. Простата заявка не дава голям брой връзки към документи, т.к списъкът включва документи, съдържащи една от думите, въведени по време на заявката, или проста фраза (вижте таблица 1). Операторът and ви позволява да посочите, че всички ключови думи трябва да бъдат включени в съдържанието на документа. Броят на документите обаче все още трябва да е голям и прегледът им ще отнеме доста време. Поради тази причина в някои случаи е много по-удобно да се използва контекстният оператор near, който показва, че думите трябва да са разположени достатъчно близо в документа. Използването на близо значително намалява броя на намерените документи. Наличието на знака "*" в низа на заявката означава, че думата ще се търси по нейната маска. Например, ще получим списък с документи, съдържащи думи, започващи с „gov“, ако напишем „gov*“ в низа на заявката. Това са думите правителство, губернатор и др.

    Най-развитата услуга за търсене на рускоезична информация се предоставя от сървъра за търсене Yandex. В Yandex можете просто да напишете фраза на руски, която описва това, което искате да намерите, и системата ще анализира и обработи вашата заявка, след което ще се опита да намери всичко, което е свързано с дадена тема. Използвайки специални оператори, можете да създадете низ, който обяснява на търсачката какви трябва да бъдат вашите изисквания за информацията, която ви интересува. Някои от операторите на езика за заявки на Yandex можете да видите тук: http://help.yandex.ru/search/ -id=481939

    Не по-малко популярната търсачка Rambler поддържа статистика за трафика на връзки от собствената си база данни; същите логически оператори И, ИЛИ, НЕ, метасимволът * (подобен на знака * в AltaVista, който разширява обхвата на заявката), коефициент символи + и - се поддържат, за да увеличите или намалите значението на думите, въведени в заявката.

    Нека да разгледаме най-популярните технологии за търсене на информация в Интернет.

    Тема 3 Работа с интернет търсачки

    Изпратете добрата си работа в базата знания е лесно. Използвайте формата по-долу

    Студенти, докторанти, млади учени, които използват базата от знания в обучението и работата си, ще ви бъдат много благодарни.

    публикувано на http://www.allbest.ru/

    Съвременни методи за извличане на информация

    Въведение

    Как да можем да четем, пишем или говорим публично в днешните условия информационно обществоспособността за компетентно извършване на професионално търсене е незаменимо умение на интелектуален специалист.

    Бързият растеж и динамичното развитие на информационните ресурси (предимно представените в Интернет) задължава всеки човек да притежава разнообразни и сложни умения за търсене. Възможността за бързо и правилно търсене в Интернет означава спестяване на време, притежаване на достоверна и актуална информация, което означава правене на правилни изводи и вземане на правилни решения.

    Информационните евристики са предназначени да помогнат на специалиста бързо да извърши селективно и ефективно търсене при решаване на специфични интелектуални проблеми.

    Проблемът с търсенето и използването на информация е един от най-актуалните в съвременната наука. Разбира се, Интернет е незаменим за ефективното и качествено търсене на информация. Въпреки това, самият факт на съхраняване на огромен слой от човешки знания в Интернет не показва високата ефективност на търсенето и използването на информация. Дори ако информацията е представена в удобна форма, човек в крайна сметка трябва да я овладее. А ефективността и качеството на работата му ще зависи от неговото владеене на методите и техниките за търсене.

    Следователно в основата на използването на информацията е проблемът за търсенето и трансформирането й в такова съдържание и форма, които създават възможност за по-удобно и ефективно усвояване на информацията и нейното ефективно използване в социални дейности.

    В тази връзка целта на тази работа е да проучи характеристиките на развитието и разпространението на информация, да разгледа основните цели и методи за извличане на информация, да анализира правилата за изграждане на стратегия за търсене и формулиране на заявка за търсене.

    Главна част

    Евристиката в общ смисъл е изкуството и науката за откриване и творческо търсене в сложна предметна област.

    В същото време евристиката има много значения.

    По този начин евристиката е система за обучение, която насърчава развитието на находчивостта на учениците, способността за самостоятелно получаване на знания, когнитивната активност и нуждата от знания.

    Също така, евристиката е наука за моделите и методите за откриване и изучаване на нови неща в човешката творческа и познавателна дейност; психология на творчеството.

    Евристиката се отнася до методология за решаване на проблеми, която използва опити и грешки и експериментални резултати, за да намери директен път към решение.

    Евристиките са специални методи за решаване на проблеми (евристични методи), които обикновено се противопоставят на формалните методи за решаване, базирани на точни математически модели. Използването на евристични методи (евристика) намалява времето за решаване на проблем в сравнение с метода на пълното ненасочено изброяване на възможните алтернативи; получените решения по правило не са най-добрите, а се отнасят само до набора от възможни решения.

    Евристиката е набор от механизми, присъщи на дадено лице, с помощта на които се генерират процедури, насочени към решаване на творчески проблеми (например механизми за установяване на ситуационни връзки в проблемна ситуация, отрязване на неперспективни клонове в дърво от опции, генериране на опровержения с помощта на контрапримери и др.). Тези механизми, които заедно определят метатеорията за решаване на творчески проблеми, са универсални по природа и не зависят от конкретния проблем, който се решава.

    Евристиката е наука, която изучава евристична дейност; специален клон на науката за мисленето. Основният му обект е творческата дейност; най-важните проблеми са задачи, свързани с модели за вземане на решения (в нестандартни проблемни ситуации), търсене на нещо ново за субект или общество, структуриране на описания на външния свят (въз основа на класификации като периодичната таблицаили таксономия на К. Линей). Евристиката като наука се развива в пресечната точка на психологията и теорията изкуствен интелект, структурна лингвистика, теория на информацията.

    По този начин централната дума на евристиката е търсене (информация).

    Няма съмнение, че разработването на методи за получаване и използване на различна социална информация традиционно е централният проблем на научната организация на работата на специалистите.

    За да вземе решение във всяка конкретна ситуация, специалистът трябва да получи най-пълната и актуална информацияотносими към този случай.

    Изборът на източници на информация, стратегии за нейното търсене, методи за проверка на надеждността и съответствието със съществуващата информация, методи за оценка на полезността на намерената информация за решаване на проблеми - всички тези фактори са характеристики на човешкото информационно поведение.

    Критериите за информационна култура на дадено лице могат да се считат за способността му да формулира адекватно своята нужда от информация в целия набор от информационни ресурси, да обработва информация и да създава качествено нова информация, да поддържа индивидуални системи за търсене на информация и адекватно да подбира и оценява информация.

    Интернет отвори достъп до много информационни ресурси, които в момента е невъзможно за читателите на руските библиотеки да получат по друг начин. Съчетавайки локални, национални и глобални мрежи, той се превърна в огромен информационен ресурс, най-динамичният от всички съществуващи в момента.

    Много важна характеристика на Интернет е, че потребителят не само получава достъп до информация, но и сам я произвежда. Освен това търсенето на информация в нови условия и в нова информационна среда се оставя на самия специалист.

    В това отношение могат да се подчертаят два положителни момента:

    -увеличава вероятността за идентифициране на информация, която е полезна по същество, но не отговаря строго формално на заявката. За разлика от посредника, специалистът не е принуден да се придържа стриктно към формулировката на заявката. Самият той води диалог с търсачката, променяйки тактиката на търсене в зависимост от получените резултати;

    - формират се основите на научното мислене и уменията за изследователска работа. Специалистът се научава да навигира в мрежовото пространство, да избира от голям брой документи това, което наистина е необходимо и накрая да променя заявката си в зависимост от анализа на вече идентифицирани документи.

    Потребителите обаче често не се чувстват доволни от резултатите от търсенето в нова информационна среда. Това обикновено се случва поради следните причини:

    По правило потребителите използват или търсачки (AltaVista, HotBot), или директории с ресурси (Yahoo) като инструмент за търсене. Въпреки редица предимства, гореспоменатите търсачки не осигуряват научен контрол на качеството (т.е. процесът на включване на информация в базата данни на тези търсачки не е под контрола на експерти по темата), което може да доведе до ненадеждни информация, получена в резултат на търсенето;

    -липса на знания и умения за съставяне на заявка към търсачка води до получаване на голямо количество информация шум;

    - потребителят често не осъзнава факта, че въпреки факта, че информацията съществува в Интернет, тя е извън полезрението на търсачките. Липсата на основни познания за извършване на търсене води до намаляване на пълнотата на получената информация.

    По този начин може да се твърди, че в Интернет има повече възможности, отколкото се използват в момента. И следователно проблемът не е липсата на качествена информация в интернет, а невъзможността на специалист да я намери.

    В рамките на библиографските изследвания е натрупан, теоретично и методически обобщен богат исторически опит в търсенето и използването на информационни източници. Именно в библиографската наука се формира и сега целенасочено се развива специална научна дисциплина - библиографската евристика.

    Библиографската евристика е една от най-важните и активно развиващи се части на общата наука за библиографията и библиографознанието. В съвременните условия на ускорение и сложност информационни процесиобществото му обръща особено внимание.

    Библиографската евристика се разбира като библиографска дисциплина, която развива историята, теорията и методологията на търсенето на информация.

    Категорията „информация” включва и понятието „библиографска информация”, което е един от най-важните й компоненти. Това се обяснява с функционалната роля, т.е. социалната задача, която обществото решава чрез библиографска информация в процеса на производство, разпространение и използване на социална информация и знания.

    Обективният характер на съществуването и използването на такава информация предопределя разнообразни задачи при нейното търсене. Като цяло, реалното разнообразие от такива задачи може да се сведе до три основни цели на извличане на информация:

    - търсене на необходимата информация за източника и установяване на присъствието му в системата от други източници. Провежда се чрез търсене на библиографска информация и библиографски помагала (информационни издания), специално създадени за по-ефективно търсене и използване на информация (литература, книги);

    -търсене на самите информационни източници (документи и публикации), които съдържат или могат да съдържат необходимата информация;

    -търсене на фактическа информация, съдържаща се в литература, книги, например за исторически факти и събития, за технически спецификациимашини и процеси, за свойствата на веществата и материалите, за биографични данни от живота и творчеството на писател, учен и др.

    Тези цели определят и три основни типа извличане на информация: библиографско, документално и фактографско, които са тясно свързани помежду си.

    Например, за да намерите източник на информация (документ или публикация), трябва да знаете определен набор от библиографска информация (факти), която го характеризира и отличава от много други: поне от тези, написани от същия автор, на същата тема, издадена от същото издателство, през същата година и т.н. Следователно първо трябва да направите библиографско търсене. И обратно, за да проведем фактологично търсене в която и да е област на знанието или практиката, първо трябва да намерим онези литературни източници (документи, публикации), които могат да съдържат интересни за нас факти. Следователно първо трябва да извършите библиографско и документално търсене.

    Търсенето и използването на мощни потоци от информация става все по-трудно.

    И за това библиографската евристика разполага с редица методи за търсене на информация: непрекъсната, селективна, интуитивна, типологична („рецепта“), индуктивна, дедуктивна, методът на библиографските препратки, методът на издигане от абстрактното към конкретното.

    Нека ги разгледаме накратко.

    И така, солиден метод. Това проучване е пълно и без пропуски, всички налични помощни средства и източници. Очевидно е, че в съвременните условия тази техника е трудно приложима дори за тясна тема. Поради това често се разглежда само като чисто теоретично.

    Извадковият метод е по-рационален и реалистичен начин за търсене на информация, който се свежда до подбор и проучване на определен набор от източници.

    Интуитивен метод. Отнася се до способността за намиране на необходимия материал чрез библиографски усет и дългогодишен опит.

    Типологичен или метод на рецепта, когато използването на задачи за извличане на информация позволява за всяко конкретно извличане на информация да очертае конкретен път и документални средства (наръчници, източници) на решение, т.е. да предостави вид модел, рецепта за решаване тази задача за търсене. По този начин оптималният стандартен модел за разработване на различни „рецепти“ за извличане на информация е библиографското описание.

    Индуктивен метод за търсене на информация. Процесът на познание с помощта на индукция възниква от индивидуални преценки и факти до Общи правилаи обобщения, които изразяват общ модел.

    Дедуктивен метод за извличане на информация. Обратната картина ще се развие, ако търсим по дедуктивния метод. Такава ориентация на мисълта може да възникне при изучаване на определена област от явления, създаване на подробна научна теория и др.

    Метод за търсене на информация чрез библиографски препратки. Възможността за използването му се крие в самата природа на литературата, състояща се от определена връзка между факти, произведения, документи и публикации. Всяко ново литературно произведение е до известна степен анализ, оценка и обобщение на вече наличната в литературата социална информация. Специфична форма за отразяване на тази връзка и приемственост на литературното развитие е библиографската справка (бележка под линия).

    Представените методи ви позволяват да намерите необходимата информация в традиционната информационна среда.

    Но в наше време не по-малко, а в някои случаи много по-важни са методите и техниките за търсене на информация в новата информационна среда – Интернет.

    Търсенето на информация може да се извърши чрез няколко метода, които се различават значително както по отношение на ефективността и качеството на търсенето, така и по вида на извличаната информация.

    Нека разгледаме основните методи за търсене на информация в Интернет, използвани поотделно или в комбинация един с друг.

    На първо място, това е използването на търсачките. В момента този метод е един от основните и всъщност единственият метод при извършване на предварително търсене. В резултат на търсенето ще се появи списък с интернет ресурси, които трябва да разгледате подробно.

    Използването на търсачките се основава на използването на ключови думи, предадени на сървърите за търсене като аргументи за търсене.

    Директното търсене с помощта на хипертекстови връзки също се счита за методи. Тъй като всички сайтове в световната мрежа всъщност са взаимосвързани, информацията може да се търси чрез последователно разглеждане на свързани страници с помощта на браузър.

    На пръв поглед този напълно ръчен метод за търсене изглежда като пълен анахронизъм, в същото време този метод на уеб страници често се оказва единственият възможен в последните етапи на търсене на информация, когато механичното изследване отстъпва място на по- задълбочен анализ.

    В същото време използването на каталози, класифицирани и тематични списъци и всякакъв вид справочници се отнася и за този тип търсене.

    Търсенето със специални инструменти е напълно автоматизиран метод, който е много ефективен за извършване на първоначално търсене.

    Същността на този метод се състои в използването на специализирани програми - паяци, които автоматичен режимразглеждат уеб страници, търсейки информацията, която търсят.

    Тоест можем да говорим за опция за автоматизирано сърфиране с помощта на хипертекстови връзки (търсачките използват подобни методи).

    Този метод е особено ефективен, ако използването на търсачките не дава необходимите резултати поради нестандартния характер на заявката или други причини.

    Друг метод е анализът на нови ресурси, търсенето на които може да е необходимо при провеждане на повтарящи се цикли на търсене, търсене на най-новата информация или за анализиране на тенденциите в развитието на обекта на изследване във времето.

    Друга причина за това търсене е, че повечето търсачки актуализират своите индекси със значително забавяне, причинено от огромните обеми данни, които се обработват, и този пропуск обикновено е по-голям, колкото по-малко популярна е темата, която ви интересува. Това съображение е много важно, когато извършвате търсене в силно специализирана предметна област.

    Очевидно е, че търсенето на информация в Интернет се разглежда повече като процес на решаване на проблема с търсенето, пред който е изправен потребителят, а не като просто намиране на информация, подходяща за заявката.

    Основните етапи на методологията на търсене са:

    -формулиране и изясняване на искането за информация. На този етап има целенасочено ограничаване и конкретизиране на общата цел на търсенето;

    -планиране на процедурата по търсене. Основната цел на този процес е да се определят начини и средства за рационално решаване на проблема с търсенето. Този етап включва разработването на стратегии за търсене, които отговарят на идентифицираните набори от изисквания;

    - осъществяване на търсене. Окончателното решение на проблема с търсенето.

    Техниката за търсене на информация включва няколко етапа.

    Първият етап е формулиране и изясняване на искането за информация. Този етап традиционно играе водеща роля. Последващият избор на информационни ресурси ще зависи от това колко правилно е формулирана заявката. „Искане за разяснение“ в библиотечната практика е поредица от критерии или въпроси, необходими за изясняване на потребността на потребителя от информация. По време на интервюто се изяснява вида на източника, в който ще се търси, съдържанието на темата и дълбочината на ретроспективното търсене. На този етап е препоръчително:

    -формулиране на заявка на естествен език;

    - определяне на вида на информационната потребност;

    - определяне на целта на търсене на информация;

    - определяне на необходимите ограничения за търсене;

    - окончателно формулиране на искането за информация.

    Целта на стъпка 1 е да създадете представа за информацията, която търсите. За да получи тази идея, собственикът на информационната потребност трябва да я изрази възможно най-точно на естествен език.

    Дори една доста груба представа за вида на информационната нужда ни позволява да изясним изискванията, определени от нея, които трябва да се вземат предвид при търсене. Традиционно се разграничават два вида информационни потребности: 1) когато най-добрата метаинформация (информация за информация) се признава за тази, която най-пълно и точно описва конкретната информационна потребност на даден потребител и позволява да се получи точен отговор. ; 2) когато границите не са ясно определени и могат също да се променят с времето.

    Процеси за извличане на информация, чрез които се задоволяват информационните нужди различни видове, като цяло се различават един от друг и следователно можем да говорим за различни видове търсене на информация. Търсенето на информация, което задоволява информационни нужди от първия тип, се нарича фактологично. Относно търсенето на информация, задоволяваща нуждите от втория вид - като документална. Често обаче, за да намерите някои факти в Интернет, първо трябва да потърсите документи (уеб страници), съдържащи тези факти. В този случай може да се говори за документално фактологично издирване.

    Следващата стъпка е да се определи целта на търсене на информация, което ни позволява да идентифицираме степента на необходимата пълнота на информацията, което също влияе върху избора на търсачки. Целите на извличането на информация традиционно са противоположни една на друга:

    -предварително запознаване с проблема;

    - задълбочено проучване на проблема.

    По правило обичайната цел на търсенето на информация е някъде между тези две крайности, тоест потребителят се нуждае от известна информация, но не се нуждае от абсолютна пълнота на информацията.

    Основните ограничения традиционно включват: ограничения за видове публикации, езици на публикациите, географски и хронологичен обхват на търсене. Следователно е необходимо ясно да се изясни:

    - информация от кои източници интересува потребителя (статии, монографии, материали от конференции и др.);

    -на какъв език;

    -какъв е географският обхват на търсенето;

    -какъв е хронологичният обхват на търсенето.

    За финализиране на заявката за информация е необходимо да се извърши цялостен лексикален анализ на информацията, която ще се търси. Необходимо е да се получи от някакъв източник прецедент за подробно и компетентно описание на разглеждания въпрос. Такъв източник може да бъде както високоспециализиран справочник, така и обща енциклопедия. Въз основа на изучения материал е необходимо да се формулира възможно най-широк набор от ключови думи под формата на отделни термини, фрази, професионална лексика и клишета, ако е необходимо на няколко езика.

    Основната цел на етапа на планиране на процедурата за търсене е да се определят начини и средства за рационално решаване на проблема с търсенето. Включва развитие обща програмаТърсене. В същото време се извършва подбор и оценка на качеството на търсачките и се извършва търсене на липсваща информация.

    На този етап говорим за следните стъпки:

    -подбор и оценка на качеството на търсачките;

    -разработване на обща програма за търсене.

    Изборът и оценката на качеството на търсачките трябва да се извършва от гледна точка на съответствието им с реалните информационни потребности и спецификата на заявката. Всеки потребител има специфични изисквания, които влияят върху избора на търсачка, нейното съдържание и възможности. Когато избирате търсачка, трябва да обърнете внимание на следните параметри: обем на индекса на търсачката, контрол на качеството на информацията, която съдържа, както и възможностите на езиците за заявки.

    Разработването на обща програма за търсене се състои в идентифициране на обекти, методи и възможни посоки на търсене (маршрути) въз основа на идентифицирани ограничения на търсенето (тематични, хронологични, езикови, географски), както и степента на пълнота на търсенето.

    Тактиките и инструментите за търсене могат да варират значително в зависимост не само от темата, но и от други параметри на заявката. Тук трябва да се ръководите от редица общи насоки.

    Например естеството на търсенето се определя изцяло от съдържанието на поставената от потребителя задача за търсене. И в тази връзка е важно да се отбележи, че първоначално търсенето е, така да се каже, обвързано с темата и с целта за подробно, цялостно развитие на нейния план, когато е особено необходимо широко покритие на източниците на информация.

    Следователно, на първо време, в по-голяма степен издирването е в ходинформационни ресурси (т.е. колекции от документи). И едва след това търсенето на информация се конкретизира и ограничава до непосредственото съдържание на решавания проблем за търсене. На този етап преобладава търсенето на самите документи.

    Разбира се, през целия процес на търсене трябва да комбинирате различни видовеи методи за търсене в две основни посоки: от една страна, от търсачки с обща класификация до предметно ориентирани ресурсни индекси, след това до конкретни документи и фактите, съдържащи се в тях; от друга страна, от уникални думи и фрази за заявка до локатори на ресурси по темата и/или конкретни документи.

    Целта на последния етап е окончателното решение на задачата за търсене. Той също така включва създаване на инструментите, необходими за решаването му.

    На този етап трябва да изпълните следните стъпки:

    -избор на набор от информационни ресурси по темата за търсене;

    -провеждане на търсене в информационни ресурси;

    -оценка на пълнотата на информацията;

    -разширяване на обхвата на информационните ресурси.

    На етапа на избор на набор от информационни ресурси по темата за търсене се извършва търсене в набор от търсачки, избрани на етапа на планиране. Търсенето може да се извърши както от конкретно към общо, така и от общо към конкретно. В резултат на това се формира списък с информационни ресурси, които могат да съдържат информация по въпроса.

    Списъкът с информационни ресурси е планиран по такъв начин, че ресурсите, допълващи се взаимно, да покриват максимално информацията по дадена тема в съответствие с предварително зададени ограничения за търсене. Ако техният кръг е твърде тесен, резултатите от търсенето може да са незадоволителни, а ако са твърде широки, усилията за търсене ще се увеличат.

    На този етап е необходимо ясно да се определи какво се знае за търсената информация и какво е неизвестно, но трябва да се открие. Например името на обекта, който представлява интерес, може да е известно информационен център, но URL адресът му е неизвестен. Следователно е необходимо да се генерира списък със заявки за намиране на липсващата информация. Този списък се генерира въз основа на идентифицирани ключови думи и налична информация за ресурси.

    Препоръчително е да търсите липсващи връзки в описанието на ресурса (метаданни) с помощта на търсачки и метатърсачки. Въпреки това, ако нищо не се знае за ресурсите, които търсите, препоръчително е да се обърнете към търсачки за класификация или специализирани системи за търсене в речници. Ако потребителят не е експерт в тази област, той трябва да се свърже с търсачки за класификация с научен контрол на качеството (информационни портали).

    При извършване на търсене се препоръчва използването на следните методи: метод на предположение, метод на търсене от общо към конкретно, метод на търсене от конкретно към общо. Методът на отгатване е, че след това можете да опитате да напишете името на желаната организация или нейното съкращение. Методът за търсене от общо към специфично обикновено се използва при извършване на търсения в търсачки за класификация. Тъй като търсенето в тях се извършва само по тематични категории и описания на ресурси, препоръчително е първоначално заявката да се разшири колкото е възможно повече. Методът за търсене от специфично към общо обикновено се използва при извършване на търсения в търсачки с речници.

    В резултат на това се формира списък с информационни ресурси. Тази стъпка ви позволява да създадете лична информационна система, насочена към решаване на конкретен проблем при търсене.

    Когато извършвате търсене на документи, трябва да сте в състояние както да стесните, така и да разширите заявката си. По правило търсенето на информация, от която потребителят наистина се нуждае, е дейност, състояща се от няколко стъпки, по време на които потребителят формулира някои заявки, анализира получената извадка (резултатът от заявката) и въз основа на анализа изяснява неговото разбиране за структурата на базата данни и възможностите на търсачката информационна система, техните информационни нужди и формулира ново искане (изяснява старото). И отново редува стъпки на вземане на проби и анализ, като постепенно прецизира заявката и се придвижва към целта.

    Традиционно има две основни стратегии за търсене: търсене в индустрията и търсене по предмет. Те отразяват две противоположни тенденции в отношенията между науките и отраслите на знанието: диференциация на науките и тяхната интеграция. Стратегията за търсене в индустрията се извършва от общото към специфичното чрез разглеждане на йерархични класификатори, а стратегията за търсене по предмета се извършва от специфичното към общото чрез вземане на проби от данни според стойностите на дескриптори и ключови думи (т.е. данните се разглеждат от гледна точка на техните „предметни“ свойства).

    Изборът на конкретна стратегия за търсене зависи от конкретната задача за търсене. Например, при равни други условия търсенето с ключови думи е за предпочитане пред търсенето с класификатор, толкова по-конкретна е заявката. Както при търсене на информационни ресурси, при търсене на документи е необходимо да се вземат предвид възможностите на езиците за заявки, предлагани от различни СУБД.

    След идентифициране на някои от документите чрез търсене в основния кръг от информационни ресурси е препоръчително да се прегледа и оцени пълнотата на получената информация.

    Потребителят не винаги се нуждае от цялата информация по посочената тема. Често всичко, от което се нуждае, са няколко уважавани източника.

    На този етап се генерира списък с документи и се извършва проверка за дублиране. Въпреки това, ако пълнотата на получената информация е недостатъчна, е необходимо да се извърши допълнително търсенеинформационни ресурси.

    При търсене на информация в интернет, в което пълнотата играе роля важна роля, трябва да запомните, че нито една търсачка не индексира всичко, което е в Интернет.

    Можете да разширите списъка с информационни ресурси по следните начини:

    - извършване на търсене в чужди системи за метатърсене, за да се идентифицират бази данни, посветени конкретно на търсената тема;

    -търсене чрез хипертекстови връзки, преминавайки от вече намерени документи;

    -търсене в бази данни въз основа на URL структурата на вече намерени документи.

    Използването на изследваните методи позволява на потребителя самостоятелно да търси информация в нова информационна среда. Това дава възможност не само да се подобри качеството на информацията, получена в резултат на търсене, но и да се увеличи нейната пълнота.

    И в заключение, бих искал да обърна внимание и на някои съвети от участниците в Купата на Русия за търсене в Интернет:

    1. Опитайте се да разберете смисъла на въпроса. Може би вече знаете отговора. Да намеря правилен адресстраници, потърсете ключовите думи от въпроса и отговора, който знаете едновременно.

    2. Броят на документите, получени в резултат на претърсване, може да бъде огромен. Следователно, за оптимално извличане на информация, правилен комплектключови думи.

    3. Проверете правописа на думите. Използвайте синоними, ако списъкът с намерени страници е твърде малък.

    4. Търсете повече от една дума наведнъж. Стеснете търсенето си възможно най-много.

    5. Използвайте настройките за търсене в търсачките, за да зададете удобни параметриописания на документи и структура на страницата с резултати от търсенето.

    Заключение

    В изследването са представени и дискутирани въпроси от теорията, методите и методологията на библиографската и информационната евристика.

    Очевидно е, че овладяването на основите на тази област е необходимо за формирането на професионалните звания и умения на всеки специалист.

    Тъй като образованието на съвременния специалист трябва да гарантира не толкова неговите професионални умения и способности, а по-скоро способността за социална адаптация и конкурентоспособността на личността, информационната грамотност на специалиста е основата на неговата професионална компетентност и фактор за нейното развитие. развитие.

    В процеса на търсене на информация трябва да се ръководите от редица общи методически препоръки.

    Няма съмнение, че характерът на търсенето се определя изцяло от съдържанието на поставената задача. Формулирането на проблем за търсене ви позволява да определите областта и характеристиките на използваните източници и да улесните създаването на програма за търсене.

    Първоначално търсенето е обвързано с темата и целта за подробно, цялостно развитие на нейния план, когато е особено необходимо широко покритие на източниците. След това търсенето на информация се конкретизира и ограничава до непосредственото съдържание на задачата.

    В най-общ вид процесът на търсене на информация може да бъде разделен на етапи на формулиране на проблема за търсене, разработване работна програматърсене, изпълнение на търсенето и представяне на резултатите от него.

    И в заключение посочваме, че във всеки случай само със систематично и целенасочено обучение, знания и способност за рационално прилагане на система за търсене на информация, съвременният специалист може да бъде уверен в ефективността и качеството на своята работа.

    Списък на източниците

    1. Бородкин Л.И., Владимиров В.Н., Гарскова И.М. ABC на Интернет. Интернет адресиране. Търсене на информационни ресурси в мрежата. Към вашия бележник//Нови и скорошна история. 1999. № 1.

    2. Брайчевски С.М. Съвременни информационни потоци: актуални проблеми // Научно-техническа информация. Сер.1. 2005. № 11.

    3. Гречихин А.А. Библиографска евристика. - М.: 1984 г.

    4. Комер Д. Принципи на интернет. Курс на обучение. - Санкт Петербург: 2002.

    5. Кузнецов I.N. Информация: търсене, анализ, защита. - М.: 2004 г.

    6. Ланде Д.В. Търсене на знания в интернет. Професионална работа. - М.: 2005 г.

    7. Паршукова Г.Б. Информационната грамотност като фактор за развитие на професионалната компетентност. Технологии на информационното общество - Интернет и модерно общество: Доклади на VIII Всеруска съвместна конференция (Санкт Петербург, 8-11 ноември 2005 г.). - Санкт Петербург: Филологически факултет на Санкт Петербургския държавен университет, 2005 г.

    8. Прохоров А. Ефективно търсене в Интернет // Computer Press. 2006. № 2.

    9. Степанов В.К. Библиографско търсене в Интернет//Библиография. 1998. № 1.

    10. Талантов М. Професионално търсенев Интернет: планиране на процедура за търсене // Компютърна преса. 1999. № 8.

    11. Татарников О. Нови технологии за търсене в Интернет//КомпютърПрес. 2005. № 10.

    12. Toffler B.E., Imber J. Речник на маркетинговите термини. - М.: 2000.

    13. Яценко Н.Е. Речниксоциални научни термини. - Санкт Петербург: 1999.

    Публикувано на Allbest.ru

    Подобни документи

      Характеристики на търсене на информация в Интернет: стратегия и методология. Търсачки, каталози и портали на информационни ресурси. Подбор и въвеждане на ключови думи. Използвайки режима "разширено търсене", който има всяка една от интернет търсачките.

      резюме, добавено на 08/06/2014

      Концепция и принципи на работа, вътрешна структура и елементи, история на формирането и развитието на търсачката "Rambler". Проучване и анализ, както и оценка на ефективността на тази търсачка за търсене на икономическа информация в Интернет.

      курсова работа, добавена на 05/10/2015

      Проучване на класификацията на инструментите за търсене според V.V. Дудихин. Намиране на информация с помощта на ресурси за търсене. Формиране на заявки. Използване на ключови думи. Индексиране на документи, хоствани на различни сървъри. Чуждестранни лидери на търсачките.

      презентация, добавена на 03/10/2015

      Характеристики на основните патентни бази данни, използвани при търсене на патентна информация в Интернет. Стратегия за търсене на патенти и системи за патентна класификация. Използване на логически оператори и ключови думи при търсене.

      презентация, добавена на 15.09.2011 г

      История на търсачките. Класификация на информационните системи по степен на автоматизация. Три основни начина за търсене на информация в Интернет. Разлика между търсачки и директории. Предназначение и видове информационни системи на държавни институции.

      курсова работа, добавена на 13.05.2015 г

      Техники за търсене на информация в Интернет. Търсене по известен адрес, потребителска конструкция на адреса. Специални системи за търсене на информация: класификация (рубикатори) и речници. Търсене на информационни ресурси в различни области.

      резюме, добавено на 03.04.2010 г

      Нарастването на количеството информация в света, увеличаването му в Интернет в геометрична прогресия. Броят на сайтовете, регистрирани в търсачката Yandex. Характеристики на ефективното търсене на информация в Интернет. Диаграма на информационния поток.

      презентация, добавена на 27.08.2013 г

      Характеристика на методите за търсене на информация в Интернет, а именно с помощта на хипертекстови връзки, търсачки и специални инструменти. Анализ на нови интернет ресурси. История на появата и описание на западни и рускоезични търсачки.

      резюме, добавено на 05/12/2010

      Обосновка за избор на метод за извличане на ключова дума. Анализ на предметната област, проектиране на информационна система за търсене на релевантни документи. Изпълнение на заявки към електронни библиотеки. Внедряване на системния интерфейс за търсене на релевантни документи.

      дисертация, добавена на 21.09.2016 г

      Световната мрежае набор от информационни ресурси, свързани чрез телекомуникации и базирани на хипертекстово представяне на данни. Търсене на информация в интернет. Посочване на областта за търсене чрез маркиране на ключови думи.



    Свързани публикации