tévék. Konzolok. Projektorok és tartozékok. Technológiák. Digitális TV

Keresőmotor Yandex ru. Hogyan működik a Yandex kereső Mi az a Yandex kereső

Jó napot, SEO blogom kedves olvasói. . Ez a cikk arról szól hogyan működik a Yandex kereső milyen technológiákat és algoritmusokat használ a webhelyek rangsorolására, és mit tesz a felhasználók válaszainak előkészítésére. Sokan tudják, hogy az orosz keresésnek ez a zászlóshajója megadja az alaphangot a Runetben, birtokolja Eurázsia legnagyobb adatbázisát, több mint egymilliárd oldal tartalmát kezeli, és minden kérdésre tudja a választ. A Liveinternet 2012. augusztusi adatai szerint a Yandex részesedése Oroszországban 60,5%. A portál havi közönsége 48,9 millió fő. De nekünk, bloggereknek az a legfontosabb, hogy a kereső hogyan fogadja a kéréseinket, hogyan dolgozza fel azokat, és mi az eredménye. Egyrészt ezen információk ismerete és megértése megkönnyíti számunkra a Yandex összes erőforrásának használatát, másrészt könnyebben népszerűsíthetjük blogjainkat. Ezért azt javaslom, hogy legfeljebb nézzenek velem fontos technológiák a legjobb keresőmotor a Runeten.

Amikor egy internetfelhasználó először szeretne egy keresőmotorhoz fordulni információért, egy kérdés merülhet fel benne: „Hogyan működik a keresés?” De amikor megkapja, ez a kérdés gyakran egy másikra változik: „Miért ilyen gyorsan?” És tényleg, miért tart 20 másodpercig egy fájl keresése egy számítógépen, és miért jelenik meg egy másodperc alatt a számítógépek teljes hálózatától a világ minden tájáról érkező kérés eredménye? A legérdekesebb dolog az, hogy az első két kérdésre (hogyan történik a keresés és miért 1 másodperc) egy válaszban lehet válaszolni - a keresőmotor előre felkészült a felhasználó kérésére.

Ahhoz, hogy megértsük a Yandex működési elvét, mint más keresőmotorok, húzzunk egy analógiát telefonkönyv. Bármely telefonszám megtalálásához ismerni kell az előfizető vezetéknevét, és minden keresés ebben az esetben maximum egy percet vesz igénybe, mert a telefonkönyv minden oldala folyamatos alfabetikus index. De képzelje el, ha a keresést egy másik lehetőség használatával hajtanák végre, ahol a telefonszámokat maguk a számok rendeznék. Az ilyen, hosszabb ideig elhúzódó keresések után a számok nagyon sokáig a kereső szeme előtt maradnak. 🙂

Hasonlóképpen, a keresőmotor az internetről származó összes információt a számára kényelmes formában jeleníti meg. És ami a legfontosabb, mindezeket az adatokat előre elhelyezik a könyvtárában, még mielőtt a látogató megérkezne a kéréseivel. Vagyis amikor kérdést teszünk fel a Yandexnek, már tudja a válaszunkat. És egy pillanat alatt átadja nekünk. Ez a második azonban számos fontos folyamatot tartalmaz, amelyeket most részletesen megvizsgálunk.

Internetes indexelés

A Yandex ru minden olyan információt összegyűjt, ami a kezébe kerül az interneten. Speciális berendezések segítségével minden tartalom áttekintésre kerül, beleértve a vizuális paramétereken alapuló képeket is. Ilyen gyűjtéssel foglalkozik keresőmotor, az adatok gyűjtésének és előkészítésének folyamatát pedig indexelésnek nevezzük. Egy ilyen gép alapja egy számítógépes rendszer, amelyet másként keresőrobotnak neveznek. Rendszeresen feltérképezi az indexelt webhelyeket, ellenőrzi, hogy vannak-e új tartalmak, és az internetet is keresi a törölt oldalak után. Ha azt észleli, hogy egy ilyen oldal már nem létezik, vagy bezárták az indexelésből, eltávolítja a keresésből.

Hogyan talál egy keresőrobot új oldalakat? Először is a más oldalak linkjeinek köszönhetően. Mert ha egy linket helyeznek el egy új webes erőforrásra egy már indexelt webhelyről, akkor a következő alkalommal, amikor meglátogatja a másodikat, a robot meglátogatja az elsőt. Másodszor, van egy csodálatos szolgáltatás, amelyet népiesen „addurilka”-nak hívnak (az in angol-addurl - cím hozzáadása). Ebben megadhatja új oldalának címét, amelyet egy idő után egy keresőrobot is felkeres. Harmadszor, segítséggel speciális program A Yandex.Bar nyomon követi az azt használó felhasználók látogatásait. Ennek megfelelően, ha valaki egy új webes erőforráson landol, ott hamarosan megjelenik egy robot.

Minden oldal szerepel a keresésben? Naponta több millió oldalt indexelnek. Vannak köztük változó minőségű oldalak, amelyek tartalmazhatnak különféle információk- egyedi tartalomtól a teljes szemétig. Ráadásul a statisztikák szerint sokkal több szemét van az interneten. A keresőrobot speciális algoritmusok segítségével elemzi az egyes dokumentumokat. Meghatározza, hogy rendelkezik-e hasznos információval, és képes-e válaszolni a felhasználó kérésére. Ha nem, akkor az ilyen oldalakat nem fogadják el „kozmonautáknak”, de ha igen, akkor bekerül a keresésbe.

Miután egy robot felkeresett egy oldalt és meghatározta annak hasznosságát, megjelenik a keresőmotor tárhelyén. Itt minden dokumentumot az alapokig elemezünk, ahogy az autóközpont mesterei mondják - egészen a fogaskerekekig. Az oldalt megtisztítják a html jelölésektől, a tiszta szöveg teljes leltáron megy keresztül - minden szó helye kiszámításra kerül. Ebben a szétszedett formában az oldal számokat és betűket tartalmazó táblázattá alakul, amelyet egyébként indexnek neveznek. Mostantól függetlenül attól, hogy mi történik az oldalt tartalmazó webes erőforrással, annak legújabb példánya mindig elérhető a keresésben. Még ha a webhely már nem is létezik, a dokumentumainak másolatai egy ideig az interneten tárolódnak.

Minden index, a dokumentumtípusokra, kódolásra, nyelvre vonatkozó adatokkal, a másolatokkal együtt alkot keresési adatbázis . Időről időre frissül, így speciális szervereken található, amelyek segítségével feldolgozzák a keresőmotor felhasználóitól érkező kéréseket.

Milyen gyakran fordul elő az indexelési folyamat? Először is, ez a webhelyek típusától függ. Az első típusú webes erőforrás nagyon gyakran változtatja oldalainak tartalmát. Vagyis amikor egy keresőrobot minden alkalommal felkeresi ezeket az oldalakat, minden alkalommal más tartalmat tartalmaznak. Legközelebb nem fogsz találni semmit ezek használatával, ezért az ilyen webhelyek nem szerepelnek az indexben. A második típusú webhely egy adattárház, amelynek oldalaira időszakonként linkek kerülnek letöltésre. Egy ilyen oldal tartalma általában nem változik, így a robot rendkívül ritkán látogatja meg. Más oldalak az anyag frissítésének gyakoriságától függenek. Ez a következőket jelenti: minél gyorsabban jelenik meg az új tartalom az oldalon, annál gyakrabban jön a keresőrobot. És elsőbbséget élveznek a legfontosabb webes források (például egy híroldal egy nagyságrenddel fontosabb minden blognál).

Az indexelés lehetővé teszi a keresőmotor első funkciójának elvégzését - információgyűjtést az internet új oldalairól. De a Yandexnek van egy második funkciója is - válasz keresése a felhasználó kérésére egy már előkészített keresési adatbázisban.

A Yandex választ készít

A kérelem feldolgozásának és a megfelelő válaszok kiadásának folyamatát a számítógépes rendszer "Metasearch" . A munkájához először összegyűjti az összes bemeneti információt: melyik régióból érkezett a kérés, melyik osztályba tartozik, vannak-e hibák a kérésben stb. Az ilyen feldolgozás után a metasearch ellenőrzi, hogy vannak-e pontosan ugyanazok a lekérdezések azonos paraméterekkel az adatbázisban. Ha a válasz igen, akkor a rendszer megjeleníti a felhasználónak a korábban elmentett eredményeket. Ha ilyen kérdés nem létezik az adatbázisban, akkor a metakeresés az indexadatokat tartalmazó keresési adatbázist keresi.

És itt történnek csodálatos dolgok. Képzeld el, hogy van egy szupererős számítógép, amely a keresőrobotok által feldolgozott teljes internetet tárolja. A felhasználó beállít egy lekérdezést, és megkezdődik a keresés a memóriacellákban a lekérdezésben érintett összes dokumentumra vonatkozóan. A válasz megvan, és mindenki elégedett. De vegyünk egy másik esetet, amikor sok olyan kérés van, amelyek ugyanazokat a szavakat tartalmazzák a testükben. A rendszernek minden alkalommal ugyanazokon a memóriacellákon kell keresztülmennie, ami jelentősen megnövelheti az adatfeldolgozási időt. Ennek megfelelően az idő növekszik, ami a felhasználó elvesztéséhez vezethet - egy másik keresőmotorhoz fordul segítségért.

Az ilyen késedelmek elkerülése érdekében a webhelyindexben található összes másolat különböző számítógépek között van elosztva. A kérés továbbítása után a metasearch utasítja az ilyen szervereket, hogy keressenek rá a szövegrészükre. Ezt követően minden adat visszakerül ezekről a gépekről központi számítógép, az összes kapott eredményt egyesíti, és az első tíz legjobb választ adja a felhasználónak. Ezzel a technológiával két legyet ölnek meg egy csapásra: a keresési idő többszörösére csökken (a választ a másodperc töredéke alatt kapjuk meg), és a platformok növekedésének köszönhetően az információk megkettőződnek (az adatok nem vesznek el a hirtelen meghibásodások miatt ). Maguk a duplikált információkat tartalmazó számítógépek egy adatközpontot alkotnak - ez egy kiszolgálókkal ellátott helyiség.

Amikor a keresőmotor felhasználója feltesz egy lekérdezést, 100-ból 20 alkalommal a kérdésben szereplő eredmények nem egyértelműek. Például, ha beírja a „Napóleon” szót a keresősávba, akkor még nem tudni, milyen választ vár - süteményreceptet vagy a nagy parancsnok életrajzát. Vagy a „Grimm testvérek” kifejezés - mesék, filmek, zenei csoport. A célok ilyen lehetséges tartományának konkrét válaszokra szűkítésére a Yandex speciális technológiával rendelkezik S p e c t r. A keresési lekérdezési statisztikák segítségével figyelembe veszi a felhasználói igényeket. A látogatók által a Yandexben feltett összes kérdés közül a Spectrum különféle objektumokat azonosít bennük (személyek nevei, könyvek címei, autómodellek stb.). Ezek az objektumok bizonyos kategóriákba vannak osztva. Jelenleg több mint 60 ilyen kategória létezik. Segítségükkel a kereső az adatbázisában van különböző jelentések szavak a felhasználói lekérdezésekben. Érdekes módon ezeket a kategóriákat rendszeresen ellenőrzik (az elemzés hetente néhányszor történik), ami lehetővé teszi a Yandex számára, hogy pontosabban válaszoljon a feltett kérdésekre.

A Spectrum technológia alapján a Yandex párbeszédablakokat szervez. A keresősáv alatt jelennek meg, amelybe a felhasználó beírja kétértelmű lekérdezését. Ez a sor tükrözi azokat a kategóriákat, amelyekhez a kérdés alanya tartozhat. A további keresési eredmények attól függenek, hogy a felhasználó ezt a kategóriát választotta.

A Yandex keresőmotor felhasználóinak 15-30% -a csak helyi információkat szeretne kapni (a lakóhelyük szerinti régióból származó adatok). Például az Ön városának mozikjában megjelenő új filmekről. Ezért az ilyen kérésre adott válasznak régiónként eltérőnek kell lennie. Ebben a tekintetben a Yandex a technológiáját használja régiók alapján keressen . Például ezeket a válaszokat kaphatják azok a lakosok, akik filmrepertoárt keresnek az Oktyabr mozijukban:

De ezt az eredményt kapják Sztavropol város lakói ugyanazért a kérésért:

A felhasználó régióját elsősorban az IP-címe határozza meg. Néha ezek az adatok nem pontosak, mert több szolgáltató egyszerre több régióban is dolgozhat, és ezért megváltoztathatja felhasználóik IP-címét. Elvileg, ha ez megtörténik veled, könnyen megváltoztathatod a régiódat a keresőben a beállításokban. A jobb oldalon található felső sarok az eredményoldalon. Meg tudod változtatni.

Yandex ru keresőmotor - válaszeredmények

Amikor a Metasearch elkészítette a választ, a Yandex keresőmotorjának meg kell jelenítenie azt a találati oldalon. Ez a talált dokumentumokra mutató hivatkozások listája, mindegyikről egy kis információval. Az eredménykiadási technológia feladata, hogy a felhasználó számára a legrelevánsabb válaszokat a lehető leginformatívabb módon adja meg. Az egyik ilyen hivatkozás sablonja így néz ki:

Nézzük meg részletesebben ezt az eredményformát. Mert keresési eredmény címe A Yandex gyakran használja az oldal címének nevét (amit az optimalizálók írnak a címcímkébe). Ha nincs ott, akkor a cikk vagy bejegyzés címében szereplő szavak jelennek meg itt. Ha a cím szövege nagy, a keresőmotor ebbe a mezőbe írja be a cím szempontjából leginkább releváns töredéket. ezt a kérést.

Nagyon ritkán, de előfordul, hogy a cím nem egyezik a kérés tartalmával. Ebben az esetben a Yandex a keresési eredmény címét a cikkben vagy bejegyzésben található szöveg alapján alakítja ki. Biztosan lesznek benne kérdőszavak.

Mert töredék a kereső az oldalon található összes szöveget felhasználja. Kijelöli az összes töredéket, ahol a lekérdezésre adott válasz megtalálható, majd kiválasztja a legrelevánsabbat, és beszúrja a dokumentumra mutató hivatkozásokat az űrlapmezőbe. Ennek a megközelítésnek köszönhetően egy hozzáértő optimalizáló egy részlet megtekintése után újra elkészítheti azt, ezáltal javítva a hivatkozás vonzerejét.

A felhasználói kérés eredményének jobb észlelése érdekében a címsorok hivatkozásként vannak formázva a szövegben (kék színnel kiemelve aláhúzással). Annak érdekében, hogy a webes erőforrás vonzóvá és felismerhetővé váljon, egy favicon kerül hozzáadásra - egy kis márkás webhely ikon. A szöveg bal oldalán jelenik meg a címsor előtti első sorban. A kérésben szereplő összes szó a válaszban is kiemelve van. vastagon szedve az észlelés megkönnyítése érdekében.

IN utóbbi időben A Yandex keresőmotor különféle információkat ad a részlethez, amelyek segítségével a felhasználó még gyorsabban és pontosabban találja meg a választ. Például, ha a felhasználó beírja egy szervezet nevét a kérelmébe, akkor a Yandex hozzáadja annak címét, elérhetőségeit és a földrajzi térképek helyére mutató hivatkozást a részletben. Ha a kereső ismeri az oldal felépítését, amely a felhasználó számára választ tartalmazó dokumentumot tartalmaz, akkor biztosan megmutatja. Ráadásul a Yandex azonnal hozzáadhatja egy ilyen webes erőforrás leglátogatottabb oldalait a részlethez, így a látogató, ha kívánja, azonnal eljuthat a kívánt részhez, időt takarítva meg.

Vannak olyan töredékek, amelyek egy termék árát tartalmazzák egy online áruházhoz, egy szálloda vagy étterem értékelését csillagok formájában, és más érdekes információkat tartalmaznak különféle számokkal a keresési dokumentumokban található objektumokról. Az ilyen információk célja, hogy megadják teljes lista adatok azokról az elemekről vagy tárgyakról, amelyek érdeklik a felhasználót.

Általában már tól különféle példák A válaszoldal így fog kinézni:

Rangsorolás és értékelők

A Yandex feladata nem csak az összes keresése lehetséges opciók válasz, hanem a legjobbak (releváns) kiválasztása is. Végül is a felhasználó nem fogja áttúrni az összes linket, amelyet a Yandex keresési eredményként fog megadni. A keresési eredmények rendszerezésének folyamatát ún rangsor . Vagyis a rangsor határozza meg a javasolt válaszok minőségét.

Vannak szabályok, amelyek alapján a Yandex meghatározza a releváns oldalakat:

  • A keresési minőséget rontó webhelyek leminősítésre kerülnek az eredményoldalon. Általában ezek olyan webes források, amelyek tulajdonosai megpróbálják megtéveszteni a keresőmotort. Például ezek olyan webhelyek, amelyek oldalain értelmetlen vagy láthatatlan szöveg található. Természetesen egy keresőrobot számára látható és érthető, de a dokumentumot olvasó látogató számára nem. Vagy olyan webhelyek, amelyek egy linkre kattintva a keresési eredmények területén azonnal áthelyezik a felhasználót egy teljesen más webhelyre.
  • Az erotikus tartalmat tartalmazó webhelyek nem szerepelnek az eredmények között, vagy jelentősen csökkentek a rangsorban. Ez annak a ténynek köszönhető, hogy az ilyen internetes források gyakran használnak agresszív promóciós módszereket.
  • A vírusokkal fertőzött oldalak nem kerülnek lesorolásra a keresési eredmények között, és nem záródnak ki a keresési eredményekből – ebben az esetben a felhasználót egy speciális ikon segítségével tájékoztatják a veszélyről. Ez annak a ténynek köszönhető, hogy a Yandex feltételezi, hogy az ilyen webes források fontos dokumentumokat tartalmazhatnak a keresőmotor látogatóinak kérésére.

Például a Yandex így rangsorolja a webhelyeket az „alma” lekérdezésre:

A rangsorolási tényezők mellett a Yandex speciális mintákat használ olyan lekérdezésekhez és válaszokhoz, amelyeket a keresőmotorok felhasználói a legmegfelelőbbnek tartanak. Jelenleg egyetlen gép sem tud ilyen mintákat készíteni – ez az ember kiváltsága. A Yandexben az ilyen szakembereket hívják értékelők. Feladatuk az összes keresési dokumentum teljes elemzése és a megadott lekérdezésekre adott válaszok kiértékelése. Kiválasztják a legjobb válaszokat, és létrehoznak egy speciális képzési készletet. Ebben a keresőmotor a releváns oldalak és tulajdonságaik közötti kapcsolatot látja. Az ilyen információk birtokában a Yandex minden kéréshez kiválaszthatja az optimális rangsorolási képletet. Az ilyen képlet elkészítésének módszerét Matrixnetnek nevezik. Ennek a rendszernek az az előnye, hogy ellenáll a túlillesztésnek, ami lehetővé teszi számos rangsorolási tényező figyelembevételét anélkül, hogy növelné a szükségtelen minősítések és minták számát.

A bejegyzésem végén érdekes statisztikákat szeretnék mutatni, amelyeket a Yandex keresőmotor gyűjtött össze munkája során.

1. A személynevek népszerűsége Oroszországban és az orosz városokban (az adatok bloggerek és közösségi hálózatok felhasználói 2012. márciusi beszámolóiból származnak).

Nagy Látó

1863-ban a nagy író, Jules Verne megalkotta következő könyvét „Párizs a 20. században”. Ebben részletesen leírta a metrót, az autót, a villanyszéket, a számítógépet és még az internetet is. A kiadó azonban megtagadta a könyv kinyomtatását, és több mint 120 évig ott feküdt, mígnem Jules Verne dédunokája 1989-ben rá nem talált. A könyv 1994-ben jelent meg.

Ebben a cikkben arról fogok beszélni, hogy mi a Yandex keresőmotor, hogyan működik ez a kereső, és példákat adok azokra a webhelyekre, amelyeket a Yandex keresőmotor korlátoz a rangsorban.

Keresőmotor A Yandex a népszerűség tekintetében a 20. helyen áll a világon és az 1. Oroszországban. Hivatalosan a Yandex céget 1997-ben, szeptember 23-án hagyták jóvá, fejlesztése a Comp Tek International cég keretein belül kezdődött, és már 2000-ben a Yandex önálló cégként kezdett létezni.

A cég alapítói Volozh Arkady Jurijevics, aki az ügyvezető igazgató, és Szegalovics Ilja Valentinovics (1964-2013), a Yandex alapítója, technológiai és fejlesztési igazgató. Kicsit tanultunk a Yandex történetéről, most beszéljünk a keresőjéről.

Így a Yandex cég fő iránya a kereső, jellegzetes tulajdonsága ami finomhangolás keresési lekérdezés. A Yandex keresőmotorja lehetővé teszi a kiválasztott lekérdezés keresését orosz, ukrán, fehérorosz, tatár, kazah, angol, török, német és francia nyelven, figyelembe véve azok morfológiai helyesírását.

A Yandex egy alapos algoritmust is kidolgozott a relevancia értékelésére és a dokumentumok ellenőrzésének elveire, kizárva a különböző kódolású másolataikat. Ellentétben a Google-lel, pontosabban a PR-rangsorolási algoritmusától - a PageRank, egy másik fontos pont a Yandex keresőmotor számára a tematikus hivatkozási index - TIC - bevezetése.

A Yandex keresőmotor munkája

http://www.yandex.ru
A Yandex keresőben vannak olyan robotok, amelyek képviselik egy konkrét program hogy ellenőrizze a webhelyek relevanciáját. A keresőrobotok közvetlen hivatkozásokon keresztül jutnak el az oldalra, új oldalakat indexelnek és elmentenek az adatbázisukba. Ahhoz, hogy egy webhely indexelt oldala a TOP-ba kerüljön, ami nagyon fontos, figyelembe kell venni olyan indexelési kérdéseket, mint a kulcsszavak gyakorisága az oldalon, az Ön webhelyére vezető külső hivatkozások száma, ill. a webhely teljes súlya, amelyet egy olyan mutató mér, mint a Yandex TIC.

Példa azokra a webhelyekre, amelyeket a Yandex rendszer korlátoz a rangsorban

Nem egyedi tartalommal rendelkező webhelyek, amelyeket más webhelyekről másoltak vagy írtak át.

Olyan webhelyek, amelyek csoportokban intenzíven kapcsolódnak egymáshoz.

Értelmetlen tartalommal rendelkező webhelyek.

Megtévesztő technológiát használó webhelyek.

Fórumok és üzenőfalak, amelyek sok linkspamet tartalmaznak.

Olyan webhelyek, amelyek olyan külső hivatkozások elhelyezésével próbálnak relevanciát elérni, amelyek nem a szerző felkérése, hogy látogassa meg erőforrását.

1. Kifejezések és fogalommeghatározások Ebben a személyes adatok kezeléséről szóló megállapodásban (a továbbiakban: Megállapodás) az alábbi kifejezések meghatározásai a következők: Üzemeltető – egyéni vállalkozó Oleg Aleksandrovich Dneprovsky. A Szerződés elfogadása - a Megállapodás összes feltételének teljes és feltétel nélküli elfogadása személyes adatok elküldésével és feldolgozásával. Személyes adatok - a Felhasználó (a személyes adatok alanya) által az oldalon megadott, közvetlenül vagy közvetve ezzel a Felhasználóval kapcsolatos információk. Felhasználó - bármely magánszemély ill jogi személy , miután sikeresen befejezte a beviteli mezők kitöltésének folyamatát az oldalon. A beviteli mezők kitöltése az az eljárás, amellyel a Felhasználó beazonosítás céljából beküldi keresztnevét, vezetéknevét, telefonszámát, személyes e-mail címét (a továbbiakban: Személyes adat) az oldal regisztrált felhasználóinak adatbázisába. a Felhasználó. A beviteli mezők kitöltése eredményeként a személyes adatok az Üzemeltető adatbázisába kerülnek. A beviteli mezők kitöltése önkéntes. weboldal – az interneten található, egy oldalból álló weboldal. 2. Általános rendelkezések 2.1. Ez a megállapodás a 2006. július 27-i 152-FZ „A személyes adatokról” szövetségi törvény követelményei és az „Orosz Föderáció jogszabályainak megsértése a személyes adatok területén” című 13.11. cikkének rendelkezései alapján készült. személyes adatok” az Orosz Föderáció adminisztratív szabálysértési kódexében foglaltak szerint, és minden olyan személyes adatra érvényes, amelyet az Üzemeltető a Webhely használata során a Felhasználóról megszerezhet. 2.2. A beviteli mezők Felhasználó általi kitöltése az oldalon azt jelenti, hogy a Felhasználó feltétel nélkül beleegyezik a jelen Szerződés összes feltételébe (a Szerződés elfogadása). Ha nem ért egyet ezekkel a feltételekkel, a Felhasználó nem tölti ki az oldalon található beviteli mezőket. 2.3. A Felhasználó hozzájárulása a személyes adatok Üzemeltető részére történő átadásához és azok Üzemeltető általi kezeléséhez az Üzemeltető tevékenységének megszűnéséig vagy a Felhasználó hozzájárulásának visszavonásáig érvényes. A Felhasználó a jelen Szerződés elfogadásával és a regisztrációs eljárás lefolytatásával, valamint az oldal utólagos belépésével megerősíti, hogy szabad akaratából és saját érdekében személyes adatait feldolgozás céljából átadja az Üzemeltetőnek, és hozzájárul ahhoz, hogy feldolgozásuk. A Felhasználót értesítjük, hogy személyes adatainak feldolgozását az Üzemeltető a 2006. július 27-i 152-FZ „A személyes adatokról” szövetségi törvény alapján végzi. 3. Az Üzemeltetőnek átadandó, a felhasználóra vonatkozó személyes adatok és egyéb információk listája 3.1. Az Üzemeltető Weboldal használata során a Felhasználó az alábbi személyes adatokat adja meg: 3.1.1. Megbízható személyes adatok, amelyeket a Felhasználó a beviteli mezők kitöltésekor és/vagy a Weboldal szolgáltatásainak igénybevétele során önállóan ad meg magáról, ideértve a vezetéknév, keresztnév, apanév, telefonszám (otthoni vagy mobil), személyes e-mail cím. 3.1.2. Azok az adatok, amelyek a Felhasználó készülékére telepített szoftver segítségével azok használata során automatikusan átkerülnek az Oldal szolgáltatásaiba szoftver, beleértve az IP-címet, a cookie-kból származó információkat, a Felhasználó böngészőjére vonatkozó információkat (vagy más olyan programokat, amelyeken keresztül a szolgáltatások elérhetők). 3.2. Az Üzemeltető nem ellenőrzi a Felhasználó által megadott személyes adatok pontosságát. Ebben az esetben az Üzemeltető feltételezi, hogy a Felhasználó megbízható és elegendő személyes információt ad a beviteli mezőkben javasolt kérdésekről. 4. A személyes adatok gyűjtésének és felhasználásának céljai, szabályai 4.1. Az Üzemeltető olyan személyes adatokat kezel, amelyek a Felhasználó szolgáltatásainak nyújtásához és szolgáltatások nyújtásához szükségesek. 4.2. A Felhasználó személyes adatait az Üzemeltető az alábbi célokra használja fel: 4.2.1. Felhasználó azonosítása; 4.2.2. A Felhasználó személyre szabott szolgáltatásainak biztosítása (valamint a cég új akcióiról, szolgáltatásairól levélben történő tájékoztatás); 4.2.3. Szükség esetén kapcsolattartás a Felhasználóval, ideértve a szolgáltatások igénybevételével, szolgáltatásnyújtásával kapcsolatos értesítések, kérések, információk küldését, valamint a Felhasználó kérelmének, kérelmeinek feldolgozását; 4.3. A személyes adatok kezelése során a következő tevékenységekre kerül sor: gyűjtés, rögzítés, rendszerezés, felhalmozás, tárolás, pontosítás (frissítés, módosítás), kimásolás, felhasználás, zárolás, törlés, megsemmisítés. 4.4. A felhasználó nem tiltakozik az ellen, hogy az általa meghatározott információkat bizonyos esetekben átadják az Orosz Föderáció felhatalmazott állami szerveinek az Orosz Föderáció hatályos jogszabályainak megfelelően. 4.5. A Felhasználó személyes adatait az Üzemeltető a jelen Szerződésben meghatározott módon tárolja és kezeli az Üzemeltető tevékenységének teljes időtartama alatt. 4.6. A személyes adatok kezelését az Üzemeltető adatbázisok vezetésével, automatizált, mechanikus és manuális módszerekkel végzi. 4.7. Az oldal használ Cookie-kés egyéb technológiák a webhely szolgáltatásainak használatának nyomon követésére. Ezek az adatok az optimalizáláshoz szükségesek műszaki munka Weboldal és a szolgáltatás minőségének javítása. Az oldal automatikusan rögzíti az információkat (beleértve az URL-t, az IP-címet, a böngésző típusát, a nyelvet, a kérés dátumát és időpontját) a webhely minden látogatójáról. A felhasználónak jogában áll megtagadni a személyes adatok megadását a Webhely meglátogatásakor, vagy letiltani a sütiket, de ebben az esetben előfordulhat, hogy a Webhely nem minden funkciója működik megfelelően. 4.8. A jelen Szerződésben meghatározott titoktartási feltételek minden olyan információra vonatkoznak, amelyet az Üzemeltető a Felhasználóról az Oldalon való tartózkodása és az Oldal használata során szerezhet meg. 4.9. A jelen Megállapodás végrehajtása során nyilvánosan közzétett információk, valamint azok az információk, amelyeket a felek vagy harmadik felek olyan forrásokból szerezhetnek be, amelyekhez bárki szabadon hozzáférhet, nem minősül bizalmasnak. 4.10. Az Üzemeltető minden szükséges intézkedést megtesz annak érdekében, hogy a Felhasználó személyes adatait megóvja a jogosulatlan hozzáféréstől, módosítástól, nyilvánosságra hozataltól vagy megsemmisítéstől, ideértve: az adatgyűjtési, tárolási és feldolgozási folyamatok folyamatos belső ellenőrzését és a biztonság garantálását; biztosítja az adatok fizikai biztonságát, megakadályozva az illetéktelen hozzáférést az oldal működését biztosító technikai rendszerekhez, amelyekben az Üzemeltető személyes adatokat tárol; a személyes adatokhoz csak az Üzemeltető azon alkalmazottai vagy felhatalmazott személyek számára biztosít hozzáférést, akiknek szükségük van ezekre az információkra a Felhasználónak nyújtott szolgáltatásokkal, valamint az Oldal üzemeltetésével, fejlesztésével és fejlesztésével közvetlenül összefüggő feladatok ellátásához. 4.11. A Felhasználó személyes adatai bizalmasak maradnak, kivéve azokat az eseteket, amikor a Felhasználó önként ad magáról adatokat általános hozzáférés céljából korlátlan számú személy számára. 4.12. A Felhasználó személyes adatainak az Üzemeltető általi továbbítása az Üzemeltető átszervezése és a jogok átruházása az Üzemeltető jogutódjára során jogszerű, míg a jelen Szerződésben foglaltak betartására vonatkozó minden kötelezettség az általa kapott adatokkal kapcsolatban átkerült a jogutódhoz személyes adatok. 4.13. Ez a nyilatkozat csak az Üzemeltető webhelyére vonatkozik. A Vállalat nem ellenőrzi és nem vállal felelősséget harmadik felek webhelyeiért (szolgáltatásaiért), amelyekhez a felhasználó az Üzemeltető webhelyén elérhető hivatkozásokon keresztül hozzáférhet, beleértve a keresési eredményeket is. Az ilyen Oldalakon (szolgáltatásokon) a felhasználótól egyéb személyes adatok gyűjthetők vagy kérhetők, illetve egyéb tevékenységek is végrehajthatók. 5. A felhasználó, mint személyes adatok alanya jogai, a személyes adatok felhasználó általi megváltoztatása és törlése 5.1. A felhasználónak joga van: 5.1.2. Kötelezheti az Üzemeltetőt személyes adatainak pontosítására, zárolására vagy megsemmisítésére, ha a személyes adat hiányos, elavult, pontatlan, jogellenesen jutott vagy az adatkezelés megjelölt céljához nem szükséges, valamint jogainak védelme érdekében törvényben előírt intézkedéseket is megtenni. 5.1.3. Tájékoztatást kaphat személyes adatainak kezeléséről, beleértve az alábbiakat: 5.1.3.1. a személyes adatok Üzemeltető általi feldolgozásának tényének megerősítése; 5.1.3.2. az üzemeltető által a személyes adatok feldolgozásának céljai és módjai; 5.1.3.3. az Üzemeltető neve és székhelye; 5.1.3.4. a személyes adatok érintett alanyával kapcsolatos kezelt személyes adatok, azok beérkezésének forrása, kivéve, ha a szövetségi törvény eltérő eljárást ír elő az ilyen adatok bemutatására; 5.1.3.5. a személyes adatok feldolgozásának feltételei, beleértve a tárolás időtartamát is; 5.1.3.6. az Orosz Föderáció hatályos jogszabályai által előírt egyéb információk. 5.2. A személyes adatok kezeléséhez adott hozzájárulásának visszavonását a Felhasználó úgy teheti meg, hogy a megfelelő írásos (nyomtatott anyagi közegés a Felhasználó által aláírt) értesítést. 6. Az Üzemeltető kötelezettségei. Személyes adatokhoz való hozzáférés 6.1. Az Üzemeltető vállalja, hogy megakadályozza az Üzemeltető Weboldal Felhasználóinak személyes adataihoz való jogosulatlan és nem célzott hozzáférést. Ugyanakkor felhatalmazott és célzott hozzáférés az Oldalhasználók személyes adatait azokhoz az összes érdekelt fél hozzáférésének tekinti, az Üzemeltető oldal tevékenységi céljainak és tárgyának keretében valósul meg. Ugyanakkor az Üzemeltető nem vállal felelősséget a Felhasználók személyes adataival való esetleges visszaélésért, amely a következők miatt következik be: a szoftverben, valamint a hardverben és a hálózatokban az Üzemeltetőn kívül eső műszaki problémák; az Üzemeltető Weboldalainak harmadik fél általi szándékos vagy nem szándékos, nem rendeltetésszerű használatával kapcsolatban; 6.2 Az Üzemeltető megteszi a szükséges és elégséges szervezési és technikai intézkedéseket annak érdekében, hogy megvédje a felhasználó személyes adatait a jogosulatlan vagy véletlenszerű hozzáféréstől, megsemmisítéstől, módosítástól, blokkoltól, másolástól, terjesztéstől, valamint harmadik felek egyéb jogellenes tevékenységétől. 7. Az adatvédelmi szabályzat változásai. Alkalmazandó jogszabályok 7.1. Az Üzemeltető jogosult a jelen Szabályzatot a Felhasználók külön értesítése nélkül módosítani. Ha módosítja az aktuális kiadást, a dátum megjelenik utolsó frissítés

. A Szabályzat új kiadása a közzététel pillanatától lép hatályba, hacsak a Szabályzat új kiadása másként nem rendelkezik. 7.2. Az Orosz Föderáció joga alkalmazandó erre a rendeletre, valamint a Felhasználó és az Üzemeltető közötti, a Rendelet alkalmazásával összefüggésben létrejött kapcsolatra. elfogadom nem fogadom el Régóta szerves részévé váltak

Orosz Internet

. A keresőmotorok ma már hatalmas és összetett mechanizmusok, amelyek nemcsak információkereső eszközt jelentenek, hanem csábító területeket is jelentenek az üzleti élet számára.

A keresőmotor-felhasználók többsége soha nem gondolkodott (vagy gondolkodott rajta, de nem talált választ) a keresőmotorok működési elvén, a felhasználói kérések feldolgozásának sémáján, miből állnak ezek a rendszerek és hogyan működnek...

A keresőrendszer egy szoftver- és hardverkomplexum, amelyet arra terveztek, hogy keressen az interneten, és válaszoljon a felhasználói kérésekre, szöveges kifejezés (keresési lekérdezés) formájában, az információforrásokra mutató hivatkozások listájának elkészítésével, relevancia szerinti sorrendben ( a kérésnek megfelelően). A legnagyobb nemzetközi keresők: "Google", Yahoo , MSN . Az orosz interneten ezek a Yandex, a Rambler, az Aport.

Nézzük meg közelebbről a keresési lekérdezés fogalmát a Yandex keresőmotor segítségével. A keresési lekérdezést a felhasználónak annak megfelelően kell megfogalmaznia, hogy mit szeretne találni, a lehető legrövidebben és legegyszerűbben. Tegyük fel, hogy a Yandexben szeretnénk információkat találni az autó kiválasztásáról. Ehhez nyissa meg a Yandex főoldalát, és írja be a „hogyan válasszunk autót” keresési lekérdezés szövegét. Ezt követően a feladatunk az, hogy megnyitjuk a kérésünkre megadott hivatkozásokat az internetes információforrásokhoz. Lehetséges azonban, hogy nem találjuk meg a szükséges információkat. Ha ez megtörténik, akkor vagy újra kell fogalmaznia a kérését, vagy a keresőmotor adatbázisa valóban nem tartalmaz releváns információt a kérésünkre vonatkozóan (ez akkor fordulhat elő, ha nagyon „szűk” lekérdezéseket teszünk fel, mint pl. „hogyan válasszunk egy autó Arhangelszkben)

Minden keresőmotor elsődleges célja, hogy az embereknek pontosan azt az információt közölje, amit keresnek. És megtanítani a felhasználókat, hogy „helyes” kéréseket intézzenek a rendszerhez, pl. a keresőmotorok működési elveinek megfelelő lekérdezések lehetetlenek. Ezért a fejlesztők olyan algoritmusokat és működési elveket hoznak létre a keresőmotorok számára, amelyek lehetővé teszik a felhasználók számára, hogy megtalálják a keresett információkat.

Ez azt jelenti, hogy a keresőmotornak ugyanúgy kell „gondolnia”, mint a felhasználónak, amikor információt keres. Amikor a felhasználó kérést intéz egy keresőmotorhoz, a lehető leggyorsabban és legegyszerűbben szeretné megtalálni, amire szüksége van. Az eredményt megkapva több alapvető paramétertől vezérelve értékeli a rendszer teljesítményét. Megtalálta, amit keresett? Ha nem találta meg, hányszor kellett átfogalmaznia a lekérdezést, hogy megtalálja, amit keresett? Mennyi naprakész információk sikerült megtalálnia? Milyen gyorsan dolgozta fel a kereső a lekérdezést? Mennyire voltak kényelmesek a keresési eredmények megjelenítése? A keresett eredmény az első vagy a századik volt? Mennyi felesleges szemetet találtak vele együtt hasznos információkat? A keresőmotor elérésekor, mondjuk, egy hét vagy egy hónap múlva megtalálják a szükséges információkat?

Annak érdekében, hogy mindezen kérdéseket válaszokkal kielégítsék, a keresőmotor-fejlesztők folyamatosan fejlesztik a keresési algoritmusokat és elveket, új funkciókat és képességeket adnak hozzá, és minden lehetséges módon igyekeznek felgyorsítani a rendszer működését.

3. A keresőmotor főbb jellemzői

Ismertesse a keresőmotorok főbb jellemzőit:

  • Teljesség

    A teljesség a keresőrendszer egyik fő jellemzője, amely a lekéréssel talált dokumentumok számának aránya az interneten található összes, az adott kérést kielégítő dokumentum számához viszonyítva. Például, ha az interneten 100 oldal található, amely tartalmazza a „hogyan válasszunk autót” kifejezést, és ezek közül csak 60 található a megfelelő lekérdezéshez, akkor a keresés teljessége 0,6 lesz. Nyilvánvalóan minél teljesebb a keresés, annál kevésbé valószínű, hogy a felhasználó nem találja meg a számára szükséges dokumentumot, feltéve, hogy az egyáltalán létezik az interneten.

  • Pontosság

    A pontosság a keresőmotor másik fő jellemzője, amelyet az határoz meg, hogy a talált dokumentumok mennyire egyeznek a felhasználó lekérdezésével. Például, ha a „hogyan válasszunk autót” lekérdezés 100 dokumentumot tartalmaz, ezek közül 50 tartalmazza a „hogyan válasszak autót” kifejezést, a többi pedig egyszerűen ezeket a szavakat („hogyan válasszuk ki a megfelelő rádiót és telepítsük egy autó”), akkor a keresési pontosságot 50/100-nak (=0,5) tekintjük. Minél pontosabb a keresés, a gyorsabb felhasználó meg fogja találni a számára szükséges dokumentumokat, minél kevesebb különféle „szemét” található közöttük, annál ritkábban nem felelnek meg a talált dokumentumok a kérésnek.

  • Relevancia

    A relevancia ugyanilyen fontos összetevője a keresésnek, amelyet az jellemez, hogy a dokumentumok interneten való közzétételétől a keresőmotor index adatbázisába való bekerüléséig eltelik az idő. Például az érdekes hírek megjelenése utáni napon nagyszámú felhasználó fordult releváns lekérdezésekkel a keresőmotorokhoz. Objektíven egy nap sem telt el a témával kapcsolatos hírek megjelenése óta, de a főbb dokumentumok már indexelve és kereshetővé váltak, köszönhetően a nagy keresőmotorok úgynevezett „gyors adatbázisának”, amely naponta többször frissül.

  • Keresés sebessége

    A keresési sebesség szorosan összefügg a terhelési ellenállásával. Például a Rambler Internet Holding LLC szerint ma munkaidőben a Rambler keresőmotorja körülbelül 60 kérést kap másodpercenként. Az ilyen munkaterhelés csökkenti az egyedi kérések feldolgozásának idejét. Itt a felhasználó és a keresőmotor érdekei egybeesnek: a látogató minél gyorsabban szeretne eredményt kapni, a keresőnek pedig a lehető leggyorsabban kell feldolgoznia a kérést, hogy ne lassítsa a későbbi lekérdezések számítását.

  • Láthatóság

4. Rövid történelem kereső fejlesztés

Az Internet fejlődésének kezdeti időszakában felhasználóinak száma csekély, a rendelkezésre álló információ mennyisége viszonylag csekély volt. A legtöbb esetben csak a kutatók fértek hozzá az internethez. Ebben az időben az internetes információkeresés nem volt olyan sürgős, mint most.

A hozzáférés megszervezésének egyik első módja információs források A hálózat elkezdte létrehozni a webhelyek nyílt könyvtárait, az erőforrásokra mutató hivatkozásokat, amelyekben téma szerint csoportosították. Az első ilyen projekt a Yahoo.com weboldal volt, amely 1994 tavaszán nyílt meg. Miután a katalógusban található webhelyek száma jelentősen megnőtt, a katalógusban lehetőség nyílt a szükséges információk keresésére. Teljes értelemben ez még nem volt keresőmotor, mivel a keresési terület csak a katalógusban található erőforrásokra korlátozódott, és nem minden internetes forrásra.

A linkkönyvtárakat korábban széles körben használták, de mára szinte teljesen elvesztették népszerűségüket. Mivel még a modern, hatalmas mennyiségű katalógusok is csak az Internet elenyésző részéről tartalmaznak információt. A DMOZ hálózat legnagyobb címtára (más néven Open Directory Project) mintegy 5 millió forrás információt tartalmaz, míg a Google kereső adatbázisa több mint 8 milliárd dokumentumból áll.

1995-ben megjelentek a Lycos és az AltaVista keresőmotorok. Ez utóbbi évek óta vezető szerepet tölt be az internetes információkeresés területén.

1997-ben Sergey Brin és Larry Page létrehozta a Google keresőmotorját, mint a kutatási projekt a Stanford Egyetemen. A jelenben Google pillanat- a világ legnépszerűbb keresője!

1997 szeptemberében hivatalosan is bejelentették a Yandex keresőmotort, amely a legnépszerűbb az orosz nyelvű interneten.

Jelenleg három fő keresőmotor létezik (nemzetközi) - a Google, a Yahoo és, amelyek saját adatbázisokkal és keresési algoritmusokkal rendelkeznek. A legtöbb más keresőmotor (amelyek közül sok van) ilyen vagy olyan formában használja a felsorolt ​​három találatát. Például az AOL keresés (search.aol.com) a Google adatbázisát használja, míg az AltaVista, a Lycos és az AllTheWeb a Yahoo adatbázist.

5. A keresőrendszer összetétele és működési elvei

Oroszországban a fő keresőmotor a Yandex, ezt követi a Rambler.ru, Google.ru, Aport.ru, Mail.ru. Ezenkívül a Mail.ru jelenleg a Yandex keresőmotorját és adatbázisát használja.

Szinte minden nagyobb keresőmotor saját szerkezettel rendelkezik, amely különbözik a többitől. Lehetőség van azonban az összes keresőmotorban közös fő összetevők azonosítására. A szerkezeti különbségek csak ezen összetevők kölcsönhatási mechanizmusainak megvalósításában lehetnek.

Indexelő modul

Az indexelő modul három segédprogramból (robotból) áll:

A Spider egy weboldalak letöltésére tervezett program. A pók letölti az oldalt, és lekéri az oldalról az összes belső hivatkozást. Minden oldal html kódja letöltődik. A robotok HTTP protokollokat használnak az oldalak letöltéséhez. A pók a következőképpen működik. A robot elküldi a „get/path/document” kérést és néhány más HTTP kérés parancsot a szervernek. Válaszul a robot megkapja a szolgáltatási információkat és magát a dokumentumot tartalmazó szövegfolyamot.

  • Oldal URL-je
  • az oldal letöltésének dátuma
  • Szerver válasz http fejléc
  • oldal törzse (html kód)

A Crawler ("utazó" pók) egy olyan program, amely automatikusan követi az oldalon található összes hivatkozást. Kijelöli az oldalon található összes hivatkozást. Feladata az, hogy meghatározza, merre menjen tovább a pók, hivatkozások vagy egy előre meghatározott címlista alapján. A Crawler a talált linkeket követve olyan új dokumentumokat keres, amelyek még ismeretlenek a kereső számára.

Az Indexer (robot indexer) egy olyan program, amely elemzi a pókok által letöltött weboldalakat. Az indexelő elemzi az oldalt alkotóelemeire, és saját lexikai és morfológiai algoritmusai segítségével elemzi azokat. Különféle oldalelemeket elemeznek, például szöveget, címsorokat, hivatkozásokat, szerkezeti és stílusjegyeket, speciális szolgáltatási HTML-címkéket stb.

Így az indexelő modul lehetővé teszi egy adott erőforráskészlet feltérképezését hivatkozások segítségével, a talált oldalak letöltését, az új oldalakra mutató hivatkozások kinyerését a kapott dokumentumokból, és ezeknek a dokumentumoknak a teljes elemzését.

Adatbázis

Az adatbázis vagy keresőindex egy adattároló rendszer, egy információs tömb, amelyben az indexelő modul által letöltött és feldolgozott összes dokumentum speciálisan átalakított paraméterei tárolódnak.

Keresőszerver

A keresőszerver az egész rendszer legfontosabb eleme, hiszen a keresés minősége és sebessége közvetlenül függ a működését megalapozó algoritmusoktól.

A keresőszerver a következőképpen működik:

  • A felhasználótól kapott kérést morfológiai elemzésnek vetjük alá. Az adatbázisban található minden egyes dokumentum információs környezete generálódik (amely ezt követően formában, azaz a keresési eredményoldalon a kérésnek megfelelő szöveges információ formájában jelenik meg).
  • A kapott adatokat bemeneti paraméterként egy speciális rangsoroló modulhoz továbbítják. Minden dokumentum adatfeldolgozása megtörténik, ennek eredményeként minden dokumentumnak saját minősítése van, amely jellemzi a felhasználó által bevitt lekérdezés relevanciáját, illetve a keresőindexben tárolt dokumentum különböző összetevőit.
  • A felhasználó választásától függően ez az értékelés további feltételekkel módosítható (például az úgynevezett „bővített keresés”).
  • Ezután egy töredéket generálunk, vagyis minden talált dokumentumhoz kivonjuk a dokumentumtáblából a címet, a lekérdezésnek leginkább megfelelő rövid kivonatot, valamint magára a dokumentumra mutató hivatkozást, és kiemeljük a talált szavakat.
  • A kapott keresési eredményeket SERP (Search Engine Result Page) – keresési eredményoldal – formájában továbbítják a felhasználónak.

Mint látható, ezek az összetevők szorosan kapcsolódnak egymáshoz és kölcsönhatásban működnek, világos, meglehetősen összetett mechanizmust alkotva a keresőrendszer működéséhez, amely hatalmas erőforrásokat igényel.

6. Következtetés

Most pedig foglaljuk össze a fentieket.

  • Minden keresőmotor elsődleges célja, hogy az embereknek pontosan azt az információt közölje, amit keresnek.
  • A keresőmotorok főbb jellemzői:
    1. Teljesség
    2. Pontosság
    3. Relevancia
    4. Keresés sebessége
    5. Láthatóság
  • Az első teljes értékű kereső az 1994-ben megjelent WebCrawler projekt volt.
  • A keresőrendszer a következő összetevőket tartalmazza:
    1. Indexelő modul
    2. Adatbázis
    3. Keresőszerver

Reméljük, hogy mesterkurzusunk lehetővé teszi, hogy jobban megismerje a keresőmotor fogalmát, és jobban megértse a keresőmotorok fő funkcióit, jellemzőit és működési elveit.

Ma egy másikba megyünk hosszú távon utazás a keresőmotor-fejlesztés díszes ösvényein ( Yandex, Yandex). Azt hiszem, az online keresés hazai óriása már régen olyan szintre nőtt, hogy nem kell lustálkodni és beleásni minden zugába, emlékezni, hogyan fejlődött a Yandex kereső, és mi volt az egész során érdekes. fennállásának éveit.

Sőt, sok látogató érkezik a Yandex keresőjéből. Sokan elmennek közülük kontextuális reklámozás, Nemrég fogadott örökbe a blog, úgyhogy szerintem ez a cég több mint megérdemel egy nagy bejegyzést róla.

Ha figyelembe vesszük az orosz internetet, akkor a Yandex a vitathatatlan vezető. Oroszországban ez az első legfontosabb keresőmotor. Vannak regionális keresőmotorok, bizonyos fiókok Fehéroroszországban, Ukrajnában és Kazahsztánban. A Yandex nagyon népszerű ezen országok lakosai körében. Ezt legalábbis a statisztikák alapján tudom megítélni, látva, hogy sok látogató más vidékről érkezik.

Jelenleg a Yandex nem csak keresőmotor, hanem számos szolgáltatás is, amelyekhez a keresőmotor minden felhasználója hozzáfér. Itt megtalálhatja a szükséges információkat, navigálhat a szabadidős tevékenységek között, képeket, termékeket találhat, árakat hasonlíthat össze, ellenőrizheti az időjárást, kommunikálhat a közösségi oldalon, tévét nézhet és közlekedési menetrendeket nézhet. Számos vállalati megoldás létezik. Akár a Narod.ru oldalra is felkereshet. A Yandex kényelmes rendszerrel rendelkezik, amely funkcionalitást biztosít a webhelyekkel való munkavégzéshez. A szolgáltatás legfrissebb újdonságai közé tartozik, amely elég sokáig fizetős maradt, de 2011 decemberében ez a szolgáltatás abszolút mindenki számára elérhetővé vált.

A Yandex csodálatos technológiáiról és hasznos szolgáltatásairól még nagyon-nagyon sokáig sorolhatnám. Ezért az információ könnyebb érzékelhetősége érdekében az utazásunkat összetevőkre bontom. Leírom a kereső teljes útját időrendi sorrendben évenként - a létrehozástól napjainkig.

A Yandex fejlesztésének története

1980-1990-es évek

A Yandex fejlődésének története gyökerei a már távoli 80-as évekbe, a Szovjetunió idejébe nyúlnak vissza. Ekkor kezdődött el először a keresőszoftver fejlesztése az Arcadiánál. A munkát Arkady Borkovsky és Arkady Volozh vezetésével végezték. Ez az első keresési technológia megkapta a "Yandex" nevet. Maga a Yandex webhely pedig, amelyet ma is láthatunk, 1996-ban jelent meg. Ígéretesnek ítélték meg az akkoriban zajló fejlesztéseket, amelyek eredményeként a CompTek (számítógépek és alkatrészek értékesítése) vezetése és a rendszerfejlesztők döntöttek a technológia továbbfejlesztésének és a rendszerbe történő bevezetésének célszerűségéről. tömegek. Ezzel kapcsolatban egy széles közönséget megcélzó projektfejlesztési koncepció készült.

A Yandex hivatalosan csak 1997. szeptember 23-án jelent meg. És valójában eleinte a CompTek International egyik részlege volt. Vagyis ott egyáltalán nem volt függetlenség. És csak 2000-ben lett a Yandex az a cég, amely ma látható. Abban az értelemben, hogy a cég már teljesen függetlenné vált. Független Yandex.

A cég egyébként jóval a Yandex kereső bejelentése előtt kitalált egy nevet. A Yandex jelentése „nyelvi index”. Ha angolról fordítják, akkor kiderül, hogy „Még egy indexelő”. Igaz, aztán a keresőmotor fejlődésével más értelmezések is kezdtek megjelenni. Például, ha az angol indexben lefordítja az első betűt (I-Z) angolról oroszra, akkor „Yandex”-et kap.

A „Yandex” nevet Ilya Segalovich (jelenlegi technológiai igazgató) és Arkady Volozh találta ki.

Egy évvel a cég hivatalos megjelenése előtt, 1996. október 18-án rendezték meg a Netcom’96 kiállítást, amelyen a CompTek bemutatta a fejlődő keresőmotor első termékeit. Ezek voltak a Yandex.Site és a Yandex.Dict. Aztán hat hónappal később megjelent a Yandex.CD - dokumentumokat keresve a CD-ROM-on, majd elindult a Yandex.Lib projekt. Ez egy Yandex csomagkönyvtár volt, amelyet mindenféle alkalmazásba és adatbázisba való beágyazásra szántak.

Abban az időben, amikor a Yandex.ru-t hivatalosan bemutatták a nyilvánosságnak, a következők voltak érdekesek:

    A dokumentumok relevanciájának felmérése. Abban az időben a Yandex elég jól tudott másolatokat találni és kizárni. Ugyanakkor a dokumentumokat különféle kódolásban keresték

    Keresés pontos szóforma szerint. Yashka tudta, hogyan kell keresni a morfológiát figyelembe véve

    Keresés távolság alapján. A Yandex pontos kifejezésekkel kereshet egy bekezdésben

    Az oldalak relevanciájának felmérésének magja a működőképes volt. Minden egyes kérelemhez a dokumentumokat a kérelemnek való megfelelés (relevancia) figyelembevételével választották ki. Ezenkívül a keresési eredményekhez tartozó dokumentumok kiválasztásakor figyelembe vették a kulcsszó gyakoriságát (sűrűségét) az oldalon. Egyébként éppen ennek az algoritmusnak az (akkori) tökéletlensége miatt sűrűn csomagolt oldalak jelentek meg a legjobb keresési eredmények között kulcsszavakat, valójában semmi értelme.

    A keresés során figyelembe vették a szavak közötti távolságot és azt is, hogy a szavak hogyan helyezkednek el a dokumentumban

Yandex weboldal tervezés

A Yandex webhely legelső kialakítása meglehetősen primitív és tökéletlen volt. A jól ismert Artemy Lebedev fejlesztette ki. Így nézett ki

Egyébként ugyanebben az évben megnyílt a Yandex fórum. Rendszerhasználók és fejlesztők közötti kommunikációra szolgál. Az ötlet jó volt, a fórum normálisan működött. Igaz, 2008-ig létezett. Ezután a prioritások enyhe átrendezése következett. Amennyire meg tudom ítélni, a szocializációt részesítették előnyben. A Yandex is elkezdte aktívan fejleszteni sajátját közösségi hálózat, amely alapján megjelent az aktuális blog, ahol az összes Yandex-bejelentés megjelenik, és ahol valójában a felhasználók kommunikálnak a fejlesztőkkel. Láthatod magad, a régi fórum URL-jét ( http://forum.yandex.ru/yandex/) ma már mindenki ismeri az átirányítást http://webmaster.ya.ru/.

1998

Az elindított projekt jó lehetőségeket mutatott, és tovább dolgoztak rajta. 1998-ban a keresőmotort továbbfejlesztették, és sok mást is bevezettek. funkcionalitás felhasználók számára. Különösen lehetővé vált a találtak között a keresés, a hasonló dokumentumok keresése és még sok más. A tervezésen is folyik a munka. kezdőlap Yandex. Most egy kicsit megváltozott

Mint látható, külsőleg semmi sem változott. Többnyire műszaki munkát végeztek

1999

Az év során jelentősen nőtt az internet orosz részesedésének közönsége. Ezzel párhuzamosan a Yandex minősége és technológiája nőtt, és a fejlesztők számos fejlesztést vezettek be. A Yandex keresőmotorja új keresőbotot vezetett be, amely jelentősen megnövelte a dokumentumok hálózaton való feltérképezésének sebességét.

A funkcionalitás felhasználói részeit érintő újítások a következők voltak:

    Mostantól lehetőség van konkrétabban is keresni – megjegyzések, feliratok, képek, címek alapján

    Keresési korlátozást vezettünk be a webhelyek egy csoportján

    Az orosz nyelvű dokumentumokat külön kiemeltük

Egyébként 1999-ben vezették be először a ma már jól ismert fogalmat (tematikus hivatkozási index). Igaz, akkor elég primitíven kiszámolták. Az oldal (más néven TIC) tekintélye nagymértékben függött a számunkra érdekes domainre hivatkozó oldalak számától.

A főoldal dizájnja egyébként is változott. Most valami hasonlóbb lett a jelenlegihez

1999-ben volt még egy jelentős esemény. Ekkor jelent meg egy ingyenes weboldal-készítő, amelyet mindannyian Narod.ru néven ismertünk (ingyenes tárhely és fájlmegosztó szolgáltatás). Egyébként ez a projekt még mindig létezik. A projekt mottója ez volt: 60 másodpercben.

2000

Talán az új szolgáltatások bevezetése tette lehetővé a Yandex számára, hogy a fejlődés alapvetően új szintjét érje el. Idővel a keresőmotor szilárdan megalapozta állapotát, ami jelentősen lehetővé tette Sőt, már volt is új projekt, nem a CompTek égisze alatt indult.

1999-ben Arkady Volozh, felismerve a projekt fejlesztésének kilátásait, csak a Yandex népszerűsítésére kezdett összpontosítani. A nehézséget azonban az jelentette, hogy tapasztalt, vállalati építőipari ismeretekkel rendelkező partnereket kellett találni. Az egyetlen nehézséget az jelentette, hogy olyan partnereket kellett találni, akik befektetnének a projekt fejlesztésébe, de nem szükséges a vezetés teljes átadása a vezetésük alá.

És találtak egy ilyen partnert. Egy társaság volt ru-Net Holdings. 2000 tavaszán befektetési szerződést kötöttek ezzel a céggel. Itt azonban volt néhány áldozat. Ennek ellenére fel kellett adnom a keresőmotor egy bizonyos részét. A megállapodás szerint a cég megkapta a kereső 1/3-át. Vagyis ettől a pillanattól kezdve a Yandex megszűnt a CompTek strukturális részlege lenni, hanem független vállalattá vált, amely saját irodákkal, saját menedzsmenttel, saját költségvetéssel stb. Arkady Volozh lett a cég vezérigazgatója.

Úgy gondolom, hogy a Yandex nagyon szerencsés volt az első vezetőjével, mert Volozh nemcsak szakértőnek bizonyult a potenciális partnerek megtalálásában, hanem jó újítónak is. Az önálló „úszás” kezdete után óriási változások kezdődtek a társaságban. Jelentősen bővült a stáb, maga az erőforrás pedig új lendületet kapott vezetőitől.

Összességében a ru-Net Holdings körülbelül 5 millió dollárt fektetett be. Mit ne mondjak, az üzlet nagyon jövedelmezőnek bizonyult, különös tekintettel arra, hogy ma a RuNet első számú keresőmotorja legalább több száz millió dollárba kerül. Ez a legóvatosabb becslés szerint.

A 2000-es év abból a szempontból is jelentős volt, hogy ebben az évben kezdett világosabban kirajzolódni a Yandex multiportalitása, mert sok olyan szolgáltatás kezdett megjelenni, amelyek nem közvetlenül a kereséshez kötődnek. Ilyen szolgáltatások voltak a Yandex.News, a Yandex.Mail, a képeslapok és a ya.ru keresősávja. Ezen kívül sok szolgáltatás később egyesült, így a mai Yandex.Market néven ismertté vált. Ezenkívül egy másik jelentős újítás a felhasználói böngészőkbe való integráláshoz speciális szoftver bevezetése volt - a Yandex Bar.

2001

Az idei év fordulópont volt, mert 2001-ben a Yandex lett a Runet vezetője a forgalom tekintetében. Emellett nőtt a cég szerverein tárolt információk mennyisége is. A mérete 1 terabájt volt. Idén egyébként megjelent a Yandex.Images is. Ezen kívül elektronikus fizetési rendszer Yandex.Money

Ezen túlmenően a Yandex főoldalának kialakítása is jelentősen javult. Itt találhatók linkek az új szolgáltatásokhoz és hírekhez. Elmondhatjuk, hogy általában a mai Yandex körvonalai már megjelentek

2002

Ebben az évben a fejlesztők aktívan dolgoznak a kommunikációs szolgáltatás - Yandex.Mail - fejlesztésén. Sokat dolgoztak a levelezés szűrésén. 2002 a három szolgáltatás – a Products, a Guru és a Select – Yandex.Market egyesülésének éve volt. Egyébként saját szemével is láthatja, hogy ez a szolgáltatás ma is nagyon aktuális. A befektetési évek során talán először 2002-ben jelent meg egy cél - az önellátás elérése. Szükség volt egy stratégiai rendszer kidolgozására a projekt monetizálására. Sőt, olyat, amely a jövőben stabil és nagy profitot hozna. Ilyen modell lett, és éppen az a bevétel, amelyet a cég ebből a reklámmodellből kezdett kapni, tette lehetővé az önellátást a vártnál jóval korábban. Ezért elmondhatjuk, hogy 2002 fordulópont volt az üzletorientált modellbe való belépés szempontjából, ami ráadásul már elkezdte meghozni a gyümölcsét.

2003

Ebben az évben folytatódott az aktív munka a Yandex.Mail szolgáltatáson. Itt vezették be a következő hatalmas változtatásokat, amelyek a rendszer minden felhasználóját érintik. Természetesen a Ya.Mail funkcionálisabbá és kényelmesebbé vált. A jövőre nézve szeretném elmondani, hogy a jövőben a szolgáltatás is nagyon aktívan fejlődött, és felhasználói nemegyszer sok új érdekességgel találkoztak. A felhasználók különösen korlátlan méretű postafiókot és egy új „Spam Defense” spamszűrőt kaptak. 2003-ban a Yandex dizájnját ismét frissítették.

Mellesleg, minden terv egy adott verziónak felelt meg. A terv 2003-as verziója a nyolcadik volt a sorban, és így nézett ki

Bármilyen kiterjesztés új verzió a tervezés kezdetben egy béta tesztelési időszakon megy keresztül. És ha ezt megelőzően a bétatesztek zárt módban zajlottak, akkor ezúttal az új felület kéthetes próbatesztelése során bárki hozzáférhetett az új felülethez. Igaz, egy évvel később a főt újra frissítették, de sikeresebben. És ebben a formában 2007-ig létezett.

A Yandex már akkoriban is meglehetősen jó hírű cég volt, mert már 2003-ban sikeresen beépítették a Yandex keresőt az elnöki webhelyre. 2003 őszén a fejlesztők bevezették a következő termékfrissítéseket: Yandex.Publisher, Yandex.Server (Yandex.Server), amelyek a Yandex.Site öröksége lett.

2004

A RuNetben az első számú kereső által elfoglalt üzleti modell nagyon jól működött, aminek eredményeként 2004-ben már több tízmillió dollárt tett ki a cég profitja. Ez lendületet adott az új szolgáltatások, például a térképen való keresőszolgáltatás, a blogok és a fórumok fejlesztésének. A 2004-es év arról is nevezetes, hogy ekkor jelent meg egy komoly versenytárs az orosz piacon a Google személyében. Sürgősen be kellett lépni a vezetésért folytatott küzdelembe, aminek eredményeként a Yandex vezetése úgy döntött, hogy tízszeresére növeli létszámát. Kezdetben 200, a létszám frissítése után 2000 alkalmazott volt. De a lényeg az, hogy a személyzeti megújítás után semmi sem változott rosszabbra. A hagyományok megmaradtak, a technológiák is korszerűek voltak. És általában azt mondhatjuk, hogy Yasha nem változott száraz társasággá.

A technológiák harca: Yandex vs Google

2005

Az idei év a cég képviseletének földrajzi bővítésének szlogenje alatt telt el. Mert megjelent a Yandex ukrán képviselete - Yandex.Ukrajna. Egyébként ennek a képviseletnek az igazgatója Sergey Petrenko, a jól ismert keresés alapítója és az érdekes BloGnot blog szerzője.

2005 azért is volt jelentős, mert a kedvencem megnyílt. Ez egy „kolotibablo webmester” elven alapuló szolgáltatás, oroszul pedig egy olyan szolgáltatás, amely lehetővé teszi a webmesterek számára, hogy hirdetéseket helyezzenek el webhelyeiken.

Ugyanebben az évben megjelent a Yandex.Dictionaries. Változások történtek a Yandex.Money szolgáltatásban is. Mostantól minden felhasználónak lehetősége van fiókját online pénztárcán keresztül kezelni.

2006

Az idei év a ma már jól ismert blogs.yandex.ru szolgáltatás megjelenésével marad emlékezetes. Ez egyfajta marketingeszköz. Lehetővé tette, hogy tanulmányozzam a közvéleményt, a blogokon és fórumokon található véleményeket. A Yandex.Maps bemutatott egy eszközt a forgalmi dugók megjelenítésére.

2006 és 2010 között a Yandex egy régi irodában volt a moszkvai Samokatnaya utcában.





Mint látható, korábban egy kicsit szűkösek voltak. Ez nem most, egy hatalmas épület 2000 alkalmazottal.

2006-ban volt egy másik érdekes esemény - Szentpéterváron megnyílt az első távoli fejlesztési iroda. Aztán persze a mérték még nem volt ugyanaz. Ez nem olyan, mint ma a Yandexnek 11 irodája van Oroszországban, Ukrajnában, Törökországban és még Kaliforniában is. Az irodák a tevékenység típusától függően változnak. Vannak fejlesztéssel foglalkozó irodák, értékesítési irodák, termékhonosítási területen dolgozó irodák

2007

Ebben az évben voltak olyan események, amelyek inkább a webmesterekre összpontosítanak. Különösen a Yandex.Photos szolgáltatás jelent meg. De számomra webmesterként érdekesebb esemény a szolgáltatás megjelenése Yandex.Metrica. Igaz, akkoriban ez egy teljesen durva szolgáltatás volt, és nem a webmestereknek, hanem a Yandex.Direct hirdetőinek szólt. Ugyanebben az évben megnyílt egy ukrán képviselet - a Yandex.ua. A LiveInternet szerint ma az orosz nyelvű forgalom csaknem 14%-a a yandex.ua webhelyről származik

Szintén 2007-ben indult el egy minden webmester által ismert projekt, amely valószínűleg csak lusta, most nem használják

2008

Elmondhatjuk, hogy idén annyira megnőtt a Yandex befolyási köre, hogy úgy döntöttek, hogy a keresőmotor fiókját az USA-ban, Kaliforniában nyitják meg. Ezzel egyidejűleg jelentős kiegészítéseket végeztek az algoritmusokon. Különösen a nemzetközi szabványok Sitemap, MediaRSS stb. támogatását kezdték el, vagyis amint látható, az érdeklődési területek messze túlmutattak a RuNeten. A RuNet első számú keresőmotorja mára az angol nyelvű oldalakká vált. Ezelőtt az volt a probléma, hogy a hazai kereső nem támogatta a nemzetközi szabványokat, ezért gond volt a burzhunet oldalak indexelésével, de a 2008-as frissítés után ez a probléma megoldódott. És ezt követően a Yandex logót teljesen oroszul kezdték írni.

2009

Ez az év azért volt jelentős, mert korábban nem volt régiónkénti felosztás. Vagyis ennek az algoritmusnak a bevezetése előtt az egységesség elveire épült. Például beírja a „” lekérdezést a keresősávba Moszkvában és Novoszibirszkben, és ugyanazokat az eredményeket kapja. Most minden megváltozott. A földrajzi függőség elvén alapuló eredmények pedig keverednek a keresési eredmények közé. Egyszerűen fogalmazva, ha a Yandex segítségével keres Moszkvában és Novoszibirszkben, az eredmények eltérőek lesznek.

2009-ben a korábban választott nyugati irányban folytatódott a munka. Különösen egy olyan szolgáltatást teszteltek, amely külföldi oldalak fordítására szolgált. Aztán ez a szolgáltatás fejlődött, és 2011-ben Yandex.Translation néven vált ismertté.

Hasonlóan fontos esemény volt egy új módszer bevezetése gépi tanulásMatrixnet. Ez a technológia különféle mintákat használ értékelésként, és különféle rangsorolási tényezőket vesz figyelembe. De a lényeg az, hogy a technológia öntanuló. Az értékelők értékelése során csak a valós mintázatok kerülnek értékelésre, a nem létezők felfedezése teljesen kizárt.

Ennek a technológiának a forradalmi jellege abban rejlik, hogy a Matrixnet egy hihetetlenül összetett rangsorolási formulát használ, amely számos tényezőt figyelembe vesz. Ez egyrészt lehetővé teszi, hogy jobb keresési eredményeket érjen el, másrészt nem teszi lehetővé a webmesterek számára, hogy megértsék ezt a mintát, és így saját érdekeik szerint befolyásolják azt.

További részletek a mátrixnet technológiáról:

2010

A Samokatnaya utcai régi iroda a múlté, és az egész cég új kastélyokba költözött. Valójában ez lett 2010 fő eseménye







Kapcsolódó kiadványok