शोध इंजिन Yandex ru. Yandex शोध इंजिन कसे कार्य करते Yandex शोध इंजिन म्हणजे काय

शुभ दुपार, माझ्या एसइओ ब्लॉगच्या प्रिय वाचकांनो. . हा लेख याबद्दल आहे Yandex शोध इंजिन कसे कार्य करते साइट रँक करण्यासाठी ते कोणते तंत्रज्ञान आणि अल्गोरिदम वापरते आणि वापरकर्त्यांना प्रतिसाद तयार करण्यासाठी ते काय करते. बऱ्याच लोकांना माहित आहे की रशियन शोधाचा हा फ्लॅगशिप रुनेटमध्ये टोन सेट करतो, युरेशियामधील सर्वात मोठ्या डेटाबेसचा मालक आहे, एक अब्जाहून अधिक पृष्ठांची सामग्री हाताळतो आणि कोणत्याही प्रश्नाचे उत्तर माहित आहे. ऑगस्ट 2012 च्या Liveinternet डेटानुसार, रशियामध्ये यांडेक्सचा वाटा 60.5% आहे. पोर्टलचे मासिक प्रेक्षक 48.9 दशलक्ष लोक आहेत. परंतु आमच्या ब्लॉगर्ससाठी सर्वात महत्त्वाची गोष्ट म्हणजे शोध इंजिन आमच्या विनंत्या कशा प्राप्त करतात, ते त्यांच्यावर कसे प्रक्रिया करतात आणि परिणामी परिणाम काय होतो. एकीकडे, ही माहिती जाणून घेणे आणि समजून घेणे आम्हाला सर्व Yandex संसाधने वापरणे सोपे करते; दुसरीकडे, आमच्या ब्लॉगची जाहिरात करणे सोपे होते. म्हणून, मी माझ्याबरोबर सर्वोत्तम रुनेट शोध इंजिनच्या सर्वात महत्वाच्या तंत्रज्ञानाकडे पाहण्याचा प्रस्ताव देतो.

जेव्हा एखादा इंटरनेट वापरकर्ता प्रथम माहितीसाठी शोध इंजिनकडे जाऊ इच्छितो, तेव्हा त्याला एक प्रश्न असू शकतो: "शोध कसे कार्य करते?" पण जेव्हा त्याला ते मिळते, तेव्हा हा प्रश्न अनेकदा दुसऱ्यामध्ये बदलतो: "एवढ्या लवकर का?" आणि खरोखर, संगणकावर फाइल शोधण्यासाठी 20 सेकंद का लागतात आणि जगभरातील संगणकांच्या संपूर्ण नेटवर्कच्या विनंतीचा परिणाम एका सेकंदात दिसून येतो? सर्वात मनोरंजक गोष्ट अशी आहे की पहिल्या दोन प्रश्नांची (शोध कसा होतो आणि 1 सेकंद का) एका उत्तरात उत्तर दिले जाऊ शकते - शोध इंजिनने वापरकर्त्याच्या विनंतीसाठी आगाऊ तयारी केली आहे.

यांडेक्सच्या ऑपरेशनचे तत्त्व समजून घेण्यासाठी, इतर शोध इंजिनांप्रमाणे, टेलिफोन निर्देशिकेसह एक साधर्म्य काढू. कोणताही फोन नंबर शोधण्यासाठी, आपल्याला ग्राहकाचे आडनाव माहित असणे आवश्यक आहे आणि या प्रकरणात कोणत्याही शोधासाठी जास्तीत जास्त एक मिनिट लागतो, कारण निर्देशिकेची सर्व पृष्ठे सतत वर्णमाला अनुक्रमणिका आहेत. परंतु कल्पना करा की शोध वेगळ्या पर्यायाचा वापर करून केला गेला असेल, जिथे फोन नंबर स्वतःच नंबरद्वारे ऑर्डर केले गेले असतील. अशा शोधांनंतर, जे दीर्घकाळ ड्रॅग केले जातील, संख्या बर्याच काळासाठी शोधकर्त्याच्या डोळ्यांसमोर राहतील. 🙂

त्याचप्रमाणे, शोध इंजिन इंटरनेटवरील सर्व माहिती त्याच्यासाठी सोयीस्कर स्वरूपात प्रदर्शित करते. आणि सर्वात महत्त्वाचे म्हणजे, हा सर्व डेटा तिच्या निर्देशिकेत आगाऊ ठेवला जातो, अभ्यागत त्याच्या विनंत्यांसह येण्यापूर्वी. म्हणजेच, जेव्हा आम्ही यांडेक्सला प्रश्न विचारतो तेव्हा त्याला आमचे उत्तर आधीच माहित असते. आणि ते आम्हाला एका सेकंदात देते. परंतु या दुसऱ्यामध्ये अनेक महत्त्वाच्या प्रक्रियांचा समावेश आहे, ज्याचा आपण आता तपशीलवार विचार करू.

इंटरनेट अनुक्रमणिका

Yandex ru इंटरनेटवर मिळू शकणारी सर्व माहिती संकलित करते. विशेष उपकरणे वापरून, व्हिज्युअल पॅरामीटर्सवर आधारित प्रतिमांसह सर्व सामग्रीचे पुनरावलोकन केले जाते. शोध इंजिन अशा संकलनात गुंतलेले आहे आणि डेटा गोळा करणे आणि तयार करणे या प्रक्रियेस अनुक्रमणिका म्हणतात. अशा मशीनचा आधार संगणक प्रणाली आहे, ज्याला अन्यथा शोध रोबोट म्हणतात. हे नियमितपणे अनुक्रमित साइट्स क्रॉल करते, नवीन सामग्रीसाठी ते तपासते आणि हटविलेल्या पृष्ठांसाठी इंटरनेट स्कॅन करते. असे काही पृष्ठ यापुढे अस्तित्वातील किंवा अनुक्रमणिकेतून बंद केल्याचे आढळल्यास, ते ते शोधातून काढून टाकते.

शोध रोबोट नवीन साइट कसा शोधतो? प्रथम, इतर साइटवरील दुव्यांसाठी धन्यवाद. कारण आधीपासून इंडेक्स केलेल्या साइटवरून नवीन वेब रिसोर्सवर लिंक टाकल्यास, पुढच्या वेळी तुम्ही दुसऱ्याला भेट देता तेव्हा रोबोट पहिल्याला भेट देईल. दुसरे म्हणजे, एक अद्भुत सेवा आहे, ज्याला "addurlka" म्हणतात (इंग्रजीतील वाक्यांश -addurl - ॲड ॲड्रेस). त्यामध्ये आपण आपल्या नवीन साइटचा पत्ता प्रविष्ट करू शकता, ज्याला काही वेळाने शोध रोबोटद्वारे भेट दिली जाईल. तिसरे म्हणजे, "Yandex.Bar" या विशेष कार्यक्रमाच्या मदतीने, ते वापरणाऱ्या वापरकर्त्यांच्या भेटींचा मागोवा घेतला जातो. त्यानुसार, जर एखादी व्यक्ती नवीन वेब संसाधनावर उतरली तर लवकरच तेथे एक रोबोट दिसेल.

सर्व पृष्ठे शोध मध्ये समाविष्ट आहेत? दररोज लाखो पृष्ठे अनुक्रमित केली जातात. त्यापैकी भिन्न गुणवत्तेची पृष्ठे आहेत, ज्यामध्ये भिन्न माहिती असू शकते - अद्वितीय सामग्रीपासून संपूर्ण कचरा पर्यंत. शिवाय, आकडेवारी सांगते त्याप्रमाणे, इंटरनेटवर जास्त कचरा आहे. शोध रोबोट विशेष अल्गोरिदम वापरून प्रत्येक दस्तऐवजाचे विश्लेषण करतो. त्यात काही उपयुक्त माहिती आहे की नाही आणि ती वापरकर्त्याच्या विनंतीला उत्तर देऊ शकते की नाही हे ते ठरवते. तसे नसल्यास, अशी पृष्ठे "कॉस्मोनॉट्स" म्हणून स्वीकारली जात नाहीत, परंतु तसे असल्यास, ते शोधात समाविष्ट केले जातात.

रोबोटने पृष्ठास भेट दिल्यानंतर आणि त्याची उपयुक्तता निश्चित केल्यानंतर, ते शोध इंजिनच्या स्टोरेजमध्ये दिसते. येथे आम्ही कोणत्याही दस्तऐवजाचे अगदी मूलभूत गोष्टींपर्यंत विश्लेषण करतो, जसे ऑटो सेंटर मास्टर्स म्हणतात - खाली कॉग्स. पृष्ठ html मार्कअपपासून साफ केले आहे, स्वच्छ मजकूर संपूर्ण यादीतून जातो - प्रत्येक शब्दाचे स्थान मोजले जाते. या डिस्सेम्बल फॉर्ममध्ये, पृष्ठ संख्या आणि अक्षरे असलेल्या टेबलमध्ये बदलते, ज्याला अन्यथा निर्देशांक म्हणतात. आता, हे पृष्ठ असलेल्या वेब संसाधनाचे काहीही झाले तरी त्याची नवीनतम प्रत नेहमी शोधात उपलब्ध असते. साइट यापुढे अस्तित्वात नसली तरीही, तिच्या दस्तऐवजांच्या प्रती काही काळ इंटरनेटवर संग्रहित केल्या जातात.

प्रत्येक इंडेक्स, दस्तऐवज प्रकार, एन्कोडिंग, भाषा, प्रतींसह एकत्रितपणे डेटासह तयार होतो डेटाबेस शोधा . हे वेळोवेळी अद्यतनित केले जाते, म्हणून ते विशेष सर्व्हरवर स्थित आहे ज्याच्या मदतीने शोध इंजिन वापरकर्त्यांच्या विनंत्यांवर प्रक्रिया केली जाते.

अनुक्रमणिका प्रक्रिया किती वेळा होते? सर्व प्रथम, ते साइटच्या प्रकारांवर अवलंबून असते. वेब संसाधनाचा पहिला प्रकार त्याच्या पृष्ठांची सामग्री बऱ्याचदा बदलतो. म्हणजेच, प्रत्येक वेळी जेव्हा शोध रोबोट या पृष्ठांवर येतो, तेव्हा त्यामध्ये प्रत्येक वेळी भिन्न सामग्री असते. पुढच्या वेळी तुम्ही त्यांचा वापर करून काहीही शोधू शकणार नाही, त्यामुळे अशा साइट्स निर्देशांकात समाविष्ट केल्या जात नाहीत. साइटचा दुसरा प्रकार डेटा वेअरहाऊस आहे, ज्याच्या पृष्ठांवर डाउनलोड करण्यासाठी दस्तऐवजांचे दुवे वेळोवेळी जोडले जातात. अशा साइटची सामग्री सहसा बदलत नाही, म्हणून रोबोट अत्यंत क्वचितच भेट देतो. इतर साइट सामग्री अद्यतनित करण्याच्या वारंवारतेवर अवलंबून असतात. याचा अर्थ खालीलप्रमाणे आहे: साइटवर जितक्या जलद नवीन सामग्री दिसून येईल, तितक्या वेळा शोध रोबोट येतो. आणि सर्वात महत्त्वाच्या वेब संसाधनांना प्रथम प्राधान्य दिले जाते (उदाहरणार्थ, बातम्या साइट कोणत्याही ब्लॉगपेक्षा अधिक महत्त्वाचा क्रम आहे).

अनुक्रमणिका आपल्याला शोध इंजिनचे पहिले कार्य करण्यास अनुमती देते - इंटरनेटवरील नवीन पृष्ठांवर माहिती गोळा करणे. परंतु यांडेक्समध्ये दुसरे कार्य देखील आहे - आधीच तयार केलेल्या शोध डेटाबेसमध्ये वापरकर्त्याच्या विनंतीचे उत्तर शोधणे.

यांडेक्स प्रतिसाद तयार करत आहे

विनंतीवर प्रक्रिया करण्याची आणि संबंधित प्रतिसाद जारी करण्याची प्रक्रिया द्वारे हाताळली जाते संगणक प्रणाली "मेटाशोध" . त्याच्या कार्यासाठी, ते प्रथम सर्व इनपुट माहिती संकलित करते: विनंती कोणत्या प्रदेशातून केली गेली, ती कोणत्या वर्गाशी संबंधित आहे, विनंतीमध्ये त्रुटी आहेत का इ. अशा प्रक्रियेनंतर, मेटासर्च डेटाबेसमध्ये समान पॅरामीटर्ससह समान क्वेरी आहेत की नाही हे तपासते. जर उत्तर होय असेल, तर सिस्टम वापरकर्त्यास पूर्वी जतन केलेले परिणाम दाखवते. असा प्रश्न डेटाबेसमध्ये अस्तित्वात नसल्यास, मेटासर्च शोध डेटाबेसला संबोधित करते ज्यामध्ये निर्देशांक डेटा असतो.

आणि इथेच आश्चर्यकारक गोष्टी घडतात. कल्पना करा की एक सुपर-शक्तिशाली संगणक आहे जो शोध रोबोट्सद्वारे प्रक्रिया केलेले संपूर्ण इंटरनेट संचयित करतो. वापरकर्ता क्वेरी सेट करतो आणि क्वेरीमध्ये समाविष्ट असलेल्या सर्व दस्तऐवजांसाठी मेमरी सेलमध्ये शोध सुरू होतो. उत्तर सापडले आहे आणि प्रत्येकजण आनंदी आहे. परंतु जेव्हा त्यांच्या शरीरात समान शब्द असलेल्या बर्याच विनंत्या असतात तेव्हा आणखी एक प्रकरण घेऊया. सिस्टमला प्रत्येक वेळी समान मेमरी सेलमधून जाणे आवश्यक आहे, ज्यामुळे डेटावर प्रक्रिया करण्यासाठी लागणारा वेळ लक्षणीयरीत्या वाढू शकतो. त्यानुसार, वेळ वाढतो, ज्यामुळे वापरकर्त्याचे नुकसान होऊ शकते - तो मदतीसाठी दुसर्या शोध इंजिनकडे वळेल.

असा विलंब टाळण्यासाठी, साइट इंडेक्समधील सर्व प्रती वेगवेगळ्या संगणकांवर वितरीत केल्या जातात. विनंती पाठवल्यानंतर, मेटासर्च अशा सर्व्हरना त्यांचा मजकूर शोधण्याची सूचना देते. त्यानंतर, या मशीनमधील सर्व डेटा मध्यवर्ती संगणकावर परत केला जातो, ते प्राप्त केलेले सर्व परिणाम एकत्र करते आणि वापरकर्त्याला शीर्ष दहा सर्वोत्तम उत्तरे देते. या तंत्रज्ञानासह, एकाच वेळी दोन पक्षी मारले जातात: शोध वेळ अनेक वेळा कमी केला जातो (उत्तर एका स्प्लिट सेकंदात मिळते) आणि, प्लॅटफॉर्मच्या वाढीमुळे, माहिती डुप्लिकेट केली जाते (अचानक ब्रेकडाउनमुळे डेटा गमावला जात नाही) . डुप्लिकेट माहिती असलेले संगणक स्वतःच डेटा सेंटर बनवतात - ही सर्व्हर असलेली खोली आहे.

जेव्हा शोध इंजिन वापरकर्ता 100 पैकी 20 वेळा प्रश्न विचारतो तेव्हा प्रश्नातील उद्दिष्टे संदिग्ध असतात. उदाहरणार्थ, जर त्याने शोध बारमध्ये "नेपोलियन" हा शब्द लिहिला, तर त्याला कोणते उत्तर अपेक्षित आहे हे अद्याप माहित नाही - केकची पाककृती किंवा महान कमांडरचे चरित्र. किंवा "ब्रदर्स ग्रिम" हा वाक्यांश - परीकथा, चित्रपट, संगीत गट. विशिष्ट उत्तरांसाठी अशा संभाव्य उद्दिष्टांची श्रेणी कमी करण्यासाठी, Yandex कडे एक विशेष तंत्रज्ञान आहे श्रेणी. हे शोध क्वेरी आकडेवारी वापरून वापरकर्त्याच्या गरजा लक्षात घेते. अभ्यागतांनी यांडेक्समध्ये विचारलेल्या सर्व प्रश्नांपैकी, स्पेक्ट्रम त्यांच्यातील विविध वस्तू ओळखतो (लोकांची नावे, पुस्तकांची शीर्षके, कार मॉडेल इ.) या वस्तू विशिष्ट श्रेणींमध्ये वितरीत केल्या जातात. सध्या अशा 60 हून अधिक श्रेणी आहेत. त्यांच्या मदतीने, शोध इंजिनच्या डेटाबेसमध्ये वापरकर्त्याच्या प्रश्नांमधील शब्दांचे वेगवेगळे अर्थ आहेत. विशेष म्हणजे, या श्रेण्या वेळोवेळी तपासल्या जातात (विश्लेषण आठवड्यातून दोन वेळा होते), जे यांडेक्सला विचारलेल्या प्रश्नांची उत्तरे अधिक अचूकपणे प्रदान करण्यास अनुमती देते.

स्पेक्ट्रम तंत्रज्ञानावर आधारित, Yandex ने संवाद प्रॉम्प्ट आयोजित केले. ते शोध बारच्या खाली दिसतात ज्यामध्ये वापरकर्ता त्याची अस्पष्ट क्वेरी टाइप करतो. ही ओळ प्रश्नाचा विषय कोणत्या श्रेणींशी संबंधित असू शकते हे प्रतिबिंबित करते. पुढील शोध परिणाम वापरकर्त्याच्या या श्रेणीच्या निवडीवर अवलंबून आहेत.

यांडेक्स शोध इंजिनच्या सर्व वापरकर्त्यांपैकी 15 ते 30% पर्यंत फक्त स्थानिक माहिती (ते ज्या प्रदेशात राहतात त्या प्रदेशातील डेटा) प्राप्त करू इच्छितात. उदाहरणार्थ, तुमच्या शहरातील चित्रपटगृहांमध्ये नवीन चित्रपटांबद्दल. म्हणून, अशा विनंतीचे उत्तर प्रत्येक प्रदेशासाठी वेगळे असावे. या संदर्भात, Yandex त्याचे तंत्रज्ञान वापरते प्रदेशांवर आधारित शोधा . उदाहरणार्थ, जे रहिवासी त्यांच्या Oktyabr सिनेमातील चित्रपटांचा संग्रह शोधत आहेत त्यांना ही उत्तरे मिळू शकतात:

परंतु स्टॅव्ह्रोपोल शहरातील रहिवाशांना त्याच विनंतीसाठी हा परिणाम प्राप्त होईल:

वापरकर्त्याचा प्रदेश प्रामुख्याने त्याच्या IP पत्त्याद्वारे निर्धारित केला जातो. काहीवेळा हा डेटा अचूक नसतो, कारण अनेक प्रदाते एकाच वेळी अनेक क्षेत्रांमध्ये काम करू शकतात आणि त्यामुळे त्यांच्या वापरकर्त्यांचे IP पत्ते बदलू शकतात. तत्त्वतः, हे आपल्या बाबतीत घडल्यास, आपण शोध इंजिनमधील सेटिंग्जमध्ये आपला प्रदेश सहजपणे बदलू शकता. हे परिणाम पृष्ठाच्या वरच्या उजव्या कोपर्यात सूचीबद्ध आहे. तुम्ही ते बदलू शकता.

शोध इंजिन Yandex ru - प्रतिसाद परिणाम

Metasearch ने उत्तर तयार केल्यावर, Yandex शोध इंजिनने ते परिणाम पृष्ठावर प्रदर्शित केले पाहिजे. ही सापडलेल्या दस्तऐवजांच्या लिंक्सची यादी आहे ज्यात प्रत्येकावर थोडी माहिती आहे. परिणाम जारी करण्यासाठी तंत्रज्ञानाचे कार्य वापरकर्त्याला सर्वात माहितीपूर्ण मार्गाने सर्वात संबंधित उत्तरे प्रदान करणे आहे. अशा दुव्याचे टेम्पलेट असे दिसते:

चला या फॉर्मचा परिणाम अधिक तपशीलवार पाहू या. च्या साठी शोध परिणाम शीर्षक यांडेक्स अनेकदा पृष्ठ शीर्षकाचे नाव वापरते (शीर्षक टॅगमध्ये ऑप्टिमायझर काय लिहितात). जर ते नसेल तर लेखाच्या किंवा पोस्टच्या शीर्षकातील शब्द येथे दिसतात. जर शीर्षक मजकूर मोठा असेल, तर शोध इंजिन या फील्डमध्ये दिलेल्या क्वेरीशी सर्वात संबंधित असलेला तुकडा ठेवते.

फार क्वचितच, परंतु असे होते की शीर्षक विनंतीच्या सामग्रीशी जुळत नाही. या प्रकरणात, Yandex लेख किंवा पोस्टमधील मजकूर वापरून त्याचे शोध परिणाम शीर्षक तयार करते. त्यात निश्चितपणे क्वेरी शब्द असतील.

च्या साठी स्निपेटशोध इंजिन पृष्ठावरील सर्व मजकूर वापरते. हे सर्व तुकड्या निवडते जेथे प्रश्नाचे उत्तर उपस्थित आहे, आणि नंतर सर्वात संबंधित एक निवडते आणि फॉर्म फील्डमध्ये दस्तऐवजाचे दुवे समाविष्ट करते. या दृष्टिकोनाबद्दल धन्यवाद, एक सक्षम ऑप्टिमायझर स्निपेट पाहिल्यानंतर त्याचा रीमेक करू शकतो, ज्यामुळे लिंकची आकर्षकता सुधारते.

वापरकर्त्याच्या विनंतीचा परिणाम अधिक चांगल्या प्रकारे समजून घेण्यासाठी, मजकूरातील दुवे म्हणून शीर्षके फॉरमॅट केली जातात (अधोरेखित करून निळ्यामध्ये हायलाइट केलेली). वेब संसाधन आकर्षक आणि ओळखण्यायोग्य बनविण्यासाठी, एक फेविकॉन जोडला जातो - साइटचा एक छोटा कॉर्पोरेट चिन्ह. हे मथळ्याच्या आधी पहिल्या ओळीवर मजकुराच्या डावीकडे दिसते. प्रतिसादातील विनंतीमध्ये समाविष्ट केलेले सर्व शब्द देखील समजण्याच्या सुलभतेसाठी ठळक अक्षरात हायलाइट केले आहेत.

अलीकडे, Yandex शोध इंजिन स्निपेटमध्ये विविध माहिती जोडत आहे जे वापरकर्त्याला त्यांचे उत्तर आणखी जलद आणि अधिक अचूकपणे शोधण्यात मदत करेल. उदाहरणार्थ, जर एखाद्या वापरकर्त्याने त्याच्या विनंतीमध्ये एखाद्या संस्थेचे नाव लिहिले, तर Yandex त्याचा पत्ता, संपर्क क्रमांक आणि स्निपेटमधील भौगोलिक नकाशेमधील स्थानाची लिंक जोडेल. जर शोध इंजिन साइटच्या संरचनेशी परिचित असेल, ज्यामध्ये वापरकर्त्यासाठी उत्तर असलेले दस्तऐवज असेल तर ते निश्चितपणे दर्शवेल. शिवाय, यांडेक्स अशा वेब संसाधनाची सर्वाधिक भेट दिलेली पृष्ठे स्निपेटमध्ये त्वरित जोडू शकते जेणेकरून, इच्छित असल्यास, अभ्यागत त्याच्या वेळेची बचत करून त्याला आवश्यक असलेल्या विभागात त्वरित जाऊ शकेल.

असे स्निपेट्स आहेत ज्यात ऑनलाइन स्टोअरसाठी उत्पादनाची किंमत, हॉटेल किंवा रेस्टॉरंटचे स्टार्सच्या स्वरूपात रेटिंग आणि शोध दस्तऐवजांमधील वस्तूंबद्दल विविध क्रमांकांसह इतर मनोरंजक माहिती असते. अशा माहितीचा उद्देश वापरकर्त्याला स्वारस्य असलेल्या वस्तू किंवा वस्तूंबद्दल डेटाची संपूर्ण सूची प्रदान करणे आहे.

सर्वसाधारणपणे, विविध उदाहरणांसह, उत्तरे असलेले पृष्ठ असे दिसेल:

रँकिंग आणि मूल्यांकनकर्ते

यांडेक्सच्या कार्यामध्ये केवळ सर्व संभाव्य उत्तर पर्याय शोधणेच नाही तर सर्वोत्तम (संबंधित) निवडणे देखील समाविष्ट आहे. तथापि, वापरकर्ता शोध परिणाम म्हणून यांडेक्सने त्याला प्रदान केलेल्या सर्व दुव्यांद्वारे रॅमेज करणार नाही. शोध परिणाम आयोजित करण्याची प्रक्रिया म्हणतात रँकिंग . म्हणजेच, हे रँकिंग आहे जे प्रस्तावित उत्तरांची गुणवत्ता ठरवते.

असे नियम आहेत ज्याद्वारे Yandex संबंधित पृष्ठे निर्धारित करते:

शोध गुणवत्तेला खराब करणाऱ्या साइट्स परिणाम पृष्ठावरील स्थानांमध्ये डाउनग्रेड केल्या जातील. सहसा ही वेब संसाधने आहेत ज्यांचे मालक शोध इंजिनला फसवण्याचा प्रयत्न करीत आहेत. उदाहरणार्थ, निरर्थक किंवा अदृश्य मजकूर असलेली पृष्ठे असलेल्या या साइट आहेत. अर्थात, हे शोध रोबोटला दृश्यमान आणि समजण्याजोगे आहे, परंतु हा दस्तऐवज वाचणाऱ्या अभ्यागताला नाही. किंवा अशा साइट्स ज्या, शोध परिणाम क्षेत्रातील दुव्यावर क्लिक करताना, वापरकर्त्यास पूर्णपणे भिन्न साइटवर त्वरित स्थानांतरित करतात.
कामुक सामग्री असलेल्या साइट परिणामांमध्ये समाविष्ट केल्या जात नाहीत किंवा रँकिंगमध्ये मोठ्या प्रमाणात कमी केल्या जातात. हे या वस्तुस्थितीमुळे आहे की अशी वेब संसाधने अनेकदा आक्रमक जाहिरात पद्धती वापरतात.
व्हायरसने संक्रमित साइट्स शोध परिणामांमध्ये कमी केल्या जात नाहीत आणि शोध परिणामांमधून वगळल्या जात नाहीत - या प्रकरणात, वापरकर्त्याला विशेष चिन्ह वापरून धोक्याची माहिती दिली जाते. शोध इंजिन अभ्यागताच्या विनंतीनुसार अशा वेब संसाधनांमध्ये महत्त्वपूर्ण दस्तऐवज असू शकतात असे यांडेक्सने गृहीत धरले आहे या वस्तुस्थितीमुळे हे आहे.

उदाहरणार्थ, यांडेक्स "सफरचंद" क्वेरीसाठी साइट्सची रँक अशा प्रकारे करेल:

रँकिंग घटकांव्यतिरिक्त, यांडेक्स क्वेरी आणि उत्तरांसह विशेष नमुने वापरते जे शोध इंजिन वापरकर्ते सर्वात योग्य मानतात. याक्षणी कोणतेही यंत्र असे नमुने बनवू शकत नाही - हा मनुष्याचा विशेषाधिकार आहे. यांडेक्समध्ये, अशा तज्ञांना बोलावले जाते मूल्यांकनकर्ते. त्यांचे कार्य सर्व शोध दस्तऐवजांचे पूर्णपणे विश्लेषण करणे आणि निर्दिष्ट प्रश्नांच्या प्रतिसादांचे मूल्यांकन करणे आहे. ते सर्वोत्तम उत्तरे निवडतात आणि एक विशेष प्रशिक्षण संच तयार करतात. त्यामध्ये, शोध इंजिन संबंधित पृष्ठे आणि त्यांच्या गुणधर्मांमधील संबंध पाहतो. अशी माहिती असल्यास, Yandex प्रत्येक विनंतीसाठी इष्टतम रँकिंग सूत्र निवडू शकते. असे सूत्र तयार करण्याच्या पद्धतीला मॅट्रिक्सनेट म्हणतात. या प्रणालीचा फायदा असा आहे की ते ओव्हरफिटिंगसाठी प्रतिरोधक आहे, जे आपल्याला अनावश्यक रेटिंग आणि नमुन्यांची संख्या न वाढवता मोठ्या प्रमाणात रँकिंग घटक विचारात घेण्यास अनुमती देते.

माझ्या पोस्टच्या शेवटी, मी तुम्हाला यांडेक्स शोध इंजिनद्वारे त्याच्या कार्याच्या प्रक्रियेत एकत्रित केलेली मनोरंजक आकडेवारी दर्शवू इच्छितो.

1. रशिया आणि रशियन शहरांमध्ये वैयक्तिक नावांची लोकप्रियता (मार्च 2012 मध्ये ब्लॉगर्स आणि सोशल नेटवर्क वापरकर्त्यांच्या खात्यातून घेतलेला डेटा).

महान द्रष्टा

1863 मध्ये, महान लेखक ज्युल्स व्हर्नने त्यांचे पुढील पुस्तक तयार केले, "20 व्या शतकातील पॅरिस." त्यात त्यांनी भुयारी मार्ग, कार, इलेक्ट्रिक खुर्ची, संगणक आणि अगदी इंटरनेटचे तपशीलवार वर्णन केले. तथापि, प्रकाशकाने पुस्तक छापण्यास नकार दिला आणि 1989 मध्ये ज्युल्स व्हर्नच्या पणतूला ते सापडेपर्यंत 120 वर्षांहून अधिक काळ ते तिथेच पडून राहिले. हे पुस्तक 1994 मध्ये प्रकाशित झाले.

या लेखात मी यांडेक्स शोध इंजिन काय आहे, हे शोध इंजिन कसे कार्य करते याबद्दल बोलेन आणि यांडेक्स शोध इंजिन रँकिंगमध्ये मर्यादित असलेल्या साइटची उदाहरणे देईन.

यांडेक्स शोध इंजिन, त्याच्या लोकप्रियतेच्या बाबतीत, जगात 20 व्या आणि रशियामध्ये 1 व्या क्रमांकावर आहे. अधिकृतपणे, यांडेक्स कंपनीला 1997 मध्ये 23 सप्टेंबर रोजी मान्यता देण्यात आली, त्याचा विकास कॉम्प टेक इंटरनॅशनल कंपनीच्या चौकटीत सुरू झाला आणि 2000 मध्ये यांडेक्स स्वतंत्र कंपनी म्हणून अस्तित्वात येऊ लागला.

कंपनीचे संस्थापक वोलोज अर्काडी युरीविच आहेत, जे जनरल डायरेक्टर आहेत आणि सेगालोविच इल्या व्हॅलेंटिनोविच (1964-2013), यांडेक्सचे संस्थापक आणि तंत्रज्ञान आणि विकास संचालक आहेत. आम्ही यांडेक्सच्या इतिहासाबद्दल थोडेसे शिकलो आहोत, आता त्याच्या शोध इंजिनबद्दल बोलूया.

आणि म्हणून यांडेक्स कंपनीची मुख्य दिशा शोध इंजिन आहे, ज्याचे विशिष्ट वैशिष्ट्य म्हणजे शोध क्वेरीचे उत्कृष्ट ट्यूनिंग. यॅन्डेक्स शोध इंजिन तुम्हाला रशियन, युक्रेनियन, बेलारूसी, टाटर, कझाक, इंग्रजी, तुर्की, जर्मन आणि फ्रेंच भाषेतील शब्दलेखन लक्षात घेऊन तुमची निवडलेली क्वेरी शोधण्याची परवानगी देते.

Yandex ने विविध एन्कोडिंगमधील त्यांच्या प्रती वगळून कागदपत्रे तपासण्याचे तत्त्व आणि प्रासंगिकतेचे मूल्यांकन करण्यासाठी एक सखोल अल्गोरिदम देखील विकसित केला आहे. Google च्या विपरीत, अधिक अचूकपणे त्याच्या PR रँकिंग अल्गोरिदम - PageRank वरून, Yandex शोध इंजिनसाठी आणखी एक महत्त्वाचा मुद्दा म्हणजे थीमॅटिक उद्धरण निर्देशांक - TIC चा परिचय.

यांडेक्स शोध इंजिनचे कार्य

http://www.yandex.ru
यांडेक्स शोध इंजिनमध्ये रोबोट्स आहेत, जे त्यांच्या प्रासंगिकतेसाठी साइट तपासण्यासाठी एक विशिष्ट प्रोग्राम आहेत. शोध रोबोट थेट लिंकद्वारे साइटवर जातात, नवीन पृष्ठे अनुक्रमित करतात आणि त्यांना त्यांच्या डेटाबेसमध्ये जतन करतात. साइटचे अनुक्रमित पृष्ठ शीर्षस्थानी जाण्यासाठी, जे खूप महत्वाचे आहे, पृष्ठावरील कीवर्डची वारंवारता, आपल्या साइटवर जाणाऱ्या बाह्य दुव्यांची संख्या आणि यासारख्या अनुक्रमित समस्या विचारात घेणे आवश्यक आहे. साइटचे एकूण वजन, जे Yandex TIC सारख्या निर्देशकाद्वारे मोजले जाते.

साइट्सचे उदाहरण जे यांडेक्स सिस्टम रँकिंगमध्ये मर्यादित करते

नॉन-युनिक सामग्री असलेल्या साइट ज्या इतर साइटवरून कॉपी केल्या गेल्या किंवा पुन्हा लिहिल्या गेल्या.

गटांमध्ये एकमेकांशी गहनपणे लिंक करणाऱ्या साइट.

निरर्थक सामग्री असलेल्या साइट.

फसव्या तंत्रज्ञानाचा वापर करणाऱ्या साइट.

फोरम आणि मेसेज बोर्ड ज्यामध्ये भरपूर लिंक स्पॅम असतात.

लेखकाने त्याच्या संसाधनाला भेट देण्याचे आमंत्रण नसलेले बाह्य दुवे ठेवून प्रासंगिकता मिळवण्याचा प्रयत्न करणाऱ्या साइट्स.

1. अटी आणि व्याख्या वैयक्तिक डेटाच्या प्रक्रियेवरील या करारामध्ये (यापुढे करार म्हणून संदर्भित), खालील अटींमध्ये खालील व्याख्या आहेत: ऑपरेटर - वैयक्तिक उद्योजक ओलेग अलेक्झांड्रोविच नेप्रोव्स्की. कराराची स्वीकृती - वैयक्तिक डेटा पाठवून आणि प्रक्रिया करून कराराच्या सर्व अटींची पूर्ण आणि बिनशर्त स्वीकृती. वैयक्तिक डेटा - साइटवर वापरकर्त्याने (वैयक्तिक डेटाचा विषय) प्रविष्ट केलेली आणि या वापरकर्त्याशी प्रत्यक्ष किंवा अप्रत्यक्षपणे संबंधित माहिती. वापरकर्ता - कोणतीही वैयक्तिक किंवा कायदेशीर संस्था ज्याने साइटवरील इनपुट फील्ड भरण्याची प्रक्रिया यशस्वीरित्या पूर्ण केली आहे. इनपुट फील्ड भरणे ही वापरकर्त्यासाठी त्यांचे नाव, आडनाव, फोन नंबर, वैयक्तिक ईमेल पत्ता (यापुढे वैयक्तिक डेटा म्हणून संदर्भित) साइटच्या नोंदणीकृत वापरकर्त्यांच्या डेटाबेसवर पाठविण्याची प्रक्रिया आहे, ओळखण्याच्या उद्देशाने केली जाते. वापरकर्ता. इनपुट फील्ड भरण्याच्या परिणामी, वैयक्तिक डेटा ऑपरेटरच्या डेटाबेसला पाठविला जातो. इनपुट फील्ड भरणे ऐच्छिक आहे. वेबसाइट - इंटरनेटवर स्थित आणि एक पृष्ठ असलेली वेबसाइट. 2. सामान्य तरतुदी 2.1. हा करार 27 जुलै 2006 च्या फेडरल लॉ क्रमांक 152-FZ “वैयक्तिक डेटावर” च्या आवश्यकतांच्या आधारे तयार केला गेला आहे आणि “क्षेत्रातील रशियन फेडरेशनच्या कायद्याचे उल्लंघन” यावरील अनुच्छेद 13.11 च्या तरतुदींवर आधारित आहे. रशियन फेडरेशनच्या प्रशासकीय गुन्ह्यांच्या संहितेचा वैयक्तिक डेटा आणि साइट वापरताना ऑपरेटर वापरकर्त्याबद्दल मिळवू शकणाऱ्या सर्व वैयक्तिक डेटासाठी वैध आहे. २.२. साइटवरील वापरकर्त्याद्वारे इनपुट फील्ड भरणे म्हणजे या कराराच्या सर्व अटींसह वापरकर्त्याचा बिनशर्त करार (कराराची स्वीकृती). या अटींशी असहमत असल्यास, वापरकर्ता साइटवरील इनपुट फील्ड भरत नाही. २.३. ऑपरेटरला वैयक्तिक डेटाची तरतूद करण्यासाठी वापरकर्त्याची संमती आणि ऑपरेटरद्वारे त्यांची प्रक्रिया ऑपरेटरच्या क्रियाकलापांच्या समाप्तीपर्यंत किंवा वापरकर्त्याने संमती मागे घेईपर्यंत वैध आहे. हा करार स्वीकारून आणि नोंदणी प्रक्रियेतून जावून, तसेच नंतर साइटवर प्रवेश करून, वापरकर्ता पुष्टी करतो की, त्याच्या स्वत: च्या इच्छेनुसार आणि स्वतःच्या हितासाठी, तो ऑपरेटरकडे प्रक्रियेसाठी त्याचा वैयक्तिक डेटा हस्तांतरित करतो आणि त्यास सहमती देतो. त्यांची प्रक्रिया. वापरकर्त्याला सूचित केले जाते की त्याच्या वैयक्तिक डेटाची प्रक्रिया ऑपरेटरद्वारे 27 जुलै 2006 क्रमांक 152-एफझेड "वैयक्तिक डेटावर" च्या फेडरल कायद्याच्या आधारे केली जाईल. 3. ऑपरेटरकडे हस्तांतरित केल्या जाणाऱ्या वापरकर्त्याच्या वैयक्तिक डेटाची आणि इतर माहितीची सूची 3. 1. ऑपरेटरची वेबसाइट वापरताना, वापरकर्ता खालील वैयक्तिक डेटा प्रदान करतो: 3.1.1. इनपुट फील्ड भरताना आणि/किंवा आडनाव, नाव, आश्रयस्थान, टेलिफोन नंबर (घर किंवा मोबाईल), वैयक्तिक ईमेल पत्ता यासह साइट सेवा वापरण्याच्या प्रक्रियेत वापरकर्त्याने स्वतःबद्दल स्वतंत्रपणे दिलेली विश्वसनीय वैयक्तिक माहिती. ३.१.२. IP पत्ता, कुकीजमधील माहिती, वापरकर्त्याच्या ब्राउझरबद्दलची माहिती (किंवा इतर प्रोग्राम ज्याद्वारे सेवांमध्ये प्रवेश केला जातो) यासह वापरकर्त्याच्या डिव्हाइसवर स्थापित सॉफ्टवेअर वापरून साइट सेवांमध्ये स्वयंचलितपणे हस्तांतरित केलेला डेटा. ३.२. ऑपरेटर वापरकर्त्याद्वारे प्रदान केलेल्या वैयक्तिक डेटाच्या अचूकतेची पडताळणी करत नाही. या प्रकरणात, ऑपरेटर गृहीत धरतो की वापरकर्ता इनपुट फील्डमध्ये प्रस्तावित प्रश्नांवर विश्वसनीय आणि पुरेशी वैयक्तिक माहिती प्रदान करतो. 4. वैयक्तिक डेटा संकलन आणि वापरासाठी उद्देश, नियम 4.1. ऑपरेटर सेवा प्रदान करण्यासाठी आणि वापरकर्त्याला सेवा प्रदान करण्यासाठी आवश्यक असलेल्या वैयक्तिक डेटावर प्रक्रिया करतो. ४.२. वापरकर्त्याचा वैयक्तिक डेटा ऑपरेटरद्वारे खालील उद्देशांसाठी वापरला जातो: 4.2.1. वापरकर्ता ओळख; ४.२.२. वापरकर्त्याला वैयक्तिकृत सेवा प्रदान करणे (तसेच पत्रे पाठवून कंपनीच्या नवीन जाहिराती आणि सेवांबद्दल माहिती देणे); ४.२.३. सेवांच्या वापराशी संबंधित सूचना, विनंत्या आणि माहिती पाठवणे, सेवांची तरतूद, तसेच वापरकर्त्याकडून विनंत्या आणि अनुप्रयोगांवर प्रक्रिया करणे यासह आवश्यक असल्यास वापरकर्त्याशी संपर्क राखणे; ४.३. वैयक्तिक डेटाच्या प्रक्रियेदरम्यान, खालील क्रिया केल्या जातील: संकलन, रेकॉर्डिंग, पद्धतशीरीकरण, संचयन, संचयन, स्पष्टीकरण (अद्यतन करणे, बदलणे), काढणे, वापरणे, अवरोधित करणे, हटवणे, नष्ट करणे. ४.४. काही प्रकरणांमध्ये त्याने निर्दिष्ट केलेली माहिती रशियन फेडरेशनच्या सध्याच्या कायद्यानुसार रशियन फेडरेशनच्या अधिकृत राज्य संस्थांना प्रदान केली जाऊ शकते यावर वापरकर्त्याचा आक्षेप नाही. ४.५. वापरकर्त्याचा वैयक्तिक डेटा ऑपरेटरद्वारे या करारामध्ये प्रदान केलेल्या पद्धतीने ऑपरेटरद्वारे संग्रहित आणि प्रक्रिया केला जातो. ४.६. वैयक्तिक डेटाची प्रक्रिया ऑपरेटरद्वारे डेटाबेस, स्वयंचलित, यांत्रिक आणि मॅन्युअल पद्धती राखून केली जाते. ४.७. साइट सेवांच्या वापराचा मागोवा घेण्यासाठी साइट कुकीज आणि इतर तंत्रज्ञान वापरते. साइटचे तांत्रिक ऑपरेशन ऑप्टिमाइझ करण्यासाठी आणि सेवा तरतुदीची गुणवत्ता सुधारण्यासाठी हा डेटा आवश्यक आहे. साइट साइटवरील प्रत्येक अभ्यागताची माहिती (URL, IP पत्ता, ब्राउझर प्रकार, भाषा, तारीख आणि विनंतीच्या वेळेसह) स्वयंचलितपणे रेकॉर्ड करते. वापरकर्त्यास साइटला भेट देताना वैयक्तिक डेटा प्रदान करण्यास नकार देण्याचा किंवा कुकीज अक्षम करण्याचा अधिकार आहे, परंतु या प्रकरणात, साइटची सर्व कार्ये योग्यरित्या कार्य करू शकत नाहीत. ४.८. या करारामध्ये प्रदान केलेल्या गोपनीयतेच्या अटी सर्व माहितीवर लागू होतात जी ऑपरेटर नंतरच्या साइटवर राहून आणि साइटच्या वापरादरम्यान वापरकर्त्याबद्दल मिळवू शकतो. ४.९. या कराराच्या अंमलबजावणीदरम्यान सार्वजनिकरित्या उघड केलेली माहिती, तसेच कोणत्याही व्यक्तीस मुक्त प्रवेश असलेल्या स्त्रोतांकडून पक्ष किंवा तृतीय पक्षांद्वारे मिळवता येणारी माहिती गोपनीय नाही. ४.१०. ऑपरेटर वापरकर्त्याच्या वैयक्तिक डेटाच्या गोपनीयतेचे अनधिकृत प्रवेश, बदल, प्रकटीकरण किंवा विनाश यापासून संरक्षण करण्यासाठी सर्व आवश्यक उपाययोजना करतो, यासह: डेटा गोळा करणे, संग्रहित करणे आणि प्रक्रिया करणे आणि सुरक्षितता सुनिश्चित करणे या प्रक्रियेची सतत अंतर्गत पडताळणी सुनिश्चित करणे; डेटाची भौतिक सुरक्षा सुनिश्चित करते, तांत्रिक प्रणालींमध्ये अनधिकृत प्रवेश प्रतिबंधित करते जे साइटचे ऑपरेशन सुनिश्चित करते, ज्यामध्ये ऑपरेटर वैयक्तिक डेटा संग्रहित करतो; केवळ ऑपरेटरच्या त्या कर्मचाऱ्यांना किंवा अधिकृत व्यक्तींना वैयक्तिक डेटामध्ये प्रवेश प्रदान करते ज्यांना ही माहिती वापरकर्त्यासाठी सेवांच्या तरतूदीशी संबंधित कर्तव्ये पार पाडण्यासाठी, तसेच साइटचे ऑपरेशन, विकास आणि सुधारणेसाठी आवश्यक आहे. ४.११. वापरकर्त्याचा वैयक्तिक डेटा गोपनीय राहतो, ज्या प्रकरणांमध्ये वापरकर्ता अमर्यादित लोकांपर्यंत सामान्य प्रवेशासाठी स्वेच्छेने स्वतःबद्दल माहिती प्रदान करतो त्याशिवाय. ४.१२. ऑपरेटरच्या पुनर्रचना दरम्यान आणि ऑपरेटरच्या कायदेशीर उत्तराधिकारीकडे अधिकारांचे हस्तांतरण करताना वापरकर्त्याच्या वैयक्तिक डेटाचे ऑपरेटरद्वारे हस्तांतरण कायदेशीर आहे, तर त्याला प्राप्त झालेल्या वैयक्तिक माहितीच्या संबंधात या कराराच्या अटींचे पालन करण्याच्या सर्व जबाबदाऱ्या आहेत. कायदेशीर उत्तराधिकारी हस्तांतरित. ४.१३. हे विधान केवळ ऑपरेटरच्या वेबसाइटवर लागू होते. शोध परिणामांसह ऑपरेटरच्या वेबसाइटवर उपलब्ध असलेल्या लिंक्सद्वारे वापरकर्ता प्रवेश करू शकणाऱ्या तृतीय पक्षाच्या साइट्ससाठी (सेवा) कंपनी नियंत्रित करत नाही आणि जबाबदार नाही. अशा साइट्सवर (सेवा), इतर वैयक्तिक माहिती संकलित केली जाऊ शकते किंवा वापरकर्त्याकडून विनंती केली जाऊ शकते आणि इतर क्रिया केल्या जाऊ शकतात 5. वैयक्तिक डेटाचा विषय म्हणून वापरकर्त्याचे अधिकार, वापरकर्त्याद्वारे वैयक्तिक डेटा बदलणे आणि हटवणे 5.1. वापरकर्त्यास अधिकार आहेत: 5.1.2. ऑपरेटरने त्याचा वैयक्तिक डेटा स्पष्ट करणे, वैयक्तिक डेटा अपूर्ण, जुना, चुकीचा, बेकायदेशीरपणे प्राप्त केलेला किंवा प्रक्रियेच्या नमूद उद्देशासाठी आवश्यक नसल्यास तो अवरोधित करणे किंवा नष्ट करणे आवश्यक आहे आणि त्याच्या अधिकारांचे संरक्षण करण्यासाठी कायद्याद्वारे प्रदान केलेल्या उपाययोजना देखील कराव्यात. ५.१.३. 5.1.3.1 समाविष्ट असलेल्या माहितीसह त्याच्या वैयक्तिक डेटाच्या प्रक्रियेशी संबंधित माहिती प्राप्त करा. ऑपरेटरद्वारे वैयक्तिक डेटाच्या प्रक्रियेच्या वस्तुस्थितीची पुष्टी; ५.१.३.२. ऑपरेटरद्वारे वापरलेल्या वैयक्तिक डेटावर प्रक्रिया करण्याचे उद्देश आणि पद्धती; ५.१.३.३. ऑपरेटरचे नाव आणि स्थान; ५.१.३.४. वैयक्तिक डेटाच्या संबंधित विषयाशी संबंधित प्रक्रिया केलेला वैयक्तिक डेटा, त्यांच्या पावतीचा स्रोत, जोपर्यंत अशा डेटाच्या सादरीकरणासाठी वेगळी प्रक्रिया फेडरल कायद्याद्वारे प्रदान केली जात नाही तोपर्यंत; ५.१.३.५. वैयक्तिक डेटाच्या प्रक्रियेच्या अटी, त्यांच्या स्टोरेजच्या कालावधीसह; ५.१.३.६. रशियन फेडरेशनच्या वर्तमान कायद्याद्वारे प्रदान केलेली इतर माहिती. ५.२. वैयक्तिक डेटाच्या प्रक्रियेसाठी संमती मागे घेणे वापरकर्त्याद्वारे ऑपरेटरला योग्य लिखित (मूर्त माध्यमावर मुद्रित आणि वापरकर्त्याने स्वाक्षरी केलेली) सूचना पाठवून केले जाऊ शकते. 6. ऑपरेटरच्या जबाबदाऱ्या. वैयक्तिक डेटामध्ये प्रवेश 6.1. ऑपरेटरने ऑपरेटरच्या वेबसाइटच्या वापरकर्त्यांच्या वैयक्तिक डेटावर अनधिकृत आणि लक्ष्यित नसलेल्या प्रवेशास प्रतिबंध करण्याची हमी दिली आहे. या प्रकरणात, साइट वापरकर्त्यांच्या वैयक्तिक डेटावर अधिकृत आणि लक्ष्यित प्रवेश सर्व स्वारस्य पक्षांद्वारे त्यांचा प्रवेश मानला जाईल, ऑपरेटरच्या साइटच्या उद्दिष्टांच्या आणि विषयाच्या चौकटीत लागू केला जाईल. त्याच वेळी, ऑपरेटर वापरकर्त्यांच्या वैयक्तिक डेटाच्या संभाव्य गैरवापरासाठी जबाबदार नाही जे याच्या परिणामी उद्भवते: सॉफ्टवेअर आणि हार्डवेअर आणि ऑपरेटरच्या नियंत्रणाबाहेरील नेटवर्कमधील तांत्रिक समस्या; ऑपरेटरच्या वेबसाइट्सच्या तृतीय पक्षांद्वारे त्यांच्या इच्छित उद्देशाव्यतिरिक्त इतर हेतुपुरस्सर किंवा अनावधानाने वापर केल्याच्या संबंधात; 6.2 ऑपरेटर वापरकर्त्याच्या वैयक्तिक माहितीचे अनधिकृत किंवा अपघाती प्रवेश, नाश, बदल, अवरोधित करणे, कॉपी करणे, वितरण तसेच त्याच्यासह तृतीय पक्षांच्या इतर बेकायदेशीर कृतींपासून संरक्षण करण्यासाठी आवश्यक आणि पुरेशी संस्थात्मक आणि तांत्रिक उपाययोजना करतो. 7. गोपनीयता धोरणातील बदल. लागू कायदे 7.1. वापरकर्त्यांना कोणतीही विशेष सूचना न देता या नियमांमध्ये बदल करण्याचा ऑपरेटरला अधिकार आहे. जेव्हा वर्तमान आवृत्तीमध्ये बदल केले जातात, तेव्हा शेवटच्या अद्यतनाची तारीख दर्शविली जाते. विनियमांची नवीन आवृत्ती त्याच्या प्रकाशनाच्या क्षणापासून अंमलात येईल, अन्यथा नियमांच्या नवीन आवृत्तीद्वारे प्रदान केल्याशिवाय. ७.२. रशियन फेडरेशनचा कायदा या नियमनाला लागू होईल आणि नियमन लागू करण्याच्या संदर्भात उद्भवलेल्या वापरकर्ता आणि ऑपरेटरमधील संबंध. मी स्वीकारतो मी स्वीकारत नाही

ते बर्याच काळापासून रशियन इंटरनेटचा अविभाज्य भाग बनले आहेत. शोध इंजिने ही आता प्रचंड आणि जटिल यंत्रणा आहेत जी केवळ माहिती शोध साधनच नव्हे तर व्यवसायासाठी आकर्षक क्षेत्र देखील दर्शवितात.

बहुतेक शोध इंजिन वापरकर्त्यांनी शोध इंजिनच्या ऑपरेशनच्या तत्त्वाबद्दल, वापरकर्त्यांच्या विनंतीवर प्रक्रिया करण्याच्या योजनेबद्दल, या प्रणालींमध्ये काय समाविष्ट आहे आणि ते कसे कार्य करतात याबद्दल कधीही विचार केला नाही (किंवा त्याबद्दल विचार केला, परंतु त्यांना उत्तर सापडले नाही) ...

हा मास्टर क्लास शोध इंजिन कसे कार्य करतात या प्रश्नाचे उत्तर देण्यासाठी डिझाइन केले आहे. तथापि, दस्तऐवजांच्या रँकिंगवर परिणाम करणारे घटक तुम्हाला येथे सापडणार नाहीत. शिवाय, आपण यांडेक्स अल्गोरिदमच्या तपशीलवार स्पष्टीकरणावर अवलंबून राहू नये. यांडेक्स शोध इंजिनचे तंत्रज्ञान आणि विकास संचालक इल्या सेगालोविच यांच्या म्हणण्यानुसार, तो केवळ इल्या सेगालोविच स्वत: द्वारे "छळाखाली" ओळखला जाऊ शकतो ...

2. शोध इंजिनची संकल्पना आणि कार्ये

शोध प्रणाली हे एक सॉफ्टवेअर आणि हार्डवेअर कॉम्प्लेक्स आहे जे इंटरनेटवर शोधण्यासाठी आणि वापरकर्त्याच्या विनंतीला प्रतिसाद देण्यासाठी डिझाइन केलेले आहे, मजकूर वाक्यांश (शोध क्वेरी) च्या स्वरूपात निर्दिष्ट केले आहे, माहितीच्या स्त्रोतांच्या लिंक्सची सूची तयार करून, प्रासंगिकतेनुसार ( विनंतीनुसार). सर्वात मोठी आंतरराष्ट्रीय शोध इंजिने: "गुगल", Yahoo , MSN . रशियन इंटरनेटवर हे यांडेक्स, रॅम्बलर, एपोर्ट आहेत.

उदाहरण म्हणून यांडेक्स शोध इंजिनचा वापर करून शोध क्वेरीच्या संकल्पनेवर बारकाईने नजर टाकूया. शोध क्वेरी वापरकर्त्याने त्याला जे शोधायचे आहे त्यानुसार, थोडक्यात आणि शक्य तितक्या सहजतेने तयार केले पाहिजे. समजा कार कशी निवडावी याविषयी आम्हाला Yandex मध्ये माहिती मिळवायची आहे. हे करण्यासाठी, Yandex मुख्य पृष्ठ उघडा आणि शोध क्वेरीचा मजकूर "कार कशी निवडावी" प्रविष्ट करा. पुढे, आमचे कार्य इंटरनेटवरील माहितीच्या स्त्रोतांना आमच्या विनंतीनुसार प्रदान केलेले दुवे उघडण्याचे खाली येते. तथापि, हे शक्य आहे की आम्हाला आवश्यक असलेली माहिती सापडणार नाही. असे झाल्यास, एकतर तुम्हाला तुमची विनंती पुन्हा शब्दबद्ध करणे आवश्यक आहे किंवा शोध इंजिन डेटाबेसमध्ये आमच्या विनंतीवर कोणतीही संबंधित माहिती नाही (अतिशय "अरुंद" क्वेरी विचारताना असे होऊ शकते, उदाहरणार्थ, "कसे निवडावे अर्खंगेल्स्क मध्ये एक कार")

कोणत्याही शोध इंजिनचे प्राथमिक उद्दिष्ट लोकांना ते शोधत असलेली माहिती अचूकपणे पोहोचवणे हे असते. आणि वापरकर्त्यांना सिस्टमला "योग्य" विनंत्या करायला शिकवा, उदा. शोध इंजिनच्या ऑपरेटिंग तत्त्वांचे पालन करणाऱ्या क्वेरी अशक्य आहेत. त्यामुळे, डेव्हलपर सर्च इंजिनसाठी अल्गोरिदम आणि ऑपरेटिंग तत्त्वे तयार करतात जे वापरकर्त्यांना ते शोधत असलेली माहिती शोधू देतात.

याचा अर्थ माहिती शोधताना वापरकर्ता ज्या प्रकारे विचार करतो त्याच प्रकारे शोध इंजिनने "विचार" केला पाहिजे. जेव्हा एखादा वापरकर्ता शोध इंजिनला विनंती करतो तेव्हा त्याला शक्य तितक्या लवकर आणि सहजतेने आवश्यक असलेले शोधायचे असते. परिणाम प्राप्त करून, तो अनेक मूलभूत पॅरामीटर्सद्वारे मार्गदर्शन केलेल्या सिस्टमच्या कार्यक्षमतेचे मूल्यांकन करतो. तो जे शोधत होता ते त्याला सापडले का? जर त्याला ते सापडले नाही, तर तो जे शोधत होता ते शोधण्यासाठी त्याला किती वेळा क्वेरी पुन्हा सांगावी लागली? त्याला किती संबंधित माहिती सापडली? शोध इंजिनने क्वेरीवर किती लवकर प्रक्रिया केली? शोध परिणाम सादर करणे किती सोयीचे होते? तुम्ही जो निकाल शोधत होता तो पहिला होता की शंभरावा? उपयुक्त माहितीसह किती अनावश्यक कचरा सापडला? शोध इंजिनमध्ये प्रवेश करताना आवश्यक माहिती सापडेल, म्हणा, एका आठवड्यात किंवा एका महिन्यात?

या सर्व प्रश्नांची उत्तरे देऊन समाधान करण्यासाठी, शोध इंजिन विकासक सतत शोध अल्गोरिदम आणि तत्त्वे सुधारत आहेत, नवीन कार्ये आणि क्षमता जोडत आहेत आणि सिस्टमच्या ऑपरेशनला गती देण्यासाठी प्रत्येक संभाव्य मार्गाने प्रयत्न करीत आहेत.

3. शोध इंजिनची मुख्य वैशिष्ट्ये

चला शोध इंजिनच्या मुख्य वैशिष्ट्यांचे वर्णन करूया:

पूर्णता
संपूर्णता हे शोध प्रणालीच्या मुख्य वैशिष्ट्यांपैकी एक आहे, जे विनंतीनुसार सापडलेल्या दस्तऐवजांच्या संख्येचे इंटरनेटवरील एकूण दस्तऐवजांच्या संख्येचे गुणोत्तर आहे जे दिलेली विनंती पूर्ण करतात. उदाहरणार्थ, जर इंटरनेटवर 100 पृष्ठे असतील ज्यात "कार कशी निवडावी" हा वाक्यांश असेल आणि त्यापैकी फक्त 60 संबंधित क्वेरीसाठी आढळली असतील, तर शोधाची पूर्णता 0.6 असेल. अर्थात, शोध जितका अधिक पूर्ण होईल, वापरकर्त्याला आवश्यक असलेले दस्तऐवज सापडणार नाही याची शक्यता कमी आहे, जर ते इंटरनेटवर अजिबात अस्तित्वात असेल.
अचूकता
अचूकता हे शोध इंजिनचे आणखी एक मुख्य वैशिष्ट्य आहे, जे सापडलेले दस्तऐवज वापरकर्त्याच्या क्वेरीशी किती प्रमाणात जुळतात यावरून निर्धारित केले जाते. उदाहरणार्थ, जर “कार कशी निवडावी” या क्वेरीमध्ये 100 दस्तऐवज असतील, तर त्यापैकी 50 मध्ये “कार कशी निवडावी” हा वाक्यांश असेल आणि बाकीच्यांमध्ये फक्त हे शब्द असतील (“योग्य रेडिओ कसा निवडावा आणि तो कसा स्थापित करावा एक कार”), नंतर शोध अचूकता 50/100 (=0.5) च्या समान मानली जाते. शोध जितका अधिक अचूक असेल, वापरकर्त्याला आवश्यक असलेले दस्तऐवज जितक्या जलद सापडतील, तितक्या कमी विविध प्रकारचे "कचरा" त्यांच्यामध्ये आढळतील, कमी वेळा सापडलेले दस्तऐवज विनंतीशी संबंधित नसतील.
प्रासंगिकता
प्रासंगिकता हा शोधाचा तितकाच महत्त्वाचा घटक आहे, जो इंटरनेटवर दस्तऐवज प्रकाशित केल्यापासून ते शोध इंजिन इंडेक्स डेटाबेसमध्ये प्रवेश करेपर्यंतच्या वेळेनुसार दर्शविला जातो. उदाहरणार्थ, स्वारस्यपूर्ण बातम्या दिसल्याच्या दुसऱ्या दिवशी, मोठ्या संख्येने वापरकर्ते संबंधित क्वेरींसह शोध इंजिनकडे वळले. वस्तुनिष्ठपणे, या विषयावरील बातम्यांच्या माहितीच्या प्रकाशनानंतर एका दिवसापेक्षा कमी कालावधी झाला आहे, परंतु मुख्य दस्तऐवज आधीच अनुक्रमित केले गेले आहेत आणि शोधासाठी उपलब्ध आहेत, मोठ्या शोध इंजिनच्या तथाकथित "जलद डेटाबेस" च्या अस्तित्वामुळे धन्यवाद, जे दिवसातून अनेक वेळा अद्यतनित केले जाते.
शोध गती
शोध गती त्याच्या लोड प्रतिरोधनाशी जवळून संबंधित आहे. उदाहरणार्थ, रॅम्बलर इंटरनेट होल्डिंग एलएलसीच्या मते, आज, व्यवसायाच्या वेळेत, रॅम्बलर शोध इंजिनला प्रति सेकंद सुमारे 60 विनंत्या प्राप्त होतात. अशा वर्कलोडसाठी वैयक्तिक विनंतीचा प्रक्रिया वेळ कमी करणे आवश्यक आहे. येथे वापरकर्त्याचे आणि शोध इंजिनचे हितसंबंध जुळतात: अभ्यागताला शक्य तितक्या लवकर परिणाम मिळवायचे आहेत आणि शोध इंजिनने विनंतीवर शक्य तितक्या लवकर प्रक्रिया करणे आवश्यक आहे, जेणेकरुन त्यानंतरच्या क्वेरींची गणना कमी होऊ नये.
दृश्यमानता

4. शोध इंजिनच्या विकासाचा संक्षिप्त इतिहास

इंटरनेट विकासाच्या सुरुवातीच्या काळात, त्याच्या वापरकर्त्यांची संख्या कमी होती आणि उपलब्ध माहितीचे प्रमाण तुलनेने कमी होते. बहुतेक भागांसाठी, फक्त संशोधन कर्मचाऱ्यांना इंटरनेटवर प्रवेश होता. यावेळी इंटरनेटवर माहिती शोधण्याचे काम आताच्या इतपत निकडीचे नव्हते.

नेटवर्क माहिती संसाधनांमध्ये प्रवेश आयोजित करण्याचा पहिला मार्ग म्हणजे साइट्सच्या खुल्या निर्देशिका तयार करणे, संसाधनांचे दुवे ज्यामध्ये विषयानुसार गटबद्ध केले गेले. असा पहिला प्रकल्प Yahoo.com वेबसाइट होता, जी 1994 च्या वसंत ऋतूमध्ये उघडली गेली. कॅटलॉगमधील साइट्सची संख्या लक्षणीय वाढल्यानंतर, कॅटलॉगमध्ये आवश्यक माहिती शोधण्याची क्षमता जोडली गेली. संपूर्ण अर्थाने, ते अद्याप शोध इंजिन नव्हते, कारण शोध क्षेत्र केवळ कॅटलॉगमध्ये उपस्थित असलेल्या संसाधनांपुरते मर्यादित होते आणि सर्व इंटरनेट संसाधनांसाठी नाही.

लिंक डिरेक्टरी भूतकाळात मोठ्या प्रमाणावर वापरल्या जात होत्या, परंतु सध्या त्यांची लोकप्रियता जवळजवळ पूर्णपणे गमावली आहे. जरी आधुनिक कॅटलॉग, व्हॉल्यूममध्ये प्रचंड, फक्त इंटरनेटच्या नगण्य भागाबद्दल माहिती असते. डीएमओझेड नेटवर्कच्या सर्वात मोठ्या निर्देशिकेत (ज्याला ओपन डिरेक्टरी प्रोजेक्ट देखील म्हणतात) मध्ये 5 दशलक्ष संसाधनांची माहिती आहे, तर Google शोध इंजिन डेटाबेसमध्ये 8 अब्जाहून अधिक दस्तऐवज आहेत.

1995 मध्ये, लाइकोस आणि अल्टाविस्टा ही शोध इंजिने दिसू लागली. नंतरचे अनेक वर्षांपासून इंटरनेटवरील माहिती शोध क्षेत्रात अग्रेसर आहे.

1997 मध्ये, सेर्गे ब्रिन आणि लॅरी पेज यांनी स्टॅनफोर्ड विद्यापीठातील संशोधन प्रकल्पाचा भाग म्हणून Google शोध इंजिन तयार केले. गुगल हे सध्या जगातील सर्वात लोकप्रिय सर्च इंजिन आहे!

सप्टेंबर 1997 मध्ये, यांडेक्स शोध इंजिन, जे रशियन-भाषेच्या इंटरनेटवर सर्वात लोकप्रिय आहे, अधिकृतपणे घोषित केले गेले.

सध्या, तीन मुख्य शोध इंजिन (आंतरराष्ट्रीय) आहेत - Google, Yahoo आणि, ज्यांचे स्वतःचे डेटाबेस आणि शोध अल्गोरिदम आहेत. बहुतेक इतर शोध इंजिने (ज्यापैकी मोठ्या संख्येने आहेत) एक किंवा दुसर्या स्वरूपात तीन सूचीबद्ध केलेल्या परिणामांचा वापर करतात. उदाहरणार्थ, AOL शोध (search.aol.com) Google डेटाबेस वापरते, तर AltaVista, Lycos आणि AllTheWeb याहू डेटाबेस वापरतात.

5. शोध प्रणालीच्या ऑपरेशनची रचना आणि तत्त्वे

रशियामध्ये, मुख्य शोध इंजिन Yandex आहे, त्यानंतर Rambler.ru, Google.ru, Aport.ru, Mail.ru आहे. शिवाय, याक्षणी, Mail.ru यांडेक्स शोध इंजिन आणि डेटाबेस वापरते.

जवळजवळ सर्व प्रमुख शोध इंजिनांची स्वतःची रचना असते, इतरांपेक्षा वेगळी असते. तथापि, सर्व शोध इंजिनांसाठी सामान्य असलेले मुख्य घटक ओळखणे शक्य आहे. संरचनेतील फरक केवळ या घटकांच्या परस्परसंवादाच्या यंत्रणेच्या अंमलबजावणीच्या स्वरूपात असू शकतात.

अनुक्रमणिका मॉड्यूल

इंडेक्सिंग मॉड्यूलमध्ये तीन सहाय्यक प्रोग्राम (रोबोट्स) असतात:

स्पायडर हा वेब पृष्ठे डाउनलोड करण्यासाठी डिझाइन केलेला प्रोग्राम आहे. स्पायडर पृष्ठ डाउनलोड करतो आणि त्या पृष्ठावरील सर्व अंतर्गत दुवे पुनर्प्राप्त करतो. प्रत्येक पानाचा html कोड डाउनलोड केला जातो. पृष्ठे डाउनलोड करण्यासाठी रोबोट HTTP प्रोटोकॉल वापरतात. स्पायडर खालीलप्रमाणे कार्य करते. रोबोट "गेट/पथ/दस्तऐवज" विनंती आणि काही इतर HTTP विनंती आदेश सर्व्हरला पाठवतो. प्रतिसादात, रोबोटला सेवा माहिती आणि दस्तऐवजाचा एक मजकूर प्रवाह प्राप्त होतो.

पृष्ठ URL
पृष्ठ डाउनलोड झाल्याची तारीख
सर्व्हर प्रतिसाद http शीर्षलेख
पृष्ठाचा मुख्य भाग (html कोड)

क्रॉलर (“ट्रॅव्हलिंग” स्पायडर) हा एक प्रोग्राम आहे जो पृष्ठावरील सर्व लिंक्स आपोआप फॉलो करतो. पृष्ठावर उपस्थित असलेल्या सर्व लिंक्स निवडते. दुव्यांवर आधारित किंवा पत्त्यांच्या पूर्वनिर्धारित सूचीवर आधारित, कोळी पुढे कुठे जायचे हे निर्धारित करणे हे त्याचे कार्य आहे. क्रॉलर, सापडलेल्या दुव्यांचे अनुसरण करून, शोध इंजिनला अद्याप अज्ञात असलेल्या नवीन दस्तऐवजांचा शोध घेतो.

इंडेक्सर (रोबोट इंडेक्सर) हा एक प्रोग्राम आहे जो स्पायडरद्वारे डाउनलोड केलेल्या वेब पृष्ठांचे विश्लेषण करतो. इंडेक्सर पृष्ठाचे त्याच्या घटक भागांमध्ये विश्लेषण करतो आणि त्याचे स्वतःचे लेक्सिकल आणि मॉर्फोलॉजिकल अल्गोरिदम वापरून त्यांचे विश्लेषण करतो. विविध पृष्ठ घटकांचे विश्लेषण केले जाते, जसे की मजकूर, शीर्षके, दुवे, संरचनात्मक आणि शैली वैशिष्ट्ये, विशेष सेवा HTML टॅग इ.

अशाप्रकारे, इंडेक्सिंग मॉड्यूल तुम्हाला लिंक्स वापरून संसाधनांचा एक संच क्रॉल करण्यास, समोर आलेली पृष्ठे डाउनलोड करण्यास, प्राप्त झालेल्या दस्तऐवजांमधून नवीन पृष्ठांचे दुवे काढण्याची आणि या दस्तऐवजांचे संपूर्ण विश्लेषण करण्यास अनुमती देते.

डेटाबेस

डेटाबेस, किंवा शोध इंजिन इंडेक्स, एक डेटा स्टोरेज सिस्टम आहे, एक माहिती ॲरे ज्यामध्ये इंडेक्सिंग मॉड्यूलद्वारे डाउनलोड केलेल्या आणि प्रक्रिया केलेल्या सर्व दस्तऐवजांचे विशेष रूपांतरित पॅरामीटर्स संग्रहित केले जातात.

सर्व्हर शोधा

शोध सर्व्हर हा संपूर्ण सिस्टमचा सर्वात महत्वाचा घटक आहे, कारण शोधाची गुणवत्ता आणि गती थेट अल्गोरिदमवर अवलंबून असते जे त्याचे कार्य करते.

शोध सर्व्हर खालीलप्रमाणे कार्य करते:

वापरकर्त्याकडून प्राप्त केलेली विनंती मॉर्फोलॉजिकल विश्लेषणाच्या अधीन आहे. डेटाबेसमध्ये समाविष्ट असलेल्या प्रत्येक दस्तऐवजाचे माहिती वातावरण तयार केले जाते (जे नंतर फॉर्ममध्ये प्रदर्शित केले जाईल, म्हणजेच शोध परिणाम पृष्ठावरील विनंतीशी संबंधित मजकूर माहिती).
प्राप्त केलेला डेटा इनपुट पॅरामीटर्स म्हणून एका विशेष रँकिंग मॉड्यूलमध्ये पाठविला जातो. सर्व दस्तऐवजांसाठी डेटावर प्रक्रिया केली जाते, परिणामी प्रत्येक दस्तऐवजाचे स्वतःचे रेटिंग असते जे वापरकर्त्याने प्रविष्ट केलेल्या क्वेरीची प्रासंगिकता आणि शोध इंजिन इंडेक्समध्ये संग्रहित या दस्तऐवजाचे विविध घटक दर्शवते.
वापरकर्त्याच्या निवडीवर अवलंबून, हे रेटिंग अतिरिक्त अटींद्वारे समायोजित केले जाऊ शकते (उदाहरणार्थ, तथाकथित "प्रगत शोध").
पुढे, एक स्निपेट व्युत्पन्न केला जातो, म्हणजे, सापडलेल्या प्रत्येक दस्तऐवजासाठी, शीर्षक, क्वेरीशी सर्वोत्तम जुळणारा एक छोटा गोषवारा आणि दस्तऐवजाची लिंक स्वतः दस्तऐवज सारणीमधून काढली जाते आणि सापडलेले शब्द हायलाइट केले जातात.
परिणामी शोध परिणाम वापरकर्त्याला SERP (सर्च इंजिन परिणाम पृष्ठ) - शोध परिणाम पृष्ठाच्या रूपात प्रसारित केले जातात.

जसे आपण पाहू शकता, हे सर्व घटक एकमेकांशी जवळून संबंधित आहेत आणि परस्परसंवादात कार्य करतात, शोध प्रणालीच्या ऑपरेशनसाठी एक स्पष्ट, ऐवजी जटिल यंत्रणा तयार करतात, ज्यासाठी मोठ्या प्रमाणात संसाधनांची आवश्यकता असते.

6. निष्कर्ष

आता वरील सर्व गोष्टींचा सारांश घेऊ.

कोणत्याही शोध इंजिनचे प्राथमिक उद्दिष्ट लोकांना ते शोधत असलेली माहिती अचूकपणे पोहोचवणे हे असते.
शोध इंजिनची मुख्य वैशिष्ट्ये:
1. पूर्णता
2. अचूकता
3. प्रासंगिकता
4. शोध गती
5. दृश्यमानता
पहिले पूर्ण शोध इंजिन वेबक्रॉलर प्रकल्प होते, जे 1994 मध्ये प्रकाशित झाले.
शोध प्रणालीमध्ये खालील घटक समाविष्ट आहेत:
1. अनुक्रमणिका मॉड्यूल
2. डेटाबेस
3. सर्व्हर शोधा

आम्हाला आशा आहे की आमचा मास्टर क्लास तुम्हाला शोध इंजिनच्या संकल्पनेशी अधिक परिचित होण्यास आणि शोध इंजिनची मुख्य कार्ये, वैशिष्ट्ये आणि ऑपरेटिंग तत्त्वे अधिक चांगल्या प्रकारे समजून घेण्यास अनुमती देईल.

आज आम्ही शोध इंजिन विकासाच्या सुशोभित मार्गांवर प्रवासाच्या आणखी एका दीर्घ प्रवासाला निघालो ( यांडेक्स, यांडेक्स). मला वाटते की ऑनलाइन शोधाचा देशांतर्गत राक्षस फार पूर्वीपासून अशा स्तरावर वाढला आहे की त्याच्या सर्व कोनाड्यांमध्ये खोदण्यात फार आळशी नाही, Yandex शोध इंजिन कसे विकसित झाले आणि त्याच्या सर्व वर्षांमध्ये काय मनोरंजक होते हे लक्षात ठेवा. अस्तित्व

शिवाय, यांडेक्स शोध इंजिनकडून याला भरपूर अभ्यागत मिळतात. त्यापैकी बरेच जण संदर्भित जाहिरातींद्वारे निघून जातात, मी नुकताच ब्लॉग हाती घेतला आहे, म्हणून मला वाटते की ही कंपनी याबद्दल लिहिलेल्या मोठ्या प्रकाशनापेक्षा अधिक योग्य आहे.

जर आपण रशियन इंटरनेटचा विचार केला तर यांडेक्स हा निर्विवाद नेता आहे. रशियामध्ये हे पहिले सर्वात महत्वाचे शोध इंजिन आहे. बेलारूस, युक्रेन आणि कझाकस्तानमध्ये प्रादेशिक शोध इंजिन, शाखांची क्रमवारी आहे. यांडेक्स या देशांतील रहिवाशांमध्ये खूप लोकप्रिय आहे. इतर प्रदेशातून अनेक अभ्यागत येतात हे पाहून मी किमान आकडेवारीवरून याचा न्याय करू शकतो.

सध्या, यांडेक्स हे केवळ एक शोध इंजिन नाही तर या शोध इंजिनचे सर्व वापरकर्ते प्रवेश करू शकतात अशा असंख्य सेवा देखील आहेत. येथे आपण आपल्याला आवश्यक असलेली माहिती शोधू शकता आणि आपल्या आवडीच्या विश्रांतीच्या क्रियाकलापांमध्ये नेव्हिगेट करू शकता, चित्रे, उत्पादने शोधू शकता, किमतींची तुलना करू शकता, हवामान तपासू शकता, सोशल नेटवर्कवर संप्रेषण करू शकता, टीव्ही आणि वाहतूक वेळापत्रक पाहू शकता. अनेक एंटरप्राइझ उपाय आहेत. तुम्ही Narod.ru वर देखील जाऊ शकता. यांडेक्समध्ये एक सोयीस्कर प्रणाली आहे जी आपल्या वेबसाइटसह कार्य करण्यासाठी कार्यक्षमता प्रदान करते. सेवेच्या नवीनतम उपलब्ध नवकल्पनांपैकी एक आहे, जी बर्याच काळासाठी सशुल्क राहिली, परंतु डिसेंबर 2011 मध्ये ही सेवा पूर्णपणे प्रत्येकासाठी उपलब्ध झाली.

मी यांडेक्सच्या अद्भूत तंत्रज्ञान आणि उपयुक्त सेवांबद्दल खूप, खूप दीर्घकाळ पुढे जाऊ शकेन. म्हणून, माहितीच्या सहज आकलनासाठी, मी आमचा प्रवास घटकांमध्ये मोडतो. मी शोध इंजिनच्या संपूर्ण मार्गाचे वर्णन वर्षानुसार कालक्रमानुसार करेन - निर्मितीपासून आजपर्यंत.

यांडेक्सच्या विकासाचा इतिहास

1980 - 1990 चे दशक

यांडेक्सच्या विकासाचा इतिहासयूएसएसआरच्या काळात, आतापासून दूर असलेल्या 80 च्या दशकात त्याची मुळे परत घेते. तेव्हाच आर्केडिया येथे प्रथम शोध सॉफ्टवेअरचा विकास सुरू झाला. हे काम अर्काडी बोरकोव्स्की आणि अर्काडी वोलोझ यांच्या नेतृत्वाखाली पार पडले. ते पहिले आहे शोध तंत्रज्ञान"यांडेक्स" नाव प्राप्त झाले. आणि यांडेक्स वेबसाइट स्वतःच, जी आपण आज पाहू शकतो, 1996 मध्ये दिसली. त्या वेळी झालेल्या घडामोडींना आशादायक म्हणून ओळखले गेले, ज्याचा परिणाम म्हणून कॉम्पटेकचे व्यवस्थापन (संगणक आणि घटकांची विक्री) आणि सिस्टम डेव्हलपर्सनी तंत्रज्ञानाच्या पुढील विकासाच्या सल्ल्याचा निर्णय घेतला आणि जनतेला त्याचा परिचय दिला. . या संदर्भात, एक प्रकल्प विकास संकल्पना तयार केली गेली, ज्याचा उद्देश व्यापक प्रेक्षकांना आहे.

यांडेक्सची अधिकृतपणे केवळ 23 सप्टेंबर 1997 रोजी घोषणा करण्यात आली. आणि खरं तर, सुरुवातीला तो कॉम्पटेक इंटरनॅशनलच्या विभागांपैकी एक होता. म्हणजेच तिथे स्वातंत्र्य अजिबात नव्हते. आणि फक्त 2000 मध्ये Yandex ही कंपनी बनली ती आज पाहिली जाऊ शकते. कंपनी आधीच पूर्णपणे स्वतंत्र झाली आहे या अर्थाने. स्वतंत्र यांडेक्स.

तसे, यांडेक्स शोध इंजिनच्या घोषणेच्या खूप आधी, कंपनी एक नाव घेऊन आली. यांडेक्स - म्हणजे "भाषा निर्देशांक". इंग्रजीतून भाषांतरित केल्यास, ते "अद्याप आणखी एक इंडेक्सर" बाहेर वळते. हे खरे आहे की, शोध इंजिन जसजसे विकसित होत गेले तसतसे इतर व्याख्या दिसू लागल्या. उदाहरणार्थ, जर इंग्रजी निर्देशांकात तुम्ही इंग्रजीमधून पहिले अक्षर (I – Z) रशियनमध्ये भाषांतरित केले तर तुम्हाला “Yandex” मिळेल.

"यांडेक्स" नावाचा शोध इल्या सेगालोविच (सध्याचे तंत्रज्ञान संचालक) आणि अर्काडी वोलोझ यांनी लावला होता.

कंपनीच्या अधिकृत प्रकाशनाच्या एक वर्ष आधी, 18 ऑक्टोबर 1996 रोजी, नेटकॉम'96 प्रदर्शन आयोजित केले गेले होते, ज्यामध्ये कॉम्पटेकने विकसनशील शोध इंजिनची पहिली उत्पादने सादर केली. हे Yandex.Site आणि Yandex.Dict होते. त्यानंतर, सहा महिन्यांनंतर, Yandex.CD दिसू लागले - CD ROM वर कागदपत्रे शोधत आहेत, आणि नंतर Yandex.Lib प्रकल्प सुरू झाला. ही Yandex पॅकेज लायब्ररी होती, जी सर्व प्रकारच्या ऍप्लिकेशन्स आणि डेटाबेसमध्ये एम्बेड करण्यासाठी होती.

ज्या वेळी Yandex.ru अधिकृतपणे लोकांसमोर सादर केले गेले त्या वेळी, खालील गोष्टी मनोरंजक म्हणून हायलाइट केल्या जाऊ शकतात:

कागदपत्रांच्या प्रासंगिकतेचे मूल्यांकन करणे. त्या वेळी, यांडेक्स प्रती शोधण्यात आणि त्या वगळण्यात खूप चांगले होते. त्याच वेळी, विविध एन्कोडिंगमध्ये कागदपत्रे शोधली गेली

अचूक शब्द फॉर्म द्वारे शोधा. यशकाला मॉर्फोलॉजी लक्षात घेऊन कसे शोधायचे हे माहित होते

अंतरावर आधारित शोधा. यांडेक्स अचूक वाक्ये वापरून परिच्छेदामध्ये शोधू शकतो

पानांच्या सुसंगततेचे मूल्यमापन करण्यासाठीचा गाभा कार्यरत होता. प्रत्येक विनंतीसाठी, विनंतीचे अनुपालन (प्रासंगिकता) लक्षात घेऊन दस्तऐवज निवडले गेले. याव्यतिरिक्त, शोध परिणामांसाठी कागदपत्रे निवडताना, पृष्ठावरील कीवर्डची वारंवारता (घनता) विचारात घेतली गेली. तसे, तंतोतंत या अल्गोरिदमच्या अपूर्णतेमुळे (त्या वेळी) कीवर्डने दाटपणे भरलेली पृष्ठे, अक्षरशः अर्थहीन, शीर्ष शोध परिणामांमध्ये दिसू लागली.

तसेच, शोध दरम्यान, शब्दांमधील अंतर आणि दस्तऐवजात शब्द कसे आहेत याचा विचार केला गेला

यांडेक्स वेबसाइट डिझाइन

यांडेक्स वेबसाइटची पहिली रचना अगदी आदिम आणि अपूर्ण होती. हे सुप्रसिद्ध आर्टेमी लेबेडेव्ह यांनी विकसित केले होते. तो असा दिसत होता

तसे, यांडेक्स फोरम त्याच वर्षी उघडले. सिस्टम वापरकर्ते आणि विकासक यांच्यातील संवादासाठी हेतू. कल्पना चांगली होती आणि मंच सामान्यपणे कार्य करतो. खरे आहे, ते 2008 पर्यंत अस्तित्वात होते. मग प्राधान्यक्रमांमध्ये थोडासा फेरबदल झाला. मी सांगू शकतो, समाजीकरणाला प्राधान्य दिले गेले. यांडेक्सने स्वतःचे सोशल नेटवर्क सक्रियपणे विकसित करण्यास देखील सुरुवात केली, ज्याच्या आधारावर सध्याचा ब्लॉग दिसला, जिथे सर्व यांडेक्स घोषणा प्रकाशित केल्या जातात आणि जिथे, खरं तर, वापरकर्ते विकसकांशी संवाद साधतात. तुम्ही स्वतः पाहू शकता, जुनी फोरम URL ( http://forum.yandex.ru/yandex/) आज एक पुनर्निर्देशन प्रत्येकाला ज्ञात आहे http://webmaster.ya.ru/.

1998

सुरू झालेल्या या प्रकल्पात चांगली क्षमता दिसून आली आणि त्यांनी त्यावर काम सुरू ठेवले. 1998 मध्ये, शोध इंजिनमध्ये सुधारणा करण्यात आली आणि वापरकर्त्यांसाठी इतर अनेक कार्ये सुरू करण्यात आली. विशेषतः, जे सापडले त्याद्वारे शोधणे, समान कागदपत्रे शोधणे आणि बरेच काही करणे शक्य झाले. यांडेक्स होम पेजच्या डिझाईनवरही काम सुरू आहे. आता ती थोडी बदलली आहे

जसे आपण पाहू शकता, बाह्यतः काहीही बदललेले नाही. बरीचशी तांत्रिक कामे झाली

1999

वर्षभरात, इंटरनेटच्या रशियन शेअरचे प्रेक्षक लक्षणीय वाढले आहेत. यासह, Yandex ची गुणवत्ता आणि तंत्रज्ञान वाढले आहे आणि विकासकांनी अनेक सुधारणा सादर केल्या आहेत. यांडेक्स शोध इंजिनने एक नवीन शोध बॉट सादर केला आहे, ज्याने नेटवर्कवर दस्तऐवज क्रॉल करण्याच्या गतीमध्ये लक्षणीय वाढ केली आहे.

कार्यक्षमतेच्या वापरकर्त्याच्या भागांवर परिणाम करणारे नवकल्पन खालीलप्रमाणे होते:

आता अधिक विशिष्टपणे - भाष्ये, मथळे, चित्रे, शीर्षके शोधणे शक्य आहे

आम्ही साइट्सच्या गटावर शोध प्रतिबंध सादर केला

रशियन भाषेतील दस्तऐवज स्वतंत्रपणे हायलाइट केले गेले

तसे, 1999 मध्ये आता सुप्रसिद्ध संकल्पना (थीमॅटिक उद्धरण अनुक्रमणिका) प्रथम सादर केली गेली. खरे आहे, नंतर त्याची गणना अगदी आदिम पद्धतीने केली गेली. साइटचा अधिकार (उर्फ TIC) मोठ्या प्रमाणात आमच्या स्वारस्याच्या डोमेनशी लिंक केलेल्या साइटच्या संख्येवर अवलंबून आहे.

मुख्य पृष्ठाची रचना, तसे, बदलली आहे. आता ते सध्याच्या सारखेच काहीतरी बनले आहे

1999 मध्ये आणखी एक महत्त्वाची घटना घडली. तेव्हाच एक विनामूल्य वेबसाइट बिल्डर दिसला, जो आपल्या सर्वांना Narod.ru (विनामूल्य होस्टिंग आणि फाइल शेअरिंग सेवा) म्हणून ओळखला जातो. तसे, हा प्रकल्प अद्याप अस्तित्वात आहे. या प्रकल्पाचे ब्रीदवाक्य होते: 60 सेकंदात.

वर्ष 2000

कदाचित ही नवीन सेवांची ओळख होती ज्यामुळे यांडेक्सला विकासाच्या मूलभूतपणे नवीन स्तरावर पोहोचता आले. कालांतराने, शोध इंजिनने आपली स्थिती दृढपणे स्थापित केली, ज्यामुळे ते लक्षणीयरीत्या शक्य झाले खरं तर, हा एक नवीन प्रकल्प होता, जो कॉम्पटेकच्या आश्रयाने सुरू झालेला नाही.

1999 मध्ये, आर्काडी वोलोझने प्रकल्पाच्या विकासाची शक्यता ओळखून केवळ यांडेक्सला प्रोत्साहन देण्यावर लक्ष केंद्रित करण्यास सुरवात केली. पण अडचण अशी होती की कॉर्पोरेट बांधकाम कौशल्य असलेले अनुभवी भागीदार शोधणे आवश्यक होते. एकमात्र अडचण अशी होती की प्रकल्पाच्या विकासामध्ये गुंतवणूक करणारे भागीदार शोधणे आवश्यक होते, परंतु त्यांच्या नेतृत्वाखाली व्यवस्थापनाचे संपूर्ण हस्तांतरण आवश्यक नसते.

आणि असा जोडीदार सापडला. ती एक कंपनी होती ru-नेट होल्डिंग्ज. 2000 च्या वसंत ऋतूमध्ये, या कंपनीसोबत गुंतवणूकीचा करार झाला. येथे मात्र काही जीवितहानी झाली. तरीही, मला शोध इंजिनचा ठराविक हिस्सा सोडावा लागला. करारानुसार, कंपनीला 1/3 सर्च इंजिन मिळाले. म्हणजेच, त्या क्षणापासून, यांडेक्सने कॉम्पटेकचा स्ट्रक्चरल विभाग बनणे बंद केले, परंतु एक स्वतंत्र कंपनी बनली ज्याची स्वतःची कार्यालये, स्वतःचे व्यवस्थापन, स्वतःचे बजेट इ. अर्काडी वोलोज कंपनीचे महासंचालक झाले.

मला वाटते की यांडेक्स त्याच्या पहिल्या नेत्यासह खूप भाग्यवान होता, कारण वोलोज केवळ संभाव्य भागीदार शोधण्यात तज्ञच नाही तर एक चांगला नवोदित देखील होता. स्वतंत्र "पोहणे" सुरू झाल्यानंतर, कंपनीमध्ये प्रचंड बदल सुरू झाले. कर्मचारी लक्षणीयरीत्या भरले गेले आहेत आणि संसाधनाला स्वतःच्या नेत्यांकडून एक नवीन किक मिळाली आहे.

एकूण, ru-Net होल्डिंग्सने सुमारे $5 दशलक्ष गुंतवणूक केली. मी काय म्हणू शकतो, हा करार खूप फायदेशीर ठरला, विशेषत: आज RuNet मधील पहिल्या क्रमांकाच्या शोध इंजिनची किंमत किमान शंभर दशलक्ष डॉलर्स असेल. हा सर्वात पुराणमतवादी अंदाज आहे.

2000 हे वर्ष या कारणास्तव देखील महत्त्वपूर्ण होते की या वर्षातच यांडेक्सची बहुपयोगीता अधिक स्पष्टपणे प्रकट होऊ लागली, कारण अनेक सेवा दिसू लागल्या ज्या थेट शोधाशी जोडलेल्या नाहीत. अशा सेवा होत्या Yandex.News, Yandex.Mail, Postcards आणि ya.ru वर शोध बार. याव्यतिरिक्त, अशा अनेक सेवा होत्या ज्या नंतर विलीन झाल्या, ज्या आज आपल्याला Yandex.Market म्हणून ओळखतात. याव्यतिरिक्त, आणखी एक महत्त्वपूर्ण नवीनता म्हणजे वापरकर्ता ब्राउझर - यांडेक्स बारमध्ये एकत्रीकरणासाठी विशेष सॉफ्टवेअरचा परिचय.

वर्ष 2001

हे वर्ष एक निर्णायक बिंदू होते, कारण 2001 मध्ये यांडेक्स रहदारीच्या बाबतीत रुनेटचा नेता बनला. याव्यतिरिक्त, कंपनीच्या सर्व्हरवर संग्रहित माहितीचे प्रमाण देखील वाढले आहे. त्याचा आकार 1 टेराबाइट होता. तसे, Yandex.Images देखील या वर्षी दिसू लागले. याव्यतिरिक्त, इलेक्ट्रॉनिक पेमेंट सिस्टम Yandex.Money दिसू लागले

याव्यतिरिक्त, यांडेक्स मुख्यपृष्ठाची रचना अधिक लक्षणीयरीत्या सुधारली गेली आहे. येथे नवीन सेवा आणि बातम्यांचे दुवे आहेत. आम्ही असे म्हणू शकतो की सर्वसाधारणपणे आजच्या यांडेक्सची रूपरेषा आधीच दिसली आहे

2002

या वर्षी, विकासक संप्रेषण सेवा सुधारण्यासाठी सक्रियपणे कार्यरत आहेत - Yandex.Mail. पत्रव्यवहार फिल्टर करण्यासाठी बरेच काम केले गेले आहे. 2002 हे तीन सेवांच्या विलीनीकरणाचे वर्ष होते - उत्पादने, गुरु आणि एकामध्ये निवडा - Yandex.Market. तसे, तुम्ही स्वतःच पाहू शकता की ही सेवा आजही अतिशय संबंधित आहे. कदाचित गुंतवणूकीच्या सर्व वर्षांमध्ये प्रथमच, 2002 मध्ये एक ध्येय दिसून आले - स्वयंपूर्णता प्राप्त करणे. प्रकल्पाच्या कमाईसाठी धोरणात्मक प्रणाली विकसित करणे आवश्यक होते. शिवाय, भविष्यात स्थिर आणि मोठा नफा मिळवून देणारा. हे असे मॉडेल बनले आणि या जाहिरात मॉडेलमधून कंपनीला मिळू लागलेले उत्पन्न हेच होते ज्यामुळे अपेक्षेपेक्षा खूप लवकर स्वयंपूर्णता प्राप्त करणे शक्य झाले. म्हणूनच, आम्ही असे म्हणू शकतो की व्यवसाय-देणारं मॉडेलमध्ये प्रवेश करण्याच्या दृष्टीने 2002 हा एक टर्निंग पॉइंट होता, ज्याने आधीच फळ देण्यास सुरुवात केली आहे.

2003

या वर्षी, Yandex.Mail सेवेवर सक्रिय कार्य चालू राहिले. येथे, पुढील मोठ्या प्रमाणात बदल सादर केले गेले, ज्यामुळे सिस्टमच्या सर्व वापरकर्त्यांवर परिणाम झाला. अर्थात, Ya.Mail अधिक कार्यक्षम आणि सोयीस्कर झाले आहे. पुढे पाहताना, मला असे म्हणायचे आहे की भविष्यात सेवा देखील खूप सक्रियपणे विकसित झाली आहे आणि त्याच्या वापरकर्त्यांनी अनेक नवीन मनोरंजक वैशिष्ट्ये एकापेक्षा जास्त वेळा पाहिली आहेत. विशेषतः, वापरकर्त्यांना अमर्यादित मेलबॉक्स आकार आणि नवीन “स्पॅम संरक्षण” स्पॅम फिल्टर प्राप्त झाले. 2003 मध्ये, यांडेक्सचे डिझाइन पुन्हा अद्यतनित केले गेले.

तसे, प्रत्येक डिझाइन विशिष्ट आवृत्तीशी संबंधित आहे. डिझाइनची 2003 आवृत्ती सलग आठवी होती आणि ती यासारखी दिसत होती

नवीन डिझाइन आवृत्तीचे कोणतेही प्रकाशन सुरुवातीला बीटा चाचणी कालावधीतून जाते. आणि जर याआधी बीटा चाचण्या बंद मोडमध्ये केल्या गेल्या असतील, तर यावेळी, नवीन इंटरफेसच्या चाचणी चाचणीच्या दोन आठवड्यांदरम्यान, कोणालाही नवीन इंटरफेसमध्ये प्रवेश मिळू शकेल. खरे आहे, एका वर्षानंतर मुख्य पुन्हा अपग्रेड केले गेले, परंतु अधिक यशस्वीरित्या. आणि ते 2007 पर्यंत या स्वरूपात अस्तित्वात होते.

त्या वेळीही, यांडेक्स आधीपासूनच एक प्रतिष्ठित कंपनी होती, कारण 2003 मध्ये यांडेक्स शोध इंजिन यशस्वीरित्या अध्यक्षीय वेबसाइटवर लागू केले गेले होते. 2003 च्या शेवटी, विकासकांनी पुढील उत्पादन अद्यतने आणली: Yandex.Publisher, Yandex.Server (Yandex.Server), जे Yandex.Site चा वारसा बनले.

2004

रुनेटमधील पहिल्या क्रमांकाच्या शोध इंजिनने व्यापलेले व्यवसाय मॉडेल खूप चांगले कार्य केले, परिणामी 2004 मध्ये कंपनीला मिळालेला नफा आधीच कोट्यवधी डॉलर्स इतका होता. यामुळे नवीन सेवांच्या विकासास चालना मिळाली, उदाहरणार्थ, नकाशा, ब्लॉग आणि मंचांवर शोध सेवा. 2004 हे वर्ष देखील उल्लेखनीय आहे की तेव्हाच Google च्या व्यक्तीमध्ये एक गंभीर प्रतिस्पर्धी रशियन बाजारात दिसला. नेतृत्वासाठी संघर्षात प्रवेश करण्याची तातडीची गरज होती, परिणामी यांडेक्स व्यवस्थापनाने आपले कर्मचारी दहापट वाढविण्याचा निर्णय घेतला. सुरुवातीला 200 होते, कर्मचारी अपडेट केल्यानंतर 2,000 कर्मचारी होते. परंतु मुख्य गोष्ट अशी आहे की कर्मचाऱ्यांच्या नूतनीकरणानंतर काहीही वाईट झाले नाही. परंपरा कायम राहिल्या, तंत्रज्ञानही अद्ययावत होते. आणि सर्वसाधारणपणे, आपण असे म्हणू शकतो की यश कोरड्या कॉर्पोरेशनमध्ये बदलले नाही.

तंत्रज्ञानाची लढाई: यांडेक्स वि गुगल

2005 वर्ष

कंपनीच्या प्रतिनिधी कार्यालयाच्या भौगोलिक विस्ताराच्या घोषणेखाली हे वर्ष पार पडले. कारण Yandex चे युक्रेनियन प्रतिनिधी कार्यालय दिसू लागले - Yandex.Ukraine. तसे, या प्रतिनिधी कार्यालयाचे संचालक सेर्गेई पेट्रेन्को आहेत, जे सुप्रसिद्ध शोधाचे संस्थापक आणि मनोरंजक ब्लॉग ब्लॉगनॉटचे लेखक आहेत.

2005 हे वर्ष देखील लक्षणीय होते कारण माझे आवडते वर्ष उघडले. ही "कोलोटीबाब्लो वेबमास्टर" तत्त्वावर आधारित सेवा आहे आणि रशियन भाषेत, ही एक सेवा आहे जी वेबमास्टर्सना त्यांच्या साइटवर जाहिरात ठेवण्याची परवानगी देते.

त्याच वर्षी, Yandex.Dictionaries दिसू लागले. Yandex.Money सेवेमध्ये देखील बदल झाले आहेत. आता सर्व वापरकर्त्यांना ऑनलाइन वॉलेटद्वारे त्यांचे खाते व्यवस्थापित करण्याची संधी आहे.

2006

हे वर्ष आता सुप्रसिद्ध सेवा blogs.yandex.ru च्या देखाव्यासाठी लक्षात ठेवले जाईल. हे एक प्रकारचे विपणन साधन आहे. मला लोकांचे मत, ब्लॉग आणि फोरमवरील पुनरावलोकनांचा अभ्यास करण्याची परवानगी दिली. Yandex.Maps ने ट्रॅफिक जाम प्रदर्शित करण्यासाठी एक साधन सादर केले आहे.

2006 ते 2010 पर्यंत, यांडेक्स मॉस्कोमधील समोकटनाया स्ट्रीटवरील जुन्या कार्यालयात होते.

जसे आपण पाहू शकता, पूर्वी ते थोडे अरुंद होते. ही आता नाही, 2000 कर्मचाऱ्यांसाठी एक मोठी इमारत आहे.

2006 मध्ये, आणखी एक मनोरंजक घटना घडली - सेंट पीटर्सबर्गमध्ये पहिले दूरस्थ विकास कार्यालय उघडले गेले. मग, अर्थातच, प्रमाण अद्याप समान नव्हते. आज यांडेक्सची रशिया, युक्रेन, तुर्की आणि अगदी कॅलिफोर्नियामध्ये 11 कार्यालये आहेत असे नाही. कार्यालये क्रियाकलाप प्रकारानुसार बदलतात. विकासामध्ये गुंतलेली कार्यालये, विक्री कार्यालये, कार्यालये आहेत जी उत्पादन स्थानिकीकरणाच्या क्षेत्रात कार्य करतात

2007

या वर्षी अशा घटना घडल्या आहेत ज्या वेबमास्टर्सवर अधिक केंद्रित आहेत. विशेषतः, Yandex.Photos सेवा दिसू लागली. परंतु माझ्यासाठी, एक वेबमास्टर म्हणून, एक अधिक मनोरंजक घटना म्हणजे सेवेचा देखावा Yandex.Metrica. खरे आहे, त्या वेळी ही एक पूर्णपणे क्रूड सेवा होती आणि ती वेबमास्टर्ससाठी नव्हती, परंतु Yandex.Direct जाहिरातदारांसाठी होती. त्याच वर्षी, एक युक्रेनियन प्रतिनिधी कार्यालय उघडले - Yandex.ua. आज, LiveInternet नुसार, जवळजवळ 14% रशियन भाषेतील रहदारी yandex.ua वरून येते

तसेच 2007 मध्ये, सर्व वेबमास्टर्सना ज्ञात असलेला एक प्रकल्प सुरू करण्यात आला, जो कदाचित फक्त आळशी लोक वापरत नाहीत

2008

आम्ही असे म्हणू शकतो की यावर्षी यांडेक्सच्या प्रभावाचे क्षेत्र इतके वाढले आहे की यूएसए, कॅलिफोर्नियामध्ये शोध इंजिनची शाखा उघडण्याचा निर्णय घेण्यात आला. त्याच वेळी, अल्गोरिदममध्ये महत्त्वपूर्ण जोडणी केली गेली. विशेषत:, आंतरराष्ट्रीय दर्जाचे Sitemap, MediaRSS, इत्यादींना समर्थन मिळू लागले. म्हणजे, जसे तुम्ही बघू शकता, रुचीची क्षेत्रे RuNet च्या पलीकडे गेली आहेत. RuNet वर प्रथम क्रमांकाचे सर्च इंजिन आता इंग्रजी भाषेतील साइट बनले आहे. याआधी, समस्या अशी होती की देशांतर्गत शोध इंजिन आंतरराष्ट्रीय मानकांना समर्थन देत नाही, आणि म्हणून बुरझुनेट वरून अनुक्रमित साइट्समध्ये समस्या होती, परंतु 2008 मध्ये अपग्रेड झाल्यानंतर, ही समस्या सोडवली गेली. आणि त्यानंतर, यांडेक्स लोगो पूर्णपणे रशियनमध्ये लिहिला जाऊ लागला.

वर्ष 2009

हे वर्ष लक्षणीय होते कारण त्याआधी प्रदेशानुसार शोधाची विभागणी नव्हती. म्हणजेच, या अल्गोरिदमचा परिचय करण्यापूर्वी, ते एकसमानतेच्या तत्त्वांवर बांधले गेले होते. उदाहरणार्थ, तुम्ही मॉस्को आणि नोवोसिबिर्स्क मधील शोध बारमध्ये “” क्वेरी प्रविष्ट करता आणि तुम्हाला समान परिणाम मिळतात. आता सर्वकाही बदलले आहे. आणि भू-अवलंबनाच्या तत्त्वावर आधारित परिणाम शोध परिणामांमध्ये मिसळले जातात. सोप्या भाषेत सांगायचे तर, आपण मॉस्को आणि नोवोसिबिर्स्कमध्ये यांडेक्स वापरून शोधल्यास, परिणाम भिन्न असतील.

2009 मध्ये, पूर्वी निवडलेल्या पश्चिम दिशेने काम चालू राहिले. विशेषतः, परदेशी साइट्सचे भाषांतर करण्यासाठी वापरल्या जाणाऱ्या सेवेची चाचणी घेण्यात आली. नंतर ही सेवा विकसित झाली आणि 2011 मध्ये ती Yandex.Translation म्हणून ओळखली जाऊ लागली.

तितकीच महत्त्वाची घटना म्हणजे नवीन मशीन लर्निंग पद्धतीचा परिचय - मॅट्रिक्सनेट. हे तंत्रज्ञान मूल्यमापन म्हणून विविध नमुने वापरते आणि विविध क्रमवारीचे घटक विचारात घेते. पण मुख्य गोष्ट अशी आहे की तंत्रज्ञान स्वयं-शिक्षण आहे. मूल्यांकनकर्त्यांचे मूल्यांकन करताना, केवळ वास्तविक नमुन्यांचे मूल्यांकन केले जाते आणि अस्तित्वात नसलेल्यांचा शोध पूर्णपणे वगळला जातो.

या तंत्रज्ञानाचे क्रांतिकारक स्वरूप या वस्तुस्थितीत आहे की मॅट्रिक्सनेट एक आश्चर्यकारकपणे जटिल रँकिंग सूत्र वापरते जे मोठ्या संख्येने घटक विचारात घेते. हे, एकीकडे, तुम्हाला चांगले शोध परिणाम प्राप्त करण्यास अनुमती देते, परंतु दुसरीकडे, हे वेबमास्टर्सना हा नमुना समजून घेण्यास अनुमती देणार नाही आणि म्हणूनच, त्यांच्या स्वत: च्या आवडीनुसार त्यावर प्रभाव टाकेल.

मॅट्रिक्सनेट तंत्रज्ञानाबद्दल अधिक तपशील:

2010

समोकटनाया रस्त्यावरील जुने कार्यालय भूतकाळातील गोष्ट आहे आणि संपूर्ण कंपनी नवीन वाड्यांमध्ये गेली आहे. खरं तर, ही 2010 ची मुख्य घटना बनली