खोज इंजन (कंप्यूटिंग)

एक खोज इंजन एक सूचना पुनर्प्राप्ति सुविधा है जिसे कंप्यूटर प्रणाली  पर संग्रहीत जानकारी खोजने में सहायता के लिए डिज़ाइन किया गया है। खोज परिणाम आमतौर पर एक सूची में प्रस्तुत किए जाते हैं और आमतौर पर हिट कहलाते हैं। सूचना अधिभार के प्रबंधन के लिए अन्य तकनीकों के समान, खोज इंजन जानकारी खोजने के लिए आवश्यक समय और जानकारी की मात्रा को कम करने में मदद करते हैं, जिस पर परामर्श किया जाना चाहिए।

खोज इंजन का सबसे सार्वजनिक, दृश्य रूप एक वेब खोज इंजन है जो वर्ल्ड वाइड वेब पर जानकारी की खोज करता है।

सर्च इंजन कैसे काम करते हैं
खोज इंजन वस्तुओं के एक समूह को एक इंटरफ़ेस (कंप्यूटर विज्ञान) प्रदान करते हैं जो उपयोगकर्ताओं को रुचि के आइटम के बारे में मानदंड निर्दिष्ट करने में सक्षम बनाता है और इंजन को मेल खाने वाली वस्तुओं को खोजने में सक्षम बनाता है। मानदंड को वेब खोज क्वेरी के रूप में संदर्भित किया जाता है। टेक्स्ट सर्च इंजन के मामले में, खोज क्वेरी को आमतौर पर शब्दों के एक सेट के रूप में व्यक्त किया जाता है जो वांछित अवधारणा की पहचान करता है जिसमें एक या अधिक दस्तावेज़ शामिल हो सकते हैं। खोज क्वेरी वाक्य - विन्यास  की कई शैलियाँ हैं जो सख्तता में भिन्न हैं। यह पिछली साइटों से खोज इंजनों के भीतर नाम भी बदल सकता है। जबकि कुछ पाठ खोज इंजनों को उपयोगकर्ताओं को व्हाइटस्पेस (कंप्यूटर विज्ञान) द्वारा अलग किए गए दो या तीन शब्दों को दर्ज करने की आवश्यकता होती है, अन्य खोज इंजन उपयोगकर्ताओं को संपूर्ण दस्तावेज़, चित्र, ध्वनि और प्राकृतिक भाषा के विभिन्न रूपों को निर्दिष्ट करने में सक्षम कर सकते हैं। कुछ खोज इंजन क्वेरी विस्तार के रूप में जानी जाने वाली प्रक्रिया के माध्यम से वस्तुओं का एक गुणवत्ता सेट प्रदान करने की संभावना बढ़ाने के लिए खोज प्रश्नों में सुधार लागू करते हैं। क्वेरी समझने के तरीकों का उपयोग मानकीकृत क्वेरी भाषा के रूप में किया जा सकता है।

क्वेरी द्वारा निर्दिष्ट मानदंडों को पूरा करने वाली वस्तुओं की सूची को आमतौर पर क्रमबद्ध या रैंक किया जाता है। प्रासंगिकता (उच्चतम से निम्नतम) द्वारा रैंकिंग आइटम वांछित जानकारी खोजने के लिए आवश्यक समय कम कर देता है। संभाव्यता खोज इंजन स्ट्रिंग मीट्रिक (प्रत्येक आइटम और क्वेरी के बीच, आमतौर पर 1 से 0 के पैमाने पर, 1 सबसे समान होने के कारण) और कभी-कभी लोकप्रियता या प्राधिकरण ( ग्रंथमिति देखें) या प्रासंगिक प्रतिक्रिया का उपयोग करने के आधार पर आइटम रैंक करते हैं। बूलियन तर्क सर्च इंजन आमतौर पर केवल उन वस्तुओं को लौटाते हैं जो ऑर्डर के संबंध में बिल्कुल मेल खाते हैं, हालांकि बूलियन सर्च इंजन शब्द केवल बूलियन-शैली सिंटैक्स (ऑपरेटरों का उपयोग तार्किक संयोजन, तार्किक संयोजन, नहीं, और अनन्य और न ही गेट का उपयोग) को संदर्भित कर सकता है। ) एक संभाव्य संदर्भ में।

मिलान करने वाली वस्तुओं का एक सेट प्रदान करने के लिए जो कुछ मानदंडों के अनुसार जल्दी से क्रमबद्ध होते हैं, एक खोज इंजन आमतौर पर इंडेक्स (खोज इंजन) के रूप में संदर्भित प्रक्रिया के माध्यम से विचाराधीन वस्तुओं के समूह के बारे में मेटा डेटा  एकत्र करेगा। इंडेक्स को आमतौर पर कम मात्रा में  कंप्यूटर भंडारण  की आवश्यकता होती है, यही वजह है कि कुछ सर्च इंजन केवल इंडेक्स की गई जानकारी को स्टोर करते हैं, न कि प्रत्येक आइटम की पूरी सामग्री को, और इसके बजाय  नागिन (एल्बम)  में आइटम को नेविगेट करने की एक विधि प्रदान करते हैं। वैकल्पिक रूप से, खोज इंजन प्रत्येक आइटम की एक प्रति कैश (कंप्यूटिंग) में संग्रहीत कर सकता है ताकि उपयोगकर्ता आइटम की स्थिति को उस समय देख सकें जब इसे अनुक्रमित किया गया था या संग्रह उद्देश्यों के लिए या दोहराव वाली प्रक्रियाओं को अधिक कुशलतापूर्वक और तेज़ी से काम करने के लिए। अन्य प्रकार के सर्च इंजन इंडेक्स को स्टोर नहीं करते हैं। वेब क्रॉलर, या स्पाइडर टाइप सर्च इंजन (ए.के.ए. रीयल-टाइम सर्च इंजन) खोज क्वेरी के समय आइटम एकत्र और मूल्यांकन कर सकते हैं, प्रारंभिक आइटम की सामग्री के आधार पर गतिशील रूप से अतिरिक्त आइटम पर विचार कर सकते हैं (बीज या बीज यूआरएल के रूप में जाना जाता है) इंटरनेट क्रॉलर के मामले में)। मेटा सर्च इंजन न तो एक इंडेक्स और न ही एक कैश स्टोर करते हैं और इसके बजाय परिणामों का एक समग्र, अंतिम सेट प्रदान करने के लिए इंडेक्स या एक या अधिक अन्य सर्च इंजन के परिणामों का पुन: उपयोग करते हैं।

डाटाबेस आकार, जो 2000 के दशक की शुरुआत में एक महत्वपूर्ण विपणन विशेषता थी, को समान रूप से प्रासंगिकता रैंकिंग पर जोर देकर विस्थापित किया गया था, जिसके द्वारा खोज इंजन पहले सर्वोत्तम परिणामों को क्रमबद्ध करने का प्रयास करते हैं। प्रासंगिकता रैंकिंग पहली बार 1996 के आसपास एक प्रमुख मुद्दा बन गया, जब यह स्पष्ट हो गया कि परिणामों की पूरी सूची की समीक्षा करना अव्यावहारिक था। नतीजतन, प्रासंगिकता रैंकिंग के लिए कलन विधि में लगातार सुधार हुआ है। परिणामों को व्यवस्थित करने के लिए Google की पृष्ठ रैंक  पद्धति पर सबसे अधिक प्रेस हुई है, लेकिन सभी प्रमुख खोज इंजन परिणामों के क्रम में सुधार की दृष्टि से अपनी रैंकिंग पद्धतियों को लगातार परिष्कृत करते रहते हैं। 2006 तक, खोज इंजन रैंकिंग पहले से कहीं अधिक महत्वपूर्ण हैं, इतना अधिक कि एक उद्योग विकसित हो गया है (खोज इंजन अनुकूलन, या एसईओ) वेब-डेवलपर्स को उनकी खोज रैंकिंग में सुधार करने में मदद करने के लिए, और मामला कानून का एक पूरा निकाय मामलों के इर्द-गिर्द विकसित हो गया है। जो खोज इंजन रैंकिंग को प्रभावित करते हैं, जैसे कि मेटा टैग में ट्रेडमार्क का उपयोग। कुछ खोज इंजनों द्वारा खोज रैंकिंग की बिक्री ने भी पुस्तकालयाध्यक्षों और उपभोक्ता अधिवक्ताओं के बीच विवाद पैदा कर दिया है। उपयोगकर्ताओं के लिए खोज इंजन अनुभव में सुधार जारी है। Google के ज्ञान का ग्राफ को जोड़ने से इंटरनेट पर व्यापक प्रभाव पड़ा है, संभवतः कुछ वेबसाइटों के ट्रैफ़िक को भी सीमित कर दिया गया है, उदाहरण के लिए विकिपीडिया। जानकारी खींचकर और इसे Google के पृष्ठ पर प्रस्तुत करके, कुछ तर्क देते हैं कि यह अन्य साइटों को नकारात्मक रूप से प्रभावित कर सकता है। हालांकि, कोई बड़ी चिंता नहीं हुई है।

सर्च इंजन के प्रकार

 * स्रोत से


 * डेस्कटॉप खोज
 * संघीय खोज
 * मानव खोज इंजन
 * मेटासर्च इंजन
 * multisearch
 * खोज एग्रीगेटर
 * वेब सर्च इंजन


 * सामग्री प्रकार से


 * ऑडियो खोज
 * पूरा पाठ खोजें
 * छवि खोजो
 * वीडियो खोज इंजन


 * इंटरफ़ेस द्वारा


 * वृद्धिशील खोज
 * तुरंत उत्तर
 * शब्दार्थ खोज
 * चयन-आधारित खोज
 * आवाज खोज


 * विषय के अनुसार


 * ग्रंथ सूची डेटाबेस
 * उद्यम खोज
 * चिकित्सा साहित्य पुनर्प्राप्ति
 * कार्यक्षेत्र खोज

यह भी देखें

 * स्वचालित सारांश
 * एमानुएल गोल्डबर्ग (प्रारंभिक खोज इंजन के आविष्कारक)
 * इंडेक्स (सर्च इंजन)
 * उलटा सूचकांक
 * खोज इंजनों की सूची
 * एक सेवा के रूप में खोजें
 * सर्च इंजन अनुकूलन
 * सुझाव ड्रॉप-डाउन सूची खोजें
 * सॉल्वर (कंप्यूटर विज्ञान)
 * स्पैमडेक्सिंग
 * एसक्यूएल
 * टेक्स्ट खनन