एक खोज इंजन सॉफ्टवेयर है, जो आमतौर पर इंटरनेट पर एक्सेस किया जाता है, जो उपयोगकर्ता की क्वेरी के अनुसार जानकारी का एक डेटाबेस खोजता है। इंजन परिणामों की एक सूची प्रदान करता है जो उपयोगकर्ता के लिए सबसे अच्छा मिलान करता है।
आज, इंटरनेट पर कई अलग-अलग खोज इंजन उपलब्ध हैं, प्रत्येक अपनी क्षमताओं और विशेषताओं के साथ। पहले विकसित किए गए खोज इंजन को आर्ची माना जाता है, जिसका उपयोग एफ़टीपी फ़ाइलों की खोज के लिए किया गया था और पहला पाठ-आधारित खोज इंजन वेरोनिका माना जाता है। आज, सबसे लोकप्रिय और प्रसिद्ध खोज इंजन Google है। अन्य लोकप्रिय खोज इंजनों में AOL, Ask.com, Baidu, Bing, और Yahoo शामिल हैं।
सर्च इंजन एक ऐसी सेवा है जो इंटरनेट उपयोगकर्ताओं को वर्ल्ड वाइड वेब (डब्ल्यूडब्ल्यूडब्ल्यू) के माध्यम से सामग्री की खोज करने की अनुमति देती है। एक उपयोगकर्ता कीवर्ड या कुंजी वाक्यांशों को एक खोज इंजन में दर्ज करता है और वेबसाइटों, छवियों, वीडियो या ऑनलाइन डेटा के रूप में वेब सामग्री परिणामों की एक सूची प्राप्त करता है। किसी उपयोगकर्ता द्वारा खोज इंजन के माध्यम से लौटाए गए सामग्री की सूची को खोज इंजन परिणाम पृष्ठ (SERP) के रूप में जाना जाता है।
एक खोज इंजन एक वेब-आधारित उपकरण है जो उपयोगकर्ताओं को वर्ल्ड वाइड वेब पर जानकारी का पता लगाने में सक्षम बनाता है। सर्च इंजन के लोकप्रिय उदाहरण Google, याहू! और एमएसएन सर्च हैं। खोज इंजन स्वचालित सॉफ़्टवेयर अनुप्रयोगों (रोबोट, बॉट या मकड़ियों के रूप में संदर्भित) का उपयोग करते हैं जो वेब के साथ यात्रा करते हैं, जो पृष्ठ से पृष्ठ तक, साइट से साइट पर लिंक का अनुसरण करते हैं। मकड़ियों द्वारा एकत्रित जानकारी का उपयोग वेब के खोजे जाने योग्य सूचकांक बनाने के लिए किया जाता है।
सरल बनाने के लिए, खोज इंजन को दो घटकों के रूप में सोचें। सबसे पहले एक मकड़ी / वेब क्रॉलर उस सामग्री के लिए वेब को ट्रोल करता है जिसे खोज इंजन के सूचकांक में जोड़ा जाता है। फिर, जब कोई उपयोगकर्ता किसी खोज इंजन पर सवाल उठाता है, तो खोज इंजन के एल्गोरिथ्म के आधार पर प्रासंगिक परिणाम दिए जाते हैं। प्रारंभिक खोज इंजन काफी हद तक पृष्ठ की सामग्री पर आधारित थे, लेकिन जैसा कि वेबसाइट ने सिस्टम को गेम के लिए सीखा है, एल्गोरिदम बहुत अधिक जटिल हो गए हैं और खोज किए गए परिणाम शाब्दिक रूप से सैकड़ों चर पर आधारित हो सकते हैं।
वहाँ महत्वपूर्ण बाजार में हिस्सेदारी के साथ खोज इंजन की एक महत्वपूर्ण संख्या हुआ करती थी। वर्तमान में, Google और Microsoft के बिंग बाजार के अधिकांश हिस्से को नियंत्रित करते हैं। (जबकि याहू कई प्रश्न उत्पन्न करता है, उनकी बैक-एंड खोज तकनीक Microsoft को आउटसोर्स की जाती है।)
उपयोगकर्ताओं के लिए, एक खोज इंजन उनके कंप्यूटर, स्मार्टफोन, टैबलेट या किसी अन्य डिवाइस पर एक ब्राउज़र के माध्यम से पहुँचा जाता है। आज, अधिकांश नए ब्राउज़र एक ऑम्निबॉक्स का उपयोग करते हैं, जो ब्राउज़र के शीर्ष पर एक टेक्स्ट बॉक्स है जो पता दिखाता है और वह है जहां आप इंटरनेट पर भी खोज सकते हैं। आप खोज करने के लिए प्रमुख खोज इंजन मुख पृष्ठ पर भी जा सकते है.
क्योंकि बड़े खोज इंजनों में लाखों और कभी-कभी अरबों पृष्ठ होते हैं, कई खोज इंजन न केवल पृष्ठों को खोजते हैं, बल्कि उनके महत्व के आधार पर परिणाम भी प्रदर्शित करते हैं। यह महत्व आमतौर पर विभिन्न एल्गोरिदम का उपयोग करके निर्धारित किया जाता है।
दृश्य खोज इंजन उदाहरणों को दाईं ओर छवि में चित्रित किया गया है, सभी खोज इंजन डेटा का स्रोत एक मकड़ी या क्रॉलर है, जो स्वचालित रूप से पृष्ठों का दौरा करता है और उनकी सामग्री को अनुक्रमित करता है। एक बार जब कोई पृष्ठ क्रॉल किया जाता है, तो पृष्ठ में मौजूद डेटा संसाधित और अनुक्रमित होता है। अक्सर, इसमें नीचे दिए गए चरण शामिल हो सकते हैं।