‘Google सर्च’ कैसे काम करता है ? How Does Google search work?

दोस्तों आज आप इन्टरनेट पर हमेसा कुछ न कुछ search करते ही होंगे और इन्टरनेट मतलब google इसका पर्याय बन चुका है और google पर अपने keyword टाइप करते ही हमें हजारो लाखो सूचनाये सेकंडो में ही search रिजल्ट में डिस्प्ले होने लगती है और आप अपनी जरूरत के हिसाब उन रिजल्ट पर क्लिक करके अपनी आवश्यकताओ को पूरा कर लेते है | पर क्या आप आपने कभी सोचा है की google इतनी जल्दी इन सूचनाओ को लाता कहा से है | चलिए आज हम इन्ही चीजो के बारे में जानते है और कुछ google के इंट्रेस्टिंग फैक्ट के बारे में जानते है | तो सबसे पहले google काम कैसे करता है ?

‘Google सर्च’ कैसे काम करता है ?

जब आप वेब पर कुछ खोजते हैं, तो आपको उपयोगी जानकारी वाले हज़ारों या कभी-कभी लाखों वेबपेज मिलते हैं. आप जब तक लिखना खत्म करें उससे पहले ही Google दिखाए जाने वाले नतीजों का पता लगा लेता है. ऐसा इसलिए क्योंकि google आपको सबसे अच्छी जानकारी मुहैया कराने की प्राथमिकता डेटा है |

वेब का कॉन्टेंट व्यवस्थित करना?

Google आपके खोजने से पहले ही ‘सर्च’ के इंडेक्स में वेबपेजों के बारे में जानकारी व्यवस्थित कर देता है. इंडेक्स एक लाइब्रेरी की तरह है. फ़र्क इतना ही है कि इसमें दुनिया की सभी लाइब्रेरी से ज़्यादा जानकारी एक साथ मौजूद है.
आप जो खोज रहे हैं वह तुरंत मिलेगा Google के सर्च एल्गोरिदम झटपट अरबों वेबपेजों को हमारे ‘सर्च’ इंडेक्स में क्रम से लगा देते हैं ताकि आपकी खोज के लिए सटीक और काम के नतीजे मिल सकें.

नतीजों को उपयोगी तरीके से दिखाना

Google कई उपयोगी फ़ॉर्मैट में नतीजे उपलब्ध कराता है. इनकी मदद से आप खोजी जाने वाली चीज़ें तेज़ी से पा सकते हैं. जानकारी चाहे रास्ते के निर्देशों वाले मैप, इमेज, और वीडियो के रूप में हो या खबरों के रूप में, हम इसे दिखाने के नए तरीकों की सुविधाएं लाते जा रहे हैं.

Google का revenue का सोर्स क्या है ?

Google का मुख्य revenue सोर्स विज्ञापन है न की खोज के परिणाम, भले ही विज्ञापन देने वाले, वेबपेज की बेहतरीन जगहों पर विज्ञापन दिखाने के लिए पैसे दे सकते हैं, लेकिन कोई भी खोज नतीजों में बेहतर जगह नहीं खरीद सकता.आपको हमेशा बेहतर जानकारी देता है google को यह बात पता है कि ‘सर्च’ हमेशा बेहतर हो सकता है. इसीलिए, Google के इंजीनियर इसे हर रोज़ टेस्ट करते हैं. साथ ही, हर साल लाखों प्रयोग भी करते हैं. हज़ारों सुधार इसी का नतीजा हैं.

अपने वेबसाइट को सबसे ऊपर कैसे रैंक कराये?

जैसे की आप सभी को पता होना चाहिए की google अपनी तरफ से कोई भी परिणाम स्वतः नहीं उपलब्ध कराता है इसके लिए google users को पैसे कमाने के साथ साथ उसको एक ऐसा प्लेट फॉर्म उपलब्ध कराता है जहा पर users अपने ब्लॉग्गिंग, इमेज, पोस्टिंग, मपिंग सर्विसेज, एमैलिंग आदि की सुविधा प्रदान करता है|

सर्च में जानकारी कैसे व्यवस्थित की जाती है?

आपके खोजने से पहले, वेब क्रॉलर सैकड़ों अरबों वेबपेजों से जानकारी जुटा कर उसे सर्च इंडेक्स में व्यवस्थित करते हैं.
जैसे मान लीजिये आपको ऑनलाइन घर बैठे पैसे कमाने है तो इसके लिए आप ब्लॉग्गिंग कर सकते है ब्लॉग्गिंग करने के लिए आपको एक डोमेन खरीदना होता है और इसको अपनों सर्वर में इंडेक्स होस्ट करना होता है, इसके बाद लिखे हुए कंटेंट को google में इंडेक्स करना होता है| Crawling करना होता है आदि बहुत सी बातो की जानकारी रखनी होती है जो आपके सुविधा के लिए बुनियादी बातें नीचे पढ़ सकते है –

सर्च की बुनियादी बातें-

क्रॉल करने की प्रक्रिया की शुरुआत पहले से क्रॉल की जा चुकीं वेबसाइट और वेबसाइट मालिकों की ओर से दिए गए साइटमैप देखने से होती है. इन वेबसाइट पर जाने के बाद, क्रॉलर इन पर मौजूद लिंक के ज़रिए और पेज खोजते हैं. यह सॉफ़्टवेयर नई साइट, मौजूदा साइट में हुए बदलाव और बेकार पड़े लिंक पर खास ध्यान देता है. कंप्यूटर प्रोग्राम यह तय करते हैं कि किन साइट को क्रॉल करना है, कितनी बार क्रॉल करना है और हर साइट से कितने पेज लाने हैं.

Search Console की सुविधा देते हैं, ताकि साइट के मालिकों को इस बारे में चुनने के विकल्प दे पाएं कि Google उनकी साइट को कैसे क्रॉल करे वे इस बारे में ज़्यादा जानकारी वाले निर्देश दे सकते हैं कि उनकी साइट के पेज कैसे प्रोसेस किए जाएं.request a recrawl साथ ही, वे “robots.txt” फ़ाइल का इस्तेमाल करके साइट क्रॉल होने की प्रक्रिया से पूरी तरह ऑप्ट-आउट भी कर सकते हैं. Google कभी भी किसी साइट को ज़्यादा क्रॉल करने के लिए, पैसे नहीं लेता — सभी वेबसाइटों को एक तरह के ही टूल उपलब्ध करवाते हैं, ताकि उपयोगकर्ताओं को सबसे बेहतर नतीजे मिल सकें.

वेब, लगातार बढ़ रही अरबों किताबों की एक ऐसी लाइब्रेरी है, जिसे प्रबंधित करने का कोई फ़ाइलिंग सिस्टम नहीं है. वेब क्रॉलर नाम के सॉफ़्टवेयर का इस्तेमाल करके सार्वजनिक रूप से उपलब्ध वेबपेजों को खोजते हैं. क्रॉलर वेबपेजों को देखते हैं और उन पेजों पर मौजूद लिंक को फ़ॉलो करते हैं, ठीक वैसे ही, जैसे आप वेब पर सामग्री ब्राउज़ करते हैं. वे एक लिंक से दूसरे लिंक पर जाते हैं और उन वेबपेजों का डेटा Google के सर्वर पर वापस लाते हैं.

इंडेक्स करके जानकारी व्यवस्थित करना?

जब क्रॉलर को कोई वेबपेज मिलता है, तो सिस्टम उस पेज की सामग्री ठीक उस तरह से पेश करते हैं जैसे कि एक ब्राउज़र करता है. google खास संकेतों पर ध्यान देते हैं — कीवर्ड से लेकर वेबसाइट पर मौजूद ताज़ा जानकारी तक — और google सर्च इंडेक्स में इस सब पर नज़र रखता हैं.

‘Google सर्च’ इंडेक्स में अरबों वेबपेज हैं और इसका आकार 100,000,000 गीगाबाइट से भी ज़्यादा है. यह किसी किताब के पीछे दिए गए इंडेक्स की तरह है, जिसमें इंडेक्स किए गए हर वेबपेज में शामिल हर शब्द के लिए एक एंट्री होती है. जब किसी वेबपेज को इंडेक्स में शामिल करते हैं, तो पेज को इंडेक्स में मौजूद सभी शब्दों की एंट्री में जोड़ देते हैं.नॉलेज ग्राफ़ के ज़रिए आपके लिए ज़रूरी लोगों, स्थानों और चीजें को बेहतर तरीके से समझने के अपने दायरे को लगातार बढ़ाने की कोशिश कर रहे हैं. अब सिर्फ़ कीवर्ड मिलान तक ही सीमित नहीं हैं. ऐसा करने के लिए google सिर्फ़ वेबपेज के बारे में जानकारी ही नहीं, बल्कि और तरह की जानकारी को भी व्यवस्थित करते हैं. अब Google सर्च की मदद से आप दुनिया की प्रमुख लाइब्रेरी में मौजूद लाखों किताबों में से कोई लेख ढूंढ सकते हैं, अपनी स्थानीय सार्वजनिक परिवहन एजेंसी से गाड़ियों का समय जान सकते हैं. आप वर्ल्ड बैंक जैसी सार्वजनिक संस्थाओं के आंकड़े भी देख सकते हैं.

सर्च एल्गोरिदम कैसे काम करते हैं?

वेब पर मौजूद असीमित सामग्री को देखते हुए, उसे सिलसिलेवार मुहैया कराने में किसी तरह की मदद के बिना अपनी ज़रूरत की चीज़ खोज पाना करीब-करीब नामुमकिन है. Google रैंकिंग सिस्टम ठीक यही काम करने के लिए बनाए गए हैं ये सिस्टम सर्च इंडेक्स में सैकड़ों अरबों वेबपेजों को क्रम से लगाते हैं, ताकि आपको काम के और फ़ायदेमंद नतीजे झटपट मिल सकें. साथ ही, इन पेजों को इस तरह दिखाया जाता है कि आपको खोजी जा रही चीज़ पाने में देर न लगे.

इन रैंकिंग सिस्टम में एक नहीं, बल्कि एल्गोरिद्म की पूरी सीरीज़ होती है. सबसे ज़्यादा काम की जानकारी मुहैया कराने के लिए खोज एल्गोरिद्म कई चीज़ों पर नज़र डालते हैं. इनमें आपकी क्वेरी के शब्द, पेजों की उपयोगिता और ज़रूरत के मुताबिक होना, स्रोतों की विशेषज्ञता के साथ ही आपकी जगह की जानकारी और सेटिंग शामिल हैं. हर चीज़ पर लागू होने वाली विशेषता में आपकी क्वेरी के हिसाब से फ़र्क़ होता है—जैसे कि शब्दकोश परिभाषाओं की क्वेरी के मुकाबले ताज़ा खबरों की क्वेरी का जवाब देते समय सामग्री कितनी नई है इसकी अहम भूमिका होती है.

जाँच करने की हमारी एक मुश्किल प्रक्रिया है जिसमें लाइव टेस्ट करने वाले और सर्च क्वालिटी आंकने वाले दुनिया भर के हजारों बाहरी प्रशिक्षित लोग दोनों ही शामिल होते हैं. इसकी मदद से सर्च एल्गोरिद्म को ज़रूरत के मुताबिक होने और क्वालिटी के ऊंचे मानकों की शर्त पूरी करने वाले बना पाते हैं. क्वालिटी आंकने वाले ये लोग ‘सर्च’ एल्गोरिद्म के लिए लक्ष्य तय करने वाले सख्‍त दिशानिर्देशों का पालन करते हैं और इन्हें हर कोई देख सकता है.

आपके शब्दों का विश्लेषण करना?

अच्छे जवाब दिखाने के लिए, आपकी खोज का मतलब समझना बहुत ज़रूरी है. इसलिए, आपकी खोज से जुड़ी जानकारी वाले पेज ढूंढने के लिए, पहला काम होता है आपकी सर्च क्वेरी की जांच करके उसके शब्दों का मतलब समझना. भाषा के मॉडल बनाकर यह समझने की कोशिश करते हैं कि इंडेक्स में किस तरह के शब्दों के समूह ढूंढने चाहिए|

इसमें कई ऐसे साधारण दिखने वाले कदम भी शामिल हैं, जैसे किसी शब्द को लिखने में हुई गलती (वर्तनी की गलती) . इसके साथ ही इसका दायरा बढ़ाकर यह समझना भी शामिल है कि आपने किस तरह की क्वेरी दर्ज की है. इसके लिए मूल निवासियों की भाषा को समझने के लिए बनाई गई अपनी नई तकनीक का इस्तेमाल करते हैं. उदाहरण के लिए, समानार्थी शब्द सिस्टम की मदद से सर्च को आपके लिखे शब्द समझना आसान हो जाता है, भले ही किसी शब्द के कई मतलब हों. इस सिस्टम को बनाने में पांच साल से ज़्यादा समय लगा और यह कई भाषाओं में की गईं 30% से ज़्यादा खोज के नतीजों को काफ़ी सुधार देता है.
google यह भी समझने की कोशिश करता हैं कि आप किस तरह की जानकारी खोज रहे हैं. क्या यह किसी बहुत खास जानकारी से जुड़ी खोज है या एक व्यापक क्वेरी है? क्या इसमें ‘समीक्षा’, ‘तस्वीरें’ या ‘खुले रहने का समय’ जैसे शब्द हैं, जो जानकारी खोजने के पीछे एक खास वजह थी? क्या आप ‘चर्चा में’ चल रहे कीवर्ड को खोज रहे हैं जिसका यह मतलब है कि आप उस दिन किसी सामग्री को प्रकाशित करना चाहते हैं? या आप अपने आस-पास होने वाले कारोबार के बारे में खोज रहे हैं और उसी जगह से जुड़ी जानकारी पाना चाहते हैं?

क्वेरी को इस तरह बांटने का खास तौर पर अहम पहलू यह विश्लेषण है कि आपकी क्वेरी में नई सामग्री मांगी जा रही है या नहीं. अगर आप ऐसे कीवर्ड खोजते हैं जो रुझान में हैं, तो ताज़ा जानकारी देने वाले एल्गोरिदम, इसका मतलब ऐसे संकेत के रूप में निकालेंगे कि पुराने पेजों के मुकाबले अप-टू-डेट जानकारी फायदेमंद हो सकती है.

आपकी खोजे हुए शब्द से मिलान करना-

google उन वेबपेज को ढूंढते हैं, जिन पर आपकी क्वेरी से मिलती-जुलती जानकारी होती है. जब आप कुछ खोजते हैं, तो सबसे बुनियादी स्तर पर एल्गोरिदम आपके सर्च के लिए शब्द को इंडेक्स में ढूंढते हैं. इंडेक्स के ज़रिए सही वेबपेज ढूंढे जाते हैं. वे जांचते हैं कि वे कीवर्ड, पेज पर कितनी बार और कहां दिखाई दे रहे हैं. जैसे, क्या कीवर्ड मुख्य शीर्षक में, शीर्षकों में या फिर लेख के बीच में कहीं दिख रहे हैं.


जानकारी काम की है, इसका सबसे बड़ा संकेत यह है कि वेबपेज में वही कीवर्ड दिए गए हों जो आपकी सर्च क्वेरी में हैं. अगर कीवर्ड, पेज पर दिखाई देते हैं या हेडिंग या टेक्स्ट के रूप में दिखाई देते हैं, तो जानकारी काम की हो सकती है. सर्च किए गए नतीजे क्वेरी के समान हैं या नहीं, यह पता लगाने के लिए कीवर्ड का मिलान करने के बजाय, इकट्ठा और अनियमित किए गए इंटरैक्शन डेटा का इस्तेमाल करते हैं.उस डेटा से ऐसे संकेत मिलते हैं जिनकी मदद से हमारे मशीन से सीखने वाले सिस्टम काम की जानकारी का बेहतर अनुमान लगा पाते हैं.

उपयोगी पेजों की रैंकिंग करना-

किसी भी क्वेरी के लिए ऐसे हज़ारों या लाखों वेबपेज होते हैं, जिन पर दी गई जानकारी क्वेरी से जुड़ी हो सकती है. इसलिए, सबसे अच्छे पेजों को पहले रैंक करना बहुत ज़रूरी होता है. ऐसा करने के लिए भी हम एल्गोरिदम लिखते हैं, ताकि यह जांच की जा सके कि ये वेबपेज किस हद तक फायदेमंद हैं. ये एल्गोरिदम सैंकड़ों अलग-अलग पहलुओं की जांच करके वेब पर उपलब्ध सबसे अच्छी जानकारी ढूंढने की कोशिश करते हैं. जिन पहलुओं की जांच की जाती है उनमें, सामग्री का नयापन, आपके खोज शब्द कितनी बार दिखाए दिए हैं और पेज पर उपयोगकर्ताओं का अनुभव शामिल हैं. सामग्री के भरोसेमंद और प्रामाणिक होने का आकलन करने के लिए, ऐसी साइटें ढूंढते हैं जिन्हें एक जैसी क्वेरी के लिए, बहुत सारे लोगों ने अहमियत दी है. अगर उसी विषय से जुड़ी दूसरी खास वेबसाइट भी पेज के लिंक देती हैं, तो इसका मतलब है कि जानकारी की क्वालिटी अच्छी है.


वेब पर ऐसी कई स्पैम साइटें हैं जो धोखेबाज़ी के तरीकों से सर्च नतीजों में ऊपर आने की कोशिश करती हैं. जैसे, बार-बार कीवर्ड दोहराना या PageRank को बढ़ाने वाले लिंक खरीदना. ये साइट, उपयोगकर्ताओं को खराब अनुभव देती हैं और Google उपयोगकर्ताओं को नुकसान पहुंचा सकती हैं या उन्हें गुमराह कर सकती हैं. इसलिए हम स्पैम की पहचान करने और Google के वेबमास्टर दिशा-निर्देशों का उल्लंघन करने वाली साइटों को अपने नतीजों से हटाने के लिए एल्गोरिदम लिखते हैं.
वेब पर सामग्री और जानकारी का बड़ा इकोसिस्टम लगातार बदल रहा है. और यह अपने सिस्टम की क्वालिटी को लगातार मापते हैं और इसका मूल्यांकन करते हैं. ऐसा इसलिए भी किया जाता है ताकि यह पक्का कर सकें कि जो जानकारी आपको दी जा रही हैं वह उपयोगी हो. साथ ही, कोशिश यह भी रहती है आपको बेहतर नतीजे उपलब्ध कराये जाये, जिससे आपका भरोसा बना रहे.

“आशा करता हु की यह जानकारी बहुत इंट्रेस्टिंग लगी होगी और यदि आप एक ब्लॉगर है तो यह जानकारी आपके लिए मील का पत्थर साबित हो सकती है | और यदि यह जानकारी आपको पसंद आई हो तो प्लीज अपने मित्रो के साथ इसे जरूर साझा करे|”
धनयवाद |

Leave a Reply

Your email address will not be published. Required fields are marked *