कोलेस्ड हैशिंग

कोलेस्ड हैशिंग, जिसे कोलेस्ड चेनिंग भी कहा जाता है, इस प्रकार हैश तालिका में संघटन समाधान की युक्ति है जो सेपरेट चेनिंग और विवृत एड्रेसिंग का हाइब्रिड बनाती है।

सेपरेट चेनिंग हैश तालिका
एक सेपरेट चेनिंग हैश तालिका में, समान पते पर हैश किए गए आइटम उस पते पर सूची (या चेन) पर रखे जाते हैं। इस तकनीक के परिणामस्वरूप बड़ी मात्रा में मेमोरी व्यर्थ हो सकती है क्योंकि तालिका को लोड फैक्टर को बनाए रखने के लिए पर्याप्त बड़ा होना चाहिए जो अच्छा प्रदर्शन करता है (सामान्यतः आइटमों की अपेक्षित संख्या से दोगुना), और अतिरिक्त मेमोरी का उपयोग पहले आइटम को छोड़कर सभी के लिए किया जाना चाहिए श्रृंखला (जब तक कि सूची शीर्षलेखों का उपयोग नहीं किया जाता है, उस स्थिति में श्रृंखला में सभी आइटमों के लिए अतिरिक्त मेमोरी का उपयोग किया जाना चाहिए)।

उदाहरण
अस्पस्ट विधि से उत्पन्न तीन वर्ण लंबी स्ट्रिंग्स के अनुक्रम qrj, aty, qur, dim, ofu, gcl, rhv, clq, ecd, qsu को देखते हुए, निम्न तालिका उत्पन्न की जाएगी (जेनकिन्स हैश फ़ंक्शन वन-एट-ए-टाइम का उपयोग करके | बॉब जेनकिंस का वन-ए-टाइम हैश एल्गोरिथम) आकार 10 की तालिका के साथ:

यह युक्ति प्रभावी, कुशल और प्रयुक्त करने में बहुत सरल है। चूँकि, कभी-कभी अतिरिक्त मेमोरी का उपयोग निषेधात्मक हो सकता है, और सबसे सामान्य विकल्प, ओपन एड्रेसिंग में असुविधाजनक हानि होती हैं जो प्रदर्शन को कम करते हैं। इस प्रकार ओपन एड्रेसिंग का प्राथमिक हानि प्राथमिक और द्वितीयक क्लस्टरिंग है, जिसमें खोज प्रयुक्त बकेट के लंबे अनुक्रम तक पहुंच सकती है जिसमें विभिन्न हैश पते वाले आइटम होते हैं; इस प्रकार हैश पते वाले आइटम अन्य हैश पते वाले आइटम की खोज को लंबा कर सकते हैं।

इन समस्याओं का समाधान समेकित हैशिंग है। कोलेस्ड हैशिंग सेपरेट चेनिंग के समान तकनीक का उपयोग करता है, किन्तु लिंक की गई सूची के लिए नए नोड्स आवंटित करने के अतिरिक्त, वास्तविक तालिका में बकेट का उपयोग किया जाता है। इस प्रकार संघटन के समय तालिका में पहली खाली बकेट को संघटन बकेट माना जाता है। जब तालिका में कहीं भी संघटन होता है, जिससे आइटम को संघटन बकेट में रखा जाता है और श्रृंखला और संघटन बकेट के बीच लिंक बनाया जाता है। नए डाले गए आइटम के लिए सेपरेट हैश पते वाले आइटम से संघटन संभव है, जैसे कि छवि में उदाहरण में स्थिति जब आइटम सीएलक्यू डाला जाता है। ऐसा कहा जाता है कि clq की श्रृंखला qrj की श्रृंखला के साथ मिलती है, इसलिए एल्गोरिदम का नाम। चूँकि, संवृत सम्बोधन द्वारा प्रदर्शित क्लस्टरिंग की तुलना में एकत्र होने की सीमा सामान्य है। उदाहरण के लिए, जब संलयन होता है, तो श्रृंखला की लंबाई केवल 1 से बढ़ती है, जबकि संवृत एड्रेसिंग में, इच्छानुसार लंबाई के खोज अनुक्रम संयोजित हो सकते हैं।

सेलर
एकीकरण के प्रभाव को कम करने के लिए महत्वपूर्ण अनुकूलन, हैश फ़ंक्शन के पता स्थान को केवल तालिका के सबसेट तक सीमित करना है। उदाहरण के लिए, यदि तालिका का आकार M है और बकेट की संख्या 0 से M - 1 तक है, तो हम पता स्थान को प्रतिबंधित कर सकते हैं जिससे हैश फ़ंक्शन केवल तालिका में पहले N स्थानों के लिए पते निर्दिष्ट करे। शेष एम - एन बाल्टियाँ, जिन्हें सेलर कहा जाता है, विशेष रूप से उन वस्तुओं को संग्रहीत करने के लिए उपयोग की जाती हैं जो सम्मिलन के समय टकराती हैं। जब तक सेलर समाप्त नहीं होता है, तब तक कोई संलयन नहीं हो सकता है।

एम के सापेक्ष एन का इष्टतम विकल्प तालिका के लोड फैक्टर (या पूर्णता) पर निर्भर करता है। सावधानीपूर्वक विश्लेषण से पता चलता है कि मान N = 0.86 × M अधिकांश लोड कारकों के लिए लगभग-इष्टतम प्रदर्शन देता है।

वेरिएंट
प्रविष्टि के लिए अन्य प्रकार भी संभव हैं जिनसे खोज समय में सुधार हुआ है। विलोपन एल्गोरिदम विकसित किए गए हैं जो यादृच्छिकता को संरक्षित करते हैं, और इस प्रकार औसत खोज समय विश्लेषण विलोपन के बाद भी बना रहता है। == कार्यान्वयन                                                                                                                                                                                                               ==

C (प्रोग्रामिंग भाषा) में सम्मिलन: इस युक्ति का लाभ यह है कि सेपरेट-सेपरेट चेनिंग के लिए खोज एल्गोरिदम का उपयोग समेकित हैश तालिका में बदलाव के बिना किया जा सकता है।

सी में लुकअप:

प्रदर्शन
विलोपन कठिन हो सकता है. सम्मिलित श्रृंखला प्राथमिक और द्वितीयक क्लस्टरिंग के प्रभावों से बचती है, और परिणामस्वरूप सेपरेट श्रृंखला के लिए कुशल खोज एल्गोरिदम का लाभ उठा सकती है। यदि शृंखलाएँ छोटी हैं, तो यह युक्ति बहुत कुशल है और इसे मेमोरी-वार अत्यधिक संघनित किया जा सकता है। इस प्रकार संवृत एड्रेसिंग की तरह, सम्मिलित हैश तालिका से विलोपन अजीब और संभावित रूप से महंगा है, और तालिका का आकार बदलना बहुत महंगा है और इसे संभवतः ही कभी किया जाना चाहिए।

== संदर्भ                                                                                                                                                                                                                                                         ==