सरोगेट कुंजी

सरोगेट कुंजी (या सिंथेटिक कुंजी, स्यूडोकी, इकाई पहचानकर्ता, तथ्यहीन कुंजी, या तकनीकी कुंजी) डेटाबेस में या तो मॉडलिंग की विश्व में इकाई या डेटाबेस में वस्तु के लिए विशिष्ट पहचानकर्ता है। प्राकृतिक कुंजी प्राकृतिक (या व्यवसाय) कुंजी के विपरीत, सरोगेट कुंजी अनुप्रयोग डेटा से प्राप्त नहीं होती है।

परिभाषा
सरोगेट की कम से कम दो परिभाषाएँ हैं:


 * सरोगेट (1) - हॉल, ओवलेट और टॉड (1976): सरोगेट बाहरी विश्व में एक इकाई का प्रतिनिधित्व करता है। सरोगेट आंतरिक रूप से प्रणाली द्वारा उत्पन्न होता है लेकिन फिर भी उपयोगकर्ता या अनुप्रयोग को दिखाई देता है।
 * सरोगेट (2) - वाइरिंगा और डी जॉन्ज (1991): सरोगेट डेटाबेस में ही एक वस्तु का प्रतिनिधित्व करता है। सरोगेट आंतरिक रूप से प्रणाली द्वारा उत्पन्न होता है और उपयोगकर्ता या अनुप्रयोग के लिए अदृश्य होता है।

सरोगेट (1) परिभाषा भंडारण मॉडल के अतिरिक्त डेटा मॉडल से संबंधित है और इस पूरे लेख में इसका उपयोग किया गया है। दिनांक (1998) देखें।

सरोगेट और प्राथमिक कुंजी के बीच महत्वपूर्ण अंतर इस बात पर निर्भर करता है कि डेटाबेस वर्तमान डेटाबेस है या अस्थायी डेटाबेस है। चूंकि वर्तमान डेटाबेस केवल वर्तमान में मान्य डेटा को संग्रहीत करता है, मॉडल की विश्व में सरोगेट और डेटाबेस की प्राथमिक कुंजी के बीच एक-से-एक पत्राचार होता है। इस स्थिति में सरोगेट को प्राथमिक कुंजी के रूप में उपयोग किया जा सकता है, जिसके परिणामस्वरूप सरोगेट कुंजी शब्द होता है। अस्थायी डेटाबेस में, चूंकि, प्राथमिक कुंजी और सरोगेट के बीच कई-से-एक संबंध होते हैं। चूँकि डेटाबेस में सरोगेट के अनुरूप कई ऑब्जेक्ट हो सकते हैं, हम सरोगेट को प्राथमिक कुंजी के रूप में उपयोग नहीं कर सकते हैं; सरोगेट के अतिरिक्त, प्रत्येक वस्तु को विशिष्ट रूप से पहचानने के लिए अन्य विशेषता की आवश्यकता होती है।

चूंकि हॉल एट अल. (1976) इस बारे में कुछ नहीं कहते हैं, अन्य लोगों ने तर्क दिया है कि किराए की कोख में निम्नलिखित विशेषताएं होनी चाहिएː


 * मूल्य का पुन: उपयोग नहीं किया जाता है।
 * मूल्य प्रणाली जनित है।
 * मूल्य उपयोगकर्ता या अनुप्रयोग द्वारा हेरफेर करने योग्य नहीं है।
 * मूल्य में कोई अर्थपूर्ण अर्थ नहीं है।
 * मूल्य उपयोगकर्ता या अनुप्रयोग को दिखाई नहीं देता है।
 * मान विभिन्न डोमेन से कई मानों से बना नहीं है।

अभ्यास में सरोगेट
वर्तमान डेटाबेस में, सरोगेट कुंजी प्राथमिक कुंजी हो सकती है, जो डेटाबेस प्रबंधन प्रणाली द्वारा उत्पन्न होती है और डेटाबेस में किसी भी अनुप्रयोग डेटा से प्राप्त नहीं होती है। सरोगेट कुंजी का एकमात्र महत्व प्राथमिक कुंजी के रूप में कार्य करना है। यह भी संभव है कि सरोगेट कुंजी डेटाबेस से उत्पन्न यूयूआईडी (उदाहरण के लिए, प्रत्येक कर्मचारी के यूयूआईडी के अतिरिक्त प्रत्येक कर्मचारी के लिए एचआर नंबर) के अतिरिक्त उपस्थित हो।

सरोगेट कुंजी अधिकांशतः अनुक्रमिक संख्या (उदाहरण के लिए अनुकूली सर्वर एंटरप्राइज़ या माइक्रोसॉफ्ट एसक्यूएल सर्वर पहचान कॉलम, पोस्टग्रेएसक्यूएल या इन्फोर्मिक्स, ओरेकल कॉर्पोरेशन  या माइक्रोसॉफ्ट एसक्यूएल सर्वर   या कॉलम परिभाषित किया गया है   माई एसक्यूएल में) होती है। कुछ डेटाबेस सरोगेट कुंजियों के लिए संभावित डेटा प्रकार के रूप में यूयूआईडी/गाइड (उदाहरण के लिए पोस्टग्रेएसक्यूएल या एसक्यूएल सर्वर) प्रदान करते हैं।

अन्य सभी स्तंभों से स्वतंत्र कुंजी होने से डेटाबेस संबंधों को डेटा मूल्यों या डेटाबेस डिज़ाइन (डेटाबेस को अधिक चुस्त सॉफ्टवेयर विकास बनाने) में परिवर्तन से अलग किया जाता है और विशिष्टता की गारंटी देता है।

अस्थायी डेटाबेस में, सरोगेट कुंजी और प्राकृतिक कुंजी के बीच अंतर करना आवश्यक है। प्रत्येक पंक्ति में व्यवसाय कुंजी और सरोगेट कुंजी दोनों होंगी। सरोगेट कुंजी डेटाबेस में अनूठी पंक्ति की पहचान करती है, व्यापार कुंजी मॉडलिंग की विश्व की अनूठी इकाई की पहचान करती है। तालिका पंक्ति परिभाषित समय अवधि के लिए इकाई की सभी विशेषताओं को धारण करने वाले समय के एक टुकड़े का प्रतिनिधित्व करती है। वे स्लाइस व्यावसायिक इकाई के पूरे जीवन काल को दर्शाते हैं। उदाहरण के लिए, तालिका कर्मचारी अनुबंध अनुबंधित कार्य घंटों का ट्रैक रखने के लिए अस्थायी जानकारी रख सकता है। अनुबंध के लिए व्यापार कुंजी दोनों पंक्तियों में समान (गैर-अद्वितीय) होगी चूंकि प्रत्येक पंक्ति के लिए सरोगेट कुंजी अद्वितीय है।

कुछ डेटाबेस डिज़ाइनर अन्य प्रत्याशी कुंजियों की उपयुक्तता की सावधान किए बिना व्यवस्थित रूप से सरोगेट कुंजियों का उपयोग करते हैं, जबकि अन्य डेटा में पहले से उपस्थित कुंजी का उपयोग करेंगे, यदि कोई है।

कुछ वैकल्पिक नाम सरोगेट अवधारणा की प्रकृति के अतिरिक्त नए सरोगेट मान उत्पन्न करने के विधि का वर्णन करते हैं।

सरोगेट्स उत्पन्न करने के दृष्टिकोण में सम्मिलित हैं:


 * सार्वभौमिक रूप से अद्वितीय पहचानकर्ता (यूयूआईडी)
 * विश्व स्तर पर विशिष्ट पहचानकर्ता (गाइडएस)
 * वस्तु पहचानकर्ता (ओआईडी)
 * अनुकूली सर्वर एंटरप्राइज़ या माइक्रोसॉफ्ट एसक्यूएल सर्वर पहचान स्तंभ  या
 * ओरेकल कॉर्पोरेशन, या   (संस्करण 12.1 से प्रारंभ)
 * माइक्रोसॉफ्ट एसक्यूएल सर्वर  (एसक्यूएल सर्वर 2012 से प्रारंभ) पोस्टग्रेएसक्यूएल या आईबीएम इनफॉर्मिक्स सीरियल
 * माई एसक्यूएल
 * एसक्यूलाइट  (यदि   का उपयोग किया जाता है, तो यह उन संख्याओं के पुन: उपयोग को रोक देगा जो पहले से ही उपयोग किए जा चुके हैं, लेकिन उपलब्ध हैं)
 * माइक्रोसॉफ्ट पहुंच में वाहन नंबर डेटा प्रकार
 * आईबीएम डाटाबेस और पोस्टग्रेएसक्यूएल  के रूप में।
 * टेराडाटा में आइडेंटिटी कॉलम (डेटा परिभाषा भाषा में प्रयुक्त)।
 * तालिका अनुक्रम जब अनुक्रम की गणना प्रक्रिया और फ़ील्ड के साथ अनुक्रम तालिका आईडी, अनुक्रमनाम, अनुक्रम वैल्यू और वृद्धि मूल्य द्वारा की जाती है।

स्थिरता
पंक्ति उपस्थित होने पर सरोगेट कुंजियाँ सामान्यतः नहीं बदलतीं इसके निम्नलिखित लाभ हैं:


 * अनुप्रयोग डेटाबेस में पंक्ति के लिए अपना संदर्भ नहीं खो सकते हैं (चूंकि पहचानकर्ता नहीं बदलता है)।
 * प्राथमिक या प्राकृतिक कुंजी डेटा को सदैव संशोधित किया जा सकता है, यहां तक ​​कि उन डेटाबेस के साथ भी जो संबंधित विदेशी कुंजी में कैस्केडिंग अपडेट का समर्थन नहीं करते हैं।

आवश्यकता परिवर्तन
विशेषताएँ जो विशिष्ट रूप से किसी इकाई की पहचान करती हैं, बदल सकती हैं, जो प्राकृतिक कुंजियों की उपयुक्तता को अमान्य कर सकती हैं। निम्नलिखित उदाहरण पर विचार करें:


 * कर्मचारी का नेटवर्क उपयोगकर्ता नाम प्राकृतिक कुंजी के रूप में चुना जाता है। किसी अन्य कंपनी के साथ विलय होने पर, नए कर्मचारियों को सम्मिलित किया जाना चाहिए। कुछ नए नेटवर्क उपयोगकर्ता नाम विरोध उत्पन्न करते हैं क्योंकि उनके उपयोगकर्ता नाम (जब कंपनियां अलग थीं) स्वतंत्र रूप से उत्पन्न हुए थे।

इन स्थितियों में, सामान्यतः प्राकृतिक कुंजी में नई विशेषता (उदाहरण के लिए, मूल कंपनी कॉलम) जोड़ी जानी चाहिए।

सरोगेट कुंजी के साथ, सरोगेट कुंजी को परिभाषित करने वाली केवल तालिका बदली जानी चाहिए। प्राकृतिक कुंजी के साथ, प्राकृतिक कुंजी का उपयोग करने वाली सभी तालिकाओं (और संभवतः अन्य, संबंधित सॉफ़्टवेयर) को बदलना होगा।

कुछ समस्या डोमेन स्पष्ट रूप से उपयुक्त प्राकृतिक कुंजी की पहचान नहीं करते हैं। सरोगेट कुंजियाँ ऐसी प्राकृतिक कुंजी चुनने से बचें जो गलत हो सकती है।

प्रदर्शन
सरोगेट कुंजियाँ कॉम्पैक्ट डेटा प्रकार होती हैं, जैसे कि चार-बाइट पूर्णांक। यह डेटाबेस को एकाधिक कॉलम की तुलना में एकल कुंजी कॉलम को तेज़ी से क्वेरी करने की अनुमति देता है। इसके अतिरिक्त, चाबियों का एक गैर-अनावश्यक वितरण परिणामी बी-ट्री इंडेक्स को पूरी तरह से संतुलित करता है। यौगिक कुंजी की तुलना में सरोगेट कुंजियाँ भी सम्मिलित होने के लिए कम खर्चीली हैं।

अनुकूलता
कई डेटाबेस अनुप्रयोग डेवलपमेंट प्रणाली, ड्राइवर और ऑब्जेक्ट-रिलेशनल मैपिंग प्रणाली, जैसे कि रूबी ऑन रेल्स या हाइबरनेट (जावा) का उपयोग करते समय, प्रत्येक तालिका के लिए प्राकृतिक कुंजी के अतिरिक्त पूर्णांक या गाइड सरोगेट कुंजी का उपयोग करना बहुत सरल होता है डेटाबेस-प्रणाली-एग्नोस्टिक ऑपरेशंस और ऑब्जेक्ट-टू-रो मैपिंग का समर्थन करें।

एकरूपता
जब प्रत्येक तालिका में एक समान सरोगेट कुंजी होती है, तो तालिका-स्वतंत्र विधि से कोड लिखकर कुछ कार्यों को सरलता से स्वचालित किया जा सकता है।

सत्यापन
प्रसिद्ध पैटर्न या संरचना का पालन करने वाले कुंजी-मूल्यों को डिज़ाइन करना संभव है जो स्वचालित रूप से सत्यापित हो सकते हैं। उदाहरण के लिए, कुछ तालिका के कुछ कॉलम में उपयोग की जाने वाली कुंजियों को उन कुंजियों से अलग दिखने के लिए डिज़ाइन किया जा सकता है जिन्हें किसी अन्य कॉलम या तालिका में उपयोग करने का प्रयोजन है, जिससे उन अनुप्रयोग त्रुटियों का पता लगाना सरल हो जाता है जिसमें कुंजियाँ गुम हो गए हैं। चूँकि, सरोगेट कुंजियों की इस विशेषता का उपयोग कभी भी अनुप्रयोगों के किसी भी तर्क को चलाने के लिए नहीं किया जाना चाहिए, क्योंकि यह डेटाबेस सामान्यीकरण के सिद्धांतों का उल्लंघन करेगा।

अलगाव
जेनरेट की गई सरोगेट कुंजियों के मूल्यों का पंक्ति में रखे गए डेटा के वास्तविक विश्व के अर्थ से कोई संबंध नहीं है। सरोगेट कुंजी का उपयोग करके किसी अन्य तालिका के लिए विदेशी कुंजी संदर्भ रखने वाली पंक्ति का निरीक्षण करते समय, सरोगेट कुंजी की पंक्ति का अर्थ कुंजी से ही नहीं समझा जा सकता है। संबंधित डेटा आइटम देखने के लिए प्रत्येक विदेशी कुंजी को जोड़ा जाना चाहिए। यदि उचित डेटाबेस बाधाओं को सेट नहीं किया गया है, या विरासत प्रणाली से आयात किया गया डेटा जहां संदर्भित अखंडता नियोजित नहीं किया गया था, तो विदेशी-कुंजी मान होना संभव है जो प्राथमिक-कुंजी मान के अनुरूप नहीं है और इसलिए अमान्य है। (इस संबंध में, सीजे डेट सरोगेट चाबियों की अर्थहीनता को लाभ के रूप में मानते हैं)

ऐसी त्रुटियों को खोजने के लिए, किसी को क्वेरी करनी चाहिए जो बाहरी कुंजी के साथ तालिका और प्राथमिक कुंजी के साथ तालिका के बीच बाएं बाहरी जोड़ का उपयोग करती है, रिकॉर्ड को अलग करने के लिए आवश्यक किसी भी फ़ील्ड के अतिरिक्त दोनों प्रमुख फ़ील्ड दिखाती है; सभी अमान्य विदेशी-कुंजी मानों में प्राथमिक-कुंजी कॉलम न्यूल के रूप में होगा। इस तरह की जांच करने की आवश्यकता इतनी सामान्य है कि माइक्रोसॉफ्ट एक्सेस वास्तव में खोज बेजोड़ क्वेरी विज़ार्ड प्रदान करता है जो संवाद के माध्यम से उपयोगकर्ता को चलने के बाद उपयुक्त एसक्यूएल उत्पन्न करता है। (चूंकि, ऐसे प्रश्नों को मैन्युअल रूप से लिखना बहुत मुश्किल नहीं है।) बेजोड़ प्रश्नों का पता लगाएं, सामान्यतः लीगेसी डेटा इनहेरिट करते समय डेटा क्लींजिंग प्रक्रिया के भाग के रूप में नियोजित किया जाता है।

निर्यात और साझा किए जाने वाले डेटा के लिए सरोगेट कुंजियाँ अप्राकृतिक हैं। विशेष कठिनाई यह है कि दो अन्य समान स्कीमाओं (उदाहरण के लिए, परीक्षण स्कीमा और विकास स्कीमा) से तालिकाओं में ऐसे रिकॉर्ड हो सकते हैं जो व्यावसायिक दृष्टि से समतुल्य हों, लेकिन अलग-अलग कुंजियाँ हों। क्षणिक डेटा को छोड़कर, सरोगेट कुंजियों को निर्यात नहीं करके इसे कम किया जा सकता है (सबसे स्पष्ट रूप से, उन अनुप्रयोगों को निष्पादित करने में जिनके पास डेटाबेस से "लाइव" कनेक्शन है)।

जब सरोगेट कुंजियाँ प्राकृतिक कुंजियों की जगह लेती हैं, तो डोमेन विशिष्ट संदर्भात्मक अखंडता से समझौता किया जाएगा। उदाहरण के लिए, ग्राहक मास्टर टेबल में, एक ही ग्राहक के पास अलग-अलग ग्राहक आईडी के अनुसार कई रिकॉर्ड हो सकते हैं, तथापि प्राकृतिक कुंजी (ग्राहक का नाम, जन्म तिथि और ई-मेल पते का संयोजन) अद्वितीय हो। समझौता को रोकने के लिए, तालिका की प्राकृतिक कुंजी को प्रतिस्थापित नहीं किया जाना चाहिए: इसे अनूठी बाधा के रूप में संरक्षित किया जाना चाहिए, जिसे प्राकृतिक-कुंजी क्षेत्रों के संयोजन पर अद्वितीय सूचकांक के रूप में प्रयुक्त किया गया है।

क्वेरी अनुकूलन
संबंधपरक डेटाबेस मानते हैं कि तालिका की प्राथमिक कुंजी पर अद्वितीय सूचकांक (डेटाबेस) प्रयुक्त होता है। अद्वितीय सूचकांक दो उद्देश्यों को पूरा करता है:

(i) इकाई अखंडता को प्रयुक्त करने के लिए, क्योंकि प्राथमिक कुंजी डेटा पंक्तियों में अद्वितीय होना चाहिए और (ii) पूछताछ के समय पंक्तियों की त्वरित खोज करना। चूँकि सरोगेट कुंजियाँ किसी तालिका की पहचान करने वाली विशेषताओं को प्रतिस्थापित करती हैं - प्राकृतिक कुंजी - और चूंकि पहचान करने वाली विशेषताओं को क्वेरी किए जाने की संभावना है, इसलिए संभावित प्रश्नों को पूरा करते समय क्वेरी ऑप्टिमाइज़र को पूर्ण तालिका स्कैन करने के लिए विवश किया जाता है। पूर्ण तालिका स्कैन का उपाय पहचान करने वाली विशेषताओं, या उनके सेट पर अनुक्रमणिका प्रयुक्त करना है। जहां इस तरह के सेट स्वयं प्रत्याशी कुंजी हैं, इंडेक्स अद्वितीय इंडेक्स हो सकता है।

चूँकि, ये अतिरिक्त अनुक्रमणिकाएँ डिस्क स्थान लेंगी और आवेषण और विलोपन को धीमा कर देंगी।

सामान्यीकरण
सरोगेट कुंजियों के परिणामस्वरूप किसी भी प्राकृतिक कुंजी में डुप्लिकेट मान हो सकते हैं। दोहराव को रोकने के लिए, एसक्यूएल के  कथन या   कथन  का उपयोग करके तालिका को परिभाषित करते समय प्राकृतिक कुंजियों की भूमिका को अद्वितीय बाधाओं के रूप में संरक्षित करना चाहिए, यदि बाधाओं को बाद के विचार के रूप में जोड़ा जाता है।

व्यवसाय प्रक्रिया मॉडलिंग
क्योंकि सरोगेट कुंजियाँ अप्राकृतिक हैं, व्यावसायिक आवश्यकताओं को मॉडलिंग करते समय त्रुटियां दिखाई दे सकती हैं। व्यावसायिक आवश्यकताओं, प्राकृतिक कुंजी पर विश्वास करते हुए, फिर सरोगेट कुंजी में अनुवाद करने की आवश्यकता होती है। रणनीति तार्किक मॉडल (जिसमें सरोगेट कुंजियाँ दिखाई नहीं देती हैं) और उस मॉडल के भौतिक कार्यान्वयन के बीच स्पष्ट अंतर बनाना है, यह सुनिश्चित करने के लिए कि तार्किक मॉडल सही और यथोचित अच्छी तरह से सामान्यीकृत है, और यह सुनिश्चित करने के लिए कि भौतिक मॉडल तार्किक मॉडल का सही कार्यान्वयन है।

असावधानीपूर्ण प्रकटीकरण
यदि सरोगेट कुंजियाँ क्रमिक रूप से उत्पन्न की जाती हैं, तो स्वमित्विक जानकारी लीक हो सकती है। हाल ही में उत्पन्न अनुक्रमिक कुंजी से पहले उत्पन्न अनुक्रमिक कुंजी को घटाकर, उस समय अवधि के समय डाली गई पंक्तियों की संख्या सीख सकते हैं। यह उदाहरण के लिए, लेन-देन की संख्या या प्रति अवधि नए खातों को प्रकट कर सकता है। उदाहरण के लिए जर्मन टैंक समस्या देखें।

इस समस्या को दूर करने के कुछ उपाय हैं:


 * अनुक्रमिक संख्या को यादृच्छिक राशि से बढ़ाएं;
 * यूयूआईडी जैसी यादृच्छिक कुंजी उत्पन्न करें।

असावधानीपूर्ण धारणाएँ
क्रमिक रूप से उत्पन्न सरोगेट कुंजियाँ यह संकेत दे सकती हैं कि उच्च कुंजी मान वाली घटनाएँ कम मान वाली घटनाओं के बाद हुईं। यह आवश्यक रूप से सत्य नहीं है, क्योंकि ऐसे मान समय अनुक्रम की गारंटी नहीं देते हैं क्योंकि सम्मिलन विफल हो सकते हैं और अंतराल छोड़ सकते हैं जो बाद में भरे जा सकते हैं। यदि कालक्रम महत्वपूर्ण है तो तिथि और समय को अलग-अलग अंकित किया जाना चाहिए।

यह भी देखें

 * प्राकृतिक कुंजी
 * वस्तु पहचानकर्ता
 * निरंतर वस्तु पहचानकर्ता

स्रोत

 * एंगेल्स, आर.डब्ल्यू.: (1972), ए ट्यूटोरियल ऑन डाटा-बेस ऑर्गनाइजेशन, एनुअल रिव्यू इन ऑटोमैटिक प्रोग्रामिंग, वॉल्यूम.7, पार्ट 1, पेर्गमॉन प्रेस, ऑक्सफोर्ड, पीपी. 1-64।
 * बोरजे लैंगफोर्स | लैंगफोर्स, बी (1968)। एलीमेंट्री फाइल्स एंड एलीमेंट्री फाइल रिकॉर्ड्स, प्रोसीडिंग्स ऑफ फाइल 68, फाइल ऑर्गनाइजेशन पर एक IFIP/IAG इंटरनेशनल सेमिनार, एम्स्टर्डम, नवंबर, पीपी। 89-96।
 * बोरजे लैंगफोर्स | लैंगफोर्स, बी (1968)। एलीमेंट्री फाइल्स एंड एलीमेंट्री फाइल रिकॉर्ड्स, प्रोसीडिंग्स ऑफ फाइल 68, फाइल ऑर्गनाइजेशन पर एक IFIP/IAG इंटरनेशनल सेमिनार, एम्स्टर्डम, नवंबर, पीपी। 89-96।