डाटा संलयन

डेटा फ़्यूज़न (डाटा संलयन) किसी भी व्यक्तिगत डेटा स्रोत द्वारा प्रदान की गई जानकारी की तुलना में अधिक सुसंगत, सटीक और उपयोगी जानकारी उत्पन्न करने के लिए कई डेटा स्रोतों को एकीकृत करने की प्रक्रिया है।

डेटा फ़्यूज़न प्रक्रियाओं को प्रायः निम्न, मध्यवर्ती या उच्च के रूप में वर्गीकृत किया जाता है, यह उस प्रसंस्करण चरण पर निर्भर करता है जिस पर फ़्यूज़न होता है। निम्न-स्तरीय डेटा फ़्यूज़न नए रॉ डेटा (असंसाधित्र आँकड़ा) का उत्पादन करने के लिए रॉ डेटा के कई स्रोतों को जोड़ता है। उम्मीद यह है कि फ़्यूज्ड डेटा मूल इनपुट की तुलना में अधिक एन्ट्रॉपी (सूचना सिद्धांत) और सिंथेटिक डेटा है।

उदाहरण के लिए, सेंसर फ़्यूज़न (संवेदक संलयन) को (मल्टी-सेंसर) डेटा फ़्यूज़न के रूप में भी जाना जाता है और यह सूचना फ़्यूज़न का एक उपवर्ग है।

डेटा फ़्यूज़न की अवधारणा मनुष्यों और जानवरों की जीवित रहने की क्षमता में सुधार करने के लिए कई इंद्रियों से जानकारी को सम्मिलित करने की विकसित क्षमता में उत्पन्न हुई है। उदाहरण के लिए, दृष्टि, स्पर्श, गंध और स्वाद का संयोजन यह संकेत दे सकता है कि कोई पदार्थ खाने योग्य है या नहीं है।

जेडीएल/डीएफआईजी मॉडल
1980 के दशक के मध्य में, प्रयोगशालाओं के संयुक्त निदेशकों ने डेटा फ़्यूज़न सबपैनल का गठन किया हुआ था (जिसे बाद में डेटा फ़्यूज़न समूह के रूप में जाना जाने लगा)। वर्ल्ड वाइड वेब के आगमन के साथ, डेटा फ़्यूज़न में डेटा, सेंसर और सूचना फ़्यूज़न सम्मिलित हो गए थे। जेडीएल/डीएफआईजी ने डेटा फ़्यूज़न का एक मॉडल पेश किया जिसने विभिन्न प्रक्रियाओं को विभाजित किया था। वर्तमान में, डेटा फ़्यूज़न सूचना समूह (डीएफआईजी) मॉडल के छह स्तर हैं:
 * स्तर 0: स्रोत प्रीप्रोसेसिंग (या डेटा मूल्यांकन)
 * स्तर 1: वस्तु मूल्यांकन
 * स्तर 2: स्थिति का आकलन
 * स्तर 3: प्रभाव आकलन (या खतरा शोधन)
 * स्तर 4: प्रक्रिया परिशोधन (या संसाधन प्रबंधन)
 * स्तर 5: उपयोगकर्ता परिशोधन (या संज्ञानात्मक शोधन)
 * स्तर 6: मिशन शोधन (या मिशन प्रबंधन)

यद्यपि जेडीएल मॉडल (स्तर 1-4) आज भी उपयोग में है, लेकिन इसके निहितार्थ के लिए प्रायः इसकी आलोचना की जाती है कि स्तर आवश्यक रूप से क्रम में होते हैं और ह्यूमन-इन-द-लूप की क्षमता के पर्याप्त प्रतिनिधित्व की कमी के लिए भी।. डीएफआईजी मॉडल (स्तर 0-5) ने स्थिति जागरूकता, उपयोगकर्ता परिशोधन और मिशन प्रबंधन के निहितार्थों का पता लगाया। इन कमियों के अतिरिक्त, जेडीएल/डीएफआईजी मॉडल डेटा फ़्यूज़न प्रक्रिया को देखने, चर्चा और सामान्य समझ को सुविधाजनक बनाने के लिए उपयोगी हैं। और सिस्टम-स्तरीय सूचना संलयन डिज़ाइन के लिए महत्वपूर्ण है।

भू-स्थानिक अनुप्रयोग
भू-स्थानिक (जीआईएस) डोमेन में, डेटा फ़्यूज़न प्रायः डेटा एकीकरण का पर्याय बन जाता है। इन अनुप्रयोगों में, प्रायः विविध डेटा सेटों को एक एकीकृत (फ्यूज्ड) डेटा सेट में संयोजित करने की आवश्यकता होती है जिसमें इनपुट डेटा सेट से सभी डेटा बिंदु और समय चरण सम्मिलित होते हैं। फ़्यूज़्ड डेटा सेट एक साधारण संयुक्त सुपरसेट से भिन्न होता है जिसमें फ़्यूज़्ड डेटा सेट के बिंदुओं में विशेषताएँ और मेटाडेटा होते हैं जो मूल डेटा सेट में इन बिंदुओं के लिए सम्मिलित नहीं किए गए होंगे।

इस प्रक्रिया का एक सरलीकृत उदाहरण नीचे दिखाया गया है जहां डेटा सेट α को डेटा सेट β के साथ जोड़कर फ़्यूज्ड डेटा सेट δ बनाया जाता है। सेट α में डेटा बिंदुओं में स्थानिक निर्देशांक X और Y और विशेषताएँ A1 और A2 हैं। सेट β में डेटा बिंदुओं में स्थानिक निर्देशांक X और Y और विशेषताएँ B1 और B2 हैं। फ़्यूज़्ड डेटा सेट में सभी बिंदु और विशेषताएँ सम्मिलित हैं। एक साधारण परिस्थिति में जहां सभी विशेषताएँ संपूर्ण विश्लेषण डोमेन में एक समान हैं, विशेषताओं को आसानी से निर्दिष्ट किया जा सकता है: एम?, एन?, क्यू?, आर? एम, एन, क्यू, आर के लिए। एक वास्तविक एप्लिकेशन में, विशेषताएँ एक समान नहीं होती हैं और फ़्यूज्ड सेट में डेटा बिंदुओं पर विशेषताओं को ठीक से निर्दिष्ट करने के लिए सामान्यतः कुछ प्रकार के प्रक्षेप की आवश्यकता होती है।

एक अधिक जटिल अनुप्रयोग में, समुद्री पशु शोधकर्ता पशु ट्रैकिंग डेटा को बैथिमीट्रिक, मौसम विज्ञान, समुद्री सतह तापमान (एसएसटी) और पशु आवास डेटा के साथ संयोजित करने के लिए डेटा फ़्यूज़न का उपयोग करते हैं ताकि मौसम जैसी बाहरी ताकतों की प्रतिक्रिया में निवास स्थान के उपयोग और पशु व्यवहार या पानी का तापमान की जांच और समझ की जा सके, इनमें से प्रत्येक डेटा सेट एक अलग स्थानिक ग्रिड और नमूना दर प्रदर्शित करता है, इसलिए एक साधारण संयोजन संभवतः गलत धारणाएं उत्पन्न करेगा और विश्लेषण के परिणामों को खराब कर देगा। लेकिन डेटा फ़्यूज़न के उपयोग के माध्यम से, सभी डेटा और विशेषताओं को एक ही दृश्य में एक साथ लाया जाता है जिसमें पर्यावरण की अधिक संपूर्ण तस्वीर बनाई जाती है। यह वैज्ञानिकों को प्रमुख स्थानों और समय की पहचान करने और पर्यावरण और जानवरों के व्यवहार के बीच बातचीत में नई अंतर्दृष्टि बनाने में सक्षम बनाता है।

दाईं ओर के चित्र में, तस्मानिया के तट पर रॉक लॉबस्टर का अध्ययन किया गया है। तस्मानिया विश्वविद्यालय के ह्यू पेडर्सन ने दक्षिणी रॉक लॉबस्टर ट्रैकिंग डेटा (दिन और रात के लिए क्रमशः पीले और काले रंग में कोडित) को बाथमीट्री और निवास स्थान डेटा के साथ फ्यूज करने के लिए डेटा फ़्यूज़न सॉफ़्टवेयर का उपयोग किया ताकि रॉक लॉबस्टर व्यवहार की एक अनूठी 4D तस्वीर बनाई जा सके।

डेटा एकीकरण
भू-स्थानिक डोमेन के बाहर के अनुप्रयोगों में, डेटा एकीकरण और डेटा फ़्यूज़न शब्दों के उपयोग में अंतर लागू होता है। उदाहरण के लिए, बिजनेस इंटेलिजेंस जैसे क्षेत्रों में, डेटा एकीकरण का उपयोग डेटा के संयोजन का वर्णन करने के लिए किया जाता है, जबकि डेटा फ़्यूज़न एकीकरण है जिसके बाद कमी या प्रतिस्थापन होता है। डेटा एकीकरण को सेट संयोजन के रूप में देखा जा सकता है जिसमें बड़े सेट को बरकरार रखा जाता है, जबकि फ़्यूज़न बेहतर आत्मविश्वास के साथ सेट न्यूनीकरण तकनीक है।

आवेदन क्षेत्र

 * जैव सूचना विज्ञान
 * बॉयोमेट्रिक्स
 * व्यापारिक सूचना
 * व्यावसायिक प्रदर्शन प्रबंधन
 * रसायन सूचना विज्ञान
 * मात्रात्मक संरचना-गतिविधि संबंध
 * खोज विज्ञान
 * भौगोलिक सूचना प्रणाली
 * गुप्तचर सेवा
 * बुद्धिमान परिवहन प्रणाली
 * लायल्टी कार्ड
 * समुद्र विज्ञान
 * मिट्टी का मानचित्रण
 * वायरलेस सेंसर नेटवर्क

विभिन्न ट्रैफ़िक सेंसिंग तौर-तरीकों से
ट्रैफ़िक स्थिति को सटीक रूप से निर्धारित करने के लिए विभिन्न सेंसिंग तकनीकों के डेटा को बुद्धिमान तरीकों से जोड़ा जा सकता है। एक डेटा फ़्यूज़न आधारित दृष्टिकोण जो सड़क किनारे एकत्रित ध्वनिक, छवि और सेंसर डेटा का उपयोग करता है, विभिन्न व्यक्तिगत तरीकों के लाभों को संयोजित करने के लिए दिखाया गया है।

निर्णय संलयन
कई परिस्थितियों में, भौगोलिक रूप से फैले हुए सेंसर गंभीर रूप से ऊर्जा- और बैंडविड्थ-सीमित होते हैं। इसलिए, एक निश्चित घटना से संबंधित रॉ डेटा को प्रायः प्रत्येक सेंसर से कुछ बिट्स में संक्षेपित किया जाता है। किसी द्विआधारी घटना का अनुमान लगाते समय (अर्थात्, $$\mathcal{H}_0$$ या $$\mathcal{H}_1$$ ), चरम परिस्थिति में केवल बाइनरी निर्णय सेंसर से निर्णय फ़्यूज़न सेंटर (डीएफसी) में भेजे जाते हैं और बेहतर वर्गीकरण प्रदर्शन प्राप्त करने के लिए संयुक्त होते हैं।

संवर्धित प्रासंगिक जागरूकता के लिए
मोशन सेंसर, पर्यावरण सेंसर, पोजिशन सेंसर सहित कई अंतर्निहित सेंसर के साथ, एक आधुनिक मोबाइल डिवाइस सामान्यतः मोबाइल एप्लिकेशन को कई संवेदी डेटा तक पहुंच प्रदान करता है जिसका लाभ प्रासंगिक जागरूकता को बढ़ाने के लिए किया जा सकता है। सिग्नल प्रोसेसिंग और डेटा फ़्यूज़न तकनीकों जैसे फ़ीचर जेनरेशन, व्यवहार्यता अध्ययन और प्रमुख घटक विश्लेषण (पीसीए) का उपयोग करने से ऐसे संवेदी डेटा से डिवाइस की गति और प्रासंगिक प्रासंगिक स्थिति को वर्गीकृत करने की घनात्मक दर में काफी सुधार होगा। कई संदर्भ-संवर्धित सूचना तकनीकें स्निडारो, एट अल द्वारा प्रदान की जाती हैं।

बायेसियन ऑटो-प्रतिगामी गाऊसी प्रक्रियाएं
गॉसियन प्रक्रियाएँ एक लोकप्रिय मशीन लर्निंग मॉडल हैं। यदि एक ऑटोरेग्रेसिव मॉडल डेटा के बीच ऑटो-रिग्रेसिव संबंध माना जाता है, और प्रत्येक डेटा स्रोत को गॉसियन प्रक्रिया माना जाता है, तो यह एक गैर-रेखीय बायेसियन प्रतिगमन  समस्या का गठन करता है।

मल्टीफिडेलिटी सिमुलेशन बायेसियन ऑटो-रिग्रेसिव गॉसियन प्रक्रियाएं भी देखेंl

यह भी देखें

 * डेटा सम्मिलन
 * डेटा मुंगइंग
 * छवि संलयन
 * सूचना एकीकरण
 * एकीकृत स्तर
 * मेटा-विश्लेषण
 * सेंसर फ़्यूज़न

स्रोत

 * सामान्य सन्दर्भ

बाहरी संबंध

 * Discriminant Correlation Analysis (DCA)
 * Sensordata Fusion, An Introduction
 * International Society of Information Fusion
 * Sensor Fusion for Nanopositioning