पुनरावर्ती बायेसियन अनुमान

संभाव्यता सिद्धांत, सांख्यिकी और यंत्र अधिगम  में, पुनरावर्ती बायेसियन अनुमान, जिसे बेयस फ़िल्टर के रूप में भी जाना जाता है, घनत्व अनुमान के लिए एक सामान्य संभाव्य दृष्टिकोण है, एक अज्ञात संभाव्यता घनत्व फ़ंक्शन (संभावना घनत्व फ़ंक्शन) आने वाले माप और गणितीय प्रक्रिया मॉडल का उपयोग करके समय के साथ पुनरावर्ती होता है।. यह प्रक्रिया काफी हद तक गणितीय अवधारणाओं और मॉडलों पर निर्भर करती है जिन्हें बायेसियन सांख्यिकी के रूप में ज्ञात पूर्व और पश्च संभावनाओं के अध्ययन के भीतर सिद्धांतित किया जाता है।

रोबोटिक्स में
बेयस फ़िल्टर एक एल्गोरिदम है जिसका उपयोग कंप्यूटर विज्ञान में एक रोबोट को उसकी स्थिति और अभिविन्यास का अनुमान लगाने की अनुमति देने के लिए कई मान्यताओं की संभावनाओं की गणना करने के लिए किया जाता है। अनिवार्य रूप से, बेयस फ़िल्टर रोबोटों को सबसे हाल ही में प्राप्त सेंसर डेटा के आधार पर, एक समन्वय प्रणाली के भीतर अपनी सबसे संभावित स्थिति को लगातार अपडेट करने की अनुमति देते हैं। यह एक पुनरावर्ती एल्गोरिदम है. इसमें दो भाग शामिल हैं: भविष्यवाणी और नवाचार। यदि चर सामान्य वितरण हैं और संक्रमण रैखिक हैं, तो बेयस फ़िल्टर कलमन फ़िल्टर के बराबर हो जाता है।

एक सरल उदाहरण में, ग्रिड में घूम रहे एक रोबोट में कई अलग-अलग सेंसर हो सकते हैं जो उसे अपने परिवेश के बारे में जानकारी प्रदान करते हैं। रोबोट निश्चितता के साथ शुरू हो सकता है कि वह स्थिति (0,0) पर है। हालाँकि, जैसे-जैसे यह अपनी मूल स्थिति से दूर और दूर जाता है, रोबोट को अपनी स्थिति के बारे में निश्चितता लगातार कम होती जाती है; बेयस फ़िल्टर का उपयोग करके, रोबोट की वर्तमान स्थिति के बारे में उसके विश्वास को एक संभावना सौंपी जा सकती है, और उस संभावना को अतिरिक्त सेंसर जानकारी से लगातार अद्यतन किया जा सकता है।

मॉडल
माप $$z$$ एक छिपे छिपा हुआ मार्कोव मॉडल (एचएमएम) के प्रकट चर हैं, जिसका अर्थ है वास्तविक स्थिति $$x$$ इसे एक न देखी गई मार्कोव प्रक्रिया माना जाता है। निम्नलिखित चित्र HMM का बायेसियन नेटवर्क प्रस्तुत करता है।

मार्कोव धारणा के कारण, तत्काल पिछली स्थिति को देखते हुए वर्तमान वास्तविक स्थिति की संभावना अन्य पिछली स्थितियों से सशर्त रूप से स्वतंत्र है।


 * $$p(\textbf{x}_k|\textbf{x}_{k-1},\textbf{x}_{k-2},\dots,\textbf{x}_0) = p(\textbf{x}_k|\textbf{x}_{k-1} )$$

इसी प्रकार, k-वें टाइमस्टेप पर माप केवल वर्तमान स्थिति पर निर्भर है, इसलिए वर्तमान स्थिति को देखते हुए यह सशर्त रूप से अन्य सभी राज्यों से स्वतंत्र है।


 * $$p(\textbf{z}_k|\textbf{x}_k,\textbf{x}_{k-1},\dots,\textbf{x}_{0}) = p(\textbf{z}_k|\textbf{x}_{k} )$$

इन मान्यताओं का उपयोग करके एचएमएम के सभी राज्यों पर संभाव्यता वितरण को सरलता से लिखा जा सकता है:


 * $$p(\textbf{x}_0,\dots,\textbf{x}_k,\textbf{z}_1,\dots,\textbf{z}_k) = p(\textbf{x}_0)\prod_{i=1}^k p(\textbf{z}_i|\textbf{x}_i)p(\textbf{x}_i|\textbf{x}_{i-1}).$$

हालाँकि, जब स्थिति x का अनुमान लगाने के लिए कलमन फ़िल्टर का उपयोग किया जाता है, तो ब्याज की संभाव्यता वितरण वर्तमान टाइमस्टेप तक माप पर वातानुकूलित वर्तमान स्थितियों से जुड़ी होती है। (यह पिछले राज्यों को हाशिये पर रखकर और माप सेट की संभावना से विभाजित करके प्राप्त किया जाता है।)

इससे कलमन फ़िल्टर के भविष्यवाणी और अद्यतन चरण संभाव्य रूप से लिखे जाते हैं। अनुमानित स्थिति से जुड़ा संभाव्यता वितरण (k - 1)-वें टाइमस्टेप से k-वें और द में संक्रमण से जुड़े संभाव्यता वितरण के उत्पादों का योग (अभिन्न) है। पिछली स्थिति से संबद्ध संभाव्यता वितरण, सभी संभव से अधिक $$x_{k-1}$$.


 * $$ p(\textbf{x}_k|\textbf{z}_{1:k-1}) = \int p(\textbf{x}_k | \textbf{x}_{k-1}) p(\textbf{x}_{k-1} | \textbf{z}_{1:k-1} ) \, d\textbf{x}_{k-1} $$

अद्यतन की संभाव्यता वितरण माप संभावना और अनुमानित स्थिति के उत्पाद के समानुपाती होती है।
 * $$ p(\textbf{x}_k|\textbf{z}_{1:k}) = \frac{p(\textbf{z}_k|\textbf{x}_k) p(\textbf{x}_k|\textbf{z}_{1:k-1})}{p(\textbf{z}_k|\textbf{z}_{1:k-1})} \propto p(\textbf{z}_k|\textbf{x}_k) p(\textbf{x}_k|\textbf{z}_{1:k-1})

$$ भाजक
 * $$p(\textbf{z}_k|\textbf{z}_{1:k-1}) = \int p(\textbf{z}_k|\textbf{x}_k) p(\textbf{x}_k|\textbf{z}_{1:k-1}) d\textbf{x}_{k}$$

के सापेक्ष स्थिर है $$x$$, इसलिए हम इसे हमेशा गुणांक के स्थान पर प्रतिस्थापित कर सकते हैं $$\alpha$$, जिसे आमतौर पर व्यवहार में नजरअंदाज किया जा सकता है। अंश की गणना की जा सकती है और फिर इसे सामान्यीकृत किया जा सकता है, क्योंकि इसका अभिन्न अंग एकता होना चाहिए।

अनुप्रयोग

 * कलमन फ़िल्टर, बहुभिन्नरूपी सामान्य वितरण के लिए एक पुनरावर्ती बायेसियन फ़िल्टर
 * कण फ़िल्टर, एक अनुक्रमिक मोंटे कार्लो (एसएमसी) आधारित तकनीक, जो असतत बिंदुओं के एक सेट का उपयोग करके संभाव्यता घनत्व फ़ंक्शन को मॉडल करती है
 * ग्रिड-आधारित अनुमानक, जो पीडीएफ को एक नियतात्मक असतत ग्रिड में उप-विभाजित करते हैं

अनुक्रमिक बायेसियन फ़िल्टरिंग
अनुक्रमिक बायेसियन फ़िल्टरिंग उस मामले के लिए बायेसियन अनुमान का विस्तार है जब मनाया गया मान समय में बदलता है। यह समय के साथ विकसित होने वाले प्रेक्षित चर के वास्तविक मूल्य का अनुमान लगाने की एक विधि है।

विधि का नाम है:
 * फ़िल्टरिंग: अतीत और वर्तमान अवलोकनों को देखते हुए वर्तमान मूल्य का अनुमान लगाते समय,
 * सुचारण समस्या: अतीत और वर्तमान टिप्पणियों को देखते हुए पिछले मूल्यों का अनुमान लगाते समय, और
 * भविष्यवाणी: अतीत और वर्तमान टिप्पणियों को देखते हुए संभावित भविष्य के मूल्य का अनुमान लगाते समय।

अनुक्रमिक बायेसियन फ़िल्टरिंग की धारणा का नियंत्रण सिद्धांत और रोबोटिक्स में बड़े पैमाने पर उपयोग किया जाता है।