व्युत्क्रम परिवर्तन नमूनाकरण

व्युत्क्रम रूपांतर सैंपलिंग जिसे व्युत्क्रम सैंपलिंग, व्युत्क्रम संभाव्यता अभिन्न रूपांतर, व्युत्क्रम रूपांतर विधि, निकोलाई स्मिरनोव रूपांतर, या स्वर्ण नियम के नाम से भी जाना जाता है; एक मूलभूत विधि है जो छद्म-यादृच्छिक संख्या सैंपलिंग के लिए काम में लाई जाती है, अर्थात किसी भी प्रायिकता वितरण से उसकी करगणना संचार फलन देते हुए किसी भी यादृच्छिक सैंपलिंग संख्याओं को उत्पन्न करने के लिए इसका प्रयोग किया जाता है।

व्युत्क्रम रूपांतर सैंपलिंग एक संख्या $$u$$ के 0 और 1 के बीच के संख्या सैंपलिंग (जिनकी व्याख्या प्रायिकता के रूप में की जाती हैं) का उपयोग करता है, और पुनः एक ऐसी सबसे छोटी संख्या $$x\in\mathbb R$$ देता है जिसके लिए $$F(x)\ge u$$ होता है, यहां $$F$$ एक यादृच्छिक चर के लिए संयोजी वितरण फलन है। उदाहरण के लिए, मान लीजिए कि $$F$$ माध्य शून्य और मानक प्रसरण एक मानक सामान्य वितरण है। नीचे दी गई तालिका समान वितरण से लिए गए प्रारूप तथा मानक सामान्य वितरण पर उनका प्रतिनिधित्व दर्शाती है।

हम यादृच्छिक रूप से वक्र के निम्न स्थान की अनुपातिता का चयन कर रहे हैं और उस क्षेत्र में संख्या लौटा रहे हैं, जिसके बाईं ओर बिलकुल इस अनुपातिता का स्थान होता है। वक्र के दूसरे सीमा में संख्या के चयन की प्रायिकता नहीं होगी क्योंकि उनमें बहुत कम क्षेत्र होता है। जिसमें किसी संख्या का चयन करने की आवश्यकता होगी वो अत्यधिक निकटता से शून्य या एक के पास अवस्थित होना चाहिए।

संगणनात्मक रूप से, इस पद्धति में वितरण के मात्रात्मक कार्य की गणना करना सम्मिलित है - दूसरे शब्दों में, वितरण के संचयी वितरण फलन (सीडीएफ) की गणना करना (जो 0 और 1 के बीच की संभावना के लिए क्षेत्र में एक संख्या को आरेखित करता है) और फिर उस फलन का व्युत्क्रम उत्पन्न करता है। इस पद्धति के अधिकांश नामों में व्युत्क्रम या व्युत्क्रम शब्द का स्रोत यही है। ध्यान दें कि असतत वितरण के लिए, सीडीएफ की गणना करना सामान्यतः बहुत कठिन नहीं है: हम बस वितरण के विभिन्न बिंदुओं के लिए व्यक्तिगत प्रायिकताओ को जोड़ते हैं। यद्यपि, सतत वितरण के लिए, हमें वितरण की प्रायिकता घनत्व फलन (पीडीएफ) को एकीकृत करने की आवश्यकता है, जो कि अधिकांश वितरणों (सामान्य वितरण सहित) के लिए विश्लेषणात्मक रूप से करना असंभव है। परिणामस्वरूप, यह विधि कई वितरणों के लिए संगणनात्मक रूप से अक्षम हो सकती है और अन्य विधियों को प्राथमिकता दी जाती है; यद्यपि, यह अस्वीकृति प्रतिसंचय पर आधारित अधिक सामान्य बनाने के लिए एक उपयोगी विधि है।

सामान्य वितरण के लिए, संबंधित विभाजक फलन के लिए एक विश्लेषणात्मक अभिव्यक्ति की कमी का तात्पर्य है कि अन्य विधियों जैसे बॉक्स-मुलर रूपांतर को संगणनीय रूप से प्राथमिकता दी जा सकती है। प्रायः ऐसा होता है कि, सरल वितरणों के लिए भी, व्युत्क्रम रूपांतर सैंपलिंग पद्धति में सुधार किया जा सकता है: उदाहरण के लिए, जिगगुराट विधिकलन और अस्वीकृति सैंपलिंग देखें। दूसरी ओर, मध्यम-क्रम बहुपदों का उपयोग करके सामान्य वितरण के विभाजक फलन को अत्यंत सटीक रूप से अनुमानित करना संभव है, और वास्तव में ऐसा करने की विधि इतनी तीव्र है कि व्युत्क्रम सैंपलिंग अब सामान्य वितरण से प्रतिचय लेने के सांख्यिकीय पैकेज के आर प्रोग्रामिंग भाषा में व्यतिक्रम विधि है।

औपचारिक कथन
किसी भी यादृच्छिक चर $$X\in\mathbb R$$ के लिए, यादृच्छिक चर $$F_X^{-1}(U)$$ का सामान्य नियम होता है जैसी कि $$X$$, यहां $$F_X^{-1}$$ $$X$$ की संयोजी प्रसरण फलन $$F_X$$ का सामान्यीकृत व्युत्क्रम है और $$U$$ $$[0,1]$$ पर समरूप है।

वास्तविकता विवरण के लिए, निर्दिष्ट प्रायिकता अंकित्र का विपरीत अनुरूप सांख्यिकीय ज्ञानकोश यह स्थापित करता है कि प्रायिकता वितरण के अनुरूप एक निर्दिष्ट प्रायिकता अंकित्र $$X$$ के लिए, जिसका संयोजी वितरण फलन $$F_X$$ है, यादृच्छिक चर $$U=F_X(X)$$ समरूप $$[0,1]$$ पर होता है।



अंतर्बोध
यदि $$U \sim \mathrm{Unif}[0,1]$$ है, तो हम $$CDF$$ $$F_X(x)$$ वाला $$X$$ उत्पन्न करना चाहते हैं। हम $$F_X(x)$$ को एक सतत, सख्तता से बढ़ने वाला फलन मानते हैं, जो अच्छी समझ प्रदान करता है।

हम देखना चाहते हैं कि क्या हम कुछ सख्तता से बढ़ने वाले रूपांतर $$T:[0,1]\mapsto \mathbb{R}$$ ढूंढ सकते हैं, जिसके लिए $$T(U)\overset{d}{=}X$$ हो। हमें यह ध्यान देना चाहिए कि $$F_X(x)=\Pr(X\leq x)=\Pr(T(U)\leq x) = \Pr(U\leq T^{-1}(x))=T^{-1}(x), \text{ for } x\in \mathbb{R},$$ यहां अंतिम चरण में उपयोग किया गया कि जब $$U$$ $$[0,1]$$ पर समरूप होता है, तो $$\Pr(U \leq y) = y$$ होता है।

हमने $$F_X$$ को $$T$$ का व्युत्क्रम फलन अथवा समतुल्य रूप से $$T(u)=F_X^{-1}(u), u\in [0,1]$$ प्राप्त किया है। इसलिए, हम $$X $$ से $$F_X^{-1}(U). $$ उत्पन्न कर सकते है।

विधि
व्युत्क्रम रूपांतर सैंपलिंग विधि द्वारा हल की जाने वाली समस्या इस प्रकार है:


 * मान लीजिए कि $$X$$ एक यादृच्छिक चर हो जिसका वितरण, संचयी वितरण फलन $$F_X$$ द्वारा वर्णित किया जा सकता है
 * हमें ऐसे $$X$$ के मानों का उत्पादन करना है जो इस वितरण के अनुरूप वितरित हों।

व्युत्क्रम रूपांतर सैंपलिंग विधि निम्नानुसार कार्य करती है:
 * 1) छद्म आयामी संख्या उत्पन्नक एक यादृच्छिक संख्या उत्पन्न करेंगा जो $$u$$ अंतराल में मानक समान वितरण से $$[0,1]$$, यानी $$U \sim \ to  Mathrm{Unif}[0,1].$$ संबंधित होगा।
 * 2) वांछित सीडीएफ का सामान्यीकृत व्युत्क्रम खोजें, अर्थात $$F_X^{-1}(u)$$।
 * 3) $$X'(u)=F_X^{-1}(u)$$ की गणना करें. गणना किए गए यादृच्छिक चर $$X'(U)$$ का वितरण $$F_X$$ है और इस प्रकार $$X$$ के समान नियम है।

अन्य शब्दों में कहा जाए, तो संयोजी वितरण फलन $$F_X$$ और एक समरूप संख्या $$U\in[0,1]$$ के दिए गए, यादृच्छिक चर $$X = F_X^{-1}(U)$$ की वितरण $$F_X$$ होती है।

यदि हम सतत परिप्रेक्ष्य की बात करें, तो व्युत्क्रम फलन को विभिन्नित अवकलित्र उपयोगी असाधारित संख्या ज्ञानकोशों के रूप में प्रदान करने के रूप में तत्वों के रूप में प्रदान किया जा सकता है जो अवकलनीय विशेष राशियों को संतुष्ट करते हैं। कुछ ऐसे अवकलनीय सांकेतिक समीकरण हैं जो अपने गैर-रैखिकता के बावजूद स्पष्ट घातांक श्रृंखला समाधान स्वीकार करते हैं।

उदाहरण

 * उदाहरण के लिए, मान लीजिए कि हमारे पास एक यादृच्छिक चर $$ U \sim \mathrm{Unif}(0,1)$$ और एक संचयी वितरण फलन है

\begin{align} F(x)=1-\exp(-\sqrt{x}) \end{align} $$
 * व्युत्क्रम करने के लिए हमें $$F(F^{-1}(u))=u$$ को हल करना होगा।

\begin{align} F(F^{-1}(u))&=u \\ 1-\exp\left(-\sqrt{F^{-1}(u)}\right) &= u \\ F^{-1}(u) &= (-\log(1-u))^2 \\ &= (\log(1-u))^2 \end{align} $$
 * यहां से हम चरण एक, दो और तीन को निष्पादित करेंगे।


 * एक अन्य उदाहरण के रूप में, हम x ≥ 0 (और अन्यथा 0) के लिए $$F_X(x)=1-e^{-\lambda x}$$ के साथ घातीय वितरण का उपयोग करते हैं। y=F(x) को हल करके हम व्युत्क्रम फलन प्राप्त करते हैं
 * $$x = F^{-1}(y) = -\frac{1}{\lambda}\ln(1-y).$$
 * इसका तात्पर्य यह है कि यदि हम $$ U \sim \mathrm{Unif}(0,1)$$ से कुछ $$y_0$$ निकालते हैं और $$x_0 = F_X^{-1}(y_0) = -\frac{1}{\lambda}\ln(1-y_0),$$ की गणना करते हैं तों यह इस $$x_0$$ में घातीय वितरण है।
 * यह विचार निम्नलिखित आरेख में दर्शाया गया है:


 * Inverse transformation method for exponential distribution.jpg
 * ध्यान दें कि यदि हम y के अतिरिक्त 1-y से प्रारंभ करते हैं तो वितरण परिवर्तित नहीं होता है। संगणनीय उद्देश्यों के लिए, इसलिए [0, 1] में यादृच्छिक संख्या y उत्पन्न करना और पुनः बस गणना करना पर्याप्त है
 * $$x = F^{-1}(y) = -\frac{1}{\lambda}\ln(y).$$

सटीकता का प्रमाण
यदि $$F$$ एक संयोजी वितरण फलन हो, और $$F^{-1}$$ उसका सामान्यीकृत व्युत्क्रम फलन हो (जिसमें निम्नतम का उपयोग किया जाता है क्योंकि सीसीएफ कमजोर रूप से क्रमशः एकचर और समरूप होते हैं), तो इसे हिन्दी में इसकी व्याख्या इस प्रकार की जा सकती है:

$$F$$ एक संयोजी वितरण फलन हो, और $$F^{-1}$$ उसका सामान्यीकृत व्युत्क्रम फलन होता है (जिसमें सीसीएफ तुलनात्मक रूप से मजबूत एकचर और Càdlàg होते हैं)।
 * $$F^{-1}(u) = \inf\;\{x \mid F(x)\geq u\} \qquad (0<u<1).$$

दावा: यदि $$U$$ एक समान वितरण (निरंतर) यादृच्छिक चर है तो $$F^{-1}(U)$$ का संयोजी वितरण $$F$$ होता है।

प्रमाण:



\begin{align} & \Pr(F^{-1}(U) \leq x) \\ & {} = \Pr(U \leq F(x)) \quad &(F\text{ is right-continuous, so }\{u:F^{-1}(u)\le x\}=\{u:u\le F(x)\}) \\ & {} = F(x)\quad &(\text{because }\Pr(U \leq u) = u,\text{ when U is uniform on}[0,1]) \\ \end{align} $$

छिन्न वितरण
व्युत्क्रम रूपांतर सैंपलिंग सरलता से छिन्न वितरण पर विस्तारित किया जा सकता है जो बिना अस्वीकृति सैंपलिंग की लागत के, अंतराल $$(a,b]$$ पर स्थित होते हैं। यहां वही विधिकलन अनुसरित किया जा सकता है, परंतु इसके स्थान पर कि 0 और 1 के बीच एक यादृच्छिक संख्या $$u$$ उत्पन्न करें, $$u$$ को $$F(a)$$ और $$F(b)$$ के बीच एक समरूप वितरण में उत्पन्न करें, और पुनः $$F^{-1}(u)$$ प्राप्त कर सके।

व्युत्क्रमों की संख्या में कमी
बड़ी संख्या में सैंपलिंग प्राप्त करने के लिए, वितरण में समान संख्या में व्युत्क्रमण करने की आवश्यकता होती है। एक ऐसी विधि जिससे हम व्युत्क्रमों की संख्या कम करके बड़ी संख्या में प्रतिचय प्राप्त कर सकते हैं, वह है स्टोकेस्टिक कोलोकेशन मोंटे कार्लो सैंपलर जो कि एक बहुपद का अवलोकन विस्तार, प्रणाली के भीतर होता है। इससे हम किसी भी संख्या के मोंटे कार्लो प्रतिचय उत्पन्न कर सकते हैं, और मूल वितरण की कुछ ही व्युत्क्रम के साथ, जिनमें एक चर के स्वतंत्र प्रतिचय के साथ व्युत्क्रम विश्लेषणीय जैसे कि मानक साधारित चर उपलब्ध होते हैं।

यह भी देखें

 * संभाव्यता अभिन्न रूपांतर
 * कोपुला (सांख्यिकी), संभाव्यता अभिन्न रूपांतर के माध्यम से परिभाषित।
 * व्युत्क्रम सीडीएफ के स्पष्ट निर्माण के लिए विभाजक फलन।
 * असतत घटकों के साथ वितरण के लिए सटीक गणितीय परिभाषा के लिए संचयी वितरण फलन # व्युत्क्रम।