व्युत्क्रम परिवर्तन नमूनाकरण

व्युत्क्रम परिवर्तन नमूनाकरण (व्युत्क्रम नमूने के रूप में भी जाना जाता है, व्युत्क्रम संभाव्यता अभिन्न परिवर्तन, व्युत्क्रम परिवर्तन विधि, निकोलाई स्मिरनोव (गणितज्ञ) परिवर्तन, या सुनहरा नियम ) छद्म-यादृच्छिक संख्या नमूने के लिए एक बुनियादी विधि है, यानी, किसी भी संभाव्यता वितरण से यादृच्छिक रूप से नमूना संख्या उत्पन्न करने के लिए, इसके संचयी वितरण फ़ंक्शन को देखते हुए।

व्युत्क्रम परिवर्तन नमूनाकरण किसी संख्या का निरंतर समान वितरण लेता है $$u$$ 0 और 1 के बीच, एक संभाव्यता के रूप में व्याख्या की जाती है, और फिर सबसे छोटी संख्या लौटाता है $$x\in\mathbb R$$ ऐसा है कि $$F(x)\ge u$$ संचयी वितरण फ़ंक्शन के लिए $$F$$ एक यादृच्छिक चर का. उदाहरण के लिए, इसकी कल्पना करें $$F$$ माध्य शून्य और मानक विचलन एक के साथ मानक सामान्य वितरण है। नीचे दी गई तालिका समान वितरण से लिए गए नमूने और मानक सामान्य वितरण पर उनका प्रतिनिधित्व दिखाती है।

हम बेतरतीब ढंग से वक्र के नीचे क्षेत्र का अनुपात चुन रहे हैं और डोमेन में संख्या लौटा रहे हैं ताकि क्षेत्र का यह अनुपात उस संख्या के बाईं ओर हो। सहज रूप से, हमें पुच्छ के अंतिम छोर में एक संख्या चुनने की संभावना नहीं है क्योंकि उनमें बहुत कम क्षेत्र है जिसके लिए शून्य या एक के बहुत करीब की संख्या चुनने की आवश्यकता होगी।

कम्प्यूटेशनल रूप से, इस पद्धति में वितरण के मात्रात्मक कार्य की गणना करना शामिल है - दूसरे शब्दों में, वितरण के संचयी वितरण फ़ंक्शन (सीडीएफ) की गणना करना (जो 0 और 1 के बीच की संभावना के लिए डोमेन में एक संख्या को मैप करता है) और फिर उस फ़ंक्शन को उल्टा करना। इस पद्धति के अधिकांश नामों में व्युत्क्रम या व्युत्क्रम शब्द का स्रोत यही है। ध्यान दें कि असतत वितरण के लिए, सीडीएफ की गणना करना आम तौर पर बहुत मुश्किल नहीं है: हम बस वितरण के विभिन्न बिंदुओं के लिए व्यक्तिगत संभावनाओं को जोड़ते हैं। हालाँकि, निरंतर वितरण के लिए, हमें वितरण की संभाव्यता घनत्व फ़ंक्शन (पीडीएफ) को एकीकृत करने की आवश्यकता है, जो कि अधिकांश वितरणों (सामान्य वितरण सहित) के लिए विश्लेषणात्मक रूप से करना असंभव है। परिणामस्वरूप, यह विधि कई वितरणों के लिए कम्प्यूटेशनल रूप से अक्षम हो सकती है और अन्य विधियों को प्राथमिकता दी जाती है; हालाँकि, यह अस्वीकृति नमूने पर आधारित अधिक आम तौर पर लागू नमूने बनाने के लिए एक उपयोगी तरीका है।

सामान्य वितरण के लिए, संबंधित क्वांटाइल फ़ंक्शन के लिए एक विश्लेषणात्मक अभिव्यक्ति की कमी का मतलब है कि अन्य तरीकों (जैसे बॉक्स-मुलर ट्रांसफॉर्म) को कम्प्यूटेशनल रूप से प्राथमिकता दी जा सकती है। अक्सर ऐसा होता है कि, सरल वितरणों के लिए भी, व्युत्क्रम परिवर्तन नमूनाकरण पद्धति में सुधार किया जा सकता है: उदाहरण के लिए, जिगगुराट एल्गोरिदम और अस्वीकृति नमूनाकरण देखें। दूसरी ओर, मध्यम-डिग्री बहुपदों का उपयोग करके सामान्य वितरण के क्वांटाइल फ़ंक्शन को बेहद सटीक रूप से अनुमानित करना संभव है, और वास्तव में ऐसा करने की विधि इतनी तेज़ है कि व्युत्क्रम नमूनाकरण अब सामान्य वितरण से नमूना लेने के लिए डिफ़ॉल्ट विधि है सांख्यिकीय पैकेज आर (प्रोग्रामिंग भाषा) में।

औपचारिक कथन
किसी भी यादृच्छिक चर के लिए $$X\in\mathbb R$$, यादृच्छिक चर $$F_X^{-1}(U)$$ एक ही कानून है जैसा $$X$$, कहाँ $$F_X^{-1}$$ संचयी वितरण फ़ंक्शन का संचयी वितरण फ़ंक्शन # व्युत्क्रम_वितरण_फ़ंक्शन_(क्वांटाइल_फ़ंक्शन) है $$F_X$$ का $$X$$ और $$U$$ पर एक समान है $$[0,1]$$. रैंडम_वेरिएबल#कंटीन्युअस_रैंडम_वेरिएबल के लिए, व्युत्क्रम संभाव्यता इंटीग्रल ट्रांसफॉर्म वास्तव में संभाव्यता अभिन्न परिवर्तन  का व्युत्क्रम है, जो बताता है कि एक सतत यादृच्छिक चर के लिए $$X$$ संचयी वितरण फ़ंक्शन के साथ $$F_X$$, यादृच्छिक चर $$U=F_X(X)$$ पर एकसमान वितरण (निरंतर) है $$[0,1]$$.



अंतर्ज्ञान
से $$U \sim \mathrm{Unif}[0,1]$$, हम उत्पन्न करना चाहते हैं $$X$$ संचयी वितरण फ़ंक्शन के साथ $$F_X(x).$$ हम यह मानते है कि $$F_X(x)$$ एक सतत, सख्ती से बढ़ता कार्य होना, जो अच्छा अंतर्ज्ञान प्रदान करता है।

हम यह देखना चाहते हैं कि क्या हम कुछ सख्ती से नीरस परिवर्तन पा सकते हैं $$T:[0,1]\mapsto \mathbb{R}$$, ऐसा है कि $$T(U)\overset{d}{=}X$$. हमारे पास होगा

$$F_X(x)=\Pr(X\leq x)=\Pr(T(U)\leq x) = \Pr(U\leq T^{-1}(x))=T^{-1}(x), \text{ for } x\in \mathbb{R},$$ जहां अंतिम चरण में उसका उपयोग किया गया $$\Pr(U \leq y) = y$$ कब $$U$$ पर एक समान है $$[0,1]$$.

तो हमें मिल गया $$F_X$$ का व्युत्क्रम कार्य होना $$T $$, या, समकक्ष $$T(u)=F_X^{-1}(u), u\in [0,1]. $$ इसलिए, हम उत्पन्न कर सकते हैं $$X $$ से $$F_X^{-1}(U). $$

विधि
व्युत्क्रम परिवर्तन प्रतिचयन विधि द्वारा हल की जाने वाली समस्या इस प्रकार है:


 * होने देना $$X$$ एक यादृच्छिक चर हो जिसका वितरण संचयी वितरण फ़ंक्शन द्वारा वर्णित किया जा सकता है $$F_X$$.
 * हम मूल्य उत्पन्न करना चाहते हैं $$X$$ जो इस वितरण के अनुसार वितरित किये जाते हैं।

व्युत्क्रम परिवर्तन नमूनाकरण विधि निम्नानुसार काम करती है:
 * 1) छद्म यादृच्छिक संख्या जनरेटर $$u$$ अंतराल में मानक समान वितरण से $$[0,1]$$, यानी से $$U \sim \mathrm{Unif}[0,1].$$
 * 2) वांछित सीडीएफ का संचयी वितरण फ़ंक्शन # व्युत्क्रम_वितरण_फ़ंक्शन_(क्वांटाइल_फ़ंक्शन) ढूंढें, यानी। $$F_X^{-1}(u)$$.
 * 3) गणना करें $$X'(u)=F_X^{-1}(u)$$. परिकलित यादृच्छिक चर $$X'(U)$$ वितरण है $$F_X$$ और इस प्रकार वही कानून है $$X$$.

संचयी वितरण फ़ंक्शन को देखते हुए, अलग-अलग तरीके से व्यक्त किया गया $$F_X$$ और एक समान चर $$U\in[0,1]$$, यादृच्छिक चर $$X = F_X^{-1}(U)$$ वितरण है $$F_X$$.

निरंतर मामले में, अंतर समीकरणों को संतुष्ट करने वाली वस्तुओं जैसे व्युत्क्रम कार्यों का उपचार दिया जा सकता है। ऐसे कुछ विभेदक समीकरण अपनी गैर-रैखिकता के बावजूद, स्पष्ट शक्ति श्रृंखला समाधान स्वीकार करते हैं।

उदाहरण

 * उदाहरण के तौर पर, मान लीजिए कि हमारे पास एक यादृच्छिक चर है $$ U \sim \mathrm{Unif}(0,1)$$ और एक संचयी वितरण फ़ंक्शन

\begin{align} F(x)=1-\exp(-\sqrt{x}) \end{align} $$
 * एक व्युत्क्रम निष्पादित करने के लिए जिसे हम हल करना चाहते हैं $$F(F^{-1}(u))=u$$

\begin{align} F(F^{-1}(u))&=u \\ 1-\exp\left(-\sqrt{F^{-1}(u)}\right) &= u \\ F^{-1}(u) &= (-\log(1-u))^2 \\ &= (\log(1-u))^2 \end{align} $$
 * यहां से हम चरण एक, दो और तीन करेंगे।


 * एक अन्य उदाहरण के रूप में, हम घातीय वितरण का उपयोग करते हैं $$F_X(x)=1-e^{-\lambda x}$$ x ≥ 0 के लिए (और अन्यथा 0)। y=F(x) को हल करके हम व्युत्क्रम फलन प्राप्त करते हैं
 * $$x = F^{-1}(y) = -\frac{1}{\lambda}\ln(1-y).$$
 * इसका मतलब यह है कि यदि हम कुछ चित्र बनाते हैं $$y_0$$एक से $$ U \sim \mathrm{Unif}(0,1)$$ और गणना करें $$x_0 = F_X^{-1}(y_0) = -\frac{1}{\lambda}\ln(1-y_0),$$ यह $$x_0$$ घातीय वितरण है.
 * यह विचार निम्नलिखित ग्राफ़ में दर्शाया गया है:


 * Inverse transformation method for exponential distribution.jpg: ध्यान दें कि यदि हम y के बजाय 1-y से शुरू करते हैं तो वितरण नहीं बदलता है। कम्प्यूटेशनल उद्देश्यों के लिए, इसलिए [0, 1] में यादृच्छिक संख्या y उत्पन्न करना और फिर बस गणना करना पर्याप्त है
 * $$x = F^{-1}(y) = -\frac{1}{\lambda}\ln(y).$$

सटीकता का प्रमाण
होने देना $$F$$ एक संचयी वितरण फ़ंक्शन बनें, और चलो $$F^{-1}$$ इसका संचयी वितरण फलन हो#इनवर्स_डिस्ट्रिब्यूशन_फंक्शन_(क्वांटाइल_फंक्शन) (न्यूनतम का उपयोग करते हुए क्योंकि सीडीएफ कमजोर रूप से मोनोटोनिक और कैडलैग|राइट-कंटीन्यूअस हैं):
 * $$F^{-1}(u) = \inf\;\{x \mid F(x)\geq u\} \qquad (0<u<1).$$

दावा: यदि $$U$$ एक समान वितरण (निरंतर) यादृच्छिक चर है $$[0,1]$$ तब $$F^{-1}(U)$$ है $$F$$ इसके सीडीएफ के रूप में।

सबूत:



\begin{align} & \Pr(F^{-1}(U) \leq x) \\ & {} = \Pr(U \leq F(x)) \quad &(F\text{ is right-continuous, so }\{u:F^{-1}(u)\le x\}=\{u:u\le F(x)\}) \\ & {} = F(x)\quad &(\text{because }\Pr(U \leq u) = u,\text{ when U is uniform on}[0,1]) \\ \end{align} $$

कटा हुआ वितरण
व्युत्क्रम परिवर्तन नमूनाकरण को अंतराल पर काटे गए वितरण के मामलों तक आसानी से बढ़ाया जा सकता है $$(a,b]$$ अस्वीकृति नमूने की लागत के बिना: समान एल्गोरिदम का पालन किया जा सकता है, लेकिन एक यादृच्छिक संख्या उत्पन्न करने के बजाय $$u$$ 0 और 1 के बीच समान रूप से वितरित, उत्पन्न करें $$u$$ के बीच समान रूप से वितरित $$F(a)$$ और $$F(b)$$, और फिर दोबारा ले लो $$F^{-1}(u)$$.

व्युत्क्रमों की संख्या में कमी
बड़ी संख्या में नमूने प्राप्त करने के लिए, वितरण में समान संख्या में व्युत्क्रमण करने की आवश्यकता होती है। बड़ी संख्या में नमूने प्राप्त करते समय व्युत्क्रमों की संख्या को कम करने का एक संभावित तरीका बहुपद अराजकता विस्तार ढांचे के भीतर तथाकथित स्टोकेस्टिक कोलोकेशन मोंटे कार्लो सैंपलर (एससीएमसी सैंपलर) का अनुप्रयोग है। यह हमें एक चर के स्वतंत्र नमूनों के साथ मूल वितरण के केवल कुछ व्युत्क्रमों के साथ किसी भी संख्या में मोंटे कार्लो नमूने उत्पन्न करने की अनुमति देता है, जिसके लिए व्युत्क्रम विश्लेषणात्मक रूप से उपलब्ध हैं, उदाहरण के लिए मानक सामान्य चर।

यह भी देखें

 * संभाव्यता अभिन्न परिवर्तन
 * कोपुला (सांख्यिकी), संभाव्यता अभिन्न परिवर्तन के माध्यम से परिभाषित।
 * व्युत्क्रम सीडीएफ के स्पष्ट निर्माण के लिए क्वांटाइल फ़ंक्शन।
 * असतत घटकों के साथ वितरण के लिए सटीक गणितीय परिभाषा के लिए संचयी वितरण फ़ंक्शन # व्युत्क्रम।