एंस्कोम्बे परिवर्तन

आँकड़ों में, एंस्कोम्बे परिवर्तन, जिसका नाम फ्रांसिस एंस्कोम्बे के नाम पर रखा गया है, वह एक विचरण-स्थिरीकरण परिवर्तन है जो एक यादृच्छिक चर को प्वासों वितरण के साथ एक ऐसे चर में परिवर्तित करता है जिसका आँकड़ा सामान्य रूप से मानक गौसियान वितरण होता है। एंस्कोम्बे परिवर्तन का उपयोग व्यापक रूप से फोटॉन-संकुचित प्रतिबिंबन (खगोल विज्ञान, एक्स-रे) में किया जाता है जहां प्रतिबिम्ब स्वाभाविक रूप से पॉइसन नियम का पालन करते हैं। एंस्कोम्ब परिवर्तन आमतौर पर डेटा को पूर्व-संसाधित करने के लिए प्रयोग किया जाता है ताकि मानक विचलन को लगभग स्थिर बनाया जा सके। फिर योगात्मक सफेद गाउसीय रव की संरचना के लिए प्रारूप किए गए निरूपित कलन विधि का उपयोग किया जाता है, और तब अंतिम अनुमान निरूपित डेटा में व्युत्क्रम एंस्कोम्बे परिवर्तन लागू करके प्राप्त किया जाता है।

परिभाषा
प्वासों वितरण के लिए माध्य $$m$$ और विचरण $$v$$ स्वतंत्र $$m = v$$ नहीं हैं। एंस्कोम्बे परिवर्तन
 * $$A:x \mapsto 2 \sqrt{x + \tfrac{3}{8}} \, $$

का लक्ष्य डेटा को रूपांतरित करना है ताकि पर्याप्त बड़े माध्य के लिए विचरण लगभग 1 निर्धारित हो, माध्य शून्य के लिए, प्रसरण अभी भी शून्य है।

यह पॉइसोनियन डेटा $$x$$ को (माध्य $$m$$ के साथ) माध्य     $$2\sqrt{m + \tfrac{3}{8}} - \tfrac{1}{4 \, m^{1/2}} + O\left(\tfrac{1}{m^{3/2}}\right)$$ और मानक विचलन  $$ 1 + O\left(\tfrac{1}{m^2}\right)$$के लगभग गॉसियन डेटा में परिवर्तित कर देता है।

यह सन्निकटन बड़े $$m$$, के लिए अधिक सटीक हो जाता है, जैसा कि चित्र में भी देखा जा सकता है।

प्रपत्र $$2 \sqrt{x + c}$$, के रूपांतरित चर के लिए, विचरण के लिए अभिव्यक्ति में एक अतिरिक्त पद $$\frac{\tfrac{3}{8} -c}{m}$$ है,  तथा $$c = \tfrac{3}{8}$$, पर इसे घटाकर शून्य कर दिया गया है, यही कारण है कि यह मान चुना गया।

उलटा
जब एंस्कोम्बे परिवर्तन का उपयोग निर्धारित करने में किया जाता है (यानी जब लक्ष्य $$x$$ से $$m$$ का अनुमान प्राप्त करना होता है), तो विचरण-स्थिर और अस्वीकृत डेटा $$y$$ मूल सीमा पर वापस करने के लिए इसके व्युत्क्रम परिवर्तन की भी आवश्यकता होती है। बीजगणितीय व्युत्क्रम


 * $$A^{-1}:y \mapsto \left( \frac{y}{2} \right)^2 - \frac{3}{8} $$

को लागू करने से आमतौर पर माध्य $$m$$ के अनुमान में अवांछित पूर्वाग्रह उत्पन्न होता है, क्योंकि आगे का वर्ग-मूल परिवर्तन रैखिक नहीं है। कभी-कभी स्पर्शोन्मुख रूप से निष्पक्ष व्युत्क्रम


 * $$y \mapsto \left( \frac{y}{2} \right)^2 - \frac{1}{8} $$

का उपयोग पूर्वाग्रह के परिणाम को कम कर देता है, लेकिन फोटॉन-सीमित प्रतिबिंबन में ऐसा नहीं है, जिसके लिए अंतर्निहित मानचित्रण
 * $$ \operatorname{E} \left[ 2\sqrt{x+\tfrac{3}{8}} \mid m \right] = 2 \sum_{x=0}^{+\infty} \left( \sqrt{x+\tfrac{3}{8}} \cdot \frac{m^x e^{-m}}{x!} \right) \mapsto m $$

द्वारा दिए गए सटीक निष्पक्ष व्युत्क्रम का उपयोग किया जाना चाहिए। इस सटीक निष्पक्ष व्युत्क्रम का एक सवृत-रूप सन्निकटन है।
 * $$y \mapsto \frac{1}{4} y^2 - \frac{1}{8} + \frac{1}{4} \sqrt{\frac{3}{2}} y^{-1} - \frac{11}{8} y^{-2} + \frac{5}{8} \sqrt{\frac{3}{2}} y^{-3}.$$

विकल्प
प्वासों वितरण के लिए कई अन्य संभावित विचरण-स्थिरीकरण परिवर्तन हैं। बार-लेव और एनिस की रिपोर्ट ऐसे परिवर्तनों का एक समूह है जिसमें एन्स्कोम्बे परिवर्तन सम्मिलित है। समूह का एक अन्य सदस्य फ्रीमैन-टुकी परिवर्तन
 * $$A:x \mapsto \sqrt{x+1}+\sqrt{x}. \, $$है।

डेटा के मानक विचलन के व्युत्क्रम के मूल के रूप में प्राप्त एक सरलीकृत परिवर्तन,


 * $$A:x \mapsto 2\sqrt{x} \, $$

है जो, विचरण को स्थिर करने में इतना अच्छा नहीं है, इसका लाभ यह है कि इसे अधिक आसानी से समझा जा सकता है।

वास्तव में, डेल्टा विधि से,

$$ V[2\sqrt{x}] \approx \left(\frac{d (2\sqrt{m})}{d m} \right)^2 V[x] = \left(\frac{1}{\sqrt{m}} \right)^2 m = 1 $$.

सामान्यीकरण
जबकि एंस्कोम्बे परिवर्तन शुद्ध पॉइसन डेटा के लिए उपयुक्त है, इसलिए कई अनुप्रयोगों में डेटा एक योगात्मक गॉसियन घटक भी प्रस्तुत करता है। इन स्थितियों का प्रयोग सामान्यीकृत एन्स्कोम्बे परिवर्तन द्वारा किया जाता है और इसके स्पर्शोन्मुख रूप से निष्पक्ष या सटीक निष्पक्ष व्युत्क्रमों द्वारा किया जाता है।

यह भी देखें

 * विचरण-स्थिरीकरण परिवर्तन
 * बॉक्स-कॉक्स परिवर्तन