सेमीपैरामीट्रिक मॉडल

आंकड़ों में, एक सेमीअपैरामीट्रिक मॉडल एक सांख्यिकीय मॉडल है जिसमें पैरामीट्रिक आँकड़े और गैर-पैरामीट्रिक घटक होते हैं।

एक सांख्यिकीय मॉडल वितरण का एक मानकीकृत परिवार है: $$\{P_\theta: \theta \in \Theta\}$$ एक सांख्यिकीय पैरामीटर द्वारा अनुक्रमित $$\theta$$.


 * पैरामीट्रिक मॉडल एक ऐसा मॉडल है जिसमें इंडेक्सिंग पैरामीटर होता है $$\theta$$ में एक वेक्टर है $$k$$-आयामी यूक्लिडियन स्थान, कुछ गैर-नकारात्मक पूर्णांक के लिए $$k$$. इस प्रकार, $$\theta$$ परिमित-आयामी है, और $$\Theta \subseteq \mathbb{R}^k$$.
 * एक गैर-पैरामीट्रिक_सांख्यिकी#गैर-पैरामीट्रिक_मॉडल के साथ, पैरामीटर के संभावित मानों का सेट $$\theta$$ कुछ स्थान का एक उपसमुच्चय है $$V$$, जो आवश्यक रूप से परिमित-आयामी नहीं है। उदाहरण के लिए, हम माध्य 0 वाले सभी वितरणों के सेट पर विचार कर सकते हैं। ऐसे स्थान टोपोलॉजिकल वेक्टर स्पेस हैं, लेकिन वेक्टर स्पेस के रूप में परिमित-आयामी नहीं हो सकते हैं। इस प्रकार, $$\Theta \subseteq V$$ कुछ संभवतः अनंत-आयामी वेक्टर अंतरिक्ष के लिए|अनंत-आयामी अंतरिक्ष $$V$$.
 * सेमीपैरामीट्रिक मॉडल के साथ, पैरामीटर में एक परिमित-आयामी घटक और एक अनंत-आयामी घटक (अक्सर वास्तविक रेखा पर परिभाषित एक वास्तविक-मूल्यवान फ़ंक्शन) दोनों होते हैं। इस प्रकार, $$\Theta \subseteq \mathbb{R}^k \times V$$, कहाँ $$V$$ एक अनंत-आयामी स्थान है।

पहली बार में ऐसा लग सकता है कि सेमीपैरामीट्रिक मॉडल में गैर-पैरामीट्रिक मॉडल शामिल हैं, क्योंकि उनमें एक अनंत-आयामी के साथ-साथ एक परिमित-आयामी घटक भी होता है। हालाँकि, एक अर्धपैरामीट्रिक मॉडल को पूरी तरह से गैरपैरामीट्रिक मॉडल से छोटा माना जाता है क्योंकि हम अक्सर केवल परिमित-आयामी घटक में रुचि रखते हैं। $$\theta$$. अर्थात्, अनंत-आयामी घटक को एक उपद्रव पैरामीटर के रूप में माना जाता है। इसके विपरीत, गैरपैरामीट्रिक मॉडल में, प्राथमिक रुचि अनंत-आयामी पैरामीटर का अनुमान लगाने में होती है। इस प्रकार गैर-पैरामीट्रिक मॉडल में अनुमान लगाने का कार्य सांख्यिकीय रूप से कठिन है।

ये मॉडल अक्सर चौरसाई  या कर्नेल (सांख्यिकी) का उपयोग करते हैं।

उदाहरण
अर्धपैरामीट्रिक मॉडल का एक प्रसिद्ध उदाहरण आनुपातिक ख़तरा मॉडल है। यदि हमें समय का अध्ययन करने में रुचि है $$T$$ कैंसर के कारण मृत्यु या प्रकाश बल्ब की विफलता जैसी किसी घटना के लिए, कॉक्स मॉडल निम्नलिखित वितरण फ़ंक्शन निर्दिष्ट करता है $$T$$:

F(t) = 1 - \exp\left(-\int_0^t \lambda_0(u) e^{\beta x} du\right), $$ कहाँ $$x$$ सहसंयोजक सदिश है, और $$\beta$$ और $$\lambda_0(u)$$ अज्ञात पैरामीटर हैं. $$\theta = (\beta, \lambda_0(u))$$. यहाँ $$\beta$$ परिमित-आयामी है और रुचिकर है; $$\lambda_0(u)$$ समय का एक अज्ञात गैर-नकारात्मक कार्य है (बेसलाइन खतरा फ़ंक्शन के रूप में जाना जाता है) और अक्सर एक उपद्रव पैरामीटर होता है। के लिए संभावित उम्मीदवारों का सेट $$\lambda_0(u)$$ अनंत-आयामी है.

यह भी देखें

 * अर्धपैरामीट्रिक प्रतिगमन
 * सांख्यिकीय मॉडल
 * क्षणों की सामान्यीकृत विधि

संदर्भ

 * Begun, Janet M.; Hall, W. J.; Huang, Wei-Min; Wellner, Jon A. (1983), "Information and asymptotic efficiency in parametric--nonparametric models", Annals of Statistics, 11 (1983), no. 2, 432--452
 * Begun, Janet M.; Hall, W. J.; Huang, Wei-Min; Wellner, Jon A. (1983), "Information and asymptotic efficiency in parametric--nonparametric models", Annals of Statistics, 11 (1983), no. 2, 432--452
 * Begun, Janet M.; Hall, W. J.; Huang, Wei-Min; Wellner, Jon A. (1983), "Information and asymptotic efficiency in parametric--nonparametric models", Annals of Statistics, 11 (1983), no. 2, 432--452
 * Begun, Janet M.; Hall, W. J.; Huang, Wei-Min; Wellner, Jon A. (1983), "Information and asymptotic efficiency in parametric--nonparametric models", Annals of Statistics, 11 (1983), no. 2, 432--452
 * Begun, Janet M.; Hall, W. J.; Huang, Wei-Min; Wellner, Jon A. (1983), "Information and asymptotic efficiency in parametric--nonparametric models", Annals of Statistics, 11 (1983), no. 2, 432--452