समानीत ची-वर्ग आँकड़ा

आंकड़ों में, कम किए गए ची-स्क्वायर आँकड़े का उपयोग फिट परीक्षण की अच्छाई में बड़े पैमाने पर किया जाता है। इसे समस्थानिक डेटिंग में माध्य वर्ग भारित विचलन (MSWD) के रूप में भी जाना जाता है और भारित न्यूनतम वर्गों के संदर्भ में इकाई भार का विचरण। इसके वर्गमूल को प्रतिगमन मानक त्रुटि कहा जाता है, प्रतिगमन की मानक त्रुटि, या समीकरण की मानक त्रुटि (देखना )

परिभाषा
इसे ची-स्क्वायर वितरण | ची-स्क्वायर प्रति डिग्री स्वतंत्रता (सांख्यिकी) के रूप में परिभाषित किया गया है: $$\chi^2_\nu = \frac{\chi^2} \nu,$$ जहां ची-वर्ग वर्ग विचलन (सांख्यिकी) का भारित योग है: $$\chi^2 = \sum_{i} {\frac{(O_i - C_i)^2}{\sigma_i^2}}$$ इनपुट के साथ: विचरण $$\sigma_i^2$$, अवलोकन O, और परिकलित डेटा C. स्वतंत्रता की डिग्री, $$\nu = n - m$$, अवलोकनों की संख्या n से फिट किए गए मापदंडों की संख्या m के बराबर है।

भारित न्यूनतम वर्गों में, परिभाषा को अक्सर मैट्रिक्स नोटेशन में लिखा जाता है $$\chi^2_\nu = \frac{r^\mathrm{T} W r}{\nu},$$ जहां r अवशिष्टों का सदिश है, और W भार मैट्रिक्स है, जो प्रेक्षणों के इनपुट (विकर्ण) सहप्रसरण मैट्रिक्स का व्युत्क्रम है। यदि W गैर-विकर्ण है, तो सामान्यीकृत न्यूनतम वर्ग लागू होता है।

सामान्य न्यूनतम वर्गों में, परिभाषा इस प्रकार सरल हो जाती है: $$\chi^2_\nu = \frac{\mathrm{RSS}}{\nu},$$ $$\mathrm{RSS} = \sum r^2,$$ जहां अंश वर्गों का अवशिष्ट योग (RSS) है।

जब फ़िट केवल एक सामान्य माध्य है, तब $$\chi^2_\nu$$ नमूना मानक विचलन के बराबर है।

चर्चा
एक सामान्य नियम के रूप में, जब माप त्रुटि का विचरण प्राथमिक रूप से ज्ञात होता है, ए $$\chi_\nu^2 \gg 1$$ खराब मॉडल फिट का संकेत देता है। ए $$\chi_\nu^2 > 1$$ इंगित करता है कि फिट ने डेटा को पूरी तरह से कैप्चर नहीं किया है (या त्रुटि भिन्नता को कम करके आंका गया है)। सिद्धांत रूप में, का एक मूल्य $$\chi_\nu^2$$ आस-पास $$1$$ इंगित करता है कि टिप्पणियों और अनुमानों के बीच मिलान की सीमा त्रुटि भिन्नता के अनुरूप है। ए $$\chi_\nu^2 < 1$$ इंगित करता है कि मॉडल डेटा को ओवर-फिट कर रहा है: या तो मॉडल अनुचित रूप से शोर को फिट कर रहा है, या त्रुटि भिन्नता को कम करके आंका गया है।

जब माप त्रुटि का विचरण केवल आंशिक रूप से ज्ञात होता है, तो भारित अंकगणितीय माध्य#अधिक या कम फैलाव के लिए सुधार|घटा हुआ ची-स्क्वायर एक अनुमान के अनुसार सुधार के रूप में काम कर सकता है।

भू-कालानुक्रम
जियोक्रोनोलॉजी में, एमएसडब्ल्यूडी फिट की अच्छाई का एक माप है जो आइसोटोपिक डेटिंग में सबसे आम उपयोग के साथ, आंतरिक और बाहरी प्रतिलिपि प्रस्तुत करने योग्यता दोनों के सापेक्ष महत्व को ध्यान में रखता है। सामान्य तौर पर जब:

एमएसडब्ल्यूडी = 1 यदि आयु डेटा टी (अंकगणितीय माध्य आयु के लिए) या लॉग (टी) (ज्यामितीय माध्य आयु के लिए) स्थान में एक सामान्य वितरण फिट बैठता है, या यदि संरचना संबंधी डेटा [लॉग (यूरेनियम/) में एक द्विचर सामान्य वितरण फिट बैठता है हीलियम),लॉग(थोरियम/हे)]-स्पेस (केंद्रीय आयु के लिए)।

एमएसडब्ल्यूडी <1 यदि देखा गया बिखराव विश्लेषणात्मक अनिश्चितताओं द्वारा अनुमानित से कम है। इस मामले में, डेटा को कम फैलाया हुआ कहा जाता है, जो दर्शाता है कि विश्लेषणात्मक अनिश्चितताओं को कम करके आंका गया था।

एमएसडब्ल्यूडी > 1 यदि देखा गया बिखराव विश्लेषणात्मक अनिश्चितताओं द्वारा अनुमानित से अधिक है। इस मामले में, डेटा को अत्यधिक फैला हुआ कहा जाता है। यह स्थिति (यू-थ)/हे जियोक्रोनोलॉजी में अपवाद के बजाय नियम है, जो आइसोटोप प्रणाली की अधूरी समझ का संकेत देती है। (U-Th)/He डेटा के अत्यधिक फैलाव को समझाने के लिए कई कारण प्रस्तावित किए गए हैं, जिनमें असमान रूप से वितरित U-Th वितरण और विकिरण क्षति शामिल है।

अक्सर जियोक्रोनोलॉजिस्ट एक ही नमूने पर मापे गए मूल्य के साथ आयु माप की एक श्रृंखला निर्धारित करेगा $$x_i$$ एक भार होना $$w_i$$ और एक संबंधित त्रुटि $$\sigma_{x_i}$$ प्रत्येक आयु निर्धारण के लिए. जहां तक ​​वजन देने का संबंध है, कोई या तो मापी गई सभी उम्र को समान रूप से तौल सकता है, या उन्हें उस नमूने के अनुपात के आधार पर तौल सकता है जिसका वे प्रतिनिधित्व करते हैं। उदाहरण के लिए, यदि नमूने का दो तिहाई हिस्सा पहले माप के लिए और एक तिहाई दूसरे और अंतिम माप के लिए इस्तेमाल किया गया था, तो पहले माप का वजन दूसरे के मुकाबले दोगुना हो सकता है।

आयु निर्धारण का अंकगणितीय माध्य है $$\overline{x} = \frac{\sum_{i=1}^N x_i} N,$$ लेकिन यह मान भ्रामक हो सकता है, जब तक कि आयु का प्रत्येक निर्धारण समान महत्व का न हो।

जब प्रत्येक मापा मूल्य को समान भार, या महत्व माना जा सकता है, तो विचरण के पक्षपाती और निष्पक्ष (या मानक विचलन # क्रमशः नमूना मानक विचलन और जनसंख्या के साथ) अनुमानकों की गणना निम्नानुसार की जाती है: $$\sigma^2 = \frac{\sum_{i=1}^N (x_i - \overline{x})^2}N \text{ and } s^2 = \frac{N}{N-1} \cdot \sigma^2 = \frac{1}{N - 1} \cdot \sum_{i=1}^{N} (x_i - \overline{x})^2.$$ मानक विचलन विचरण का वर्गमूल है।

जब किसी आयु का व्यक्तिगत निर्धारण समान महत्व का नहीं होता है, तो औसत आयु प्राप्त करने के लिए भारित माध्य का उपयोग करना बेहतर होता है, जो निम्नानुसार है: $$\overline{x}^* = \frac{\sum_{i=1}^N w_i x_i}{\sum_{i=1}^N w_i}.$$ विचरण के पक्षपाती भारित अनुमानक को दिखाया जा सकता है $$\sigma^2 = \frac{\sum_{i=1}^N w_i (x_i - \overline{x}^*)^2}{\sum_{i=1}^N w_i},$$ जिसकी गणना इस प्रकार की जा सकती है $$\sigma^2 = \frac{\sum_{i=1}^N w_i x_i^2 \cdot \sum_{i=1}^N w_i - \big(\sum_{i=1}^N w_i x_i\big)^2}{\big(\sum_{i=1}^N w_i\big)^2}.$$ नमूना विचरण के निष्पक्ष भारित अनुमानक की गणना निम्नानुसार की जा सकती है: $$s^2 = \frac{\sum_{i=1}^N w_i}{\big(\sum_{i=1}^N w_i\big)^2 - \sum_{i=1}^N w_i^2} \cdot {\sum_{i=1}^N w_i (x_i - \overline{x}^*)^2}.$$ पुनः, संगत मानक विचलन प्रसरण का वर्गमूल है।

नमूना विचरण के निष्पक्ष भारित अनुमानक की गणना निम्नानुसार भी की जा सकती है: $$s^2 = \frac{\sum_{i=1}^N w_i x_i^2 \cdot \sum_{i=1}^N w_i - \big(\sum_{i=1}^N w_i x_i\big)^2}{\big(\sum_{i=1}^N w_i\big)^2 - \sum_{i=1}^N w_i^2}.$$ भारित विचलनों (अभारित एमएसडब्ल्यूडी) के अभारित माध्य वर्ग की गणना निम्नानुसार की जा सकती है: $$\text{MSWD}_u = \frac{1}{N-1} \cdot \sum_{i=1}^N \frac{(x_i - \overline{x})^2}{\sigma_{x_i}^2}.$$ सादृश्य द्वारा, भारित विचलन (भारित MSWD) के भारित माध्य वर्ग की गणना निम्नानुसार की जा सकती है: $$\text{MSWD}_w = \frac{\sum_{i=1}^N w_i}{\big(\sum_{i=1}^N w_i\big)^2 - \sum_{i=1}^N w_i^2 } \cdot \sum_{i=1}^N \frac{w_i (x_i - \overline{x}^*)^2}{(\sigma_{x_i})^2}.$$

राश विश्लेषण
तीव्र मॉडल पर आधारित डेटा विश्लेषण में, घटी हुई ची-स्क्वायर सांख्यिकी को आउटफिट माध्य-वर्ग सांख्यिकी कहा जाता है, और सूचना-भारित कम ची-स्क्वायर सांख्यिकी को इनफिट माध्य-वर्ग सांख्यिकी कहा जाता है।