समानीत ची-वर्ग आँकड़ा

आंकड़ों में, कम किए गए ची-वर्ग आँकड़े का उपयोग फिट परीक्षण के बड़े पैमाने पर किया जाता है। इसे समस्थानिक डेटिंग में माध्य वर्ग भारित विचलन (एमएसडब्ल्यूडी) के रूप में भी जाना जाता है और भारित न्यूनतम वर्ग के संदर्भ में इकाई भार के विचरण के रूप में भी जाना जाता है। इसके वर्गमूल को प्रतिगमन मानक त्रुटि कहा जाता है, प्रतिगमन की मानक त्रुटि, या समीकरण की मानक त्रुटि   है।

परिभाषा
इसे स्वतंत्रता की डिग्री के अनुसार ची-वर्ग वितरण के रूप में परिभाषित किया गया है: $$\chi^2_\nu = \frac{\chi^2} \nu,$$ जहां ची-वर्ग वर्ग विचलन (सांख्यिकी) का भारित योग है: $$\chi^2 = \sum_{i} {\frac{(O_i - C_i)^2}{\sigma_i^2}}$$ इनपुट के साथ: विचरण $$\sigma_i^2$$, अवलोकन O, और परिकलित डेटा C है, स्वतंत्रता की डिग्री, $$\nu = n - m$$, अवलोकनों की संख्या n से फिट किए गए पैरामीटर की संख्या m के समान है।

भारित न्यूनतम वर्गों में, परिभाषा को प्रायः मैट्रिक्स नोटेशन में लिखा जाता है: $$\chi^2_\nu = \frac{r^\mathrm{T} W r}{\nu},$$ जहां r अवशिष्टों का सदिश है, और W भार मैट्रिक्स है, जो प्रेक्षणों के इनपुट (विकर्ण) सहप्रसरण मैट्रिक्स का व्युत्क्रम है। यदि W अविकर्ण है, तो सामान्यीकृत न्यूनतम वर्ग प्रारम्भ होता है।

सामान्य न्यूनतम वर्गों में, परिभाषा इस प्रकार सरल हो जाती है: $$\chi^2_\nu = \frac{\mathrm{RSS}}{\nu},$$$$\mathrm{RSS} = \sum r^2,$$ जहां भाग वर्गों का अवशिष्ट योग (आरएसएस) है।

जब फ़िट केवल सामान्य माध्य है, तब $$\chi^2_\nu$$ प्रारूप मानक विचलन के समान है।

वर्णन
सामान्य नियम के रूप में, जब माप त्रुटि का विचरण प्राथमिक रूप से ज्ञात होता है, a $$\chi_\nu^2 \gg 1$$ व्यर्थ मॉडल फिट का संकेत देता है। a $$\chi_\nu^2 > 1$$ प्रदर्शित करता है कि फिट ने डेटा को पूर्ण रूप से कैप्चर नहीं किया है (या त्रुटि भिन्नता को कम करके गणना की गई है)। सिद्धांत रूप में, मान $$\chi_\nu^2$$ के निकट $$1$$ प्रदर्शित करता है कि टिप्पणियों और अनुमानों के मध्य संघ की सीमा त्रुटि भिन्नता के अनुरूप है। a $$\chi_\nu^2 < 1$$ प्रदर्शित करता है कि मॉडल डेटा को ओवर-फिट कर रहा है: या तो मॉडल अनुचित रूप से शोर को फिट कर रहा है, या त्रुटि भिन्नता को कम करके गणना की गई है।

जब माप त्रुटि का विचरण केवल आंशिक रूप से ज्ञात होता है, तो घटा हुआ ची-वर्ग अनुमानित सुधार के रूप में कार्य कर सकता है।

भू-कालक्रम
भू-भू-कालक्रम में, एमएसडब्ल्यूडी फिट का ऐसा माप है जो आइसोटोपिक डेटिंग में सबसे सरल उपयोग के साथ, आंतरिक और बाहरी प्रतिलिपि प्रस्तुत करने योग्यता दोनों के सापेक्ष महत्व को ध्यान में रखता है।

सामान्यतः जब:

एमएसडब्ल्यूडी = 1 यदि आयु डेटा t (अंकगणितीय माध्य आयु के लिए) या लॉग (t) (ज्यामितीय माध्य आयु के लिए) स्थान में सामान्य वितरण फिट का उपयोग किया जाता है, या यदि संरचना संबंधी डेटा [log(U/He),log(Th/He)] में द्विचर सामान्य वितरण फिट का उपयोग किया जाता है।

एमएसडब्ल्यूडी <1 यदि देखा गया बिखराव विश्लेषणात्मक अनिश्चितताओं द्वारा अनुमानित से कम है। इस स्तिथि में, डेटा को अल्प विस्तारित कहा जाता है, जो दर्शाता है कि विश्लेषणात्मक अनिश्चितताओं को कम करके गणना की गई थी।

एमएसडब्ल्यूडी > 1 यदि देखा गया बिखराव विश्लेषणात्मक अनिश्चितताओं द्वारा अनुमानित से अधिक है। इस स्तिथि में, डेटा को अत्यधिक विस्तारित कहा जाता है। यह स्थिति (U-Th)/He भू-भू-कालक्रम में अपवाद के अतिरिक्त नियम है, जो आइसोटोप प्रणाली की अर्ध अध्ययन का संकेत देती है। (U-Th)/He डेटा के अत्यधिक विस्तारण के अध्ययन के लिए कई कारण प्रस्तावित किए गए हैं, जिनमें असमान रूप से वितरित U-Th वितरण और विकिरण क्षति सम्मिलित है।

प्रायः भू-कालानुक्रमिक प्रारूप पर मापे गए मान के साथ आयु माप की श्रृंखला निर्धारित करेगा $$x_i$$ भार और $$w_i$$ संबंधित त्रुटि $$\sigma_{x_i}$$ प्रत्येक आयु निर्धारण के लिए जहां तक ​​भार प्रदान करने का संबंध है, कोई या तो मापी गई सभी आयु को समान रूप से माप सकता है, या उन्हें उस प्रारूप के अनुपात के आधार पर माप सकता है जिसका वे प्रतिनिधित्व करते हैं। उदाहरण के लिए, यदि प्रारूपका दो तिहाई भाग पूर्व माप के लिए और एक तिहाई दूसरे और अंतिम माप के लिए उपयोग किया गया था, तो पूर्व माप का भार दूसरे के अपेक्षा दोगुना हो सकता है।

आयु निर्धारण का अंकगणितीय माध्य है $$\overline{x} = \frac{\sum_{i=1}^N x_i} N,$$ किंतु यह मान भ्रामक हो सकता है, जब तक कि आयु का प्रत्येक निर्धारण समान महत्व का न हो।

जब प्रत्येक मापे मान को समान भार, या महत्व माना जा सकता है, तो विचरण के पक्षपाती और निष्पक्ष (या क्रमशः "प्रारूप" और "जनसंख्या") अनुमानकों की गणना निम्नानुसार की जाती है: $$\sigma^2 = \frac{\sum_{i=1}^N (x_i - \overline{x})^2}N \text{ and } s^2 = \frac{N}{N-1} \cdot \sigma^2 = \frac{1}{N - 1} \cdot \sum_{i=1}^{N} (x_i - \overline{x})^2.$$ मानक विचलन विचरण का वर्गमूल है।

जब किसी आयु का व्यक्तिगत निर्धारण समान महत्व का नहीं होता है, तो औसत आयु प्राप्त करने के लिए भारित माध्य का उपयोग करना उत्तम होता है, जो निम्नानुसार है: $$\overline{x}^* = \frac{\sum_{i=1}^N w_i x_i}{\sum_{i=1}^N w_i}.$$ विचरण के पक्षपाती भारित अनुमानक को दिखाया जा सकता है: $$\sigma^2 = \frac{\sum_{i=1}^N w_i (x_i - \overline{x}^*)^2}{\sum_{i=1}^N w_i},$$ जिसकी गणना इस प्रकार की जा सकती है: $$\sigma^2 = \frac{\sum_{i=1}^N w_i x_i^2 \cdot \sum_{i=1}^N w_i - \big(\sum_{i=1}^N w_i x_i\big)^2}{\big(\sum_{i=1}^N w_i\big)^2}.$$ प्रारूप विचरण के निष्पक्ष भारित अनुमानक की गणना निम्नानुसार की जा सकती है: $$s^2 = \frac{\sum_{i=1}^N w_i}{\big(\sum_{i=1}^N w_i\big)^2 - \sum_{i=1}^N w_i^2} \cdot {\sum_{i=1}^N w_i (x_i - \overline{x}^*)^2}.$$ पुनः, संगत मानक विचलन प्रसरण का वर्गमूल है।

प्रारूप विचरण के निष्पक्ष भारित अनुमानक की गणना निम्नानुसार भी की जा सकती है: $$s^2 = \frac{\sum_{i=1}^N w_i x_i^2 \cdot \sum_{i=1}^N w_i - \big(\sum_{i=1}^N w_i x_i\big)^2}{\big(\sum_{i=1}^N w_i\big)^2 - \sum_{i=1}^N w_i^2}.$$ भारित विचलनों (अभारित एमएसडब्ल्यूडी) के अभारित माध्य वर्ग की गणना निम्नानुसार की जा सकती है: $$\text{MSWD}_u = \frac{1}{N-1} \cdot \sum_{i=1}^N \frac{(x_i - \overline{x})^2}{\sigma_{x_i}^2}.$$ सादृश्य द्वारा, भारित विचलन (भारित एमएसडब्ल्यूडी) के भारित माध्य वर्ग की गणना निम्नानुसार की जा सकती है: $$\text{MSWD}_w = \frac{\sum_{i=1}^N w_i}{\big(\sum_{i=1}^N w_i\big)^2 - \sum_{i=1}^N w_i^2 } \cdot \sum_{i=1}^N \frac{w_i (x_i - \overline{x}^*)^2}{(\sigma_{x_i})^2}.$$रैश विश्लेषण रैश मॉडल पर आधारित डेटा विश्लेषण में, कम किए गए ची-वर्ग सांख्यिकी को आउटफिट माध्य-वर्ग सांख्यिकी कहा जाता है, और सूचना-भारित कम किए गए ची-वर्ग सांख्यिकी को इनफिट माध्य-वर्ग सांख्यिकी कहा जाता है।