क्रुस्कल-वालिस विचरण का एकतरफा विश्लेषण

क्रस्कल-वालिस एच परीक्षण (विलियम क्रुस्कल और डब्ल्यू एलन वालिस के नाम पर) या रैंकों पर वन-वे एनोवा द्वारा क्रस्कल-वालिस परीक्षण होता है यह परीक्षण करने के लिए एक गैर-पैरामीट्रिक विधि है कि प्रतिरूप उसी से उत्पन्न होते हैं या नहीं वितरण होते है।  इसका उपयोग समान या भिन्न प्रतिरूप आकार के दो या दो से अधिक स्वतंत्र प्रतिरूपों की तुलना करने के लिए किया जाता है। यह मान-व्हिटनी यू परीक्षण का विस्तार करता है जिसका उपयोग केवल दो समूहों की तुलना करने के लिए किया जाता है। क्रुस्कल-वालिस परीक्षण का पैरामीट्रिक समकक्ष विचरण (एनोवा) का एकतरफा विश्लेषण है।

महत्वपूर्ण क्रुस्कल-वालिस परीक्षण संकेत करता है कि कम से कम प्रतिरूप स्टोचैस्टिक प्रभुत्व अन्य प्रतिरूप है। परीक्षण यह नहीं पहचानता है कि यह स्टोकास्टिक प्रभुत्व कहां होता है या स्टोकास्टिक प्रभुत्व कितने समूहों के जोड़े के लिए प्राप्त होता है। स्टोकेस्टिक प्रभुत्व के लिए विशिष्ट प्रतिरूप जोड़े का विश्लेषण करने के लिए, डन का परीक्षण, बोन्फेरोनी सुधार के साथ जोड़ीदार मान-व्हिटनी परीक्षण, या अधिक शक्तिशाली किन्तु कम प्रसिद्ध कोनोवर-ईमान परीक्षण कभी-कभी उपयोग किए जाते हैं।

चूंकि यह गैरपारंपरिक विधि है, क्रुस्कल-वालिस परीक्षण विचरण के समान एकतरफा विश्लेषण के विपरीत, अवशिष्टों के सामान्य वितरण को नहीं मानता है। इस प्रकार यदि शोधकर्ता माध्यिका में किसी भी अंतर को छोड़कर, सभी समूहों के लिए समान आकार और मापित वितरण की धारणा बना सकता है, जिससे अशक्त परिकल्पना यह है कि सभी समूहों की माध्यिकाएँ समान हैं, और वैकल्पिक परिकल्पना यह है कि कम से कम जनसंख्या माध्यक समूह का कम से कम अन्य समूह की जनसंख्या माध्यिका से भिन्न है। अन्यथा, यह कहना असंभव है कि शून्य परिकल्पना की अस्वीकृति स्थान या समूह फैलाव में बदलाव से आती है या नहीं आती है। यही समस्या मान-व्हिटनी परीक्षण के साथ भी होती है।

विधि
\begin{align} H & = \frac{12}{N(N+1)}\sum_{i=1}^g n_i \left(\bar{r}_{i\cdot} - \frac{N+1}{2}\right)^2 \\ & = \frac{12}{N(N+1)}\sum_{i=1}^g n_i \bar{r}_{i\cdot }^2 -\ 3(N+1) \end{align} $$
 * 1) सभी समूहों के सभी डेटा को एक साथ रैंक करता है; अर्थात समूह सदस्यता को नजरअंदाज करते हुए डेटा को 1 से N तक रैंक करता है। इस प्रकार किसी भी बंधे हुए मूल्यों को असाइन करें और उन्हें प्राप्त होने वाले रैंकों का औसत यदि वे बंधे नहीं होते है।
 * 2) परीक्षण आँकड़ा इसके द्वारा दिया गया है
 * $$H = (N-1)\frac{\sum_{i=1}^g n_i(\bar{r}_{i\cdot} - \bar{r})^2}{\sum_{i=1}^g\sum_{j=1}^{n_i}(r_{ij} - \bar{r})^2},$$ कहाँ
 * 1) *$$N$$ सभी समूहों में प्रेक्षणों की कुल संख्या है
 * 2) *$$g$$ समूहों की संख्या है
 * 3) *$$n_i$$ समूह में टिप्पणियों $$i$$ की संख्या है
 * 4) *$$r_{ij}$$ समूह $$i$$ से अवलोकन $$j$$ का रैंक (सभी अवलोकनों के बीच) है
 * 5) *$$\bar{r}_{i\cdot} = \frac{\sum_{j=1}^{n_i}{r_{ij}}}{n_i}$$ समूह $$i$$ में सभी अवलोकनों का औसत रैंक है
 * 6) *$$\bar{r} =\tfrac 12 (N+1)$$ सभी $$r_{ij}$$ का औसत है
 * 7) यदि डेटा में कोई संबंध नहीं है तो $$H$$ के लिए अभिव्यक्ति के प्रत्येक पूर्ण रूप से $$(N-1)N(N+1)/12$$ और $$\bar{r}=\tfrac{N+1}{2}$$ सही है। इस प्रकार


 * अंतिम सूत्र में केवल औसत रैंकों के वर्ग होते हैं।
 * 1) संबंधों के लिए एक सुधार यदि पिछले बिंदु में वर्णित शॉर्ट-कट सूत्र का उपयोग करके $$H$$ को $$1 - \frac{\sum_{i=1}^G (t_i^3 - t_i)}{N^3-N}$$ से विभाजित करके बनाया जा सकता है जहां G विभिन्न बंधे हुए रैंकों के समूहों की संख्या है और ti समूह i के अन्दर बंधे मूल्यों की संख्या है जो एक विशेष मूल्य पर बंधे हैं। यह सुधार सामान्यतः एच के मूल्य में थोड़ा अंतर करता है जब तक कि बड़ी संख्या में कोई संबंध नही होंता है।
 * 2) इस प्रकार अंत में, अशक्त परिकल्पना को अस्वीकार करने या न करने का निर्णय किसी दिए गए महत्व या अल्फा स्तर के लिए तालिका या सॉफ़्टवेयर से प्राप्त महत्वपूर्ण मान $$H$$ से $$H_c$$ की तुलना करके किया जाता है। यदि $$H$$, $$H_c$$ से बड़ा है, जिससे शून्य परिकल्पना को अस्वीकार कर दिया जाता है। यदि संभव हो (कोई संबंध प्रतिरूप बहुत बड़ा नहीं है) तो एच की तुलना एच के स्पष्ट वितरण से प्राप्त महत्वपूर्ण मूल्य से करनी चाहिए। अन्यथा, $$H$$ के वितरण को g-1 डिग्री स्वतंत्रता के साथ ची-वर्ग वितरण द्वारा अनुमानित किया जा सकता है। यदि कुछ $$n_i$$ मान छोटे हैं (अर्थात्, 5 से कम) $$H$$ का स्पष्ट संभाव्यता वितरण इस ची-स्क्वायर वितरण से अधिक भिन्न हो सकता है। इस प्रकार यदि ची-स्क्वायर संभाव्यता वितरण की एक तालिका उपलब्ध है, जिससे ची-स्क्वेर्ड $$\chi^2_{\alpha: g-1}$$ का महत्वपूर्ण मान g - 1 स्वतंत्रता की डिग्री (सांख्यिकी) पर तालिका में प्रवेश करके और वांछित के अनुसार देख कर पाया जा सकता है।
 * 3) यदि आँकड़ा महत्वपूर्ण नहीं है, जिससे प्रतिरूपो के बीच स्टोचैस्टिक प्रभुत्व का कोई प्रमाण नहीं है। चूँकि, यदि परीक्षण महत्वपूर्ण है जिससे कम से कम प्रतिरूप दूसरे प्रतिरूप पर स्थिर रूप से हावी हो जाता है। इसलिए, शोधकर्ता अलग-अलग प्रतिरूप जोड़े के बीच प्रतिरूप विरोधाभासों का उपयोग कर सकता है, या इस प्रकार डन के परीक्षण का उपयोग करके पोस्ट हॉक परीक्षण कर सकता है, जो (1) क्रुस्कल-वालिस परीक्षण के समान रैंकिंग को ठीक से नियोजित करता है, और (2) शून्य द्वारा निहित पूलित भिन्नता को ठीक से नियोजित करता है। क्रुस्कल-वालिस परीक्षण की परिकल्पना यह निर्धारित करने के लिए कि कौन से प्रतिरूप जोड़े महत्वपूर्ण रूप से भिन्न हैं। इस प्रकार एकाधिक प्रतिरूप विरोधाभास या परीक्षण करते समय, टाइप त्रुटि दर बढ़ जाती है, जिससे एकाधिक तुलना समस्या के बारे में चिंता बढ़ जाती है।

स्पष्ट संभाव्यता तालिका
क्रस्कल-वालिस परीक्षण के लिए स्पष्ट संभावनाओं की गणना करने के लिए बड़ी मात्रा में कंप्यूटिंग संसाधनों की आवश्यकता होती है। इस प्रकार स्पष्टता सॉफ़्टवेयर लगभग 30 प्रतिभागियों से कम प्रतिरूप आकार के लिए केवल स्पष्ट संभावनाएं प्रदान करता है। ये सॉफ़्टवेयर प्रोग्राम बड़े प्रतिरूप आकार के लिए स्पर्शोन्मुख सन्निकटन पर निर्भर करते हैं।

बड़े प्रतिरूप आकारों के लिए स्पष्ट संभाव्यता मान उपलब्ध हैं। स्परियर (2003) ने 45 प्रतिभागियों के रूप में बड़े प्रतिरूपो के लिए स्पष्ट संभाव्यता सारणी प्रकाशित किया था। मेयर और सीमैन (2006) ने 105 प्रतिभागियों के रूप में बड़े प्रतिरूपो के लिए स्पष्ट संभाव्यता वितरण का उत्पादन किया था।

एच का स्पष्ट वितरण
चोई एट अल ने $$H$$ के स्पष्ट वितरण की गणना करने के लिए विकसित की गई दो विधियों की समीक्षा की थी और इस प्रकार नया वितरण प्रस्तावित किया और स्पष्ट वितरण की तुलना इसके ची-स्क्वायर सन्निकटन से हुई थी।

महीने के अनुसार ओजोन के स्तर में अंतर के लिए परीक्षण
निम्न उदाहरण चेम्बर्स एट अल से डेटा का उपयोग करता है। न्यूयॉर्क शहर में 1 मई से 30 सितंबर, 1973 तक ओजोन की दैनिक रीडिंग पर डेटा R डेटा सेट वायु गुणवत्ता में हैं, और विश्लेषण R फलन क्रुस्कल.परीक्षण के लिए प्रलेखन में साम्मिलित है। महीने के अनुसार ओजोन मूल्यों के बॉक्सप्लॉट चित्र में दिखाए गए हैं।



क्रुस्कल-वालिस परीक्षण में महत्वपूर्ण अंतर (p = 6.901e-06) मिलता है जो दर्शाता है कि ओजोन 5 महीनों के बीच भिन्न होता है।

यह निर्धारित करने के लिए कि कौन से महीने अलग-अलग हैं, इस प्रकार कई परिकल्पना परीक्षण के लिए बोनफेरोनी (या अन्य) सुधार के साथ, महीनों की प्रत्येक जोड़ी के लिए विलकॉक्सन परीक्षण का उपयोग करके पोस्ट-हॉक परीक्षण किया जा सकता है।

पोस्ट-हॉक परीक्षणों से संकेत मिलता है कि, कई परीक्षण के लिए बोनफेरोनी सुधार के बाद, निम्नलिखित अंतर महत्वपूर्ण हैं (समायोजित पी <0.05)।


 * माह 5 बनाम माह 7 और 8
 * माह 9 बनाम माह 7 और 8

यह भी देखें

 * फ्रीडमैन परीक्षण
 * जोंखीरे का ट्रेंड परीक्षण

बाहरी संबंध

 * An online version of the test