क्रुस्कल-वालिस विचरण का एकतरफा विश्लेषण

From Vigyanwiki

क्रस्कल-वालिस एच परीक्षण [1] (विलियम क्रुस्कल और डब्ल्यू एलन वालिस के नाम पर) या रैंकों पर वन-वे एनोवा द्वारा क्रस्कल-वालिस परीक्षण होता है [1] यह परीक्षण करने के लिए एक गैर-पैरामीट्रिक विधि है कि प्रतिरूप उसी से उत्पन्न होते हैं या नहीं वितरण होते है। [2][3][4] इसका उपयोग समान या भिन्न प्रतिरूप आकार के दो या दो से अधिक स्वतंत्र प्रतिरूपों की तुलना करने के लिए किया जाता है। यह मान-व्हिटनी यू परीक्षण का विस्तार करता है जिसका उपयोग केवल दो समूहों की तुलना करने के लिए किया जाता है। क्रुस्कल-वालिस परीक्षण का पैरामीट्रिक समकक्ष विचरण (एनोवा) का एकतरफा विश्लेषण है।

महत्वपूर्ण क्रुस्कल-वालिस परीक्षण संकेत करता है कि कम से कम प्रतिरूप स्टोचैस्टिक प्रभुत्व अन्य प्रतिरूप है। परीक्षण यह नहीं पहचानता है कि यह स्टोकास्टिक प्रभुत्व कहां होता है या स्टोकास्टिक प्रभुत्व कितने समूहों के जोड़े के लिए प्राप्त होता है। स्टोकेस्टिक प्रभुत्व के लिए विशिष्ट प्रतिरूप जोड़े का विश्लेषण करने के लिए, डन का परीक्षण,[5] बोन्फेरोनी सुधार के साथ जोड़ीदार मान-व्हिटनी परीक्षण,[6] या अधिक शक्तिशाली किन्तु कम प्रसिद्ध कोनोवर-ईमान परीक्षण [6] कभी-कभी उपयोग किए जाते हैं।

चूंकि यह गैरपारंपरिक विधि है, क्रुस्कल-वालिस परीक्षण विचरण के समान एकतरफा विश्लेषण के विपरीत, अवशिष्टों के सामान्य वितरण को नहीं मानता है। इस प्रकार यदि शोधकर्ता माध्यिका में किसी भी अंतर को छोड़कर, सभी समूहों के लिए समान आकार और मापित वितरण की धारणा बना सकता है, जिससे अशक्त परिकल्पना यह है कि सभी समूहों की माध्यिकाएँ समान हैं, और वैकल्पिक परिकल्पना यह है कि कम से कम जनसंख्या माध्यक समूह का कम से कम अन्य समूह की जनसंख्या माध्यिका से भिन्न है। अन्यथा, यह कहना असंभव है कि शून्य परिकल्पना की अस्वीकृति स्थान या समूह फैलाव में बदलाव से आती है या नहीं आती है। यही समस्या मान-व्हिटनी परीक्षण के साथ भी होती है।[7][8][9]

विधि

  1. सभी समूहों के सभी डेटा को एक साथ रैंक करता है; अर्थात समूह सदस्यता को नजरअंदाज करते हुए डेटा को 1 से N तक रैंक करता है। इस प्रकार किसी भी बंधे हुए मूल्यों को असाइन करें और उन्हें प्राप्त होने वाले रैंकों का औसत यदि वे बंधे नहीं होते है।
  2. परीक्षण आँकड़ा इसके द्वारा दिया गया है
    कहाँ
    • सभी समूहों में प्रेक्षणों की कुल संख्या है
    • समूहों की संख्या है
    • समूह में टिप्पणियों की संख्या है
    • समूह से अवलोकन का रैंक (सभी अवलोकनों के बीच) है
    • समूह में सभी अवलोकनों का औसत रैंक है
    • सभी का औसत है
  3. यदि डेटा में कोई संबंध नहीं है तो के लिए अभिव्यक्ति के प्रत्येक पूर्ण रूप से और सही है। इस प्रकार

    अंतिम सूत्र में केवल औसत रैंकों के वर्ग होते हैं।
  4. संबंधों के लिए एक सुधार यदि पिछले बिंदु में वर्णित शॉर्ट-कट सूत्र का उपयोग करके को से विभाजित करके बनाया जा सकता है जहां G विभिन्न बंधे हुए रैंकों के समूहों की संख्या है और ti समूह i के अन्दर बंधे मूल्यों की संख्या है जो एक विशेष मूल्य पर बंधे हैं। यह सुधार सामान्यतः एच के मूल्य में थोड़ा अंतर करता है जब तक कि बड़ी संख्या में कोई संबंध नही होंता है।
  5. इस प्रकार अंत में, अशक्त परिकल्पना को अस्वीकार करने या न करने का निर्णय किसी दिए गए महत्व या अल्फा स्तर के लिए तालिका या सॉफ़्टवेयर से प्राप्त महत्वपूर्ण मान से की तुलना करके किया जाता है। यदि , से बड़ा है, जिससे शून्य परिकल्पना को अस्वीकार कर दिया जाता है। यदि संभव हो (कोई संबंध प्रतिरूप बहुत बड़ा नहीं है) तो एच की तुलना एच के स्पष्ट वितरण से प्राप्त महत्वपूर्ण मूल्य से करनी चाहिए। अन्यथा, के वितरण को g-1 डिग्री स्वतंत्रता के साथ ची-वर्ग वितरण द्वारा अनुमानित किया जा सकता है। यदि कुछ मान छोटे हैं (अर्थात्, 5 से कम) का स्पष्ट संभाव्यता वितरण इस ची-स्क्वायर वितरण से अधिक भिन्न हो सकता है। इस प्रकार यदि ची-स्क्वायर संभाव्यता वितरण की एक तालिका उपलब्ध है, जिससे ची-स्क्वेर्ड का महत्वपूर्ण मान g - 1 स्वतंत्रता की डिग्री (सांख्यिकी) पर तालिका में प्रवेश करके और वांछित के अनुसार देख कर पाया जा सकता है।
  6. यदि आँकड़ा महत्वपूर्ण नहीं है, जिससे प्रतिरूपो के बीच स्टोचैस्टिक प्रभुत्व का कोई प्रमाण नहीं है। चूँकि, यदि परीक्षण महत्वपूर्ण है जिससे कम से कम प्रतिरूप दूसरे प्रतिरूप पर स्थिर रूप से हावी हो जाता है। इसलिए, शोधकर्ता अलग-अलग प्रतिरूप जोड़े के बीच प्रतिरूप विरोधाभासों का उपयोग कर सकता है, या इस प्रकार डन के परीक्षण का उपयोग करके पोस्ट हॉक परीक्षण कर सकता है, जो (1) क्रुस्कल-वालिस परीक्षण के समान रैंकिंग को ठीक से नियोजित करता है, और (2) शून्य द्वारा निहित पूलित भिन्नता को ठीक से नियोजित करता है। क्रुस्कल-वालिस परीक्षण की परिकल्पना यह निर्धारित करने के लिए कि कौन से प्रतिरूप जोड़े महत्वपूर्ण रूप से भिन्न हैं।[5] इस प्रकार एकाधिक प्रतिरूप विरोधाभास या परीक्षण करते समय, टाइप त्रुटि दर बढ़ जाती है, जिससे एकाधिक तुलना समस्या के बारे में चिंता बढ़ जाती है।

स्पष्ट संभाव्यता तालिका

क्रस्कल-वालिस परीक्षण के लिए स्पष्ट संभावनाओं की गणना करने के लिए बड़ी मात्रा में कंप्यूटिंग संसाधनों की आवश्यकता होती है। इस प्रकार स्पष्टता सॉफ़्टवेयर लगभग 30 प्रतिभागियों से कम प्रतिरूप आकार के लिए केवल स्पष्ट संभावनाएं प्रदान करता है। ये सॉफ़्टवेयर प्रोग्राम बड़े प्रतिरूप आकार के लिए स्पर्शोन्मुख सन्निकटन पर निर्भर करते हैं।

बड़े प्रतिरूप आकारों के लिए स्पष्ट संभाव्यता मान उपलब्ध हैं। स्परियर (2003) ने 45 प्रतिभागियों के रूप में बड़े प्रतिरूपो के लिए स्पष्ट संभाव्यता सारणी प्रकाशित किया था।[10] मेयर और सीमैन (2006) ने 105 प्रतिभागियों के रूप में बड़े प्रतिरूपो के लिए स्पष्ट संभाव्यता वितरण का उत्पादन किया था।[11]

एच का स्पष्ट वितरण

चोई एट अल [12] ने के स्पष्ट वितरण की गणना करने के लिए विकसित की गई दो विधियों की समीक्षा की थी और इस प्रकार नया वितरण प्रस्तावित किया और स्पष्ट वितरण की तुलना इसके ची-स्क्वायर सन्निकटन से हुई थी।

उदाहरण

महीने के अनुसार ओजोन के स्तर में अंतर के लिए परीक्षण

निम्न उदाहरण चेम्बर्स एट अल से डेटा का उपयोग करता है।[13] न्यूयॉर्क शहर में 1 मई से 30 सितंबर, 1973 तक ओजोन की दैनिक रीडिंग पर डेटा R डेटा सेट वायु गुणवत्ता में हैं, और विश्लेषण R फलन क्रुस्कल.परीक्षण के लिए प्रलेखन में साम्मिलित है। महीने के अनुसार ओजोन मूल्यों के बॉक्सप्लॉट चित्र में दिखाए गए हैं।

Ozone by month boxplots.svg

क्रुस्कल-वालिस परीक्षण में महत्वपूर्ण अंतर (p = 6.901e-06) मिलता है जो दर्शाता है कि ओजोन 5 महीनों के बीच भिन्न होता है।

kruskal.test(Ozone ~ Month, data = airquality)

	Kruskal-Wallis rank sum test

data:  Ozone by Month
Kruskal-Wallis chi-squared = 29.267, df = 4, p-value = 6.901e-06

यह निर्धारित करने के लिए कि कौन से महीने अलग-अलग हैं, इस प्रकार कई परिकल्पना परीक्षण के लिए बोनफेरोनी (या अन्य) सुधार के साथ, महीनों की प्रत्येक जोड़ी के लिए विलकॉक्सन परीक्षण का उपयोग करके पोस्ट-हॉक परीक्षण किया जा सकता है।

pairwise.wilcox.test(airquality$Ozone, airquality$Month, p.adjust.method = "bonferroni")


	Pairwise comparisons using Wilcoxon rank sum test 

data:  airquality$Ozone and airquality$Month 

  5      6      7      8     
6 1.0000 -      -      -     
7 0.0003 0.1414 -      -     
8 0.0012 0.2591 1.0000 -     
9 1.0000 1.0000 0.0074 0.0325

P value adjustment method: bonferroni

पोस्ट-हॉक परीक्षणों से संकेत मिलता है कि, कई परीक्षण के लिए बोनफेरोनी सुधार के बाद, निम्नलिखित अंतर महत्वपूर्ण हैं (समायोजित पी <0.05)।

  • माह 5 बनाम माह 7 और 8
  • माह 9 बनाम माह 7 और 8

यह भी देखें

संदर्भ

  1. 1.0 1.1 Kruskal–Wallis H Test using SPSS Statistics, Laerd Statistics
  2. Kruskal; Wallis (1952). "एक-मानदंड विचरण विश्लेषण में रैंकों का उपयोग". Journal of the American Statistical Association. 47 (260): 583–621. doi:10.1080/01621459.1952.10483441.
  3. Corder, Gregory W.; Foreman, Dale I. (2009). गैर-सांख्यिकीविदों के लिए गैरपारंपरिक सांख्यिकी. Hoboken: John Wiley & Sons. pp. 99–105. ISBN 9780470454619.
  4. Siegel; Castellan (1988). स्वभावजन्य विज्ञान के लिए नॉनपैरामीट्रिक आंकड़े (Second ed.). New York: McGraw–Hill. ISBN 0070573573.
  5. 5.0 5.1 Dunn, Olive Jean (1964). "रैंक योगों का उपयोग करके एकाधिक तुलना". Technometrics. 6 (3): 241–252. doi:10.2307/1266041.
  6. 6.0 6.1 Conover, W. Jay; Iman, Ronald L. (1979). "बहु-तुलना प्रक्रियाओं पर" (PDF) (Report). Los Alamos Scientific Laboratory. Retrieved 2016-10-28.
  7. Divine; Norton; Barón; Juarez-Colunga (2018). "The Wilcoxon–Mann–Whitney Procedure Fails as a Test of Medians". The American Statistician. doi:10.1080/00031305.2017.1305291.
  8. Hart (2001). "Mann-Whitney test is not just a test of medians: differences in spread can be important". BMJ. doi:10.1136/bmj.323.7309.391.
  9. Bruin (2006). "FAQ: Why is the Mann-Whitney significant when the medians are equal?". UCLA: Statistical Consulting Group.
  10. Spurrier, J. D. (2003). "On the null distribution of the Kruskal–Wallis statistic". Journal of Nonparametric Statistics. 15 (6): 685–691. doi:10.1080/10485250310001634719.
  11. Meyer; Seaman (April 2006). "Expanded tables of critical values for the Kruskal–Wallis H statistic". Paper presented at the annual meeting of the American Educational Research Association, San Francisco. Critical value tables and exact probabilities from Meyer and Seaman are available for download at http://faculty.virginia.edu/kruskal-wallis/ Archived 2018-10-17 at the Wayback Machine. A paper describing their work may also be found there.
  12. Won Choi, Jae Won Lee, Myung-Hoe Huh, and Seung-Ho Kang (2003). "An Algorithm for Computing the Exact Distribution of the Kruskal–Wallis Test". Communications in Statistics - Simulation and Computation (32, number 4): 1029–1040. doi:10.1081/SAC-120023876.{{cite journal}}: CS1 maint: multiple names: authors list (link)
  13. John M. Chambers, William S. Cleveland, Beat Kleiner, and Paul A. Tukey (1983). Graphical Methods for Data Analysis. Belmont, Calif: Wadsworth International Group, Duxbury Press. ISBN 053498052X.{{cite book}}: CS1 maint: multiple names: authors list (link)

अग्रिम पठन

बाहरी संबंध