मान-व्हिटनी यू परीक्षण

आँकड़ों में, मान-व्हिटनी यू परीक्षण (जिसे मान-व्हिटनी-विलकॉक्सन (MWW/MWU), विलकॉक्सन रैंक-सम टेस्ट या विलकॉक्सन-मान-व्हिटनी परीक्षण भी कहा जाता है) एक गैर पैरामीट्रिक सांख्यिकी सांख्यिकीय परिकल्पना परीक्षण है। अशक्त परिकल्पना कि, दो आबादी से यादृच्छिक रूप से चयनित मूल्यों X और Y के लिए, X की संभावना Y से अधिक होने की संभावना Y की संभावना के बराबर है 'X से बड़ा होना।

दो आश्रित नमूनों पर उपयोग किए जाने वाले गैर-पैरामीट्रिक परीक्षण साइन परीक्षण  और विलकॉक्सन साइन-रैंक टेस्ट हैं।

धारणाएं और परिकल्पनाओं का औपचारिक बयान
हालांकि हेनरी मान और व्हिटनी मान-व्हिटनी यू परीक्षण को वैकल्पिक परिकल्पना के साथ सतत संभाव्यता वितरण प्रतिक्रियाओं की धारणा के तहत विकसित किया गया है कि एक वितरण दूसरे की तुलना में स्टोचैस्टिक ऑर्डरिंग है, शून्य परिकल्पना और वैकल्पिक परिकल्पना तैयार करने के कई अन्य तरीके हैं जैसे मान-व्हिटनी यू परीक्षण एक वैध परीक्षण देगा। एक बहुत ही सामान्य सूत्रीकरण यह मान लेना है कि:


 * 1) दोनों समूहों के सभी अवलोकन एक दूसरे की सांख्यिकीय स्वतंत्रता हैं,
 * 2) प्रतिक्रियाएँ कम से कम क्रमसूचक माप हैं (अर्थात्, कम से कम यह कह सकते हैं कि किन्हीं दो प्रेक्षणों में से कौन अधिक है),
 * 3) शून्य परिकल्पना के तहत एच0, दोनों आबादी का वितरण समान है।
 * 4) वैकल्पिक परिकल्पना एच1 यह है कि वितरण समान नहीं हैं।

सामान्य सूत्रीकरण के तहत, परीक्षण केवल संगति (सांख्यिकी) # परीक्षण है जब निम्नलिखित एच के तहत होता है1:


 * 1) जनसंख्या X से अवलोकन की संभावना जनसंख्या Y से अवलोकन से अधिक है, Y से अवलोकन की संभावना X से अवलोकन से अधिक है; अर्थात।,  $P(X > Y) ≠ P(Y > X)$ या $P(X > Y) + 0.5 · P(X = Y) ≠ 0.5$.

उपरोक्त सामान्य सूत्रीकरण की तुलना में अधिक सख्त मान्यताओं के तहत, उदाहरण के लिए, यदि प्रतिक्रियाओं को निरंतर माना जाता है और विकल्प को स्थान परिवर्तन तक सीमित रखा जाता है, अर्थात, $F_{1}(x) = F_{2}(x + δ)$, हम एक महत्वपूर्ण मान-व्हिटनी यू परीक्षण की व्याख्या माध्यिका में अंतर दिखाने के रूप में कर सकते हैं। इस स्थान परिवर्तन की धारणा के तहत, हम मान-व्हिटनी यू परीक्षण की व्याख्या यह आकलन करने के लिए भी कर सकते हैं कि क्या हॉजेस-लेहमैन दो आबादी के बीच केंद्रीय प्रवृत्ति में अंतर का अनुमान शून्य से अलग है। इस दो-नमूना समस्या के लिए होजेस-लेहमैन का अनुमान पहले नमूने में एक अवलोकन और दूसरे नमूने में एक अवलोकन के बीच सभी संभावित अंतरों का औसत है।

अन्यथा, यदि दोनों नमूनों के वितरण के फैलाव और आकार दोनों अलग-अलग हैं, तो मान-व्हिटनी यू परीक्षण माध्यिका के परीक्षण में विफल रहता है। ऐसे उदाहरण दिखाना संभव है जहां मध्यिकाएं संख्यात्मक रूप से बराबर हों, जबकि परीक्षण एक छोटे पी-मान के साथ शून्य परिकल्पना को अस्वीकार करता है।  मान-व्हिटनी यू टेस्ट / विलकॉक्सन रैंक-सम टेस्ट विलकॉक्सन साइन-रैंक टेस्ट के समान नहीं है | मान-व्हिटनी यू परीक्षण स्वतंत्र नमूनों पर लागू होता है। विलकॉक्सन हस्ताक्षरित-रैंक परीक्षण मिलान या आश्रित नमूनों पर लागू होता है।

यू आँकड़ा
होने देना $$X_1,\ldots, X_n$$ एक स्वतंत्र और समान रूप से वितरित यादृच्छिक चर |i.i.d. से नमूना $$X$$, और $$Y_1,\ldots, Y_m$$ एक आई.आई.डी. से नमूना $$Y$$, और दोनों नमूने एक दूसरे से स्वतंत्र हैं। इसी मान-व्हिटनी यू सांख्यिकी को इस प्रकार परिभाषित किया गया है:


 * $$U = \sum_{i=1}^n \sum_{j=1}^m S(X_i,Y_j),$$

साथ
 * $$S(X,Y) = \begin{cases}

1, &\text{if } X > Y, \\ \tfrac{1}{2}, &\text{if } X = Y, \\ 0, &\text{if } X < Y. \end{cases}$$

आरओसी वक्रों के लिए वक्र-अंडर-वक्र (एयूसी) आँकड़ा
यू आंकड़ा 'रिसीवर ऑपरेटिंग विशेषता वक्र के तहत क्षेत्र' (रिसीवर ऑपरेटिंग विशेषता # वक्र के तहत क्षेत्र) के बराबर है जिसे आसानी से गणना की जा सकती है।
 * $$\mathrm{AUC}_1 = {U_1 \over n_1n_2}$$

ध्यान दें कि यह उपरोक्त अनुभाग से सामान्य भाषा प्रभाव आकार के समान परिभाषा है। यानी: संभावना है कि एक क्लासिफायरियर यादृच्छिक रूप से चुने गए नकारात्मक से अधिक यादृच्छिक रूप से चुने गए सकारात्मक उदाहरण को रैंक करेगा (मान लें कि 'सकारात्मक' रैंक 'नकारात्मक' से अधिक है)। इसके संभाव्य रूप के कारण, U सांख्यिकी को दो से अधिक वर्गों के लिए क्लासिफायर की पृथक्करण शक्ति के माप के लिए सामान्यीकृत किया जा सकता है:
 * $$M = {1 \over c(c-1)} \sum \mathrm{AUC}_{k,\ell}$$

जहाँ c वर्गों की संख्या है, और Rk,ℓ एयूसी की अवधिk,ℓ वर्ग k और ℓ से संबंधित वस्तुओं की केवल रैंकिंग पर विचार करता है (अर्थात, अन्य सभी वर्गों से संबंधित वस्तुओं को अनदेखा कर दिया जाता है) क्लासिफायर के वर्ग k से संबंधित उन वस्तुओं की संभावना के अनुमान के अनुसार। एयूसीk,k हमेशा शून्य रहेगा लेकिन, दो-वर्ग के मामले के विपरीत, आम तौर पर $AUC_{k,ℓ} ≠ AUC_{ℓ,k}$, यही कारण है कि एयूसी के औसत का उपयोग करके एम माप सभी (के, ℓ) जोड़े पर योग करता हैk,ℓ और एयूसीℓ,k.

गणना
परीक्षण में एक आंकड़े की गणना शामिल है, जिसे आमतौर पर यू कहा जाता है, जिसका वितरण शून्य परिकल्पना के तहत जाना जाता है। छोटे नमूनों के मामले में, वितरण सारणीबद्ध है, लेकिन ~20 से ऊपर के नमूने के आकार के लिए, सामान्य वितरण का उपयोग करके सन्निकटन काफी अच्छा है। कुछ पुस्तकें यू के समतुल्य आँकड़ों को सारणीबद्ध करती हैं, जैसे कि यू के बजाय नमूनों में से एक में रैंक (सेट सिद्धांत) का योग।

मान-व्हिटनी यू परीक्षण सांख्यिकीय पैकेजों की सबसे आधुनिक सूची में शामिल है। यह आसानी से हाथ से भी गणना की जाती है, खासकर छोटे नमूनों के लिए। इसे करने के दो तरीके हैं।

'पहला तरीका:'

प्रेक्षणों के दो छोटे सेटों की तुलना करने के लिए, एक सीधा तरीका त्वरित है, और यू स्टेटिस्टिक के अर्थ में अंतर्दृष्टि देता है, जो सभी जोड़ीदार प्रतियोगिताओं में से जीत की संख्या से मेल खाता है (नीचे दिए गए उदाहरणों के तहत कछुआ और खरगोश का उदाहरण देखें)। एक सेट में प्रत्येक अवलोकन के लिए, दूसरे सेट में किसी भी अवलोकन पर यह पहला मान जीतने की संख्या की गणना करें (यदि यह पहला बड़ा है तो दूसरा मान हार जाता है)। किसी भी टाई के लिए 0.5 की गिनती करें। जीत और टाई का योग U है (अर्थात: $$U_1$$) पहले सेट के लिए। दूसरे सेट के लिए U विलोम है (अर्थात: $$U_2$$).

विधि दो:

बड़े नमूनों के लिए:
 * 1) सभी अवलोकनों के लिए संख्यात्मक रैंक असाइन करें (दोनों समूहों से अवलोकनों को एक सेट में रखें), सबसे छोटे मान के लिए 1 से शुरू करें। जहां बंधे हुए मूल्यों के समूह हैं, असमायोजित रैंकिंग के मध्य बिंदु के बराबर एक रैंक असाइन करें (उदाहरण के लिए, की रैंक $(3, 5, 5, 5, 5, 8)$ हैं $(1, 3.5, 3.5, 3.5, 3.5, 6)$, जहां असमायोजित रैंक होगी $(1, 2, 3, 4, 5, 6)$).
 * अब, नमूना 1 से प्राप्त टिप्पणियों के लिए रैंक जोड़ें। नमूना 2 में रैंकों का योग अब निर्धारित किया गया है, क्योंकि सभी रैंकों का योग बराबर है $N(N + 1)/2$ जहां N प्रेक्षणों की कुल संख्या है।
 * 1) यू तब दिया जाता है:
 * $$U_1=R_1 - {n_1(n_1+1) \over 2} \,\!$$
 * जहां एन1 नमूना 1 के लिए नमूना आकार है, और आर1 नमूना 1 में रैंकों का योग है।


 * ध्यान दें कि इससे कोई फर्क नहीं पड़ता कि दो नमूनों में से कौन सा नमूना माना जाता है 1. U के लिए एक समान रूप से मान्य सूत्र है


 * $$U_2= R_2 - {n_2(n_2+1) \over 2} \,\!$$
 * U का छोटा मान1 और आप2 महत्व सारणी से परामर्श करते समय उपयोग किया जाता है। दो मानों का योग द्वारा दिया गया है
 * $$U_1 + U_2 = R_1 - {n_1(n_1+1) \over 2} + R_2 - {n_2(n_2+1) \over 2}. \,\!$$
 * जानते हुए भी $R_{1} + R_{2} = N(N + 1)/2$ और $N = n_{1} + n_{2}$, और कुछ बीजगणित करने पर, हम पाते हैं कि योग है

गुण
यू का अधिकतम मूल्य दो नमूनों के लिए नमूना आकार का उत्पाद है (यानी: $$U_i = n_1 n_2$$). ऐसी स्थिति में, अन्य U 0 होगा।

गणना विधियों का उदाहरण
मान लीजिए कि ईसप अपने द कछुआ और खरगोश से असंतुष्ट है जिसमें एक कछुआ एक दौड़ में एक खरगोश को हरा पाया था, और यह पता लगाने के लिए कि क्या परिणाम सामान्य रूप से कछुओं और खरगोशों तक बढ़ाए जा सकते हैं, एक महत्व परीक्षण करने का फैसला करता है। वह 6 कछुओं और 6 खरगोशों का एक नमूना इकट्ठा करता है, और उन सभी को एक ही बार में अपनी दौड़ में लगा देता है। जिस क्रम में वे फिनिशिंग पोस्ट तक पहुँचते हैं (उनका रैंक ऑर्डर, फिनिश लाइन को पार करने वाली पहली से आखिरी तक) इस प्रकार है, एक कछुए के लिए टी और एक खरगोश के लिए एच लिखना:
 * टी एच एच एच एच एच टी टी टी टी टी टी एच

यू का मान क्या है?
 * प्रत्यक्ष विधि का उपयोग करते हुए, हम प्रत्येक कछुए को बारी-बारी से लेते हैं, और 6, 1, 1, 1, 1, 1 प्राप्त करने वाले खरगोशों की संख्या की गणना करते हैं, जिसका अर्थ है कि $U_{1} + U_{2} = n_{1}n_{2}$. वैकल्पिक रूप से, हम प्रत्येक खरगोश को बारी-बारी से ले सकते हैं, और यह गिन सकते हैं कि यह कितने कछुओं को हराता है। इस मामले में, हमें 5, 5, 5, 5, 5, 0, इसलिए मिलता है $U_{T} = 11$. ध्यान दें कि इन दो मानों का योग के लिए $U_{H} = 25$, जो है $U = 36$.
 * अप्रत्यक्ष विधि का उपयोग करना:
 * जानवरों को पाठ्यक्रम पूरा करने में लगने वाले समय तक रैंक दें, इसलिए पहले जानवर को होम रैंक 12, दूसरे रैंक को 11 और इसी तरह आगे दें।
 * कछुओं द्वारा प्राप्त रैंकों का योग है $6×6$.
 * इसलिए $12 + 6 + 5 + 4 + 3 + 2 = 32$ (विधि एक के समान)।
 * खरगोशों द्वारा प्राप्त रैंकों का योग है $U_{T} = 32 − (6×7)/2 = 32 − 21 = 11$, के लिए अग्रणी $11 + 10 + 9 + 8 + 7 + 1 = 46$.

<!--

परिणामों का उदाहरण विवरण
मान-व्हिटनी यू परीक्षण के परिणामों की रिपोर्ट करते समय, यह बताना महत्वपूर्ण है: व्यवहार में इस जानकारी में से कुछ पहले से ही आपूर्ति की जा सकती है और सामान्य ज्ञान का उपयोग यह तय करने में किया जाना चाहिए कि इसे दोहराना है या नहीं। एक विशिष्ट रिपोर्ट चल सकती है,
 * दो समूहों की केंद्रीय प्रवृत्तियों का एक उपाय (माध्यम या मध्यिका; चूंकि मान-व्हिटनी यू परीक्षण एक क्रमसूचक परीक्षण है, आमतौर पर मध्यस्थों की सिफारिश की जाती है)
 * यू का मान (शायद प्रभाव आकार के कुछ माप के साथ, जैसे #सामान्य भाषा प्रभाव आकार या #रैंक-द्विक्रमिक सहसंबंध|रैंक-द्विक्रमी सहसंबंध)।
 * नमूना आकार
 * महत्व स्तर।
 * समूह ई और सी में औसत विलंबता 153 और 247 एमएस थे; दो समूहों में वितरण महत्वपूर्ण रूप से भिन्न थे (मान-व्हिटनी $U_{H} = 46 − 21 = 25$, $U = 10.5$, $n_{1} = n_{2} = 8$ दो पूंछ वाला)।

एक बयान जो परीक्षण की सांख्यिकीय स्थिति के साथ पूर्ण न्याय करता है, चल सकता है,
 * विलकॉक्सन-मैन-व्हिटनी दो-नमूना रैंक-सम परीक्षण का उपयोग करके दो उपचारों के परिणामों की तुलना की गई। उपचार प्रभाव (उपचार के बीच अंतर) को हॉजेस-लेहमैन (एचएल) अनुमानक का उपयोग करके निर्धारित किया गया था, जो विलकॉक्सन परीक्षण के अनुरूप है। यह अनुमानक (एचएलΔ) समूह बी में एक विषय और समूह ए में एक विषय के बीच परिणामों में सभी संभावित अंतरों का माध्यिका है। जनसंख्या B से यादृच्छिक रूप से चुने गए विषय का जनसंख्या A से यादृच्छिक रूप से चुने गए विषय की तुलना में अधिक वजन है। औसत [चतुर्थक] उपचार A और B पर विषयों के लिए क्रमशः 147 [121, 177] और 151 [130, 180] किलोग्राम हैं। उपचार A ने वजन घटाया HLΔ = 5 किग्रा (0.95 सीएल [2, 9] किग्रा, $P < 0.05$, $2P = 0.02$).

हालाँकि किसी दस्तावेज़ में इतनी व्यापक रिपोर्ट मिलना दुर्लभ होगा जिसका प्रमुख विषय सांख्यिकीय अनुमान नहीं था।

सामान्य सन्निकटन और टाई सुधार
बड़े नमूनों के लिए, यू लगभग सामान्य वितरण है। उस स्थिति में, मानक स्कोर
 * $$z = \frac{ U - m_U }{ \sigma_U }, \, $$

जहां एमU और पीU यू का औसत और मानक विचलन है, लगभग एक मानक सामान्य विचलन है जिसका महत्व सामान्य वितरण की तालिकाओं में जांचा जा सकता है। एमU और पीU द्वारा दिए गए हैं


 * $$m_U = \frac{n_1 n_2}{2}, \, $$ और


 * $$\sigma_U=\sqrt{n_1 n_2 (n_1 + n_2+1) \over 12}. \, $$

बंधे हुए रैंकों की उपस्थिति में मानक विचलन का सूत्र अधिक जटिल है। यदि रैंकों में संबंध हैं, तो σ को निम्नानुसार समायोजित किया जाना चाहिए:


 * $$ \sigma_\text{ties}=\sqrt{ {n_1 n_2 (n_1 + n_2 +1) \over 12 } - { n_1 n_2 \sum_{k=1}^K (t_k^3 - t_k) \over 12 n(n-1) } },\, $$

जहां बाईं ओर केवल विचरण है और दाईं ओर संबंधों के लिए समायोजन है, टीk kth रैंक के लिए संबंधों की संख्या है, और K संबंधों के साथ अद्वितीय रैंकों की कुल संख्या है।

के साथ एक अधिक कम्प्यूटेशनल-कुशल रूप $ρ = 0.58$ तथ्य निकाला गया है


 * $$ \sigma_\text{ties}=\sqrt{ {n_1 n_2 \over 12 } \left( (n+1) - { \sum_{k=1}^K (t_k^3 - t_k) \over n(n-1)} \right)},$$

कहाँ $n_{1}n_{2}/12$.

यदि टाई की संख्या कम है (और विशेष रूप से यदि कोई बड़ा टाई बैंड नहीं है) तो हाथ से गणना करते समय टाई को अनदेखा किया जा सकता है। कंप्यूटर सांख्यिकीय पैकेज नियमित रूप से सही ढंग से समायोजित सूत्र का उपयोग करेंगे।

ध्यान दें कि जब से $n = n_{1} + n_{2}$, मतलब $U_{1} + U_{2} = n_{1}n_{2}$ का उपयोग सामान्य सन्निकटन में U के दो मानों का माध्य है। इसलिए, परिकलित z-सांख्यिकीय का निरपेक्ष मान वही होगा जो U का उपयोग किया जाता है।

प्रभाव आकार
यह वैज्ञानिकों के लिए व्यापक रूप से अनुशंसित अभ्यास है कि वे अनुमान परीक्षण के लिए प्रभाव आकार की रिपोर्ट करें।

सभी जोड़ियों में से समरूपता का अनुपात
निम्नलिखित तीन उपाय समकक्ष हैं।

सामान्य भाषा प्रभाव आकार
मान-व्हिटनी यू परीक्षण के लिए प्रभाव आकार की रिपोर्ट करने का एक तरीका सामान्य भाषा प्रभाव आकार f के साथ है। एक नमूना आंकड़े के रूप में, सामान्य भाषा प्रभाव आकार की गणना दो समूहों के बीच सभी संभावित जोड़े बनाकर की जाती है, फिर एक दिशा का समर्थन करने वाले जोड़े के अनुपात का पता लगाया जाता है (कहते हैं कि समूह 1 के आइटम समूह 2 के आइटम से बड़े हैं)। उदाहरण के लिए, दस खरगोशों और दस कछुओं के नमूने के साथ एक अध्ययन में, आदेशित जोड़े की कुल संख्या दस गुना दस या 100 जोड़ी खरगोश और कछुआ है। मान लीजिए कि परिणाम दिखाते हैं कि 100 नमूना जोड़ियों में से 90 में खरगोश कछुए की तुलना में तेजी से दौड़ा; उस स्थिति में, नमूना सामान्य भाषा प्रभाव आकार 90% है। यह नमूना मूल्य जनसंख्या मूल्य का एक निष्पक्ष अनुमानक है, इसलिए नमूना बताता है कि जनसंख्या में सामान्य भाषा प्रभाव आकार का सबसे अच्छा अनुमान 90% है। एफ और मान-व्हिटनी यू के बीच संबंध (विशेष रूप से $$U_1$$) इस प्रकार है:


 * $$ f = {U_1 \over n_1 n_2} \,$$

यह आरओसी कर्व्स के लिए #एरिया-अंडर-कर्व (एयूसी) आंकड़े के समान है। आरओसी कर्व के लिए कर्व के नीचे का क्षेत्र (एयूसी) है।

ρ आँकड़ा
एक आँकड़ा जिसे ρ कहा जाता है जो यू से रैखिक रूप से संबंधित है और वर्गीकरण के अध्ययन में व्यापक रूप से उपयोग किया जाता है (अवधारणाओं से युक्त भेदभाव सीखना), और अन्यत्र, दिए गए नमूना आकारों के लिए यू को इसके अधिकतम मूल्य से विभाजित करके गणना की जाती है, जो कि सरल है $n_{1}n_{2}/2$. ρ इस प्रकार दो वितरणों के बीच ओवरलैप का एक गैर-पैरामीट्रिक माप है; यह 0 और 1 के बीच मान ले सकता है, और यह एक अनुमान है $n_{1}×n_{2}$, जहां X और Y दो वितरणों से बेतरतीब ढंग से चुने गए अवलोकन हैं। दोनों चरम मान वितरण के पूर्ण पृथक्करण का प्रतिनिधित्व करते हैं, जबकि 0.5 का ρ पूर्ण ओवरलैप का प्रतिनिधित्व करता है। ρ आँकड़ों की उपयोगिता ऊपर उपयोग किए गए विषम उदाहरण के मामले में देखी जा सकती है, जहाँ दो वितरण जो मान-व्हिटनी यू परीक्षण पर काफी भिन्न थे, फिर भी लगभग समान माध्यक थे: इस मामले में ρ मान लगभग 0.723 के पक्ष में है खरगोशों का, इस तथ्य को सही ढंग से दर्शाता है कि भले ही मध्य कछुआ मध्य खरगोश को हरा देता है, सामूहिक रूप से कछुओं की तुलना में सामूहिक रूप से खरगोशों ने बेहतर किया।

रैंक-द्विक्रमिक सहसंबंध
मान-व्हिटनी यू परीक्षण के लिए प्रभाव आकार की रिपोर्ट करने का एक तरीका रैंक सहसंबंध के एक उपाय के साथ है जिसे रैंक-द्विक्रमिक सहसंबंध के रूप में जाना जाता है। एडवर्ड क्योरटन ने माप को पेश किया और नाम दिया। अन्य सहसंबंधी उपायों की तरह, रैंक-द्विक्रमिक सहसंबंध शून्य से एक से अधिक एक तक हो सकता है, शून्य के मान के साथ कोई संबंध नहीं दर्शाता है।

सामान्य भाषा प्रभाव आकार से रैंक-द्विक्रमिक सहसंबंध की गणना करने के लिए एक साधारण अंतर सूत्र है: सहसंबंध, परिकल्पना के अनुकूल जोड़े के अनुपात के बीच का अंतर है (एफ) घटा इसका पूरक (यानी: वह अनुपात जो प्रतिकूल है (यू) )). यह साधारण अंतर सूत्र प्रत्येक समूह के सामान्य भाषा प्रभाव आकार का अंतर है, और इस प्रकार है:


 * $$r = f - u $$

उदाहरण के लिए, उस उदाहरण पर विचार करें जहां 100 में से 90 जोड़ों में खरगोश कछुओं से तेज दौड़ते हैं। सामान्य भाषा प्रभाव का आकार 90% है, इसलिए रैंक-द्विक्रमिक सहसंबंध 90% माइनस 10% है, और रैंक-द्विक्रमिक सहसंबंध$P(Y > X) + 0.5 P(Y = X)$.

मान-व्हिटनी यू (या तो रैंक-द्विक्रमिक) के लिए एक वैकल्पिक सूत्र का उपयोग इसकी गणना करने के लिए किया जा सकता है $$U_1$$ या $$U_2$$) और प्रत्येक समूह का नमूना आकार:
 * $$ r = f - (1 - f) = 2 f - 1 = {2U_1 \over n_1 n_2} - 1 = 1 - {2U_2 \over n_1 n_2} $$

यह सूत्र तब उपयोगी होता है जब डेटा उपलब्ध नहीं होता है, लेकिन जब कोई प्रकाशित रिपोर्ट होती है, क्योंकि यू और नमूना आकार नियमित रूप से रिपोर्ट किए जाते हैं। ऊपर दिए गए उदाहरण का उपयोग करते हुए 90 जोड़े जो खरगोशों का पक्ष लेते हैं और 10 जोड़े जो कछुए का पक्ष लेते हैं, यू2 दोनों में से छोटा है, इसलिए $r = 0.80$. यह सूत्र तब देता है $U_{2} = 10$, जो उपरोक्त सरल अंतर सूत्र के समान परिणाम है।

विद्यार्थी के t- परीक्षण से तुलना
मान-व्हिटनी यू परीक्षण एक शून्य परिकल्पना का परीक्षण करता है कि एक समूह से एक यादृच्छिक रूप से निकाले गए अवलोकन की संभाव्यता वितरण दूसरे समूह से एक यादृच्छिक रूप से तैयार किए गए अवलोकन की संभावना वितरण के समान है, जो कि उन वितरणों के बराबर नहीं है (देखें) मान-व्हिटनी यू परीक्षण#अनुमान और परिकल्पना का औपचारिक विवरण)। इसके विपरीत, एक टी-परीक्षण असमान साधनों के विकल्प के विरुद्ध दो समूहों में समान साधनों की शून्य परिकल्पना का परीक्षण करता है। इसलिए, विशेष मामलों को छोड़कर, मान-व्हिटनी यू परीक्षण और टी-परीक्षण समान परिकल्पनाओं का परीक्षण नहीं करते हैं और इसकी तुलना इस बात को ध्यान में रखकर की जानी चाहिए। साधारण डेटा: मान-व्हिटनी यू परीक्षण टी-टेस्ट के लिए बेहतर होता है जब डेटा माप का स्तर # ऑर्डिनल स्केल होता है लेकिन अंतराल स्केल नहीं किया जाता है, इस मामले में पैमाने के आसन्न मूल्यों के बीच की दूरी को स्थिर नहीं माना जा सकता है। मजबूती: जैसा कि यह रैंकों के योग की तुलना करता है, मान-व्हिटनी यू परीक्षण की टी-परीक्षण की तुलना में ग़ैर की उपस्थिति के कारण नकली रूप से महत्व दर्शाने की कम संभावना है। हालांकि, मान-व्हिटनी यू परीक्षण में खराब टाइप I और टाइप II त्रुटि नियंत्रण हो सकता है, जब डेटा विषमलैंगिक और गैर-सामान्य दोनों होते हैं। दक्षता: जब सामान्यता बनी रहती है, मान-व्हिटनी यू परीक्षण में 3/$\pi$ या लगभग 0.95 जब t-परीक्षण की तुलना में। वितरण के लिए सामान्य से काफी दूर और पर्याप्त रूप से बड़े नमूना आकार के लिए, मान-व्हिटनी यू परीक्षण टी से काफी अधिक कुशल है। दक्षता में यह तुलना, हालांकि, सावधानी के साथ व्याख्या की जानी चाहिए, क्योंकि मान-व्हिटनी और टी-परीक्षण समान मात्राओं का परीक्षण नहीं करते हैं। यदि, उदाहरण के लिए, समूह के साधनों का अंतर प्राथमिक हित का है, मान-व्हिटनी एक उपयुक्त परीक्षण नहीं है। मान-व्हिटनी यू परीक्षण डेटा की रैंकिंग पर एक साधारण पैरामीट्रिक दो-नमूना टी परीक्षण | टी-परीक्षण करने के समान परिणाम देगा।

विभिन्न वितरण
मान-व्हिटनी यू परीक्षण अशक्त परिकल्पना के परीक्षण के लिए मान्य नहीं है $$P(Y>X)+0.5P(Y=X)= 0.5$$ वैकल्पिक परिकल्पना के खिलाफ $$P(Y>X)+0.5P(Y=X)\neq 0.5$$), यह मानने के बिना कि वितरण अशक्त परिकल्पना के तहत समान हैं (अर्थात, मानते हुए $$F_1=F_2$$). उन परिकल्पनाओं के बीच परीक्षण करने के लिए बेहतर परीक्षण उपलब्ध हैं। उनमें से हैं ब्रूनर_मुंज़ेल_टेस्ट|ब्रूनर-मुंज़ेल और फ़्लिग्नर-पोलीसेलो परीक्षण। विशेष रूप से, अधिक सामान्य अशक्त परिकल्पना के तहत $$P(Y>X)+0.5P(Y=X)= 0.5$$, मान-व्हिटनी यू परीक्षण में बड़े नमूनों में भी टाइप I त्रुटि दर में वृद्धि हो सकती है (विशेष रूप से यदि दो आबादी के प्रसरण असमान हैं और नमूना आकार अलग हैं), एक समस्या जो बेहतर विकल्प हल करती है। नतीजतन, यह सुझाव दिया गया है कि विकल्पों में से एक का उपयोग करें (विशेष रूप से ब्रूनर-मुंज़ेल परीक्षण) यदि यह नहीं माना जा सकता है कि वितरण अशक्त परिकल्पना के तहत समान हैं।

विकल्प
यदि कोई सरल शिफ्ट व्याख्या चाहता है, तो मान-व्हिटनी यू परीक्षण का उपयोग तब नहीं किया जाना चाहिए जब दो नमूनों का वितरण बहुत भिन्न हो, क्योंकि यह महत्वपूर्ण परिणामों की गलत व्याख्या दे सकता है। उस स्थिति में, वेल्च का टी-टेस्ट का टी-टेस्ट संस्करण अधिक विश्वसनीय परिणाम दे सकता है।

इसी तरह, कुछ लेखक (जैसे, Conover) डेटा को रैंकों में बदलने का सुझाव दें (यदि वे पहले से ही रैंक नहीं हैं) और फिर रूपांतरित डेटा पर टी-टेस्ट का प्रदर्शन करते हैं, टी-टेस्ट का संस्करण इस पर निर्भर करता है कि जनसंख्या भिन्न होने का संदेह है या नहीं। रैंक रूपांतरण भिन्नताओं को संरक्षित नहीं करते हैं, लेकिन रैंक परिवर्तनों के बाद नमूनों से भिन्नों की पुन: गणना की जाती है।

ब्राउन-फोर्सिथ परीक्षण को एफ-परीक्षण के लिए एक उपयुक्त गैर-पैरामीट्रिक समकक्ष के रूप में सुझाया गया है। समान प्रसरण के लिए एफ-परीक्षण।

एक अधिक शक्तिशाली परीक्षण ब्रूनर_मुंज़ेल_टेस्ट|ब्रूनर-मुंज़ेल परीक्षण है, जो विनिमेयता की धारणा के उल्लंघन के मामले में मान-व्हिटनी यू परीक्षण से बेहतर प्रदर्शन करता है। मान-व्हिटनी यू टेस्ट आनुपातिक ऑड्स मॉडल का एक विशेष मामला है, जो सहसंयोजक-समायोजन की अनुमति देता है। कोलमोगोरोव-स्मिर्नोव परीक्षण भी देखें।

केंडल के ताऊ
मान-व्हिटनी यू परीक्षण कई अन्य गैर पैरामीट्रिक सांख्यिकीय प्रक्रियाओं से संबंधित है। उदाहरण के लिए, यह केंडल ताऊ रैंक सहसंबंध गुणांक के बराबर है | केंडल का ताऊ सहसंबंध गुणांक यदि एक चर द्विआधारी है (अर्थात, यह केवल दो मान ले सकता है)।

सॉफ्टवेयर कार्यान्वयन
कई सॉफ्टवेयर पैकेजों में, मान-व्हिटनी यू परीक्षण (उचित विकल्पों के विरुद्ध समान वितरण की परिकल्पना) को खराब तरीके से प्रलेखित किया गया है। कुछ पैकेज गलत तरीके से संबंधों का इलाज करते हैं या स्पर्शोन्मुख तकनीकों (जैसे, निरंतरता के लिए सुधार) का दस्तावेजीकरण करने में विफल रहते हैं। 2000 की समीक्षा में निम्नलिखित में से कुछ पैकेजों पर चर्चा की गई:
 * MATLAB के पास अपने सांख्यिकी टूलबॉक्स में रैंकसम है।
 * R (प्रोग्रामिंग लैंग्वेज) का सांख्यिकी आधार-पैकेज परीक्षण को लागू करता है wilcox.test इसके आँकड़े पैकेज में।
 * आर पैकेज wilcoxonZ विलकॉक्सन दो-नमूना, युग्मित, या एक-नमूना परीक्षण के लिए z आँकड़ा की गणना करेगा।
 * SAS (सॉफ्टवेयर) अपनी PROC NPAR1WAY प्रक्रिया में परीक्षण को लागू करता है।
 * पायथन (प्रोग्रामिंग भाषा) में SciPy द्वारा प्रदान किए गए इस परीक्षण का कार्यान्वयन है
 * सिग्मास्टैट (एसपीएसएस इंक, शिकागो, आईएल)
 * SYSTAT (सांख्यिकी) (SPSS Inc., शिकागो, IL)
 * जावा (प्रोग्रामिंग भाषा) में अपाचे कॉमन्स द्वारा प्रदान किए गए इस परीक्षण का कार्यान्वयन है
 * जूलिया (प्रोग्रामिंग भाषा) के पास कई पैकेजों के माध्यम से इस परीक्षण का कार्यान्वयन है। पैकेज HypothesisTests.jl में, यह pvalue(MannWhitneyUTest(X, Y)) के रूप में पाया जाता है
 * जेएमपी (सांख्यिकीय सॉफ्टवेयर) (एसएएस इंस्टीट्यूट इंक, कैरी, एनसी)
 * एस प्लस (मैथसॉफ्ट, इंक।, सिएटल, डब्ल्यूए)
 * आंकड़े (स्टेटसॉफ्ट, इंक।, तुलसा, ओके)
 * सपना देखना (यूनिस्टैट लिमिटेड, लंदन)
 * एसपीएसएस (एसपीएसएस इंक, शिकागो)
 * आँकड़े प्रत्यक्ष (स्टैट्सडायरेक्ट लिमिटेड, मैनचेस्टर, यूके) सभी सामान्य संस्करण लागू करता है।
 * था (स्टाटा कॉर्पोरेशन, कॉलेज स्टेशन, TX) अपने रैंकसम कमांड में परीक्षण को लागू करता है।
 * स्टेटएक्सएक्ट (साइटेल सॉफ्टवेयर कॉर्पोरेशन, कैम्ब्रिज, मैसाचुसेट्स)
 * PSPP अपने WILCOXON फंक्शन में परीक्षण को लागू करता है।
 * KNIME अपने Wilcoxon-Mann में परीक्षण लागू करता है। -व्हिटनी टेस्ट नोड।

इतिहास
आँकड़ा 1914 के एक लेख में दिखाई दिया जर्मन गुस्ताव ड्यूक्लर द्वारा (विचरण में लापता शब्द के साथ)।

1945 में एक एकल पत्र में, फ्रैंक विलकॉक्सन ने प्रस्तावित किया था एक-नमूना हस्ताक्षरित रैंक और दो-नमूना रैंक योग परीक्षण, इसके पूरक विकल्प के खिलाफ एक बिंदु शून्य-परिकल्पना के साथ महत्व के परीक्षण में (यानी, बराबर बनाम बराबर नहीं)। हालाँकि, उन्होंने उस पेपर में समान-नमूना आकार के मामले के लिए केवल कुछ बिंदुओं को सारणीबद्ध किया (हालांकि बाद के एक पेपर में उन्होंने बड़ी टेबल दी)।

आँकड़ों का गहन विश्लेषण, जिसमें आठ या उससे कम के नमूने के आकार के लिए मनमाना नमूना आकार और तालिकाओं के लिए पूंछ की संभावनाओं की गणना की अनुमति देने वाली पुनरावृत्ति शामिल थी, हेनरी मान और उनके छात्र द्वारा लेख में दिखाई दिया। 1947 में डोनाल्ड रैनसम व्हिटनी। इस लेख में वैकल्पिक परिकल्पनाओं पर चर्चा की गई है, जिसमें एक स्टोकेस्टिक ऑर्डरिंग शामिल है (जहां संचयी वितरण कार्य बिंदुवार असमानता को संतुष्ट करते हैं $r = 1 – (2×10) / (10×10) = 0.80$). इस पेपर ने पहले चार क्षणों की भी गणना की और अशक्त परिकल्पना के तहत सांख्यिकी की सीमित सामान्यता को स्थापित किया, ताकि यह स्थापित हो सके कि यह असमान रूप से वितरण-मुक्त है।

यह भी देखें

 * लेपेज परीक्षण
 * कुकोनी परीक्षण
 * कोलमोगोरोव-स्मिर्नोव परीक्षण
 * विलकॉक्सन साइन-रैंक टेस्ट
 * क्रुस्कल-वालिस विचरण का एकतरफा विश्लेषण
 * ब्रूनर-मुंजेल परीक्षण
 * आनुपातिक बाधाओं मॉडल

बाहरी संबंध

 * Table of critical values of U (pdf)
 * Interactive calculator for U and its significance
 * Brief guide by experimental psychologist Karl L. Weunsch – Nonparametric effect size estimators (Copyright 2015 by Karl L. Weunsch)