मान-व्हिटनी यू परीक्षण

आँकड़ों में, मान-व्हिटनी U परीक्षण (जिसे मान-व्हिटनी-विलकॉक्सन (एमडब्ल्यूडब्ल्यू/एमडब्ल्यूयू), विल्कोक्सन क्रम-योग परीक्षण या विल्कोक्सन-मान-व्हिटनी परीक्षण भी कहा जाता है) शून्य परिकल्पना का एक अप्राचली सांख्यिकी परीक्षण है। जो यादृच्छिक रूप से, दो जनों से चयनित मान X और Y, X के Y से अधिक होने की संभावना, Y के X से अधिक होने की संभावना के बराबर है।

दो आश्रित प्रतिदर्शो पर उपयोग किए जाने वाले अप्राचली परीक्षण चिह्न परीक्षण और विल्कोक्सन चिह्न-क्रम परीक्षण हैं।

धारणाएं और परिकल्पनाओं का औपचारिक विवरण
यद्यपि मान और व्हिटनी ने वैकल्पिक परिकल्पना के साथ निरंतर प्रतिक्रियाओं की धारणा के अंतर्गत मान-व्हिटनी U परीक्षण विकसित किया है कि एक वितरण दूसरे की तुलना में स्टोकेस्टिक रूप से अधिक है, शून्य परिकल्पना और वैकल्पिक परिकल्पना तैयार करने के कई अन्य तरीके हैं जैसे मान-व्हिटनी U परीक्षण एक वैध परीक्षण देगा।

एक बहुत ही सामान्य सूत्रीकरण यह मान लेना है कि:


 * 1) दोनों समूहों के सभी अवलोकन एक दूसरे से स्वतंत्र हैं,
 * 2) प्रतिक्रियाएँ कम-से-कम क्रमिक हैं (अर्थात्, कम-से-कम यह कह सकते हैं कि किन्हीं दो प्रेक्षणों में से कौन अधिक है),
 * 3) शून्य परिकल्पना के अंतर्गत H0, दोनों जनों का वितरण समान है।
 * 4) वैकल्पिक परिकल्पना H1 यह है कि वितरण समान नहीं हैं।

सामान्य सूत्रीकरण के अंतर्गत, परीक्षण केवल तभी सुसंगत होता है जब H1 के अंतर्गत निम्नलिखित होता है:


 * 1) जनसंख्या X के किसी अवलोकन की जनसंख्या Y के अवलोकन से अधिक होने की संभावना Y के किसी अवलोकन की जनसंख्या; अर्थात।,  $P(X > Y) ≠ P(Y > X)$ या $P(X > Y) + 0.5 · P(X = Y) ≠ 0.5$ हैं।
 * 2) उपरोक्त सामान्य सूत्रीकरण की तुलना में अधिक पूर्णतः मान्यताओं के अंतर्गत, उदाहरण के लिए, यदि प्रतिक्रियाओं को निरंतर माना जाता है और विकल्प को स्थान परिवर्तन तक सीमित रखा जाता है, अर्थात, $F_{1}(x) = F_{2}(x + δ)$, तो हम एक महत्वपूर्ण व्याख्या कर सकते हैं मान-व्हिटनी U परीक्षण मध्यस्थों में अंतर दर्शाता है। इस स्थान परिवर्तन की धारणा के अंतर्गत, हम मान-व्हिटनी U परीक्षण की व्याख्या यह आकलन करने के लिए भी कर सकते हैं कि क्या दो जनों के मध्य केंद्रीय प्रवृत्ति में अंतर का होजेस-लेहमैन अनुमान शून्य से भिन्न है। इस दो-प्रतिदर्श समस्याओं के लिए होजेस-लेहमैन का अनुमान पहले प्रतिदर्श में एक अवलोकन और दूसरे प्रतिदर्श में एक अवलोकन के मध्य सभी संभावित अंतरों का माध्य है।

अन्यथा, यदि दोनों प्रतिदर्शों के परिक्षेपण और वितरण के आकार भिन्न हैं, तो मान-व्हिटनी U परीक्षण मध्यस्थों के परीक्षण में विफल रहता है। ऐसे उदाहरण दिखाना संभव है जहां माध्यिकाएं संख्यात्मक रूप से बराबर होती हैं, जबकि परीक्षण एक छोटे p-मान के साथ शून्य परिकल्पना को अस्वीकार करता है।

मान-व्हिटनी U परीक्षण/विल्कोक्सन क्रम-योग परीक्षण विल्कोक्सन चिह्न-क्रम परीक्षण के समान नहीं है, हालांकि दोनों अप्राचली सांख्यिकी हैं और इसमें क्रमों का योग सम्मिलित है। मान-व्हिटनी U परीक्षण स्वतंत्र प्रतिदर्शों पर अनुप्रयुक्त किया जाता है। विल्कोक्सन चिह्न-क्रम परीक्षण सुमेलित या आश्रित प्रतिदर्शों पर अनुप्रयुक्त किया जाता है।

U प्रतिदर्शज
मान लीजिए कि $$X_1,\ldots, X_n$$ एक आई.आई.डी $$X$$ से प्रतिदर्श और $$Y_1,\ldots, Y_m$$ एक आई.आई.डी. $$Y$$ से प्रतिदर्श है सेऔर दोनों प्रतिदर्श एक दूसरे से स्वतंत्र हैं। संबंधित मान-व्हिटनी U सांख्यिकी को इस प्रकार परिभाषित किया गया हैː


 * $$U = \sum_{i=1}^n \sum_{j=1}^m S(X_i,Y_j),$$

के साथ
 * $$S(X,Y) = \begin{cases}

1, &\text{if } X > Y, \\ \tfrac{1}{2}, &\text{if } X = Y, \\ 0, &\text{if } X < Y. \end{cases}$$

आरओसी वक्रों के लिए क्षेत्र के अंतर्गत वक्र (AUC) प्रतिदर्शज
U प्रतिदर्शज गृहीता प्रचालन विशेषता वक्र (AUC) के अंतर्गत क्षेत्र के बराबर है जिसकी गणना सरलता से की जा सकती है।
 * $$\mathrm{AUC}_1 = {U_1 \over n_1n_2}$$

ध्यान दें कि यह उपरोक्त अनुभाग से सामान्य भाषा प्रभाव आकार के समान परिभाषा है। अर्थात: संभावना है कि एक वर्गीकरणकर्ता यादृच्छिक रूप से चुने गए धनात्मक उदाहरण को यादृच्छिक रूप से चुने गए ऋणात्मक से अधिक क्रम देगा (यह मानते हुए कि 'धनात्मक' क्रम 'ऋणात्मक' से अधिक है)।

इसके संभाव्य रूप के कारण, U सांख्यिकी को दो से अधिक वर्गों के लिए वर्गीकरणकर्ता की पृथक्करण शक्ति के माप के लिए सामान्यीकृत किया जा सकता है:
 * $$M = {1 \over c(c-1)} \sum \mathrm{AUC}_{k,\ell}$$

जहाँ c वर्गों की संख्या है और Rk,ℓ, AUCk,ℓ का पद, ℓ केवल वर्ग k और ℓ से संबंधित वस्तुओं के श्रेणीक्रम पर विचार करता है (अर्थात, अन्य सभी वर्गों से संबंधित वस्तुओं को अवहेलना कर दिया जाता है) वर्गीकरणकर्ता के अनुमान के अनुसार कक्षा k से संबंधित उन वस्तुओं की संभावना है। AUCk,k सदैव शून्य होगा, परन्तु, दो-वर्गों की स्थिति के विपरीत, सामान्यतः $AUC_{k,ℓ} ≠ AUC_{ℓ,k}$, यही कारण है कि M, AUCℓ,k और AUCk,ℓ के औसत का उपयोग करते हुए, सभी (k,ℓ) युग्मों का योग मापता है।

गणना
परीक्षण में एक आंकड़े की गणना सम्मिलित है, जिसे आमतौर पर यू कहा जाता है, जिसका वितरण शून्य परिकल्पना के अंतर्गत जाना जाता है। छोटे प्रतिदर्शों के स्थिति में, वितरण सारणीबद्ध है, परन्तु ~20 से ऊपर के प्रतिदर्श के आकार के लिए, सामान्य वितरण का उपयोग करके सन्निकटन काफी अच्छा है। कुछ पुस्तकें यू के समतुल्य आँकड़ों को सारणीबद्ध करती हैं, जैसे कि यू के बजाय प्रतिदर्शों में से एक में क्रम (समुच्चय सिद्धांत) का योग।

मान-व्हिटनी यू परीक्षण सांख्यिकीय पैकेजों की सबसे आधुनिक सूची में सम्मिलित है। यह आसानी से हाथ से भी गणना की जाती है, खासकर छोटे प्रतिदर्शों के लिए। इसे करने के दो तरीके हैं।

'पहला तरीका:'

प्रेक्षणों के दो छोटे समुच्चयों की तुलना करने के लिए, एक सीधा तरीका त्वरित है, और यू स्टेटिस्टिक के अर्थ में अंतर्दृष्टि देता है, जो सभी जोड़ीदार प्रतियोगिताओं में से जीत की संख्या से मेल खाता है (नीचे दिए गए उदाहरणों के अंतर्गत कछुआ और खरगोश का उदाहरण देखें)। एक समुच्चय में प्रत्येक अवलोकन के लिए, दूसरे समुच्चय में किसी भी अवलोकन पर यह पहला मान जीतने की संख्या की गणना करें (यदि यह पहला बड़ा है तो दूसरा मान हार जाता है)। किसी भी टाई के लिए 0.5 की गिनती करें। जीत और टाई का योग U है (अर्थात: $$U_1$$) पहले समुच्चय के लिए। दूसरे समुच्चय के लिए U विलोम है (अर्थात: $$U_2$$).

विधि दो:

बड़े प्रतिदर्शों के लिए:
 * 1) सभी अवलोकनों के लिए संख्यात्मक क्रम निर्दिष्ट करें (दोनों समूहों से अवलोकनों को एक समुच्चय में रखें), सबसे छोटे मान के लिए 1 से शुरू करें। जहां बंधे हुए मानों के समूह हैं, असमायोजित श्रेणीक्रम के मध्य बिंदु के बराबर एक क्रम निर्दिष्ट करें (उदाहरण के लिए, की क्रम $(3, 5, 5, 5, 5, 8)$ हैं $(1, 3.5, 3.5, 3.5, 3.5, 6)$, जहां असमायोजित क्रम होगी $(1, 2, 3, 4, 5, 6)$).
 * अब, प्रतिदर्श 1 से प्राप्त टिप्पणियों के लिए क्रम जोड़ें। प्रतिदर्श 2 में क्रमों का योग अब निर्धारित किया गया है, क्योंकि सभी क्रमों का योग बराबर है $N(N + 1)/2$ जहां N प्रेक्षणों की कुल संख्या है।
 * 1) यू तब दिया जाता है:
 * $$U_1=R_1 - {n_1(n_1+1) \over 2} \,\!$$
 * जहां एन1 प्रतिदर्श 1 के लिए प्रतिदर्श आकार है, और आर1 प्रतिदर्श 1 में क्रमों का योग है।


 * ध्यान दें कि इससे कोई फर्क नहीं पड़ता कि दो प्रतिदर्शों में से कौन सा प्रतिदर्श माना जाता है 1. U के लिए एक समान रूप से मान्य सूत्र है


 * $$U_2= R_2 - {n_2(n_2+1) \over 2} \,\!$$
 * U का छोटा मान1 और आप2 महत्व सारणी से परामर्श करते समय उपयोग किया जाता है। दो मानों का योग द्वारा दिया गया है
 * $$U_1 + U_2 = R_1 - {n_1(n_1+1) \over 2} + R_2 - {n_2(n_2+1) \over 2}. \,\!$$
 * जानते हुए भी $R_{1} + R_{2} = N(N + 1)/2$ और $N = n_{1} + n_{2}$, और कुछ बीजगणित करने पर, हम पाते हैं कि योग है

गुणधर्म
यू का अधिकतम मान दो प्रतिदर्शों के लिए प्रतिदर्श आकार का उत्पाद है (अर्थात: $$U_i = n_1 n_2$$). ऐसी स्थिति में, अन्य U 0 होगा।

गणना विधियों का उदाहरण
मान लीजिए कि ईसप अपने द कछुआ और खरगोश से असंतुष्ट है जिसमें एक कछुआ एक दौड़ में एक खरगोश को हरा पाया था, और यह पता लगाने के लिए कि क्या परिणाम सामान्य रूप से कछुओं और खरगोशों तक बढ़ाए जा सकते हैं, एक महत्व परीक्षण करने का फैसला करता है। वह 6 कछुओं और 6 खरगोशों का एक प्रतिदर्श इकट्ठा करता है, और उन सभी को एक ही बार में अपनी दौड़ में लगा देता है। जिस क्रम में वे फिनिशिंग पोस्ट तक पहुँचते हैं (उनका क्रम ऑर्डर, समापन रेखा को पार करने वाली पहली से आखिरी तक) इस प्रकार है, एक कछुए के लिए टी और एक खरगोश के लिए एच लिखना:
 * टी एच एच एच एच एच टी टी टी टी टी टी एच

यू का मान क्या है?
 * प्रत्यक्ष विधि का उपयोग करते हुए, हम प्रत्येक कछुए को बारी-बारी से लेते हैं, और 6, 1, 1, 1, 1, 1 प्राप्त करने वाले खरगोशों की संख्या की गणना करते हैं, जिसका अर्थ है कि $U_{1} + U_{2} = n_{1}n_{2}$. वैकल्पिक रूप से, हम प्रत्येक खरगोश को बारी-बारी से ले सकते हैं, और यह गिन सकते हैं कि यह कितने कछुओं को हराता है। इस स्थिति में, हमें 5, 5, 5, 5, 5, 0, इसलिए मिलता है $U_{T} = 11$. ध्यान दें कि इन दो मानों का योग के लिए $U_{H} = 25$, जो है $U = 36$.
 * अप्रत्यक्ष विधि का उपयोग करना:
 * जानवरों को पाठ्यक्रम पूर्ण करने में लगने वाले समय तक क्रम दें, इसलिए पहले जानवर को होम क्रम 12, दूसरे क्रम को 11 और इसी तरह आगे दें।
 * कछुओं द्वारा प्राप्त क्रमों का योग है $6×6$.
 * इसलिए $12 + 6 + 5 + 4 + 3 + 2 = 32$ (विधि एक के समान)।
 * खरगोशों द्वारा प्राप्त क्रमों का योग है $U_{T} = 32 − (6×7)/2 = 32 − 21 = 11$, के लिए अग्रणी $11 + 10 + 9 + 8 + 7 + 1 = 46$.

<!--

परिणामों का उदाहरण विवरण
मान-व्हिटनी यू परीक्षण के परिणामों की रिपोर्ट करते समय, यह बताना महत्वपूर्ण है: व्यवहार में इस जानकारी में से कुछ पहले से ही आपूर्ति की जा सकती है और सामान्य ज्ञान का उपयोग यह तय करने में किया जाना चाहिए कि इसे दोहराना है या नहीं। एक विशिष्ट रिपोर्ट चल सकती है,
 * दो समूहों की केंद्रीय प्रवृत्तियों का एक उपाय (माध्यम या मध्यिका; चूंकि मान-व्हिटनी यू परीक्षण एक क्रमसूचक परीक्षण है, आमतौर पर मध्यस्थों की सिफारिश की जाती है)
 * यू का मान (शायद प्रभाव आकार के कुछ माप के साथ, जैसे #सामान्य भाषा प्रभाव आकार या #रैंक-द्विक्रमिक सहसंबंध|रैंक-द्विक्रमी सहसंबंध)।
 * नमूना आकार
 * महत्व स्तर।
 * समूह ई और सी में औसत विलंबता 153 और 247 एमएस थे; दो समूहों में वितरण महत्वपूर्ण रूप से भिन्न थे (मान-व्हिटनी $U_{H} = 46 − 21 = 25$, $U = 10.5$, $n_{1} = n_{2} = 8$ दो पूंछ वाला)।

एक बयान जो परीक्षण की सांख्यिकीय स्थिति के साथ पूर्ण न्याय करता है, चल सकता है,
 * विलकॉक्सन-मैन-व्हिटनी दो-नमूना रैंक-सम परीक्षण का उपयोग करके दो उपचारों के परिणामों की तुलना की गई। उपचार प्रभाव (उपचार के बीच अंतर) को हॉजेस-लेहमैन (एचएल) अनुमानक का उपयोग करके निर्धारित किया गया था, जो विलकॉक्सन परीक्षण के अनुरूप है। यह अनुमानक (एचएलΔ) समूह बी में एक विषय और समूह ए में एक विषय के बीच परिणामों में सभी संभावित अंतरों का माध्यिका है। जनसंख्या B से यादृच्छिक रूप से चुने गए विषय का जनसंख्या A से यादृच्छिक रूप से चुने गए विषय की तुलना में अधिक वजन है। औसत [चतुर्थक] उपचार A और B पर विषयों के लिए क्रमशः 147 [121, 177] और 151 [130, 180] किलोग्राम हैं। उपचार A ने वजन घटाया HLΔ = 5 किग्रा (0.95 सीएल [2, 9] किग्रा, $P < 0.05$, $2P = 0.02$).

हालाँकि किसी दस्तावेज़ में इतनी व्यापक रिपोर्ट मिलना दुर्लभ होगा जिसका प्रमुख विषय सांख्यिकीय अनुमान नहीं था।

सामान्य सन्निकटन और टाई सुधार
बड़े नमूनों के लिए, यू लगभग सामान्य वितरण है। उस स्थिति में, मानक स्कोर
 * $$z = \frac{ U - m_U }{ \sigma_U }, \, $$

जहां एमU और पीU यू का औसत और मानक विचलन है, लगभग एक मानक सामान्य विचलन है जिसका महत्व सामान्य वितरण की तालिकाओं में जांचा जा सकता है। एमU और पीU द्वारा दिए गए हैं


 * $$m_U = \frac{n_1 n_2}{2}, \, $$ और


 * $$\sigma_U=\sqrt{n_1 n_2 (n_1 + n_2+1) \over 12}. \, $$

बंधे हुए रैंकों की उपस्थिति में मानक विचलन का सूत्र अधिक जटिल है। यदि रैंकों में संबंध हैं, तो σ को निम्नानुसार समायोजित किया जाना चाहिए:


 * $$ \sigma_\text{ties}=\sqrt{ {n_1 n_2 (n_1 + n_2 +1) \over 12 } - { n_1 n_2 \sum_{k=1}^K (t_k^3 - t_k) \over 12 n(n-1) } },\, $$

जहां बाईं ओर केवल विचरण है और दाईं ओर संबंधों के लिए समायोजन है, टीk kth रैंक के लिए संबंधों की संख्या है, और K संबंधों के साथ अद्वितीय रैंकों की कुल संख्या है।

के साथ एक अधिक कम्प्यूटेशनल-कुशल रूप $ρ = 0.58$ तथ्य निकाला गया है


 * $$ \sigma_\text{ties}=\sqrt{ {n_1 n_2 \over 12 } \left( (n+1) - { \sum_{k=1}^K (t_k^3 - t_k) \over n(n-1)} \right)},$$

कहाँ $n_{1}n_{2}/12$.

यदि टाई की संख्या कम है (और विशेष रूप से यदि कोई बड़ा टाई बैंड नहीं है) तो हाथ से गणना करते समय टाई को अनदेखा किया जा सकता है। कंप्यूटर सांख्यिकीय पैकेज नियमित रूप से सही ढंग से समायोजित सूत्र का उपयोग करेंगे।

ध्यान दें कि जब से $n = n_{1} + n_{2}$, मतलब $U_{1} + U_{2} = n_{1}n_{2}$ का उपयोग सामान्य सन्निकटन में U के दो मानों का माध्य है। इसलिए, परिकलित z-सांख्यिकीय का निरपेक्ष मान वही होगा जो U का उपयोग किया जाता है।

प्रभाव आकार
यह वैज्ञानिकों के लिए व्यापक रूप से अनुशंसित अभ्यास है कि वे अनुमान परीक्षण के लिए प्रभाव आकार की रिपोर्ट करें।

सभी जोड़ियों में से समरूपता का अनुपात
निम्नलिखित तीन उपाय समकक्ष हैं।

सामान्य भाषा प्रभाव आकार
मान-व्हिटनी यू परीक्षण के लिए प्रभाव आकार की रिपोर्ट करने का एक तरीका सामान्य भाषा प्रभाव आकार f के साथ है। एक नमूना आंकड़े के रूप में, सामान्य भाषा प्रभाव आकार की गणना दो समूहों के बीच सभी संभावित जोड़े बनाकर की जाती है, फिर एक दिशा का समर्थन करने वाले जोड़े के अनुपात का पता लगाया जाता है (कहते हैं कि समूह 1 के आइटम समूह 2 के आइटम से बड़े हैं)। उदाहरण के लिए, दस खरगोशों और दस कछुओं के नमूने के साथ एक अध्ययन में, आदेशित जोड़े की कुल संख्या दस गुना दस या 100 जोड़ी खरगोश और कछुआ है। मान लीजिए कि परिणाम दिखाते हैं कि 100 नमूना जोड़ियों में से 90 में खरगोश कछुए की तुलना में तेजी से दौड़ा; उस स्थिति में, नमूना सामान्य भाषा प्रभाव आकार 90% है। यह नमूना मूल्य जनसंख्या मूल्य का एक निष्पक्ष अनुमानक है, इसलिए नमूना बताता है कि जनसंख्या में सामान्य भाषा प्रभाव आकार का सबसे अच्छा अनुमान 90% है। एफ और मान-व्हिटनी यू के बीच संबंध (विशेष रूप से $$U_1$$) इस प्रकार है:


 * $$ f = {U_1 \over n_1 n_2} \,$$

यह आरओसी कर्व्स के लिए #एरिया-अंडर-कर्व (एयूसी) आंकड़े के समान है। आरओसी कर्व के लिए कर्व के नीचे का क्षेत्र (एयूसी) है।

ρ आँकड़ा
एक आँकड़ा जिसे ρ कहा जाता है जो यू से रैखिक रूप से संबंधित है और वर्गीकरण के अध्ययन में व्यापक रूप से उपयोग किया जाता है (अवधारणाओं से युक्त भेदभाव सीखना), और अन्यत्र, दिए गए नमूना आकारों के लिए यू को इसके अधिकतम मूल्य से विभाजित करके गणना की जाती है, जो कि सरल है $n_{1}n_{2}/2$. ρ इस प्रकार दो वितरणों के बीच ओवरलैप का एक गैर-पैरामीट्रिक माप है; यह 0 और 1 के बीच मान ले सकता है, और यह एक अनुमान है $n_{1}×n_{2}$, जहां X और Y दो वितरणों से बेतरतीब ढंग से चुने गए अवलोकन हैं। दोनों चरम मान वितरण के पूर्ण पृथक्करण का प्रतिनिधित्व करते हैं, जबकि 0.5 का ρ पूर्ण ओवरलैप का प्रतिनिधित्व करता है। ρ आँकड़ों की उपयोगिता ऊपर उपयोग किए गए विषम उदाहरण के मामले में देखी जा सकती है, जहाँ दो वितरण जो मान-व्हिटनी यू परीक्षण पर काफी भिन्न थे, फिर भी लगभग समान माध्यक थे: इस मामले में ρ मान लगभग 0.723 के पक्ष में है खरगोशों का, इस तथ्य को सही ढंग से दर्शाता है कि भले ही मध्य कछुआ मध्य खरगोश को हरा देता है, सामूहिक रूप से कछुओं की तुलना में सामूहिक रूप से खरगोशों ने बेहतर किया।

रैंक-द्विक्रमिक सहसंबंध
मान-व्हिटनी यू परीक्षण के लिए प्रभाव आकार की रिपोर्ट करने का एक तरीका रैंक सहसंबंध के एक उपाय के साथ है जिसे रैंक-द्विक्रमिक सहसंबंध के रूप में जाना जाता है। एडवर्ड क्योरटन ने माप को पेश किया और नाम दिया। अन्य सहसंबंधी उपायों की तरह, रैंक-द्विक्रमिक सहसंबंध शून्य से एक से अधिक एक तक हो सकता है, शून्य के मान के साथ कोई संबंध नहीं दर्शाता है।

सामान्य भाषा प्रभाव आकार से रैंक-द्विक्रमिक सहसंबंध की गणना करने के लिए एक साधारण अंतर सूत्र है: सहसंबंध, परिकल्पना के अनुकूल जोड़े के अनुपात के बीच का अंतर है (एफ) घटा इसका पूरक (यानी: वह अनुपात जो प्रतिकूल है (यू) )). यह साधारण अंतर सूत्र प्रत्येक समूह के सामान्य भाषा प्रभाव आकार का अंतर है, और इस प्रकार है:


 * $$r = f - u $$

उदाहरण के लिए, उस उदाहरण पर विचार करें जहां 100 में से 90 जोड़ों में खरगोश कछुओं से तेज दौड़ते हैं। सामान्य भाषा प्रभाव का आकार 90% है, इसलिए रैंक-द्विक्रमिक सहसंबंध 90% माइनस 10% है, और रैंक-द्विक्रमिक सहसंबंध$P(Y > X) + 0.5 P(Y = X)$.

मान-व्हिटनी यू (या तो रैंक-द्विक्रमिक) के लिए एक वैकल्पिक सूत्र का उपयोग इसकी गणना करने के लिए किया जा सकता है $$U_1$$ या $$U_2$$) और प्रत्येक समूह का नमूना आकार:
 * $$ r = f - (1 - f) = 2 f - 1 = {2U_1 \over n_1 n_2} - 1 = 1 - {2U_2 \over n_1 n_2} $$

यह सूत्र तब उपयोगी होता है जब डेटा उपलब्ध नहीं होता है, लेकिन जब कोई प्रकाशित रिपोर्ट होती है, क्योंकि यू और नमूना आकार नियमित रूप से रिपोर्ट किए जाते हैं। ऊपर दिए गए उदाहरण का उपयोग करते हुए 90 जोड़े जो खरगोशों का पक्ष लेते हैं और 10 जोड़े जो कछुए का पक्ष लेते हैं, यू2 दोनों में से छोटा है, इसलिए $r = 0.80$. यह सूत्र तब देता है $U_{2} = 10$, जो उपरोक्त सरल अंतर सूत्र के समान परिणाम है।

विद्यार्थी के t- परीक्षण से तुलना
मान-व्हिटनी यू परीक्षण एक शून्य परिकल्पना का परीक्षण करता है कि एक समूह से एक यादृच्छिक रूप से निकाले गए अवलोकन की संभाव्यता वितरण दूसरे समूह से एक यादृच्छिक रूप से तैयार किए गए अवलोकन की संभावना वितरण के समान है, जो कि उन वितरणों के बराबर नहीं है (देखें) मान-व्हिटनी यू परीक्षण#अनुमान और परिकल्पना का औपचारिक विवरण)। इसके विपरीत, एक टी-परीक्षण असमान साधनों के विकल्प के विरुद्ध दो समूहों में समान साधनों की शून्य परिकल्पना का परीक्षण करता है। इसलिए, विशेष मामलों को छोड़कर, मान-व्हिटनी यू परीक्षण और टी-परीक्षण समान परिकल्पनाओं का परीक्षण नहीं करते हैं और इसकी तुलना इस बात को ध्यान में रखकर की जानी चाहिए। साधारण डेटा: मान-व्हिटनी यू परीक्षण टी-टेस्ट के लिए बेहतर होता है जब डेटा माप का स्तर # ऑर्डिनल स्केल होता है लेकिन अंतराल स्केल नहीं किया जाता है, इस मामले में पैमाने के आसन्न मूल्यों के बीच की दूरी को स्थिर नहीं माना जा सकता है। मजबूती: जैसा कि यह रैंकों के योग की तुलना करता है, मान-व्हिटनी यू परीक्षण की टी-परीक्षण की तुलना में ग़ैर की उपस्थिति के कारण नकली रूप से महत्व दर्शाने की कम संभावना है। हालांकि, मान-व्हिटनी यू परीक्षण में खराब टाइप I और टाइप II त्रुटि नियंत्रण हो सकता है, जब डेटा विषमलैंगिक और गैर-सामान्य दोनों होते हैं। दक्षता: जब सामान्यता बनी रहती है, मान-व्हिटनी यू परीक्षण में 3/$\pi$ या लगभग 0.95 जब t-परीक्षण की तुलना में। वितरण के लिए सामान्य से काफी दूर और पर्याप्त रूप से बड़े नमूना आकार के लिए, मान-व्हिटनी यू परीक्षण टी से काफी अधिक कुशल है। दक्षता में यह तुलना, हालांकि, सावधानी के साथ व्याख्या की जानी चाहिए, क्योंकि मान-व्हिटनी और टी-परीक्षण समान मात्राओं का परीक्षण नहीं करते हैं। यदि, उदाहरण के लिए, समूह के साधनों का अंतर प्राथमिक हित का है, मान-व्हिटनी एक उपयुक्त परीक्षण नहीं है। मान-व्हिटनी यू परीक्षण डेटा की रैंकिंग पर एक साधारण पैरामीट्रिक दो-नमूना टी परीक्षण | टी-परीक्षण करने के समान परिणाम देगा।

विभिन्न वितरण
मान-व्हिटनी यू परीक्षण अशक्त परिकल्पना के परीक्षण के लिए मान्य नहीं है $$P(Y>X)+0.5P(Y=X)= 0.5$$ वैकल्पिक परिकल्पना के खिलाफ $$P(Y>X)+0.5P(Y=X)\neq 0.5$$), यह मानने के बिना कि वितरण अशक्त परिकल्पना के तहत समान हैं (अर्थात, मानते हुए $$F_1=F_2$$). उन परिकल्पनाओं के बीच परीक्षण करने के लिए बेहतर परीक्षण उपलब्ध हैं। उनमें से हैं ब्रूनर_मुंज़ेल_टेस्ट|ब्रूनर-मुंज़ेल और फ़्लिग्नर-पोलीसेलो परीक्षण। विशेष रूप से, अधिक सामान्य अशक्त परिकल्पना के तहत $$P(Y>X)+0.5P(Y=X)= 0.5$$, मान-व्हिटनी यू परीक्षण में बड़े नमूनों में भी टाइप I त्रुटि दर में वृद्धि हो सकती है (विशेष रूप से यदि दो आबादी के प्रसरण असमान हैं और नमूना आकार अलग हैं), एक समस्या जो बेहतर विकल्प हल करती है। नतीजतन, यह सुझाव दिया गया है कि विकल्पों में से एक का उपयोग करें (विशेष रूप से ब्रूनर-मुंज़ेल परीक्षण) यदि यह नहीं माना जा सकता है कि वितरण अशक्त परिकल्पना के तहत समान हैं।

विकल्प
यदि कोई सरल शिफ्ट व्याख्या चाहता है, तो मान-व्हिटनी यू परीक्षण का उपयोग तब नहीं किया जाना चाहिए जब दो नमूनों का वितरण बहुत भिन्न हो, क्योंकि यह महत्वपूर्ण परिणामों की गलत व्याख्या दे सकता है। उस स्थिति में, वेल्च का टी-टेस्ट का टी-टेस्ट संस्करण अधिक विश्वसनीय परिणाम दे सकता है।

इसी तरह, कुछ लेखक (जैसे, Conover) डेटा को रैंकों में बदलने का सुझाव दें (यदि वे पहले से ही रैंक नहीं हैं) और फिर रूपांतरित डेटा पर टी-टेस्ट का प्रदर्शन करते हैं, टी-टेस्ट का संस्करण इस पर निर्भर करता है कि जनसंख्या भिन्न होने का संदेह है या नहीं। रैंक रूपांतरण भिन्नताओं को संरक्षित नहीं करते हैं, लेकिन रैंक परिवर्तनों के बाद नमूनों से भिन्नों की पुन: गणना की जाती है।

ब्राउन-फोर्सिथ परीक्षण को एफ-परीक्षण के लिए एक उपयुक्त गैर-पैरामीट्रिक समकक्ष के रूप में सुझाया गया है। समान प्रसरण के लिए एफ-परीक्षण।

एक अधिक शक्तिशाली परीक्षण ब्रूनर_मुंज़ेल_टेस्ट|ब्रूनर-मुंज़ेल परीक्षण है, जो विनिमेयता की धारणा के उल्लंघन के मामले में मान-व्हिटनी यू परीक्षण से बेहतर प्रदर्शन करता है। मान-व्हिटनी यू टेस्ट आनुपातिक ऑड्स मॉडल का एक विशेष मामला है, जो सहसंयोजक-समायोजन की अनुमति देता है। कोलमोगोरोव-स्मिर्नोव परीक्षण भी देखें।

केंडल के ताऊ
मान-व्हिटनी यू परीक्षण कई अन्य गैर पैरामीट्रिक सांख्यिकीय प्रक्रियाओं से संबंधित है। उदाहरण के लिए, यह केंडल ताऊ रैंक सहसंबंध गुणांक के बराबर है | केंडल का ताऊ सहसंबंध गुणांक यदि एक चर द्विआधारी है (अर्थात, यह केवल दो मान ले सकता है)।

सॉफ्टवेयर कार्यान्वयन
कई सॉफ्टवेयर पैकेजों में, मान-व्हिटनी यू परीक्षण (उचित विकल्पों के विरुद्ध समान वितरण की परिकल्पना) को खराब तरीके से प्रलेखित किया गया है। कुछ पैकेज गलत तरीके से संबंधों का इलाज करते हैं या स्पर्शोन्मुख तकनीकों (जैसे, निरंतरता के लिए सुधार) का दस्तावेजीकरण करने में विफल रहते हैं। 2000 की समीक्षा में निम्नलिखित में से कुछ पैकेजों पर चर्चा की गई:
 * MATLAB के पास अपने सांख्यिकी टूलबॉक्स में रैंकसम है।
 * R (प्रोग्रामिंग लैंग्वेज) का सांख्यिकी आधार-पैकेज परीक्षण को लागू करता है wilcox.test इसके आँकड़े पैकेज में।
 * आर पैकेज wilcoxonZ विलकॉक्सन दो-नमूना, युग्मित, या एक-नमूना परीक्षण के लिए z आँकड़ा की गणना करेगा।
 * SAS (सॉफ्टवेयर) अपनी PROC NPAR1WAY प्रक्रिया में परीक्षण को लागू करता है।
 * पायथन (प्रोग्रामिंग भाषा) में SciPy द्वारा प्रदान किए गए इस परीक्षण का कार्यान्वयन है {{cite web |url=http://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.mannwhitneyu.html |title=scipy.stats.mannwhitneyu|work=SciPy v0.16.0 Reference Guide |author=

सॉफ्टवेयर कार्यान्वयन
कई सॉफ़्टवेयर पैकेजों में, मैन-व्हिटनी यू परीक्षण (उचित विकल्पों के विरुद्ध समान वितरण की परिकल्पना) को खराब तरीके से प्रलेखित किया गया है। कुछ पैकेज संबंधों का ग़लत ढंग से इलाज करते हैं या स्पर्शोन्मुख तकनीकों (उदाहरण के लिए, निरंतरता के लिए सुधार) का दस्तावेज़ीकरण करने में विफल रहते हैं। 2000 की समीक्षा में निम्नलिखित कुछ पैकेजों पर चर्चा की गई
 * सिग्मास्टैट (एसपीएसएस इंक, शिकागो, आईएल)
 * SYSTAT (सांख्यिकी) (SPSS Inc., शिकागो, IL)
 * जावा (प्रोग्रामिंग भाषा) में अपाचे कॉमन्स द्वारा प्रदान किए गए इस परीक्षण का कार्यान्वयन है
 * जूलिया (प्रोग्रामिंग भाषा) के पास कई पैकेजों के माध्यम से इस परीक्षण का कार्यान्वयन है। पैकेज HypothesisTests.jl में, यह pvalue(MannWhitneyUTest(X, Y)) के रूप में पाया जाता है
 * जेएमपी (सांख्यिकीय सॉफ्टवेयर) (एसएएस इंस्टीट्यूट इंक, कैरी, एनसी)
 * एस प्लस (मैथसॉफ्ट, इंक।, सिएटल, डब्ल्यूए)
 * आंकड़े (स्टेटसॉफ्ट, इंक।, तुलसा, ओके)
 * सपना देखना (यूनिस्टैट लिमिटेड, लंदन)
 * एसपीएसएस (एसपीएसएस इंक, शिकागो)
 * आँकड़े प्रत्यक्ष (स्टैट्सडायरेक्ट लिमिटेड, मैनचेस्टर, यूके) सभी सामान्य संस्करण अनुप्रयुक्त करता है।
 * था (स्टाटा कॉर्पोरेशन, कॉलेज स्टेशन, TX) अपने क्रमसम कमांड में परीक्षण को अनुप्रयुक्त करता है।
 * स्टेटएक्सएक्ट (साइटेल सॉफ्टवेयर कॉर्पोरेशन, कैम्ब्रिज, मैसाचुसमुच्चय्स)
 * PSPP अपने WILCOXON फंक्शन में परीक्षण को अनुप्रयुक्त करता है।
 * KNIME अपने Wilcoxon-Mann में परीक्षण अनुप्रयुक्त करता है। -व्हिटनी टेस्ट नोड।

इतिहास
प्रतिदर्शज 1914 के एक लेख में दिखाई दिया जर्मन गुस्ताव ड्यूक्लर द्वारा (विचरण में लापता शब्द के साथ)।

1945 में एक एकल पत्र में, फ्क्रमविल्कोक्सन ने प्रस्तावित किया था एक-प्रतिदर्श हस्ताक्षरित क्रम और दो-प्रतिदर्श क्रम योग परीक्षण, इसके पूरक विकल्प के विरुद्ध एक बिंदु शून्य-परिकल्पना के साथ महत्व के परीक्षण में (अर्थात, बराबर बनाम बराबर नहीं)। हालाँकि, उन्होंने उस लेख्य में समान-प्रतिदर्श आकार के स्थिति के लिए केवल कुछ बिंदुओं को सारणीबद्ध किया (हालांकि बाद के एक लेख्य में उन्होंने बड़ी तालिका दी)।

आँकड़ों का गहन विश्लेषण, जिसमें आठ या उससे कम के प्रतिदर्श के आकार के लिए मनमाना प्रतिदर्श आकार और तालिकाओं के लिए पूंछ की संभावनाओं की गणना की अनुमति देने वाली पुनरावृत्ति सम्मिलित थी, हेनरी मान और उनके छात्र द्वारा लेख में दिखाई दिया। 1947 में डोनाल्ड रैनसम व्हिटनी। इस लेख में वैकल्पिक परिकल्पनाओं पर चर्चा की गई है, जिसमें एक स्टोकेस्टिक क्रमीकरण सम्मिलित है (जहां संचयी वितरण कार्य बिंदुवार असमानता को संतुष्ट करते हैं $r = 1 – (2×10) / (10×10) = 0.80$). इस लेख्य ने पहले चार क्षणों की भी गणना की और अशक्त परिकल्पना के अंतर्गत सांख्यिकी की सीमित सामान्यता को स्थापित किया, ताकि यह स्थापित हो सके कि यह असमान रूप से वितरण-मुक्त है।

यह भी देखें

 * लेपेज परीक्षण
 * कुकोनी परीक्षण
 * कोलमोगोरोव-स्मिर्नोव परीक्षण
 * विलकॉक्सन साइन-क्रम टेस्ट
 * क्रुस्कल-वालिस विचरण का एकतरफा विश्लेषण
 * ब्रूनर-मुंजेल परीक्षण
 * आनुपातिक बाधाओं मॉडल

बाहरी संबंध

 * Table of critical values of U (pdf)
 * Interactive calculator for U and its significance
 * Brief guide by experimental psychologist Karl L. Weunsch – Nonparametric effect size estimators (Copyright 2015 by Karl L. Weunsch)