मल्टीमॉडल वितरण

सांख्यिकी में, मल्टीमॉडल वितरण एक से अधिक मोड (सांख्यिकी) वाला संभाव्यता वितरण होता है। ये संभाव्यता घनत्व फलन में भिन्न-भिन्न शिखरों (स्थानीय मैक्सिमा) के रूप में दिखाई देते हैं, जैसा कि चित्र 1और 2 में दिखाया गया है। श्रेणीबद्ध, सतत और असतत डेटा सभी मल्टीमॉडल वितरण बना सकते हैं। अविभाज्य विश्लेषणों में, मल्टीमॉडल वितरण सामान्यतः द्विमोडल होते हैं।

शब्दावली
जब दो मोड असमान होते हैं तो बड़े मोड को प्रमुख मोड और दूसरे को लघु मोड के रूप में जाना जाता है। मोड के मध्य सबसे कम बारंबार मान को प्रतिमोड के रूप में जाना जाता है। प्रमुख और लघु मोड के मध्य के अंतर को आयाम के रूप में जाना जाता है। समय श्रृंखला में प्रमुख मोड को एक्रोफ़ेज़ और प्रतिमोड को बैटीफ़ेज़ कहा जाता है।

गाल्टुंग का वर्गीकरण
गाल्टुंग ने वितरण के लिए वर्गीकरण प्रणाली (एजेयूएस) प्रारम्भ की थी:
 * ए: यूनिमॉडल वितरण - मध्य में शिखर
 * जे: यूनिमॉडल - दोनों छोर पर शिखर
 * यू: बिमोडल - दोनों सिरों पर शिखर
 * एस: बिमॉडल या मल्टीमॉडल - एकाधिक शिखर

इस वर्गीकरण को तब से लेकर अब तक थोड़ा संशोधित किया गया है:


 * जे: (संशोधित) - दाईं ओर शिखर
 * एल: यूनिमॉडल - बाईं ओर शिखर
 * एफ: कोई शिखर नहीं (समतल)

इस वर्गीकरण के तहत द्विमोडल वितरण को प्रकार एस या यू के रूप में वर्गीकृत किया जाता है।

उदाहरण
गणित और प्राकृतिक विज्ञान दोनों में द्विमोडल वितरण होते हैं।

संभावना वितरण
महत्वपूर्ण द्विमोडल वितरणों में आर्क्साइन वितरण और बीटा वितरण सम्मलित होता हैं (यदि दोनों पैरामीटर ए और बी 1 से कम होते हैं)। अन्य में यू-द्विघात वितरण सम्मलित होता है।

दो सामान्य वितरणों का अनुपात भी द्विमासिक रूप से वितरित किया जाता है।


 * $$ R = \frac{ a + x }{ b + y } $$

जहाँ a और b स्थिर हैं और x और y को 0 के माध्य और 1 के मानक विचलन के साथ सामान्य चर के रूप में वितरित किया जाता है। यह R में ज्ञात घनत्व है जिसे संगम हाइपरजियोमेट्रिक फ़ंक्शन के रूप में व्यक्त किया जा सकता है।

वितरित यादृच्छिक चर के व्युत्क्रम का वितरण द्विमोडल होता है जब स्वतंत्रता की डिग्री से अधिक होती है। इसी प्रकार सामान्य रूप से वितरित चर का व्युत्क्रम भी द्विमासिक रूप से वितरित होता है।

कॉची वितरण से प्राप्त डेटा समुच्चय से उत्पन्न आँकड़ा द्वि-मोडल होता है।

प्रकृति में घटनाएँ
बिमोडल वितरण वाले चर के उदाहरणों में कुछ गीजर के विस्फोटों के मध्य का समय, आकाशगंगाओं रंग-परिमाण आरेख, श्रमिक वेवर चींटियों का आकार, हॉजकिन के लिंफोमा की घटना की उम्र, अमेरिकी वयस्कों में दवा आइसोनियाज़िड की निष्क्रियता की गति, पूर्ण परिमाण सम्मलित होता हैं। नोवा,और उन सांध्य जानवरों के सर्कैडियन लय पैटर्न जो सुबह और शाम गोधूलि दोनों में सक्रिय होते है। मत्स्य विज्ञान में मल्टीमॉडल लंबाई वितरण विभिन्न वर्ष वर्गों को प्रदर्शित करता हैं और इस प्रकार मछली की आपश्चात्क आयु वितरण और वृद्धि प्राक्लन के लिए इसका उपयोग किया जा सकता है। तलछट सामान्यतः द्वि-मोडल विधि से वितरित होते हैं। जब होस्ट चट्टान और खनिजयुक्त शिराओं को पार करते हुए खनन दीर्घाओं का प्रतिरूप लिया जाता है, तो भू-रासायनिक चर का वितरण द्वि-मोडल प्राप्त होता है। ट्रैफिक विश्लेषण में बिमॉडल वितरण भी देखा जाता है, जहाँ सुबह के व्यस्त समय के अवधि और फिर अपराह्न के व्यस्त समय के अवधि ट्रैफिक चरम पर होता है। यह घटना दैनिक जल वितरण में भी देखी जाती है, क्योंकि वर्षा, खाना पकाने और शौचालय के उपयोग के रूप में पानी की मांग सामान्यतः सुबह और शाम के समय चरम पर होती है।

अर्थमिति
अर्थमितीय मॉडल में, पैरामीटरों को द्वि-मॉडल रूप से वितरित किया जा सकता है।

गणितीय
द्विमोडल वितरण सामान्यतः दो भिन्न-भिन्न यूनिमोडल वितरणों (अर्थात् मात्र मोड वाले वितरण) के मिश्रण के रूप में उत्पन्न होता है। दूसरे शब्दों में, द्विविध रूप से वितरित यादृच्छिक चर X को $$ Y $$ संभाव्यता के साथ $$ \alpha $$ या $$ Z $$ संभाव्यता के साथ $$ (1-\alpha) $$ इस प्रकार परिभाषित किया जाता है जहाँ Y और Z एक-मॉडल यादृच्छिक चर और $$0 < \alpha < 1$$ मिश्रण गुणांक होते है।

दो भिन्न-भिन्न घटकों वाले मिश्रणों को द्वि-मॉडल होने की आवश्यकता नहीं होती है और यूनिमॉडल घटक घनत्व वाले दो घटक मिश्रणों में दो से अधिक मोड हो सकते हैं। मिश्रण में घटकों की संख्या और परिणामी घनत्व के विधियो की संख्या के मध्य कोई तत्क्षण संबंध नहीं होते है।

विशेष वितरण
डेटा समुच्चय में बार-बार होने के पश्चात् भी, बिमोडल वितरण का अध्ययन संभवतया ही कभी किया जाता है। ऐसा फ़्रीक्वेंटिस्ट या बायेसियन विधियों से उनके मापदंडों का प्राक्लन लगाने में आने वाली कठिनाइयों के कारण हो सकता है। उनमें से जिनका अध्ययन किया गया है वह निम्न प्रकार है

चरम आपदा वितरण में जैव विविधता भी स्वाभाविक रूप से उत्पन्न होती है।
 * द्विमोडल घातीय वितरण।
 * अल्फा-परोक्ष-सामान्य वितरण।
 * बिमोडल परोक्ष-सममित सामान्य वितरण।
 * कॉनवे-मैक्सवेल-पॉइसन वितरण का मिश्रण बिमोडल गणना डेटा में स्थापित किया गया है।

जीवविज्ञान
जीव विज्ञान में जनसंख्या आकार के द्वि-मोडल वितरण में योगदान देने के लिए पांच कारकों को जाना जाता है:


 * व्यक्तिगत आकारों का प्रारंभिक वितरण
 * व्यक्तियों के मध्य विकास दर का वितरण
 * प्रत्येक व्यक्ति की विकास दर का आकार और समय पर निर्भरता
 * मृत्यु दर जो प्रत्येक आकार वर्ग को भिन्न-भिन्न प्रभावित कर सकती है
 * मानव और चूहे जीनोम में डीएनए मिथाइलेशन।

वेवर चींटी श्रमिकों के आकार का द्वि-मोडल वितरण श्रमिकों के दो भिन्न-भिन्न वर्गों, अर्थात् प्रमुख श्रमिकों और छोटे श्रमिकों के अस्तित्व के कारण उत्पन्न होता है। दोनों संपूर्ण जीनोम के लिए उत्परिवर्तन के फिटनेस प्रभावों का वितरण और व्यक्तिगत जीन यह अधिकांशतः द्वि-मोडल भी पाया जाता है, अधिकांश उत्परिवर्तन या तो तटस्थ या घातक होते हैं और अपेक्षाकृत कुछ का मध्यवर्ती प्रभाव होता है।

सामान्य गुण
भिन्न-भिन्न साधनों वाले दो एकमोडल वितरणों का मिश्रण आवश्यक रूप से द्विमोडल नहीं होता है। पुरुषों और महिलाओं की ऊंचाई के संयुक्त वितरण को कभी-कभी द्वि-मॉडल वितरण के उदाहरण के रूप में उपयोग किया जाता है, यघपि वास्तव में पुरुषों और महिलाओं की औसत ऊंचाई में अंतर उनके मानक विचलन के सापेक्ष बहुत छोटा होता है, जब दो वितरण वक्र संयुक्त होते हैं तो द्वि-मॉडलिटी उत्पन्न होती है।

बिमोडल वितरण में एक विचित्र गुण होता है - यूनिमॉडल वितरण के विपरीत - माध्य माध्यिका की तुलना में अधिक सशक्त प्रतिरूप प्राक्लनक हो सकता है। यह स्पष्ट रूप से एक स्थिति होती है जब वितरण आर्कसाइन वितरण के समरूप यू आकार का होता है। यह तब तक सत्य नहीं हो सकता जब तक वितरण में या अधिक लंबी पूँछें उपस्थित हों।

मिश्रण के क्षण
मान लीजिये


 * $$ f( x ) = p g_1( x ) + ( 1 - p ) g_2( x ) \, $$

जहाँ gi संभाव्यता वितरण और p मिश्रण पैरामीटर होता है।

f(x) के क्षण निम्न प्रकार होता हैं
 * $$ \mu = p \mu_1 + ( 1 - p ) \mu_2 $$
 * $$ \nu_2 = p[ \sigma_1^2 + \delta_1^2 ] + ( 1 - p )[ \sigma_2^2 + \delta_2^2 ]$$
 * $$ \nu_3 = p [ S_1 \sigma_1^3 + 3 \delta_1 \sigma_1^2 + \delta_1^3 ] + ( 1 - p )[ S_2 \sigma_2^3 + 3 \delta_2 \sigma_2^2 + \delta_2^3 ] $$
 * $$ \nu_4 = p[ K_1 \sigma_1^4 + 4 S_1 \delta_1 \sigma_1^3 + 6 \delta_1^2 \sigma_1^2 + \delta_1^4 ] + ( 1 - p )[ K_2 \sigma_2^4 + 4 S_2 \delta_2 \sigma_2^3 + 6 \delta_2^2 \sigma_2^2 + \delta_2^4 ]$$

जहाँ
 * $$ \mu = \int x f( x ) \, dx $$
 * $$ \delta_i = \mu_i - \mu $$
 * $$ \nu_r = \int ( x - \mu )^r f( x ) \, dx $$

और Si और Ki विषमता और कुर्टोसिस का ith वितरण होता है।

दो सामान्य वितरणों का मिश्रण
ऐसी स्थितियों का सामना करना असामान्य नहीं होता है जहाँ अन्वेषक का मानना ​​​​है कि डेटा दो सामान्य वितरणों के मिश्रण से आता है। इस कारण इस मिश्रण का कुछ विस्तार से अध्ययन किया गया है।

दो सामान्य वितरणों के मिश्रण में प्राक्लन लगाने के लिए पांच पैरामीटर होते हैं: दो साधन, दो भिन्नताएं और मिश्रण पैरामीटर। समान मानक विचलन वाले दो सामान्य वितरणों का मिश्रण मात्र तभी द्विमोडल होता है, जब उनके माध्य सामान्य मानक विचलन से कम से कम दोगुने से भिन्न हों। यदि भिन्नताओं को समान माना जा सकता है (समलैंगिकता केस) तो मापदंडों का प्राक्लन सरल हो जाता है।

यदि दो सामान्य वितरणों के साधन समान्तर होती हैं, तो संयुक्त वितरण एकमोडल होता है। इस प्रकार संयुक्त वितरण की एकरूपता के लिए उदेश्य ईसेनबर्गर द्वारा निकाली गई थीं। सामान्य वितरणों के मिश्रण के द्वि-मोडल होने के लिए आवश्यक और पर्याप्त स्थितियों की पहचान रे और लिंडसे द्वारा की गई थी। न्यूनाधिक समान द्रव्यमान वाले दो सामान्य वितरणों के मिश्रण में नकारात्मक कर्टोसिस होता है क्योंकि द्रव्यमान के केंद्र के दोनों ओर के दो मोड प्रभावी रूप से वितरण की पूंछ को कम कर देते हैं।

अत्यधिक असमान द्रव्यमान वाले दो सामान्य वितरणों के मिश्रण में सकारात्मक कर्टोसिस होता है क्योंकि छोटा वितरण अधिक प्रभावी सामान्य वितरण की अंतिम भाग को लंबा कर देता है।

अन्य वितरणों के मिश्रण का प्राक्लन लगाने के लिए अतिरिक्त मापदंडों की आवश्यकता होती है।

एकरूपता के लिए परीक्षण

 * जब मिश्रण के घटकों में समान भिन्नताएं हों तो मिश्रण एक-मोडल होता है यदि और मात्र यदि
 * $$ d \le 1 $$

या


 * $$ \left\vert \log( 1 - p ) - \log( p ) \right\vert \ge 2 \log( d - \sqrt{ d^2 - 1 } ) + 2d \sqrt{ d^2 - 1 } ,$$

जहाँ p मिश्रण पैरामीटर होता है और


 * $$ d = \frac{ \left\vert \mu_1 - \mu_2 \right\vert }{ 2 \sigma }, $$

जहाँ μ1 और μ2 दो सामान्य वितरणों के साधन और σ उनका मानक विचलन होता है।


 * केस p = 1/2 के लिए निम्नलिखित परीक्षण का वर्णन शिलिंग एट अल द्वारा किया गया था। मान लीजिये


 * $$ r = \frac{ \sigma_1^2 }{ \sigma_2^2 } .$$

जहाँ पृथक्करण कारक (S) होता है


 * $$ S = \frac{ \sqrt{ -2 + 3r + 3r^2 - 2r^3 + 2( 1 - r + r^2 )^{ 1.5 } } }{ \sqrt{ r }( 1 + \sqrt{ r } ) } .$$

यदि प्रसरण समान हैं तो S = 1 होता है। मिश्रण घनत्व एकमापक होता है यदि और मात्र यदि


 * $$ | \mu_1 - \mu_2 | < S | \sigma_1 + \sigma_2 | .$$


 * एकरूपता के लिए पर्याप्त नियम होता है
 * $$|\mu_1-\mu_2| \le2\min (\sigma_1,\sigma_2).$$


 * यदि दो सामान्य वितरणों में समान मानक विचलन $$\sigma$$ होता हैं तो एकरूपता के लिए पर्याप्त नियम होता है


 * $$|\mu _1-\mu_2|\le 2\sigma \sqrt{1+\frac{|\log p-\ln (1-p)|}{2}}.$$

सारांश आँकड़े
बिमोडल वितरण इस बात का सामान्यतः उपयोग किया जाने वाला उदाहरण होता है कि किसी अनैतिक वितरण पर उपयोग किए जाने पर माध्य, माध्यिका और मानक विचलन जैसे सारांश आँकड़े कैसे भ्रामक हो सकते हैं। उदाहरण के लिए, चित्र 1 में वितरण में, माध्य और मध्यिका न्यूनाधिक शून्य होगी, तथापि शून्य विशिष्ट मान नहीं होते है। मानक विचलन भी प्रत्येक सामान्य वितरण के विचलन से बड़ा होता है।

यघपि कई सुझाव दिए गए हैं, सामान्य द्विमोडल वितरण के मापदंडों को निर्धारित करने के लिए वर्तमान में कोई सामान्यतः सहमत सारांश आँकड़ा (या आँकड़ों का समुच्चय) नहीं होता है। दो सामान्य वितरणों के मिश्रण के लिए मिश्रण पैरामीटर (संयोजन के लिए वजन) के साथ-साथ साधन और मानक विचलन का सामान्यतः उपयोग किया जाता है - कुल पांच पैरामीटर।

अशमन का D
आँकड़ा जो उपयोगी हो सकता है वह है एशमैन का D होता है:
 * $$ D = (2^\frac{ 1 }{ 2 }) \frac{ \left| \mu_1 - \mu_2 \right| }{ \sqrt{ ( \sigma_1^2 + \sigma_2^2 ) } } $$

जहाँ μ1, μ2 साधन और σ1, σ2 मानक विचलन होते हैं।

दो सामान्य वितरणों के मिश्रण के लिए वितरणों के स्वच्छ पृथक्करण के लिए D > 2 की आवश्यकता होती है।

वैन डेर ईज्क का A
यह माप आवृत्ति वितरण की सहमति की डिग्री का भारित औसत होता है। A की सीमा -1 (पूर्ण द्विरूपता) से +1 (पूर्ण एकरूपता) तक होती है। इसे इस प्रकार परिभाषित किया जाता है


 * $$ A = U ( 1 - \frac{ S - 1 }{ K - 1 } ) $$

जहाँ U वितरण की एकरूपता होती है, S उन श्रेणियों की संख्या है जिनमें शून्येतर आवृत्तियाँ और K श्रेणियों की कुल संख्या होती है।

यदि वितरण में निम्नलिखित तीन विशेषताओं में से कोई एक होती है तो U का मान 1 होता है:


 * सभी प्रतिक्रियाएँ एक ही श्रेणी में होती हैं
 * प्रतिक्रियाएं सभी श्रेणियों के मध्य समान रूप से वितरित की जाती हैं
 * प्रतिक्रियाएं दो या दो से अधिक सन्निहित श्रेणियों के मध्य समान रूप से वितरित की जाती हैं, अन्य श्रेणियों में शून्य प्रतिक्रियाएं होती हैं

इनके अतिरिक्त अन्य वितरणों के साथ डेटा को 'परतों' में विभाजित किया जाना चाहिए। इस प्रकार परत के भीतर प्रतिक्रियाएँ या तो समान्तर या शून्य होती हैं। श्रेणियों को सन्निहित होना आवश्यक नहीं होता है। प्रत्येक परत(Ai) के लिए A के मान की गणना की जाती है और वितरण के लिए भारित औसत निर्धारित किया जाता है। वज़न (wi) प्रत्येक परत के लिए उस परत में प्रतिक्रियाओं की संख्या होती है। प्रतीकों में


 * $$ A_{overall} = \sum w_i A_i $$

समान वितरण (असतत) में A = 0 होता है: जब सभी प्रतिक्रियाएँ श्रेणी A = +1 में आती हैं।

इस सूचकांक के साथ सैद्धांतिक समस्या यह है कि यह मानता है कि अंतराल समान दूरी पर होते हैं। इससे इसकी प्रयोज्यता सीमित हो सकती है।

बिमोडल पृथक्करण
यह सूचकांक मानता है कि वितरण माध्य (μ1 और μ2) और मानक विचलन (σ1 और σ2) के साथ दो सामान्य वितरण का मिश्रण होता है।:
 * $$ S = \frac{ \mu_1 - \mu_2 }{ 2( \sigma_1 +\sigma_2 ) } $$

द्विविधता गुणांक
सरले का द्विविधता गुणांक b होता है
 * $$ \beta = \frac{ \gamma^2 + 1 }{ \kappa } $$

जहाँ γ विषमता होती है और κ कर्टोसिस होता है। यहां कर्टोसिस को माध्य के आसपास मानकीकृत चौथे क्षण के रूप में परिभाषित किया जाता है। b का मान 0 और 1 के मध्य होता है। इस गुणांक के पीछे तर्क यह होता है कि हल्की पूंछ वाले द्वि-मोडल वितरण में बहुत कम कर्टोसिस, असममित चरित्र, या दोनों होंगे - जो सभी इस गुणांक को बढ़ाते हैं।

परिमित प्रतिरूप का सूत्र निम्न प्रकार होता है
 * $$ b = \frac{ g^2 + 1 }{ k + \frac{ 3( n - 1 )^2 }{ ( n - 2 )( n - 3 ) } } $$

जहाँ n प्रतिरूप में वस्तुओं की संख्या है, g प्रतिरूप विषमता और k नमूना अतिरिक्त कर्टोसिस होता है।

समान वितरण (निरंतर) के लिए b का मान 5/9 होता है। यह घातीय वितरण के लिए इसका मूल्य भी होता है। 5/9 से अधिक मान द्विमॉडल या मल्टीमॉडल वितरण का संकेत दे सकते हैं, यघपि संबंधित मान भारी विषम यूनिमॉडल वितरण का परिणाम भी हो सकते हैं। अधिकतम मूल्य (1.0) मात्र बर्नौली वितरण द्वारा मात्र दो भिन्न-भिन्न मूल्यों या दो भिन्न-भिन्न डिराक डेल्टा फलन (द्वि-डेल्टा वितरण) के योग के साथ पहुंचता है।

इस आँकड़े का वितरण अज्ञात है। यह पियर्सन द्वारा पहले प्रस्तावित आँकड़े से संबंधित होता है - कर्टोसिस और परोक्षपन के वर्ग के मध्य का अंतर (इन्फ्रा के माध्यम से) होता है।

द्विविधता आयाम
इसे इस प्रकार परिभाषित किया गया है


 * $$ A_B = \frac{A_1 - A_{ an } }{ A_1 } $$

जहाँ A1 छोटे शिखर का आयाम और Aan एंटीमोड का आयाम होता है।

AB सदैव <1 होता है। बड़े मान अधिक विशिष्ट शिखर प्रदर्शित करता हैं।

बिमोडल अनुपात
यह बाएँ और दाएँ शिखर का अनुपात होता है। गणितीय


 * $$ R = \frac{ A_r }{ A_l } $$

जहाँ Al और Ar क्रमशः बाएँ और दाएँ शिखर के आयाम होते हैं।

द्विमोडैलिटी पैरामीटर
यह पैरामीटर (B) विलकॉक के कारण होता है।
 * $$ B = \sqrt{ \frac{ A_r }{ A_l } } \sum P_i $$

जहाँ Al और Ar क्रमशः बाएँ और दाएँ शिखर के आयाम होते हैं और Pi iवें अंतराल मे वितरण के अनुपात के आधार 2 पर लिया गया लघुगणक होता है। ΣP का अधिकतम मान 1 होता है यघपि B का मान इससे अधिक हो सकता है।

इस सूचकांक का उपयोग करने के लिए, मानों का लॉग लिया जाता है। फिर डेटा को चौड़ाई के अंतराल में विभाजित किया जाता है जिसका मान लॉग 2 होता है। चोटियों की चौड़ाई उनके अधिकतम मूल्यों पर केंद्रित चार गुना 1/4Φ मानी जाती है।

द्विविधता सूचकांक

 * वांग का सूचकांक

वांग एट अल द्वारा प्रस्तावित द्विविधता सूचकांक मानता है कि वितरण समान भिन्नताओं यघपि भिन्न-भिन्न साधनों के साथ दो सामान्य वितरणों का योग होता है। इसे इस प्रकार परिभाषित किया गया है:


 * $$ \delta = \frac{ | \mu_1 - \mu_2 |}{ \sigma } $$

जहाँ μ1, μ2 साधन और σ सामान्य मानक विचलन होता है।


 * $$ BI = \delta \sqrt{ p( 1 - p ) } $$

जहाँ p मिश्रण पैरामीटर होता है।


 * स्टुर्रोक का सूचकांक

स्टुर्रोक द्वारा अलग जैव-मॉडलिटी सूचकांक प्रस्तावित किया गया है।

इस सूचकांक (B) को इस प्रकार परिभाषित किया जाता है


 * $$ B = \frac{ 1 }{ N } \left[ \left( \sum_1^N \cos ( 2 \pi m \gamma ) \right)^2 + \left( \sum_1^N \sin ( 2 \pi m \gamma ) \right)^2 \right] $$

जब m = 2 और γ को समान रूप से वितरित किया जाता है, तो B को चरघातांकीय रूप से वितरित किया जाता है।

यह आँकड़ा आवर्त सारणी का रूप होता है। यह आँकड़ों के इस रूप में आम प्राक्लन और वर्णक्रमीय रिसाव की सामान्य समस्याओं से ग्रस्त होता है।


 * डी मिशेल और एकाटिनो का सूचकांक

डी मिशेल और एकाटिनो द्वारा और जैव-मॉडलिटी सूचकांक प्रस्तावित किया जाता है। इनका सूचकांक (B) होता है


 * $$ B = | \mu - \mu_M | $$

जहाँ μ प्रतिरूप का अंकगणितीय माध्य होता है और


 * $$ \mu_M = \frac{ \sum_{ i = 1 }^L m_i x_i }{ \sum_{ i = 1 }^L m_i } $$

जहाँ mi ith बिन में डेटा बिंदुओं की संख्या है, xi \ ith बिन का केंद्र होता L बिन की संख्या होती है।

लेखकों ने बाइमोडल (बी > 0.1) और यूनिमॉडल (बी <0.1) वितरण के मध्य अंतर करने के लिए बी के लिए 0.1 के कट-ऑफ मान का सुझाव दिया जाता है। इस मूल्य के लिए कोई सांख्यिकीय औचित्य प्रस्तुत नहीं किया गया है।


 * सैमब्रूक स्मिथ का सूचकांक

सैम्ब्रुक स्मिथ एट अल द्वारा और सूचकांक (B) प्रस्तावित किया गया है

$$ B = | \phi_2 - \phi_1 | \frac{ p_2 }{ p_1 } $$

जहाँ p1 और p2 प्राथमिक (अधिक आयाम वाले) और द्वितीयक (कम आयाम वाले) मोड और φ में निहित अनुपात φ1 और φ2 प्राथमिक और द्वितीयक मोड के φ-आकार होते हैं। φ-आकार को आधार 2 पर लिए गए डेटा आकार के लॉग के गुना से कम के रूप में परिभाषित किया जाता है। इस परिवर्तन का उपयोग सामान्यतः तलछट के अध्ययन में किया जाता है।

लेखकों ने 1.5 के कट-ऑफ मान की विनती की, जिसमें B द्वि-मॉडल वितरण के लिए 1.5 से अधिक और यूनिमॉडल वितरण के लिए 1.5 से कम होता है। इस मूल्य के लिए कोई सांख्यिकीय औचित्य नहीं दिया जाता है।


 * ओत्सु की विधि

दो मोड के मध्य पृथक्करण की सीमा अन्वेषण के लिए ओत्सु की विधि मात्रा को कम करने पर निर्भर करती है $$ \frac{ n_1 \sigma_1^2 + n_2 \sigma_2^2 }{ m \sigma^2 } $$जहाँ ni ith उप-जनसंख्या में डेटा बिंदुओं की संख्या है, σi2 ith उप-जनसंख्या का विचरण है, m प्रतिरूप का कुल आकार होता है और σ2 नमूना विचरण होता है। कुछ शोधकर्ताओं (विशेष रूप से डिजिटल इमेज प्रोसेसिंग के क्षेत्र में) ने इस मात्रा को द्विरूपता का पता लगाने के लिए सूचकांक के रूप में अधिक व्यापक रूप से प्रयुक्त किया जाता है, जिसमें छोटा मान अधिक द्विमोडल वितरण का संकेत देता है।

सांख्यिकीय परीक्षण
यह निर्धारित करने के लिए कई परीक्षण उपलब्ध होता हैं कि डेटा समुच्चय को द्विमॉडल (या मल्टीमॉडल) फैशन में वितरित किया गया है या नहीं।

ग्राफ़िकल विधियाँ
तलछट के अध्ययन में, कण का आकार अधिकांशतः द्वि-मोडल होता है। अनुभवजन्य रूप से, कणों के लॉग (आकार) के विरुद्ध आवृत्ति को प्लॉट करना उपयोगी पाया गया है। इस प्रकार यह सामान्यतः कणों को द्विमोडल वितरण में स्पष्ट पृथक्करण देता है। भूवैज्ञानिक अनुप्रयोगों में लघुगणक को सामान्यतःआधार 2 पर ले जाया जाता है। लॉग रूपांतरित मानों को फाई (Φ) इकाइयों के रूप में संदर्भित किया जाता है। इस प्रणाली को अनाज के आकार (या फाई) पैमाने के रूप में जाना जाता है।

वैकल्पिक विधि संचयी आवृत्ति के विरुद्ध कण आकार के लॉग को प्लॉट करता है। इस ग्राफ़ में सामान्यतः एंटीमोड के अनुरूप कनेक्टिंग लाइन के साथ दो उचित सीधी रेखाएं सम्मलित होती है।


 * सांख्यिकी

कई आँकड़ों के लिए प्राक्लनित मान ग्राफ़िक प्लॉट से प्राप्त किए जा सकते हैं।


 * $$\mathit{Mean} = \frac{ \phi_{ 16 } + \phi_{ 50 } + \phi_{ 84 } }{ 3 }$$
 * $$\mathit{StdDev} = \frac{ \phi_{ 84 } - \phi_{ 16 } }{ 4 } + \frac{ \phi_{ 95 } - \phi_{ 5 } }{ 6.6 } $$
 * $$\mathit{Skew} = \frac{ \phi_{ 84 } + \phi_{ 16 } - 2  \phi_{ 50 } }{ 2 ( \phi_{ 84 } -  \phi_{ 16 } ) } + \frac{ \phi_{ 95 } +  \phi_{ 5 } -  2 \phi_{ 50 } }{ 2( \phi_{ 95 } - \phi_{ 5 } ) } $$
 * $$\mathit{Kurt} = \frac{ \phi_{ 95 } - \phi_{ 5 } }{ 2.44 ( \phi_{ 75 } - \phi_{ 25 } ) }$$

जहाँ माध्य माध्य होता है, मानक विचलन होता है, परोक्ष परोक्षपन होता है, कर्ट कर्टोसिस होता है और φx x पर चर φ का मान होता है।.

यूनिमॉडल बनाम बाइमोडल वितरण
1894 में पियर्सन पहले व्यक्ति थे जिन्होंने यह परीक्षण करने के लिए प्रक्रिया तैयार की कि क्या वितरण को दो सामान्य वितरणों में हल किया जा सकता है। इस विधि के लिए नौवें क्रम के बहुपद के समाधान की आवश्यकता होती है। पश्चात् के पेपर में पियर्सन ने बताया कि किसी भी वितरण विषमता 2 + 1 के लिए <कर्टोसिस होता है। पश्चात् में पियर्सन ने यह सिद्ध भी किया था।
 * $$ b_2 - b_1 \ge 1 $$

जहाँ b2 कुर्टोसिस है और b1 परोक्षपन का वर्ग होता है। समानता मात्र दो बिंदु बर्नौली वितरण या दो भिन्न-भिन्न डिराक डेल्टा कार्यों के योग के लिए होता है। ये द्विरूपता के संभावित सबसे चरम स्थिति होती है । इन दोनों स्थितियों में कर्टोसिस 1 होती है। चूंकि वे दोनों सममित होते हैं, इसलिए उनकी विषमता 0 है और अंतर 1 होता है।

बेकर ने बाइमॉडल को यूनिमॉडल वितरण में बदलने के लिए परिवर्तन का प्रस्ताव रखा था।

एकरूपता विरूद्ध द्विरूपता के कई परीक्षण प्रस्तावित किए गए हैं: हाल्डेन ने दूसरे केंद्रीय अंतर के आधार पर का सुझाव दिया। लार्किन ने पश्चात् में एफ परीक्षण पर आधारित परीक्षण प्रस्तुत किया था; बेनेट ने जी-टेस्ट|फिशर के जेड टेस्ट के आधार पर इसको बनाया था। टोकेशी ने चौथे परीक्षण का प्रस्ताव रखा है। होल्ज़मैन और वोल्मर द्वारा संभावना अनुपात पर आधारित परीक्षण प्रस्तावित किया गया है।

स्कोर और वाल्ड परीक्षणों पर आधारित विधि प्रस्तावित की गई है। अंतर्निहित वितरण ज्ञात होने पर यह विधि यूनिमॉडल और बाइमोडल वितरण के मध्य अंतर कर सकती है।

एंटीमोड परीक्षण
एंटीमोड के लिए सांख्यिकीय परीक्षण ज्ञात होता हैं।
 * ओत्सु की विधि

दो वितरणों के मध्य श्रेष्ट पृथक्करण निर्धारित करने के लिए ओट्सू की विधि सामान्यतः कंप्यूटर ग्राफिक्स में नियोजित की जाती है।

सामान्य परीक्षण
यह जांचने के लिए कि क्या कोई वितरण यूनिमॉडल के अतिरिक्त है, कई अतिरिक्त परीक्षण तैयार किए गए हैं: बैंडविड्थ परीक्षण (मल्टीमॉडल), डिप परीक्षण, अतिरिक्त द्रव्यमान परीक्षण, एमएपी परीक्षण, मोड अस्तित्व परीक्षण, रन परीक्षण, स्पैन परीक्षण, और सैडल परीक्षण।

आर (प्रोग्रामिंग भाषा) के लिए डिप टेस्ट का कार्यान्वयन उपलब्ध होता है। डिप स्टेटिस्टिक मानों के लिए p-मान 0 और 1 के मध्य होते हैं। 0.05 से कम p-मान महत्वपूर्ण मल्टीमोडैलिटी को प्रदर्शित करते हैं और 0.05 से अधिक यघपि 0.10 से कम p-वैल्यू सीमांत महत्व के साथ मल्टीमोडैलिटी का संकेत देते हैं।

सिल्वरमैन का परीक्षण
सिल्वरमैन ने मोड की संख्या के लिए बूटस्ट्रैप विधि प्रस्तुत की थी। परीक्षण निश्चित बैंडविड्थ का उपयोग करता है जो परीक्षण की शक्ति और इसकी व्याख्या को कम कर देता है। सुचारू घनत्व के तहत अत्यधिक संख्या में मोड हो सकते हैं जिनकी बूटस्ट्रैपिंग के अवधि गिनती अस्थिर होती है।

बज्गीर-अग्रवाल परीक्षण
बाजगीर और अग्रवाल ने वितरण के कुर्टोसिस के आधार पर परीक्षण का प्रस्ताव दिया है।

विशेष स्थति
कई विशेष स्थिति के लिए अतिरिक्त परीक्षण उपलब्ध होते हैं:


 * दो सामान्य वितरणों का मिश्रण

दो सामान्य वितरण डेटा के मिश्रण घनत्व के अध्ययन में पाया गया कि दो सामान्य वितरणों में पृथक्करण तब तक कठिन था जब तक कि साधन 4-6 मानक विचलन से अलग न हो जाएं। खगोल विज्ञान में कर्नेल माध्य मिलान एल्गोरिथ्म का उपयोग यह तय करने के लिए किया जाता है कि डेटा समुच्चय एकल सामान्य वितरण से संबंधित है या दो सामान्य वितरणों के मिश्रण से भी संबंधित होता है।


 * बीटा-सामान्य वितरण

यह वितरण पैरामीटर के कुछ मानों के लिए द्वि-मोडल होता है। इन मूल्यों के लिए परीक्षण का वर्णन किया जाता है।

पैरामीटर प्राक्लन और फिटिंग वक्र
यह मानते हुए कि वितरण को द्वि-मोडल के रूप में जाना जाता है या उपरोक्त या अधिक परीक्षणों द्वारा द्वि-मोडल दिखाया गया है, डेटा में वक्र फिट करना अधिकांशतः वांछनीय होता है। ये कठिन हो सकता है।

कठिन स्थितियों में बायेसियन विधियाँ उपयोगी हो सकती हैं।

सॉफ़्टवेयर

 * दो सामान्य वितरण

द्विविधता के परीक्षण के लिए आर (प्रोग्रामिंग भाषा) के लिए पैकेज उपलब्ध है। इस प्रकार यह पैकेज मानता है कि डेटा को दो सामान्य वितरणों के योग के रूप में वितरित किया जाता है। यदि यह धारणा सही नहीं है तो परिणाम विश्वसनीय नहीं हो सकते हैं। इसमें डेटा में दो सामान्य वितरणों के योग को स्थापित करने के कार्य भी सम्मलित होता हैं।

यह मानते हुए कि वितरण दो सामान्य वितरणों का मिश्रण है तो पैरामीटर निर्धारित करने के लिए अपेक्षा-अधिकतमकरण एल्गोरिदम का उपयोग किया जा सकता है। इसके लिए क्लस्टर सहित कई कार्यक्रम जैसे और आर पैकेज नॉर1मिक्स उपलब्ध होता हैं।।
 * अन्य वितरण

R के लिए उपलब्ध मिक्सटूल पैकेज कई भिन्न-भिन्न वितरणों के मापदंडों का परीक्षण और प्राक्लन लगा सकता है। दो दाएँ-पुच्छ गामा वितरणों के मिश्रण के लिए पैकेज उपलब्ध होता है।

मिश्रण मॉडल में स्थापित होने के लिए आर के लिए कई अन्य पैकेज उपलब्ध होते हैं; इनमें फ्लेक्समिक्स, मैकक्लस्ट, एजीआरएमटी, और मिक्सडिस्ट सम्मलित होते है। सांख्यिकीय प्रोग्रामिंग भाषा एसएएस भाषा पीआरओसी एफआरईक्यू प्रक्रिया के साथ विभिन्न प्रकार के मिश्रित वितरणों को भी स्थापित कर सकती है।

उदाहरण सॉफ़्टवेयर एप्लिकेशन
द कमफ़्रेकए डेटा समुच्चय (X) में समग्र संभाव्यता वितरण के स्थापन के लिए प्रोग्राम समुच्चय को भिन्न-भिन्न वितरण के साथ दो भागों में विभाजित कर सकता है। यह आंकड़ा संचयी वितरण फलन (सीडीएफ) समीकरणों के साथ वितरण स्थापन के रूप में दोहरे सामान्यीकृत प्रतिबिंबित गम्बेल वितरण का उदाहरण दिखाता है:

X < 8.10 : CDF = 1 - exp[-exp{-(0.092X^0.01+935)}] X > 8.10 : CDF = 1 - exp[-exp{-(-0.0039X^2.79+1.05)}]

यह भी देखें

 * अति प्रसारित