मल्टीकैनोनिकल एन्सेम्बल

सांख्यिकी और भौतिकी में, मल्टीकैनोनिकल एन्सेम्बल (जिसे मल्टीकैनोनिकल सैंपलिंग या फ्लैट हिस्टोग्राम भी कहा जाता है) एक मार्कोव श्रृंखला मोंटे कार्लो सैंपलिंग तकनीक है जो अभिन्न  की गणना करने के लिए मेट्रोपोलिस-हेस्टिंग्स एल्गोरिदम का उपयोग करती है जहां इंटीग्रैंड में कई स्थानीय न्यूनतम के साथ एक मोटा परिदृश्य होता है। यह राज्यों के घनत्व के व्युत्क्रम के अनुसार राज्यों का नमूना लेता है, जिसे प्राथमिकता से जानना होगा या वांग और लैंडौ एल्गोरिदम जैसी अन्य तकनीकों का उपयोग करके गणना की जानी होगी। मल्टीकैनोनिकल सैंपलिंग आइसिंग मॉडल या  कांच घूमाओ  जैसी स्पिन (भौतिकी) प्रणालियों के लिए एक महत्वपूर्ण तकनीक है।

प्रेरणा
बड़ी संख्या में स्वतंत्रता की डिग्री वाली प्रणालियों में, जैसे स्पिन (भौतिकी) प्रणालियों में, मोंटे कार्लो एकीकरण की आवश्यकता होती है। इस एकीकरण में, महत्व नमूनाकरण और विशेष रूप से महानगर एल्गोरिथ्म, एक बहुत ही महत्वपूर्ण तकनीक है। हालाँकि, मेट्रोपोलिस एल्गोरिथ्म नमूने के अनुसार बताता है $$\exp(-\beta E)$$ जहां बीटा तापमान का व्युत्क्रम है। इसका मतलब है कि एक ऊर्जा अवरोध $$\Delta E$$ ऊर्जा स्पेक्ट्रम पर काबू पाना बेहद कठिन है। पॉट्स मॉडल जैसे कई स्थानीय ऊर्जा मिनिमा वाले सिस्टम का नमूना लेना कठिन हो जाता है क्योंकि एल्गोरिदम सिस्टम के स्थानीय मिनिमा में फंस जाता है। यह अन्य दृष्टिकोणों, अर्थात् अन्य नमूनाकरण वितरणों को प्रेरित करता है।

अवलोकन
मल्टीकैनोनिकल पहनावा मेट्रोपोलिस-हेस्टिंग्स एल्गोरिथ्म का उपयोग करता है, जो सिस्टम के राज्यों के घनत्व के व्युत्क्रम द्वारा दिए गए नमूना वितरण के साथ होता है, जो नमूना वितरण के विपरीत है। $$\exp(-\beta E)$$ मेट्रोपोलिस एल्गोरिदम का. इस विकल्प के साथ, औसतन, प्रत्येक ऊर्जा पर नमूना किए गए राज्यों की संख्या स्थिर होती है, यानी यह ऊर्जा पर एक फ्लैट हिस्टोग्राम के साथ एक अनुकरण है। यह एक ऐसे एल्गोरिदम की ओर ले जाता है जिसके लिए ऊर्जा बाधाओं को दूर करना अब मुश्किल नहीं है। मेट्रोपोलिस एल्गोरिथ्म पर एक और फायदा यह है कि नमूनाकरण सिस्टम के तापमान से स्वतंत्र है, जिसका अर्थ है कि एक सिमुलेशन सभी तापमानों के लिए थर्मोडायनामिकल चर के अनुमान की अनुमति देता है (इस प्रकार नाम मल्टीकैनोनिकल: कई तापमान)। प्रथम क्रम चरण संक्रमण के अध्ययन में यह एक बड़ा सुधार है।

एक बहुविहित समूह को निष्पादित करने में सबसे बड़ी समस्या यह है कि राज्यों के घनत्व को प्राथमिकता से जानना होगा। मल्टीकैनोनिकल सैंपलिंग में एक महत्वपूर्ण योगदान वांग और लैंडौ एल्गोरिदम का था, जो अभिसरण के दौरान राज्यों के घनत्व की गणना करते समय एसिम्प्टोटिक रूप से एक मल्टीकैनोनिकल समूह में परिवर्तित हो जाता है।

बहुविहित समूह भौतिक प्रणालियों तक ही सीमित नहीं है। इसे अमूर्त प्रणालियों पर नियोजित किया जा सकता है जिनमें लागत फ़ंक्शन एफ होता है। एफ के संबंध में राज्यों के घनत्व का उपयोग करके, उच्च-आयामी इंटीग्रल की गणना करने या स्थानीय मिनीमा खोजने के लिए विधि सामान्य हो जाती है।

प्रेरणा
एक प्रणाली और उसके चरण-स्थान पर विचार करें $$\Omega$$ एक विन्यास द्वारा विशेषता $$\boldsymbol{r}$$ में $$\Omega$$ और सिस्टम के चरण-स्थान से एक-आयामी स्थान तक एक लागत फ़ंक्शन एफ $$\Gamma$$: $$F(\Omega) = \Gamma = [\Gamma_\min, \Gamma_\max]$$, एफ का स्पेक्ट्रम।

औसत मात्रा की गणना $$\langle Q\rangle$$ चरण-स्थान पर एक अभिन्न के मूल्यांकन की आवश्यकता होती है:


 * $$\langle Q\rangle = \int_\Omega Q(\boldsymbol{r}) P_r(\boldsymbol{r}) \,d\boldsymbol{r}$$

कहाँ $$P_r(\boldsymbol{r})$$ प्रत्येक राज्य का भार है (उदा. $$P_r(\boldsymbol{r})=1/V$$ समान रूप से वितरित राज्यों के अनुरूप)।

जब Q किसी विशेष राज्य पर नहीं बल्कि केवल राज्य के विशेष F के मान पर निर्भर करता है $$F(\boldsymbol{r}) = F_\boldsymbol{r}$$, के लिए सूत्र $$\langle Q\rangle$$ डायराक डेल्टा फ़ंक्शन जोड़कर एफ पर एकीकृत किया जा सकता है और इसे इस प्रकार लिखा जा सकता है



\begin{align} \langle Q\rangle & = \int_{\Gamma_\min}^{\Gamma_\max} \int_\Omega Q(F_\boldsymbol{r}) P_r(F_\boldsymbol{r}) \delta(f - F_\boldsymbol{r}) \,d\boldsymbol{r} \,df \\ & = \int_{\Gamma_\min}^{\Gamma_\max} Q(f) \int_\Omega \delta(f - F_\boldsymbol{r}) P_r(F_\boldsymbol{r}) \,d\boldsymbol{r} \, df \\ & = \int_{\Gamma_\min}^{\Gamma_\max} Q(f) P(f) \, df \\ \end{align} $$ कहाँ


 * $$P(f) = \int_\Omega P_r(r)\delta(f - F(\boldsymbol{r})) \,d\boldsymbol{r}$$

एफ का सीमांत वितरण है.

जब सिस्टम में बड़ी संख्या में स्वतंत्रता की डिग्री होती है, तो इसके लिए एक विश्लेषणात्मक अभिव्यक्ति होती है $$\langle Q\rangle$$ इसे प्राप्त करना अक्सर कठिन होता है, और मोंटे कार्लो एकीकरण को आम तौर पर गणना में नियोजित किया जाता है $$\langle Q\rangle$$. सरलतम फॉर्मूलेशन पर, विधि एन समान रूप से वितरित राज्यों को चुनती है $$\boldsymbol{r}_i\in \Omega$$, और अनुमानक का उपयोग करता है


 * $$\overline{Q}_N = \sum_{i = 1}^N Q(\boldsymbol{r}_i) V P_r(\boldsymbol{r}_i)$$

कंप्यूटिंग के लिए $$\langle Q\rangle$$ क्योंकि $$\overline{Q}_N$$ लगभग निश्चित रूप से अभिसरण होता है $$\langle Q\rangle$$ बड़ी संख्या के नियम द्वारा#मजबूत कानून:


 * $$\lim_{N\rightarrow\infty} \overline{Q}_N = \langle Q\rangle.$$

इस अभिसरण की एक विशिष्ट समस्या यह है कि Q का विचरण बहुत अधिक हो सकता है, जिससे उचित परिणाम प्राप्त करने के लिए उच्च कम्प्यूटेशनल प्रयास करना पड़ता है।

इस अभिसरण को बेहतर बनाने के लिए, मेट्रोपोलिस-हेस्टिंग्स एल्गोरिदम प्रस्तावित किया गया था। आम तौर पर, मोंटे कार्लो पद्धति का विचार अनुमानक के अभिसरण को बेहतर बनाने के लिए महत्व नमूने का उपयोग करना है $$\overline{Q}_N$$ एक मनमाना वितरण के अनुसार राज्यों का नमूना लेकर $$\pi(\boldsymbol{r})$$, और उपयुक्त अनुमानक का उपयोग करें:


 * $$\overline{Q}_N = \sum_{i = 1}^N Q(\boldsymbol{r}_i) \pi^{-1}(\boldsymbol{r}_i) P_r(\boldsymbol{r}_i)$$.

यह अनुमानक एक मनमाना वितरण से लिए गए नमूनों के माध्य के अनुमानक को सामान्यीकृत करता है। इसलिए, जब $$\pi(\boldsymbol{r})$$ एक समान वितरण है, यह ऊपर एक समान नमूने पर उपयोग किए गए वितरण से मेल खाता है।

जब सिस्टम एक भौतिक सिस्टम होता है जो ऊष्मा स्नान के संपर्क में होता है, तो प्रत्येक अवस्था $$\boldsymbol{r}$$ बोल्ट्ज़मान कारक के अनुसार भारित किया जाता है, $$P_r(\boldsymbol{r}_i) \propto \exp(-\beta F_\boldsymbol{r})$$. मोंटे कार्लो में, विहित पहनावा को चुनकर परिभाषित किया गया है $$\pi(\boldsymbol{r})$$ के आनुपातिक होना $$P_r(\boldsymbol{r}_i)$$. इस स्थिति में, अनुमानक एक साधारण अंकगणितीय औसत से मेल खाता है:
 * $$\overline{Q}_N = \frac{1}{N} \sum_{i = 1}^N Q(\boldsymbol{r}_i)$$

ऐतिहासिक रूप से, यह तेज़ कंप्यूटिंग मशीनों द्वारा राज्य की गणना के समीकरण के कारण हुआ हीट बाथ के संपर्क में आने वाले सिस्टम पर औसत की गणना करने के लिए मेट्रोपोलिस-हेस्टिंग्स एल्गोरिदम का उपयोग करना था, जहां वजन बोल्ट्जमैन कारक द्वारा दिया जाता है, $$P(\boldsymbol{x}) \propto \exp(-\beta E(\boldsymbol{r}))$$.

जबकि अक्सर ऐसा होता है कि नमूना वितरण $$\pi$$ वजन वितरण के लिए चुना गया है $$P_r$$, ऐसा होना आवश्यक नहीं है। एक स्थिति जहां विहित पहनावा एक कुशल विकल्प नहीं है, वह तब होता है जब इसे एकत्रित होने में मनमाने ढंग से लंबा समय लगता है। एक स्थिति जहां ऐसा होता है जब फ़ंक्शन F में एकाधिक स्थानीय मिनीमा होते हैं। एल्गोरिदम के लिए एक विशिष्ट क्षेत्र को स्थानीय न्यूनतम के साथ छोड़ने की कम्प्यूटेशनल लागत लागत फ़ंक्शन के न्यूनतम मूल्य के साथ तेजी से बढ़ती है। अर्थात्, न्यूनतम जितना गहरा होगा, एल्गोरिदम वहां उतना अधिक समय व्यतीत करेगा, और इसे छोड़ना उतना ही कठिन होगा (स्थानीय न्यूनतम की गहराई के साथ तेजी से बढ़ रहा है)।

लागत फ़ंक्शन के स्थानीय न्यूनतम में फंसने से बचने का एक तरीका नमूना तकनीक को स्थानीय न्यूनतम के लिए अदृश्य बनाना है। यह बहुविहित समूह का आधार है।

बहुविहित पहनावा
बहुविहित समूह को नमूना वितरण का चयन करके परिभाषित किया गया है


 * $$\pi(\boldsymbol{r}) \propto \frac{1}{P(F_\boldsymbol{r})}$$

कहाँ $$ P(f)$$ ऊपर परिभाषित F का सीमांत वितरण है। इस विकल्प का परिणाम यह है कि f, m(f) के दिए गए मान के साथ नमूनों की औसत संख्या दी गई है


 * $$ m(f) = \int_\Omega \delta(f - F_\boldsymbol{r}) \pi(\boldsymbol{r}) P_r(\boldsymbol{r})\,d\boldsymbol{r} \propto \int_\Omega \delta(f - F_\boldsymbol{r}) P_r(\boldsymbol{r}) \frac{1}{P(F_\boldsymbol{r})} d\boldsymbol{r} = \frac{1}{P(f)} \int_\Omega \delta(f - F_\boldsymbol{r}) P_r(\boldsymbol{r}) d\boldsymbol{r} = 1$$

अर्थात्, नमूनों की औसत संख्या f पर निर्भर नहीं करती है: सभी लागतें f समान रूप से नमूना की जाती हैं, भले ही वे अधिक या कम संभावित हों। यह फ्लैट-हिस्टोग्राम नाम को प्रेरित करता है। हीट बाथ के संपर्क में आने वाली प्रणालियों के लिए, नमूनाकरण तापमान से स्वतंत्र होता है और एक सिमुलेशन सभी तापमानों का अध्ययन करने की अनुमति देता है।

सुरंग बनाने का समय और महत्वपूर्ण गति धीमी होना
किसी भी अन्य मोंटे कार्लो विधि की तरह, इसमें से लिए गए नमूनों के सहसंबंध होते हैं $$P(\boldsymbol{r})$$. सहसंबंध का एक विशिष्ट माप सुरंग बनाने का समय है। टनलिंग समय को मार्कोव चरणों (मार्कोव श्रृंखला के) की संख्या से परिभाषित किया जाता है, सिमुलेशन को एफ के न्यूनतम और अधिकतम स्पेक्ट्रम के बीच एक राउंड-ट्रिप करने की आवश्यकता होती है। टनलिंग समय का उपयोग करने के लिए एक प्रेरणा यह है कि जब यह पार हो जाता है स्पेक्ट्रा, यह राज्यों के अधिकतम घनत्व वाले क्षेत्र से होकर गुजरता है, इस प्रकार प्रक्रिया का सहसंबंध समाप्त हो जाता है। दूसरी ओर राउंड-ट्रिप्स का उपयोग यह सुनिश्चित करता है कि सिस्टम सभी स्पेक्ट्रम का दौरा करता है।

क्योंकि हिस्टोग्राम वेरिएबल एफ पर सपाट है, एक मल्टीकैनोनिक पहनावा को एफ मानों की एक-आयामी रेखा पर एक प्रसार प्रक्रिया (यानी एक यादृच्छिक चलना) के रूप में देखा जा सकता है। प्रक्रिया का विस्तृत संतुलन यह निर्देशित करता है कि प्रक्रिया पर कोई स्टोकेस्टिक बहाव नहीं है। इसका तात्पर्य यह है कि सुरंग बनाने का समय, स्थानीय गतिशीलता में, एक प्रसार प्रक्रिया के रूप में स्केल होना चाहिए, और इस प्रकार सुरंग बनाने का समय स्पेक्ट्रम के आकार के साथ चतुष्कोणीय रूप से स्केल होना चाहिए, एन:


 * $$\tau_{tt} \propto N^2$$

हालाँकि, कुछ प्रणालियों में (आइज़िंग मॉडल सबसे प्रतिमानात्मक है), स्केलिंग गंभीर रूप से धीमी होने से ग्रस्त है: यह है $$N^{2+z}$$ कहाँ $$z>0$$ विशिष्ट प्रणाली पर निर्भर करता है।

स्केलिंग को द्विघात स्केलिंग में बेहतर बनाने के लिए गैर-स्थानीय गतिशीलता विकसित की गई थी ( वोल्फ एल्गोरिथ्म देखें), महत्वपूर्ण धीमी गति को मात देते हुए। हालाँकि, यह अभी भी एक खुला प्रश्न है कि क्या कोई स्थानीय गतिशीलता है जो आइसिंग मॉडल जैसे स्पिन सिस्टम में गंभीर मंदी से ग्रस्त नहीं है।