स्वतंत्र घटक विश्लेषण

From Vigyanwiki
Revision as of 12:48, 20 June 2023 by alpha>Neeraja (added Category:Vigyan Ready using HotCat)

संकेतों को अग्रेषित करने के लिए स्वतंत्र घटक विश्लेषण (आईसीए) बहुभिन्नरूपी सांख्यिकी संकेत को योगात्मक उपघटकों में अलग करने के लिए कम्प्यूटरीकृत विधि है। इसका उपयोग यह मानकर किया जाता है कि अधिक से अधिक उपघटक गाऊसी प्रमेय का पालन करते है और यह कि उपघटक दूसरे से सांख्यिकीय रूप से स्वतंत्र हैं।[1] इस प्रकार आईसीए विचारहीन स्त्रोत विभाजन की विशेष स्थिति हैं। सामान्य उदाहरण अनुप्रयोग ध्वनियुक्त कमरे में व्यक्ति के भाषण को सुनने की कॉकटेल समूह की समस्या है।[2]

परिचय

चार बेतरतीब ढंग से मिश्रित वीडियो पर आईसीए।[3] शीर्ष: मूल स्रोत वीडियो हैं। मध्य एल्गोरिदम में इनपुट के रूप में उपयोग किए जाने वाले चार यादृच्छिक मिश्रण हैं। जो नीचे: पुनर्निर्मित वीडियो में देखा जा सकता हैं।

स्वतंत्र घटक विश्लेषण बहुभिन्नरूपी संकेत को स्वतंत्र गैर-गाऊसी संकेतों में विघटित करने का प्रयास करता है। इस प्रकार उदाहरण के रूप में, ध्वनि सामान्यतः संकेत होता है जो इस प्रकार कई स्रोतों से संकेतों के प्रत्येक समय टी पर संख्यात्मक जोड़ से बना होता है। इस प्रकार प्रश्न यह है कि क्या इन योगदान स्रोतों को देखे गए कुल संकेत से अलग करना संभव है। इस प्रकार जब सांख्यिकीय स्वतंत्रता धारणा सही होती है, तो इस प्रकार मिश्रित संकेत का विचारहीन आईसीए पृथक्करण बहुत अच्छा परिणाम देता है। इस प्रकार इसका उपयोग उन संकेतों के लिए भी किया जाता है जिन्हें विश्लेषण उद्देश्यों के लिए मिश्रित करके उत्पन्न नहीं किया जाना चाहिए।

कॉकटेल पार्टी की समस्या आईसीए का सरल अनुप्रयोग है, जहाँ अंतर्निहित संकेतों को कमरे में साथ बात करने वाले लोगों के नमूना डेटा से अलग किया जाता है। सामान्यतः इसके अतिरिक्त गूँजने की समस्या को सरल बना दिया जाता है। इस प्रकार ध्यान दें कि फ़िल्टर्ड और विलंबित संकेत आश्रित घटक की प्रति है, और इस प्रकार सांख्यिकीय स्वतंत्रता धारणा का उल्लंघन नहीं होता है।

इस प्रकार निर्माण के लिए वजन को संयोजित करना से संकेतों का अवलोकन किया तथा घटकों को में आव्यूह उपयोग किया जाता है। इस पर विचार करने वाली महत्वपूर्ण बात यह है कि यदि स्रोत सम्मलित हैं, इस प्रकार कम से कम मूल संकेतों को पुनर्प्राप्त करने के लिए अवलोकन उदाहरण के लिए माइक्रोफ़ोन यदि देखा गया संकेत ऑडियो की आवश्यकता होती है। इस प्रकार जब समान संख्या में अवलोकन और स्रोत संकेत होते हैं, तो () मिश्रण आव्यूह वर्गाकार होता है। इस प्रकार अनिर्धारित के अन्य स्थितियों () और अतिनिर्धारित () की जांच की गई है।

यह मिश्रित संकेतों का आईसीए पृथक्करण बहुत अच्छे परिणाम देता है, इस प्रकार यह दो धारणाओं और मिश्रण स्रोत संकेतों के तीन प्रभावों पर आधारित है। इस प्रकार इसकी दो धारणाएं हैं :

  1. स्रोत संकेत दूसरे से स्वतंत्र हैं।
  2. प्रत्येक स्रोत संकेत के मान में गैर-गाऊसी वितरण होते हैं।

स्रोत संकेतों को मिलाने के तीन प्रभाव:

  1. स्वतंत्रता: धारणा 1 के अनुसार, स्रोत संकेत स्वतंत्र हैं; चूंकि इस प्रकार उनके संकेत मिश्रण नहीं हैं। ऐसा इसलिए है क्योंकि संकेत मिश्रण समान स्रोत संकेत साझा करते हैं।
  2. सामान्यत: इस प्रकार केंद्रीय सीमा प्रमेय के अनुसार, परिमित विचरण के साथ स्वतंत्र यादृच्छिक चर के योग का वितरण गॉसियन वितरण की ओर जाता है।
    सरल शब्दों में कहें तो, दो स्वतंत्र यादृच्छिक चर के योग में सामान्यतः वितरण होता है जो इसके करीब होता है गॉसियन दो मूल चरों में से किसी की तुलना में उपयोग किया जाता हैं। यहां इस प्रकार हम प्रत्येक संकेत के मान को यादृच्छिक चर मानते हैं।
  3. जटिलता: किसी भी संकेत मिश्रण की अस्थायी जटिलता उसके सरलतम घटक स्रोत संकेत की तुलना में अधिक होती है।

इस प्रकार इस सिद्धांत आईसीए की मौलिक स्थापना में योगदान करते हैं। इस प्रकार यदि मिश्रण के समुच्चय से निकाले गए संकेत स्वतंत्र हैं, और इस प्रकार गैर-गाऊसी हिस्टोग्राम हैं या कम जटिलता है, तो उन्हें स्रोत संकेत होना चाहिए।[4][5]

घटक स्वतंत्रता को परिभाषित करना

आईसीए अनुमानित घटकों की सांख्यिकीय स्वतंत्रता को अधिकतम करके स्वतंत्र घटकों का पता लगाता है, जिन्हें कारक, अव्यक्त चर या स्रोत भी कहा जाता है। इस प्रकार हम स्वतंत्रता के लिए प्रॉक्सी को परिभाषित करने के कई तरीकों में से चुन सकते हैं, और यह विकल्प आईसीए एल्गोरिथम के रूप को नियंत्रित करता है। इस प्रकार आईसीए के लिए स्वतंत्रता की दो व्यापक परिभाषाएँ हैं

  1. आपसी जानकारी को कम करना
  2. गैर-गौसियनिटी का अधिकतमकरण

आईसीए एल्गोरिथम का मिनिमाइजेशन-ऑफ-म्युचुअल इंफॉर्मेशन (एमएमआई) समुच्चय कुल्बैक-लीब्लर डाइवर्जेंस या कुल्बैक-लीब्लर डाइवर्जेंस और अधिकतम एंट्रॉपी के सिद्धांत जैसे उपायों का उपयोग करता है। इस प्रकार केंद्रीय सीमा प्रमेय से प्रेरित आईसीए एल्गोरिदम का गैर-गौसियनिटी समुच्चय, कुकुदता और नाइनट्रॉपी का उपयोग करता है।

आईसीए के लिए विशिष्ट एल्गोरिदम वास्तविक पुनरावृत्त एल्गोरिदम के लिए समस्या की जटिलता को सरल बनाने और कम करने के लिए केंद्रीकरण शून्य माध्य संकेत बनाने के लिए माध्य घटाना, श्वेत परिवर्तन सामान्यतः ईजेनवेल्यू अपघटन के साथ और पूर्वप्रक्रमण चरणों के रूप में आयाम में कमी का उपयोग करते हैं। इस प्रकार मुख्य घटक विश्लेषण या एकवचन मूल्य अपघटन के साथ श्वेतकरण और आयाम में कमी प्राप्त की जा सकती है। इस प्रकार श्वेतकरण यह सुनिश्चित करता है कि एल्गोरिदम चलाने से पहले सभी आयामों को समान रूप से प्राथमिकता माना जाता है। इस प्रकार आईसीए के लिए प्रसिद्ध एल्गोरिदम में इन्फो मैक्स , फास्टआईसीए, जेएडीई (आईसीए), और कर्नेल-स्वतंत्र घटक विश्लेषण सम्मलित हैं। सामान्यतः इस प्रकार आईसीए स्रोत संकेतों की वास्तविक संख्या, स्रोत संकेतों के विशिष्ट रूप से सही क्रम, और न ही स्रोत संकेतों के उचित स्केलिंग साइन सहित की पहचान नहीं कर सकता है।

आईसीए संकेत पृथक्करण के लिए महत्वपूर्ण है और इसके कई व्यावहारिक अनुप्रयोग हैं। इस प्रकार यह डेटा के तथ्यात्मक कोड की खोज या यहां तक ​​कि विशेष स्थितियों से निकटता से संबंधित है, अर्थात इस प्रकार प्रत्येक डेटा सदिश के इस सदिश के मान के लिए प्रतिनिधित्व करते हुए यह इस प्रकार परिणामी कोड को सदिश द्वारा विशिष्ट रूप से एन्कोड कोडिंग करता है। अपितु कोड घटक सांख्यिकीय रूप से स्वतंत्र हैं।

गणितीय परिभाषाएँ

रैखिक स्वतंत्र घटक विश्लेषण को नीरव और ध्वनि वाले स्थितियों में विभाजित किया जा सकता है, जहाँ नीरव आईसीए ध्वनि आईसीए की विशेष स्थिति हैं। इस प्रकार नॉनलाइनियर आईसीए को अलग स्थितियों के रूप में माना जाना चाहिए।

सामान्य परिभाषा

डेटा को देखे गए यादृच्छिक सदिश द्वारा दर्शाया गया है और छिपे हुए घटक यादृच्छिक सदिश के रूप में कार्य देखे गए डेटा को बदलना है, इस प्रकार रैखिक स्थिर परिवर्तन का उपयोग करना जैसा अधिकतम स्वतंत्र घटकों के सदिश में किसी कार्य द्वारा मापा जाता है इंडिपेंडेंट के लिए उपयोग किये जाते हैं।

जनरेटिव प्रारूप

रैखिक नीरव आईसीए

अवयव देखे गए यादृच्छिक सदिश की स्वतंत्र घटकों के योग , के रूप में उत्पन्न होते हैं:

मिश्रण भार द्वारा भारित रहता हैं।

उसी जनरेटिव प्रारूप को सदिश रूप में लिखा जा सकता है, जहाँ यादृच्छिक सदिश आधार सदिश द्वारा दर्शाया गया है। आधार सदिश मिक्सिंग आव्यूह के कॉलम बनाएं और , जहाँ उत्पादक सूत्र के रूप में लिखा जा सकता है।

इस प्रकार प्रारूप को देखते हुए यादृच्छिक सदिश का , कार्य दोनों मिश्रण आव्यूह और स्रोत का अनुमान लगाना है, इस प्रकार यह अनुकूल रूप से गणना करके किया जाता है सदिश और लागत फलन स्थापित करना जो या तो गणना की गैर-गौसियनिटी को अधिकतम करता है या इस प्रकार आपसी जानकारी को कम करता है। कुछ स्थितियों में, स्रोतों के संभाव्यता बंटन का प्राथमिक ज्ञान लागत फलन में उपयोग किया जा सकता है।

मूल स्रोत देखे गए संकेतों को गुणा करके पुनर्प्राप्त किया जा सकता है मिश्रण आव्यूह के व्युत्क्रम के साथ उपयोग किया जाता है, जिसे अनमिक्सिंग आव्यूह के रूप में भी जाना जाता है। यहाँ यह माना जाता है कि मिश्रण आव्यूह वर्ग () है। इस प्रकार यदि आधार सदिशों की संख्या प्रेक्षित सदिशों की विमा से अधिक है, अपितु छद्म व्युत्क्रम के साथ अभी भी हल करने योग्य है।

रैखिक ध्वनि आईसीए

शून्य-माध्य और असंबद्ध गाऊसी ध्वनि की अतिरिक्त धारणा के साथ , आईसीए प्रारूप रूप लेता है।

अरैखिक आईसीए

स्रोतों के मिश्रण को रैखिक होने की आवश्यकता नहीं है। इस प्रकार अरैखिक मिश्रण फलन का उपयोग करना मापदंडों के साथ अरेखीय आईसीए प्रारूप है।

पहचान

स्रोतों के क्रमपरिवर्तन और स्केलिंग तक स्वतंत्र घटकों की पहचान की जा सकती है। इस प्रकार इस पहचान की आवश्यकता है कि:

  • अधिक से अधिक स्रोत गाऊसी है,
  • देखे गए मिश्रणों की संख्या, , कम से कम अनुमानित घटकों की संख्या जितनी बड़ी होनी चाहिए : . यह मिश्रण आव्यूह कहने के बराबर है इसके व्युत्क्रम के अस्तित्व के लिए पूर्ण रैंक (रैखिक बीजगणित) का होना चाहिए।

बाइनरी आईसीए

आईसीए का विशेष संस्करण बाइनरी आईसीए है, जिसमें इस प्रकार संकेत स्रोत और मॉनिटर दोनों बाइनरी फॉर्म में हैं और मॉनिटर से अवलोकन बाइनरी स्वतंत्र स्रोतों के संयोजन मिश्रण हैं। समस्या को चिकित्सा निदान, बहु-क्लस्टर असाइनमेंट, नेटवर्क टोमोग्राफी और इंटरनेट संसाधन प्रबंधन सहित कई डोमेन में अनुप्रयोगों के लिए दिखाया गया था।

होने देना से बाइनरी चर का समुच्चय हो मॉनिटर और से बाइनरी चर का समुच्चय हो स्रोत है। इस प्रकार स्रोत-मॉनिटर कनेक्शन (अज्ञात) मिश्रण आव्यूह द्वारा दर्शाए जाते हैं, जहाँ इंगित करता है, कि i-वें स्रोत से संकेत j-वें मॉनिटर द्वारा देखा जा सकता है। इस प्रकार सिस्टम निम्नानुसार काम करता है: किसी भी समय, यदि कोई स्रोत सक्रिय है () और यह मॉनिटर से जुड़ा होता है () फिर मॉनिटर कुछ गतिविधि देखेंगे () औपचारिक रूप से हमारे पास है:

जहाँ बूलियन और है बूलियन OR है। ध्यान दें कि ध्वनि को स्पष्ट रूप से प्रतिरूपित नहीं किया जाता है, बल्कि इसे स्वतंत्र स्रोतों के रूप में माना जा सकता है।

उपरोक्त समस्या को ह्यूरिस्टिक रूप से हल किया जा सकता है[6] दिखाएँ कि यह दृष्टिकोण मध्यम ध्वनि स्तरों के अनुसार सटीक है।

सामान्यीकृत बाइनरी आईसीए ढांचा[7] व्यापक समस्या सूत्रीकरण प्रस्तुत करता है, जिसके लिए जनरेटिव प्रारूप पर किसी भी ज्ञान की आवश्यकता नहीं होती है। दूसरे शब्दों में, यह विधि किसी स्रोत को उसके स्वतंत्र घटकों के लिए जितना संभव हो सके, और इस प्रकार बिना किसी जानकारी को विघटित करने का प्रयास करती है, जिस प्रकार से इसे उत्पन्न किया गया था। यद्यपि यह समस्या अधिक जटिल दिखाई देती है, इसे शाखा और बाउंड सर्च ट्री एल्गोरिथम या सदिश के साथ आव्यूह के एकल गुणन के साथ कसकर ऊपरी सीमा के साथ सटीक रूप से हल किया जा सकता है।

विचारहीन स्त्रोत विभाजन के तरीके

प्रक्षेपण

संकेत मिश्रण में गॉसियन संभाव्यता घनत्व कार्य होते हैं, और स्रोत संकेतों में गैर-गाऊसी प्रायिकता घनत्व फलन होते हैं। इस प्रकार प्रत्येक स्रोत संकेत को वजन सदिश के आंतरिक उत्पाद और उन संकेत मिश्रणों को ले कर संकेत मिश्रणों के समुच्चय से निकाला जा सकता है जहाँ यह आंतरिक उत्पाद संकेत मिश्रणों का ऑर्थोगोनल प्रक्षेपण प्रदान करता है। शेष चुनौती इस प्रकार के वजन वाले सदिश को ढूंढ रही है। ऐसा करने के लिए प्रकार का तरीका प्रक्षेपण परस्यूट है।[8][9]

प्रक्षेपण समय में प्रक्षेपण की तलाश करता है जैसे कि निकाला गया संकेत जितना संभव हो उतना गैर-गाऊसी है। इस प्रकार यह आईसीए के विपरीत है, जो सामान्यतः एम संकेत मिश्रण से साथ एम संकेत निकालता है, जिसके लिए m × m अनमिक्सिंग आव्यूह का अनुमान लगाने की आवश्यकता होती है। इस प्रकार आईसीए पर प्रक्षेपण खोज का व्यावहारिक लाभ यह है कि यदि आवश्यक हो तो एम से कम संकेत निकाले जा सकते हैं, जहाँ प्रत्येक स्रोत संकेत को एम-एलिमेंट वेट सदिश का उपयोग करके एम संकेत मिश्रण से निकाला जाता है।

इस प्रकार प्रक्षेपण खोज के उपयोग के साथ सही वज़न सदिश ढूंढकर हम कर्टोसिस का उपयोग एकाधिक स्रोत संकेत को पुनर्प्राप्त करने के लिए कर सकते हैं।

परिमित प्रमाण के लिए संकेत के संभाव्यता घनत्व फलन के कर्टोसिस की गणना इस प्रकार की जाती है

जहाँ का नमूना माध्य है , निकाले गए संकेत निरंतर 3 सुनिश्चित करता है कि गॉसियन संकेतों में शून्य कर्टोसिस है, सुपर-गाऊसी संकेतों में सकारात्मक कुर्तोसिस है, और उप-गाऊसी संकेतों में नकारात्मक कुर्तोसिस है। इस प्रकार भाजक का विचरण है और यह सुनिश्चित करता है कि मापा कर्टोसिस संकेत विचरण को ध्यान में रखता है। इस प्रकार प्रक्षेपण परस्यूट का लक्ष्य कर्टोसिस को अधिकतम करना है, और निकाले गए संकेत को यथासंभव गैर-सामान्य बनाना है।

कर्टोसिस को गैर-सामान्यता के माप के रूप में उपयोग करते हुए, अब हम जांच कर सकते हैं कि संकेत का कर्टोसिस कैसे होता है एम मिश्रण के समुच्चय से निकाला गया वजन सदिश के रूप में भिन्न होता है, मूल के चारों ओर घुमाया जाता है। हमारी धारणा को देखते हुए कि प्रत्येक स्रोत संकेत देता है, सुपर-गाऊसी है जिसकी हम उम्मीद करेंगे:

  1. निकाले गए संकेत का कर्टोसिस अधिकतम सटीक होना जब हैं।
  2. निकाले गए संकेत का कर्टोसिस अधिकतम कब होना है, अनुमानित अक्ष के लिए ओर्थोगोनल या है, क्योंकि इस प्रकार हम जानते हैं कि इष्टतम भार सदिश रूपांतरित अक्ष के लिए ओर्थोगोनल होना चाहिए या हैं।

एकाधिक स्रोत मिश्रण संकेतों के लिए, इस प्रकार हम संकेतों को पुनर्प्राप्त करने के लिए कर्टोसिस और ग्राम-श्मिट ऑर्थोगोनलाइज़ेशन (जीएसओ) का उपयोग कर सकते हैं। एम-डायमेंशनल स्पेस में एम संकेत मिश्रण दिए जाने पर, जीएसओ इन डेटा पॉइंट्स को वेट सदिश का उपयोग करके (m-1) -डायमेंशनल स्पेस पर प्रोजेक्ट करता है। इस प्रकार हम जीएसओ के उपयोग से निकाले गए संकेतों की स्वतंत्रता की गारंटी दे सकते हैं।

का सही मान ज्ञात करने के लिए , हम ढतला हुआ वंश विधि का उपयोग कर सकते हैं। हम सबसे पहले डेटा को सफेद करते हैं, और नए मिश्रण में को रूपांतरित करता हैं, जिसका इकाई विचरण और है, इस प्रक्रिया को मान पर अपघटन लागू करके प्राप्त किया जा सकता है ,

प्रत्येक सदिश को पुनर्स्केल करना , और जाने . भारित सदिश द्वारा निकाला गया संकेत है, यदि भार सदिश w की इकाई लंबाई है, तो y का प्रसरण भी 1 है, अर्थात . कर्टोसिस को इस प्रकार लिखा जा सकता है:

के लिए अद्यतन करने की प्रक्रिया है:

जहाँ इसकी गारंटी देने के लिए छोटा स्थिरांक है इष्टतम समाधान में परिवर्तित हो जाता है। इस प्रकार प्रत्येक अद्यतन के बाद हम सामान्य करते हैं, और समुच्चय करते हैं , और अद्यतन प्रक्रिया को अभिसरण तक दोहराएं जाते हैं। हम वेट सदिश को अपडेट करने के लिए दूसरे एल्गोरिदम का भी उपयोग कर सकते है।

कर्टोसिस के अतिरिक्त एक अन्य दृष्टिकोण नेगेंट्रॉपी का उपयोग कर रहा है।[10][11] इस प्रकार कर्टोसिस की तुलना में नेगेंट्रॉपी का उपयोग करना अधिक मजबूत तरीका है, क्योंकि इस प्रकार कुर्तोसिस आउटलेयर के प्रति बहुत संवेदनशील है। इस प्रकार गौसियन वितरण की महत्वपूर्ण संपत्ति पर नेगेंट्रॉपी विधियां आधारित हैं: इस प्रकार समान भिन्नता के सभी निरंतर यादृच्छिक चर के बीच गॉसियन वैरिएबल में सबसे बड़ा एंट्रॉपी है। यही कारण है कि हम सबसे अधिक नॉनगॉसियन चर खोजना चाहते हैं। इस प्रकार विभेदक एन्ट्रापी में साधारण प्रमाण पाया जा सकता है।

y x के समान सहप्रसरण आव्यूह का गॉसियन यादृच्छिक चर है

नेगेंट्रॉपी के लिए सन्निकटन है

कॉमन के मूल पत्रों में प्रमाण पाया जा सकता है,[12][10] इस प्रकार इसे आपो हाइवरिनन, जुहा करहुनेन और एर्की ओजा द्वारा स्वतंत्र घटक विश्लेषण पुस्तक में पुन: प्रस्तुत किया गया है।[13] इस प्रकार यह सन्निकटन भी कर्टोसिस आउटलेर्स के प्रति संवेदनशीलता जैसी समस्या से ग्रस्त है। इस प्रकार अन्य दृष्टिकोण विकसित किए गए हैं।[14] :

इसका विकल्प और हैं

और

इन्फोमैक्स पर आधारित

इन्फोमैक्स आईसीए[15] अनिवार्य रूप से प्रक्षेपण खोज का बहुभिन्नरूपी, समानांतर संस्करण है। जबकि प्रक्षेपण परस्यूट एम संकेत मिश्रण के समुच्चय से बार में संकेत की श्रृंखला निकालता है, आईसीए समानांतर में एम संकेत निकालता है। इस प्रकार यह प्रक्षेपण खोज की तुलना में आईसीए को अधिक मजबूत बनाता है।[16]

प्रक्षेपण परस्यूट विधि निकाले गए संकेत की स्वतंत्रता सुनिश्चित करने के लिए ग्राम-श्मिट ऑर्थोगोनलाइजेशन का उपयोग करती है, जबकि आईसीए निकाले गए संकेत की स्वतंत्रता सुनिश्चित करने के लिए इन्फोमैक्स और अधिकतम संभावना अनुमान का उपयोग करती है। इस प्रकार निकाले गए संकेत की गैर-सामान्यता संकेत के लिए उपयुक्त प्रारूप, या पूर्व, निर्दिष्ट करके प्राप्त की जाती है।

इन्फोमैक्स पर आधारित आईसीए की प्रक्रिया संक्षेप में है: संकेत मिश्रण का समुच्चय दिया गया है, और समान स्वतंत्र प्रारूप संचयी वितरण कार्य का समुच्चय (cdfs) , हम अनमिक्सिंग आव्यूह की खोज करते हैं जो संकेतों की संयुक्त एन्ट्रॉपी को अधिकतम करता है, जहाँ इस प्रकार द्वारा निकाले गए संकेत हैं, इस प्रकार इष्टतम , संकेत अधिकतम एन्ट्रापी है और इसलिए स्वतंत्र हैं, जो इस प्रकार सुनिश्चित करता है कि निकाले गए संकेत स्वतंत्र भी हैं। इस प्रकार उलटा कार्य और संकेत प्रारूप है। इस प्रकार ध्यान दें कि यदि स्रोत संकेत प्रारूप प्रायिकता घनत्व कार्य करता है, इस प्रकार निकाले गए संकेत की प्रायिकता घनत्व फलन से मेल खाता है , इस प्रकार संयुक्त एन्ट्रापी को अधिकतम करना के बीच आपसी जानकारी की मात्रा को भी अधिकतम करता है, इस प्रकार और इस कारण से, स्वतंत्र संकेतों को निकालने के लिए एंट्रॉपी का उपयोग करना इन्फोमैक्स के रूप में जाना जाता है।

सदिश चर की एन्ट्रापी पर विचार करें , जहाँ अनमिक्सिंग आव्यूह द्वारा निकाले गए संकेतों का समुच्चय है, इस प्रकार पीडीएफ के साथ वितरण से नमूना मूल्यों के सीमित समुच्चय के लिए , की एन्ट्रापी अनुमान लगाया जा सकता है:

इस प्रकार संयुक्त पीडीएफ संयुक्त पीडीएफ से संबंधित दिखाया जा सकता है, इस प्रकार बहुभिन्नरूपी रूप से निकाले गए संकेतों की:

जहाँ जैकबियन आव्यूह है। अपने पास , और स्रोत संकेतों के लिए माना गया पीडीएफ है , इसलिए,

इसलिए,

हम जानते हैं कि कब , समान वितरण का है, और अधिकतम है।

जहाँ अनमिक्सिंग आव्यूह के निर्धारक का निरपेक्ष मान है, इसलिए,

इसलिए,

तब से , और अधिकतम करना प्रभावित नहीं करता, इसलिए इस प्रकार हम फलन को अधिकतम कर सकते हैं

इस प्रकार निकाले गए संकेत की स्वतंत्रता प्राप्त करने के लिए उपयोग किया जाता हैं ।

यदि प्रारूप संयुक्त पीडीएफ के एम सीमांत पीडीएफ़ हैं, इस प्रकार स्वतंत्र हैं और इस प्रकार स्रोत के संकेतों के लिए सामान्यतः सुपर-गॉसियन प्रारूप पीडीएफ का उपयोग करते हैं , तो हमारे पास हैं-

योग में, मनाया संकेत मिश्रण दिया जाता हैं , निकाले गए संकेतों का संगत समुच्चय और स्रोत संकेत प्रारूप , हम इष्टतम अनमिक्सिंग आव्यूह पा सकते हैं, और इस प्रकार निकाले गए संकेतों को स्वतंत्र और गैर-गाऊसी बनाते हैं। इस प्रकार प्रक्षेपण की स्थिति की प्रकार, हम अनमिक्सिंग आव्यूह का इष्टतम समाधान खोजने के लिए ग्रेडिएंट डिसेंट विधि का उपयोग कर सकते हैं।

अधिकतम संभावना अनुमान के आधार पर

अधिकतम संभावना अनुमान (एमएलई) पैरामीटर मान खोजने के लिए मानक सांख्यिकीय उपकरण उदाहरण के लिए अनमिक्सिंग आव्यूह है, जो इस प्रकार कुछ डेटा का सबसे अच्छा फिट प्रदान करते हैं (उदाहरण के लिए, निकाले गए संकेत ) किसी दिए गए प्रारूप के लिए उदाहरण के लिए, अनुमानित संयुक्त संभावना घनत्व फलन (पीडीएफ) स्रोत संकेतों का होता है।[16]

एमएल प्रारूप में पीडीएफ का विनिर्देश सम्मलित होता है, जो इस स्थितियों में पीडीएफ है, इस प्रकार अज्ञात स्रोत संकेतों की . एमएल आईसीए का उपयोग करना, उद्देश्य अनमिक्सिंग आव्यूह खोजना है जो निकाले गए संकेतों को उत्पन्न करता है, इस प्रकार संयुक्त पीडीएफ के साथ जितना संभव हो उतना संयुक्त पीडीएफ के साथ अज्ञात स्रोत संकेतों की है।

MLE इस धारणा पर आधारित है कि यदि प्रारूप और प्रारूप पैरामीटर सही हैं तो इस प्रकार डेटा के लिए उच्च संभावना प्राप्त की जानी चाहिए जो वास्तव में देखे गए थे। इसके विपरीत यदि सही पैरामीटर मानों से दूर है तो देखे गए डेटा की कम संभावना की उम्मीद की जाएगी।

MLE का उपयोग करते हुए हम प्रारूप पैरामीटर मानों के दिए गए समुच्चय के लिए प्रेक्षित डेटा की प्रायिकता कहते हैं, उदाहरण के लिए, pdf और आव्यूह देखे गए डेटा को देखते हुए प्रारूप पैरामीटर मानों की संभावना है।

हम संभावना फलन का को परिभाषित करते हैं:

यह प्रायिकता घनत्व के बराबर है।

इस प्रकार, यदि हम खोजना चाहते हैं, यह देखे गए मिश्रणों को उत्पन्न करने की सबसे अधिक संभावना है, इस प्रकार अज्ञात स्रोत संकेतों से पीडीएफ के साथ तो हमें केवल उसे खोजने की जरूरत है, जो संभावना को अधिकतम करता है, इस प्रकार अनमिक्सिंग आव्यूह जो समीकरण को अधिकतम करता है, इस प्रकार इष्टतम अनमिक्सिंग आव्यूह के एमएलई के रूप में जाना जाता है।

इस प्रकार लॉग संभावना का उपयोग करना आम बात है, क्योंकि इसका मूल्यांकन करना सरल है। जैसा कि लघुगणक मोनोटोनिक फलन है, जो कार्य को अधिकतम करता है इसके लघुगणक को भी अधिकतम करता है, यह हमें उपरोक्त समीकरण का लघुगणक लेने की अनुमति देता है, जो इस प्रकार लॉग संभावना फलन उत्पन्न करता है

यदि हम स्रोत संकेतों के लिए सामान्यतः उपयोग किए जाने वाले उच्च-कर्टोसिस प्रारूप पीडीएफ को प्रतिस्थापित करते हैं तो हमारे पास हैं

यह आव्यूह जो इस फलन को अधिकतम करता है, इस प्रकार अधिकतम संभावना अनुमान है।

इतिहास और पृष्ठभूमि

स्वतंत्र घटक विश्लेषण के लिए प्रारंभिक सामान्य रूपरेखा 1984 से जेनी हेरॉल्ट और बर्नार्ड द्वारा प्रस्तुत की गई थी,[17] इस प्रकार 1985 और 1986 में क्रिश्चियन जटन द्वारा और विकसित किया गया,[18][19][20] और 1991 में पियरे कोमोन द्वारा परिष्कृत,[12] और 1994 के अपने पेपर में लोकप्रिय हुआ।[10] इस प्रकार 1995 में, टोनी बेल और टेरी सेजनोव्स्की ने इन्फोमैक्सपर आधारित तेज़ और कुशल आईसीए एल्गोरिथम प्रस्तुत किया, जो इस प्रकार 1987 में राल्फ लिंस्कर द्वारा प्रस्तुत किया गया सिद्धांत था।

साहित्य में कई एल्गोरिदम उपलब्ध हैं जो आईसीए करते हैं। इस प्रकार औद्योगिक अनुप्रयोगों सहित बड़े पैमाने पर उपयोग किया जाने वाला फास्टिका एल्गोरिथम है, जिसे हावरिनन और ओजा द्वारा विकसित किया गया है, जो इस प्रकार लागत कार्य के रूप में नेगेंट्रॉपी का उपयोग करता है।[21] इस प्रकार अन्य उदाहरण नेत्रहीन स्रोत पृथक्करण से संबंधित हैं, जहाँ इस प्रकार अधिक सामान्य दृष्टिकोण का उपयोग किया जाता है। इस प्रकार उदाहरण के लिए, कोई स्वतंत्रता धारणा को छोड़ सकता है और इस प्रकार पारस्परिक रूप से सहसंबद्ध संकेतों को अलग कर सकता है, इस प्रकार सांख्यिकीय रूप से निर्भर संकेत विकसित किया गया है। इस प्रकार सेप होचरेइटर और जुरगेन श्मिटहुबर ने दिखाया कि नियमितीकरण (गणित) (1999) के उप-उत्पाद के रूप में गैर-रैखिक आईसीए या स्रोत पृथक्करण कैसे प्राप्त किया जाए।[22] इस प्रकार इस पद्धति को स्वतंत्र स्रोतों की संख्या के बारे में प्राथमिक ज्ञान की आवश्यकता नहीं है।

अनुप्रयोग

आईसीए को गैर-भौतिक संकेतों का विश्लेषण करने के लिए बढ़ाया जा सकता है। इस प्रकार उदाहरण के लिए, आईसीए को समाचार सूची संग्रहों के बैग पर चर्चा के विषयों को खोजने के लिए लागू किया गया है।

कुछ आईसीए आवेदन नीचे सूचीबद्ध हैं:[4]

EEGLAB में स्वतंत्र घटक विश्लेषण

* न्यूरॉन्स की ऑप्टिकल इमेजिंग[23] * न्यूरोनल स्पाइक सॉर्टिंग[24] * चेहरा पहचान[25] * प्राथमिक दृश्य न्यूरॉन्स के ग्रहणशील क्षेत्रों की प्रारूपिंग[26] * शेयर बाजार की कीमतों [27] * मोबाइल फोन संचार[28] * टमाटर के पकने का रंग आधारित पता लगाना आवश्यक होता हैं।[29]

  • ईईजी डेटा से आंखों की झपकी जैसी कलाकृतियों को हटाना।[30]
  • ईईजी का उपयोग करके निर्णय लेने की भविष्यवाणी करना।[31]
  • एकल कोशिका (जीव विज्ञान) आरएनए-अनुक्रमण प्रयोगों में समय के साथ जीन अभिव्यक्ति में परिवर्तन का विश्लेषण[32]
  • मस्तिष्क की रेस्टिंग अवस्था fMRI का अध्ययन।[33]
  • खगोल विज्ञान और ब्रह्मांड विज्ञान[34]
  • वित्त[35]


उपलब्धता

आईसीए निम्नलिखित सॉफ्टवेयर के माध्यम से लागू किया जा सकता है:

  • एसएएस भाषा प्रोसी आईसीए
  • स्किकिट-लर्न पायथन कार्यान्वयन [https://scikit-learn.org/stable/modules/generated/sklearn.decomposition.Fastica.html sklearn.decomposition.Fastica]

यह भी देखें

टिप्पणियाँ

  1. "Independent Component Analysis: A Demo".
  2. Hyvärinen, Aapo (2013). "Independent component analysis: recent advances". Philosophical Transactions: Mathematical, Physical and Engineering Sciences. 371 (1984): 20110534. Bibcode:2012RSPTA.37110534H. doi:10.1098/rsta.2011.0534. ISSN 1364-503X. JSTOR 41739975. PMC 3538438. PMID 23277597.
  3. Isomura, Takuya; Toyoizumi, Taro (2016). "स्वतंत्र घटक विश्लेषण के लिए एक स्थानीय शिक्षण नियम". Scientific Reports. 6: 28073. Bibcode:2016NatSR...628073I. doi:10.1038/srep28073. PMC 4914970. PMID 27323661.
  4. 4.0 4.1 Stone, James V. (2004). Independent component analysis : a tutorial introduction. Cambridge, Massachusetts: MIT Press. ISBN 978-0-262-69315-8.
  5. Hyvärinen, Aapo; Karhunen, Juha; Oja, Erkki (2001). स्वतंत्र घटक विश्लेषण (1st ed.). New York: John Wiley & Sons. ISBN 978-0-471-22131-9.
  6. जोहान हिमबर्गैंड आपो हाइवरिनन, बाइनरी डेटा के लिए स्वतंत्र घटक विश्लेषण: एक प्रायोगिक अध्ययन, प्रोक। इंट। इंडिपेंडेंट कंपोनेंट एनालिसिस एंड ब्लाइंड सिग्नल सेपरेशन (ICA2001), सैन डिएगो, कैलिफ़ोर्निया, 2001 पर वर्कशॉप। </ रेफ> यह मानकर कि चर निरंतर हैं और मिक्सिंग मैट्रिक्स प्राप्त करने के लिए बाइनरी ऑब्जर्वेशन डेटा पर FastICA चला रहे हैं (वास्तविक मूल्य), फिर गोल संख्या तकनीकों को लागू करें बाइनरी मान प्राप्त करने के लिए। यह दृष्टिकोण अत्यधिक गलत परिणाम उत्पन्न करने के लिए दिखाया गया है।[citation needed] एक अन्य विधि गतिशील प्रोग्रामिंग का उपयोग करना है: अवलोकन मैट्रिक्स को पुनरावर्ती रूप से तोड़ना इसके उप-मैट्रिसेस में और इन सब-मैट्रिसेस पर इंट्रेंस एल्गोरिथम चलाते हैं। मुख्य अवलोकन जो इस एल्गोरिथम की ओर ले जाता है वह उप-मैट्रिक्स है का कहाँ छिपे हुए घटकों के निष्पक्ष अवलोकन मैट्रिक्स से मेल खाती है जिनका संबंध नहीं है -वें मॉनिटर। से प्रायोगिक परिणाम<ref name="Huyna">Huy Nguyen and Rong Zheng, Binary Independent Component Analysis With or Mixtures, IEEE Transactions on Signal Processing, Vol. 59, Issue 7. (July 2011), pp. 3168–3181.
  7. Painsky, Amichai; Rosset, Saharon; Feder, Meir (2014). सामान्यीकृत बाइनरी स्वतंत्र घटक विश्लेषण. pp. 1326–1330. doi:10.1109/ISIT.2014.6875048. ISBN 978-1-4799-5186-4. S2CID 18579555. {{cite book}}: |journal= ignored (help)
  8. James V. Stone(2004); "Independent Component Analysis: A Tutorial Introduction", The MIT Press Cambridge, Massachusetts, London, England; ISBN 0-262-69315-1
  9. Kruskal, JB. 1969; "Toward a practical method which helps uncover the structure of a set of observations by finding the line transformation which optimizes a new "index of condensation", Pages 427–440 of: Milton, RC, & Nelder, JA (eds), Statistical computation; New York, Academic Press
  10. 10.0 10.1 10.2 Pierre Comon (1994) Independent component analysis, a new concept? http://www.ece.ucsb.edu/wcsl/courses/ECE594/594C_F10Madhow/comon94.pdf
  11. Hyvärinen, Aapo; Erkki Oja (2000). "Independent Component Analysis:Algorithms and Applications". Neural Networks. 4-5. 13 (4–5): 411–430. CiteSeerX 10.1.1.79.7003. doi:10.1016/s0893-6080(00)00026-5. PMID 10946390. S2CID 11959218.
  12. 12.0 12.1 P.Comon, Independent Component Analysis, Workshop on Higher-Order Statistics, July 1991, republished in J-L. Lacoume, editor, Higher Order Statistics, pp. 29-38. Elsevier, Amsterdam, London, 1992. HAL link
  13. Hyvärinen, Aapo; Karhunen, Juha; Oja, Erkki (2001). स्वतंत्र घटक विश्लेषण (Reprint ed.). New York, NY: Wiley. ISBN 978-0-471-40540-5.
  14. Hyvärinen, Aapo (1998). "स्वतंत्र घटक विश्लेषण और प्रक्षेपण खोज के लिए अंतर एंट्रॉपी के नए अनुमान।". Advances in Neural Information Processing Systems. 10: 273–279.
  15. Bell, A. J.; Sejnowski, T. J. (1995). "An Information-Maximization Approach to Blind Separation and Blind Deconvolution", Neural Computation, 7, 1129-1159
  16. 16.0 16.1 James V. Stone (2004). "Independent Component Analysis: A Tutorial Introduction", The MIT Press Cambridge, Massachusetts, London, England; ISBN 0-262-69315-1
  17. Hérault, J.; Ans, B. (1984). "Réseau de neurones à synapses modifiables : Décodage de messages sensoriels composites par apprentissage non supervisé et permanent". Comptes Rendus de l'Académie des Sciences, Série III. 299: 525–528.
  18. Ans, B., Hérault, J., & Jutten, C. (1985). Architectures neuromimétiques adaptatives  : Détection de primitives. Cognitiva 85 (Vol. 2, pp. 593-597). Paris: CESTA.
  19. Hérault, J., Jutten, C., & Ans, B. (1985). Détection de grandeurs primitives dans un message composite par une architecture de calcul neuromimétique en apprentissage non supervisé. Proceedings of the 10th Workshop Traitement du signal et ses applications (Vol. 2, pp. 1017-1022). Nice (France): GRETSI.
  20. Hérault, J., & Jutten, C. (1986). Space or time adaptive signal processing by neural networks models. Intern. Conf. on Neural Networks for Computing (pp. 206-211). Snowbird (Utah, USA).
  21. Hyvärinen, A.; Oja, E. (2000-06-01). "Independent component analysis: algorithms and applications". Neural Networks (in English). 13 (4): 411–430. doi:10.1016/S0893-6080(00)00026-5. ISSN 0893-6080. PMID 10946390. S2CID 11959218.
  22. Hochreiter, Sepp; Schmidhuber, Jürgen (1999). "LOCOCODE के माध्यम से फ़ीचर एक्सट्रैक्शन" (PDF). Neural Computation. 11 (3): 679–714. doi:10.1162/089976699300016629. ISSN 0899-7667. PMID 10085426. S2CID 1642107. Retrieved 24 February 2018.
  23. Brown, GD; Yamada,S; Sejnowski, TJ (2001). "तंत्रिका कॉकटेल पार्टी में स्वतंत्र घटक विश्लेषण". Trends in Neurosciences. 24 (1): 54–63. doi:10.1016/s0166-2236(00)01683-0. PMID 11163888. S2CID 511254.
  24. Lewicki, MS (1998). "Areview of methods for spike sorting: detection and classification of neural action potentials". Network: Computation in Neural Systems. 9 (4): 53–78. doi:10.1088/0954-898X_9_4_001. S2CID 10290908.
  25. Barlett, MS (2001). अप्रशिक्षित शिक्षण द्वारा चेहरा छवि विश्लेषण. Boston: Kluwer International Series on Engineering and Computer Science.
  26. Bell, AJ; Sejnowski, TJ (1997). "प्राकृतिक दृश्यों के स्वतंत्र घटक एज फिल्टर हैं". Vision Research. 37 (23): 3327–3338. doi:10.1016/s0042-6989(97)00121-1. PMC 2882863. PMID 9425547.
  27. Back, AD; Weigend, AS (1997). "स्टॉक रिटर्न से संरचना निकालने के लिए स्वतंत्र घटक विश्लेषण का पहला प्रयोग". International Journal of Neural Systems. 8 (4): 473–484. doi:10.1142/s0129065797000458. PMID 9730022. S2CID 872703.
  28. Hyvarinen, A, Karhunen,J & Oja,E (2001a). स्वतंत्र घटक विश्लेषण. New York: John Wiley and Sons.{{cite book}}: CS1 maint: multiple names: authors list (link)
  29. Polder, G; van der Heijen, FWAM (2003). "स्वतंत्र घटक विश्लेषण का उपयोग करके टमाटर की वर्णक्रमीय छवियों में यौगिक वितरण का अनुमान". Austrian Computer Society: 57–64.
  30. Delorme, A; Sejnowski, T; Makeig, S (2007). "उच्च-क्रम के आँकड़ों और स्वतंत्र घटक विश्लेषण का उपयोग करके ईईजी डेटा में कलाकृतियों की बढ़ी हुई पहचान". NeuroImage. 34 (4): 1443–1449. doi:10.1016/j.neuroimage.2006.11.004. PMC 2895624. PMID 17188898.
  31. Douglas, P (2013). "स्वतंत्र घटक सुविधाओं का उपयोग करके ईईजी और एफएमआरआई डेटा से विश्वास निर्णय लेने का एकल परीक्षण डिकोडिंग". Frontiers in Human Neuroscience. 7: 392. doi:10.3389/fnhum.2013.00392. PMC 3728485. PMID 23914164.
  32. Trapnell, C; Cacchiarelli, D; Grimsby, J (2014). "एकल कोशिकाओं के स्यूडोटेम्पोरल ऑर्डर द्वारा सेल भाग्य निर्णयों की गतिशीलता और नियामकों का पता चलता है". Nature Biotechnology. 32 (4): 381–386. doi:10.1038/nbt.2859. PMC 4122333. PMID 24658644.
  33. Kiviniemi, Vesa J.; Kantola, Juha-Heikki; Jauhiainen, Jukka; Hyvärinen, Aapo; Tervonen, Osmo (2003). "गैर नियतात्मक fMRI संकेत स्रोतों का स्वतंत्र घटक विश्लेषण". NeuroImage. 19 (2): 253–260. doi:10.1016/S1053-8119(03)00097-1. PMID 12814576. S2CID 17110486.
  34. Wang, Jingying; Xu, Haiguang; Gu, Junhua; An, Tao; Cui, Haijuan; Li, Jianxun; Zhang, Zhongli; Zheng, Qian; Wu, Xiang-Ping (2010-11-01). "How to Identify and Separate Bright Galaxy Clusters from the Low-frequency Radio Sky?". The Astrophysical Journal. 723 (1): 620–633. arXiv:1008.3391. Bibcode:2010ApJ...723..620W. doi:10.1088/0004-637X/723/1/620. ISSN 0004-637X.
  35. Moraux, Franck; Villa, Christophe (2003). "The dynamics of the term structure of interest rates: an Independent Component Analysis". Connectionist Approaches in Economics and Management Sciences. Advances in Computational Management Science. 6: 215–232. doi:10.1007/978-1-4757-3722-6_11. ISBN 978-1-4757-3722-6.


संदर्भ


बाहरी संबंध