आनुपातिक संकट नमूना

From Vigyanwiki
Revision as of 21:40, 6 July 2023 by alpha>Indicwiki (Created page with "{{short description|Class of statistical survival models}} आनुपातिक ख़तरे मॉडल सांख्यिकी में उत्तरजी...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

आनुपातिक ख़तरे मॉडल सांख्यिकी में उत्तरजीविता विश्लेषण का एक वर्ग है। उत्तरजीविता मॉडल किसी घटना के घटित होने से पहले बीतने वाले समय को एक या अधिक सहसंयोजकों से जोड़ते हैं जो उस समय की मात्रा के साथ जुड़ाव (सांख्यिकी) हो सकते हैं। आनुपातिक खतरों के मॉडल में, सहसंयोजक में एक इकाई वृद्धि का अनूठा प्रभाव खतरे की दर के संबंध में गुणक होता है। उदाहरण के लिए, दवा लेने से स्ट्रोक होने की जोखिम दर आधी हो सकती है, या, जिस सामग्री से निर्मित घटक का निर्माण किया जाता है उसे बदलने से विफलता की जोखिम दर दोगुनी हो सकती है। अन्य प्रकार के उत्तरजीविता मॉडल जैसे त्वरित विफलता समय मॉडल आनुपातिक खतरों को प्रदर्शित नहीं करते हैं। त्वरित विफलता समय मॉडल उस स्थिति का वर्णन करता है जहां किसी घटना का जैविक या यांत्रिक जीवन इतिहास त्वरित (या धीमा) हो जाता है।

पृष्ठभूमि

उत्तरजीविता मॉडल को दो भागों से मिलकर देखा जा सकता है: अंतर्निहित आधारभूत खतरा फ़ंक्शन, जिसे अक्सर दर्शाया जाता है , यह वर्णन करते हुए कि सहसंयोजकों के आधारभूत स्तरों पर प्रति समय इकाई घटना का जोखिम समय के साथ कैसे बदलता है; और प्रभाव पैरामीटर, यह वर्णन करते हुए कि व्याख्यात्मक सहसंयोजकों की प्रतिक्रिया में खतरा कैसे भिन्न होता है। एक विशिष्ट चिकित्सा उदाहरण में परिवर्तनशीलता को कम करने और/या भ्रम को नियंत्रित करने के लिए सहसंयोजक जैसे उपचार असाइनमेंट, साथ ही रोगी की विशेषताएं जैसे अध्ययन की शुरुआत में उम्र, लिंग और अध्ययन की शुरुआत में अन्य बीमारियों की उपस्थिति शामिल होगी।

आनुपातिक खतरों की स्थिति[1] बताता है कि सहसंयोजक खतरे से गुणात्मक रूप से संबंधित हैं। स्थिर गुणांक के सबसे सरल मामले में, उदाहरण के लिए, किसी दवा के साथ उपचार, किसी भी समय किसी विषय के खतरे को आधा कर सकता है , जबकि आधारभूत खतरा भिन्न हो सकता है। हालाँकि, ध्यान दें कि इससे विषय का जीवनकाल दोगुना नहीं हो जाता है; जीवनकाल पर सहसंयोजकों का सटीक प्रभाव किस प्रकार पर निर्भर करता है . सहसंयोजक द्विआधारी भविष्यवक्ताओं तक ही सीमित नहीं है; सतत सहसंयोजक के मामले में , आमतौर पर यह माना जाता है कि खतरा तेजी से प्रतिक्रिया करता है; प्रत्येक इकाई में वृद्धि होती है इसके परिणामस्वरूप ख़तरा आनुपातिक रूप से बढ़ जाता है।

कॉक्स मॉडल

परिचय

डेविड कॉक्स (सांख्यिकीविद्) ने देखा कि यदि आनुपातिक खतरों की धारणा कायम है (या, कायम मानी जाती है) तो प्रभाव पैरामीटर का अनुमान लगाना संभव है, जिसे दर्शाया गया है नीचे, पूर्ण जोखिम फ़ंक्शन पर कोई विचार किए बिना। उत्तरजीविता डेटा के इस दृष्टिकोण को कॉक्स आनुपातिक खतरों मॉडल का अनुप्रयोग कहा जाता है,[2] कभी-कभी इसे कॉक्स मॉडल या आनुपातिक ख़तरा मॉडल के रूप में संक्षिप्त किया जाता है।[3] हालाँकि, कॉक्स ने यह भी कहा कि आनुपातिक खतरों की धारणा की जैविक व्याख्या काफी मुश्किल हो सकती है।[4][5] होने देना Xi = (Xi1, … , Xip) विषय i के लिए सहसंयोजकों के वास्तविक मूल्य बनें। कॉक्स आनुपातिक ख़तरे मॉडल के लिए ख़तरे फ़ंक्शन का रूप है

यह अभिव्यक्ति सहसंयोजक वेक्टर (व्याख्यात्मक चर) एक्स के साथ विषय i के लिए समय टी पर खतरा फ़ंक्शन देती हैi. ध्यान दें कि विषयों के बीच, आधारभूत खतरा समरूप है (i पर कोई निर्भरता नहीं है)। विषयों के खतरों के बीच एकमात्र अंतर बेसलाइन स्केलिंग कारक से आता है .

इसे आनुपातिक क्यों कहा जाता है

आरंभ करने के लिए, मान लीजिए कि हमारे पास केवल एक ही सहसंयोजक है, , और इसलिए एक एकल गुणांक, . बढ़ने के प्रभाव पर विचार करें 1 द्वारा:

हम देख सकते हैं कि एक सहसंयोजक को 1 से बढ़ाने से मूल खतरा स्थिरांक से बढ़ जाता है . चीजों को थोड़ा पुनर्व्यवस्थित करने पर, हम देखते हैं कि:

दायीं ओर का भाग समय के साथ स्थिर रहता है (किसी भी पद का कोई मतलब नहीं है)। इस में)। यह रिश्ते, , को आनुपातिकता_(गणित) कहा जाता है।


अधिक सामान्यतः, सहसंयोजकों के साथ दो विषयों, i और j पर विचार करें और क्रमश। उनके खतरों के अनुपात पर विचार करें:

दायीं ओर का भाग समय पर निर्भर नहीं है, केवल समय पर निर्भर कारक के रूप में, , रद्द कर दिया गया। इस प्रकार दो विषयों के खतरों का अनुपात स्थिर है, यानी खतरे आनुपातिक हैं।

अवरोधन पद का अभाव

प्रतिगमन मॉडल में अक्सर एक अवरोधन शब्द (जिसे स्थिर शब्द या पूर्वाग्रह शब्द भी कहा जाता है) का उपयोग किया जाता है। कॉक्स मॉडल में आधारभूत खतरे के कारण एक का अभाव है, , उसका स्थान ले लेता है। आइए देखें कि क्या होगा यदि हम किसी भी तरह से निरूपित एक अवरोधन शब्द शामिल करें :

जहां हमने पुनः परिभाषित किया है एक नया आधारभूत ख़तरा बनना, . इस प्रकार, आधारभूत खतरे में खतरे के सभी भाग शामिल होते हैं जो विषयों के सहसंयोजकों पर निर्भर नहीं होते हैं, जिसमें कोई भी अवरोधन शब्द शामिल होता है (जो परिभाषा के अनुसार सभी विषयों के लिए स्थिर है)।

अद्वितीय समय की संभावना

कॉक्स आंशिक संभावना, जो नीचे दिखाई गई है, बेसलाइन खतरा फ़ंक्शन के ब्रेस्लो के अनुमान का उपयोग करके प्राप्त की जाती है, इसे पूर्ण संभावना में प्लग किया जाता है और फिर यह देखा जाता है कि परिणाम दो कारकों का एक उत्पाद है। पहला कारक नीचे दिखाई गई आंशिक संभावना है, जिसमें आधारभूत खतरा रद्द हो गया है। दूसरा कारक प्रतिगमन गुणांक से मुक्त है और केवल सेंसरिंग (सांख्यिकी) के माध्यम से डेटा पर निर्भर करता है। किसी भी आनुपातिक खतरे मॉडल द्वारा अनुमानित सहसंयोजकों के प्रभाव को इस प्रकार खतरे के अनुपात के रूप में रिपोर्ट किया जा सकता है।

समय Y पर विषय i के लिए देखी जाने वाली घटना के घटित होने की संभावनाi इस प्रकार लिखा जा सकता है:

कहाँ θj = exp(Xjβ) और सारांश विषयों j के सेट पर है जहां घटना समय Y से पहले नहीं हुई हैi (स्वयं विषय सहित)। जाहिर तौर पर 0 <Li(β) ≤ 1. यह एक संभावना फ़ंक्शन #आंशिक संभावना है: समय के साथ खतरे के परिवर्तन को मॉडल करने की आवश्यकता के बिना सहसंयोजकों के प्रभाव का अनुमान लगाया जा सकता है।

विषयों के साथ ऐसा व्यवहार करना जैसे कि वे सांख्यिकीय रूप से एक-दूसरे से स्वतंत्र हों, सभी वास्तविक घटनाओं की संयुक्त संभावना[6] निम्नलिखित आंशिक संभावना है, जहां घटना की घटना सी द्वारा इंगित की जाती हैi = 1:

संगत लॉग आंशिक संभावना है

मॉडल मापदंडों के अधिकतम आंशिक संभावना अनुमान उत्पन्न करने के लिए इस फ़ंक्शन को β से अधिक बढ़ाया जा सकता है।

आंशिक स्कोर (सांख्यिकी) है

और आंशिक लॉग संभावना का हेस्सियन मैट्रिक्स है

इस स्कोर फ़ंक्शन और हेस्सियन मैट्रिक्स का उपयोग करके, न्यूटन की विधि | न्यूटन-रेफसन एल्गोरिदम का उपयोग करके आंशिक संभावना को अधिकतम किया जा सकता है। हेसियन मैट्रिक्स का व्युत्क्रम, जिसका मूल्यांकन β के अनुमान पर किया जाता है, का उपयोग अनुमान के लिए अनुमानित विचरण-सहप्रसरण मैट्रिक्स के रूप में किया जा सकता है, और प्रतिगमन गुणांक के लिए अनुमानित मानक त्रुटियां उत्पन्न करने के लिए उपयोग किया जा सकता है।

संभावना जब बंधे हुए समय मौजूद हों

उन स्थितियों को संभालने के लिए कई दृष्टिकोण प्रस्तावित किए गए हैं जिनमें समय डेटा में संबंध हैं। ब्रेस्लो की विधि उस दृष्टिकोण का वर्णन करती है जिसमें ऊपर वर्णित प्रक्रिया को असंशोधित रूप से उपयोग किया जाता है, तब भी जब संबंध मौजूद हों। एक वैकल्पिक दृष्टिकोण जिसे बेहतर परिणाम देने वाला माना जाता है वह एफ्रॉन की विधि है।[7] चलो टीj अद्वितीय समय को निरूपित करें, मान लीजिए Hj सूचकांकों के समुच्चय को इस प्रकार निरूपित करें कि Yi= टीj और सीi= 1, और चलो एमj= |एचj|. एफ्रॉन का दृष्टिकोण निम्नलिखित आंशिक संभावना को अधिकतम करता है।

संगत लॉग आंशिक संभावना है

स्कोर फ़ंक्शन है

और हेस्सियन मैट्रिक्स है

कहाँ

ध्यान दें कि जब एचj खाली है (समय t के साथ सभी अवलोकनj सेंसर किया गया है), इन अभिव्यक्तियों में सारांश को शून्य माना जाता है।

उदाहरण

व्यवहार में कॉक्स मॉडल के कुछ व्यावहारिक उदाहरण नीचे दिए गए हैं।

एक एकल बाइनरी सहसंयोजक

मान लीजिए कि जिस अंतिम बिंदु में हम रुचि रखते हैं वह सर्जरी के बाद 5 साल की अवलोकन अवधि के दौरान रोगी का जीवित रहना है। मरीज़ 5 साल की अवधि के भीतर मर सकते हैं, और हम रिकॉर्ड करते हैं कि उनकी मृत्यु कब हुई, या मरीज़ 5 साल से अधिक जीवित रह सकते हैं, और हम केवल यह रिकॉर्ड करते हैं कि वे 5 साल से अधिक जीवित रहे। सर्जरी दो अस्पतालों, A या B में से एक में की गई थी, और हम जानना चाहेंगे कि क्या अस्पताल का स्थान 5 साल के जीवित रहने से जुड़ा है। विशेष रूप से, हम अस्पताल बी की तुलना में अस्पताल ए में की गई सर्जरी से खतरे में सापेक्ष वृद्धि (या कमी) जानना चाहेंगे। कुछ (नकली) डेटा प्रदान किया गया है, जहां प्रत्येक पंक्ति एक मरीज का प्रतिनिधित्व करती है: T यह दर्शाता है कि मृत्यु से पहले मरीज़ पर कितने समय तक निगरानी रखी गई थी या 5 साल (महीनों में मापा गया), और C दर्शाता है कि मरीज़ की मृत्यु 5 साल की अवधि में हुई थी या नहीं। हमने अस्पताल को एक बाइनरी वेरिएबल के रूप में एन्कोड किया है जिसे X दर्शाया गया है: 1 यदि अस्पताल A से है, 0 अस्पताल B से है।

hospital X T C
B 0 60 False
B 0 32 True
B 0 60 False
B 0 60 False
B 0 60 False
A 1 4 True
A 1 18 True
A 1 60 False
A 1 9 True
A 1 31 True
A 1 53 True
A 1 17 True

हमारा एकल-सहसंयोजक कॉक्स आनुपातिक मॉडल निम्नलिखित जैसा दिखता है अस्पताल के प्रभाव का प्रतिनिधित्व करना, और i प्रत्येक रोगी को अनुक्रमित करना:

सांख्यिकीय सॉफ्टवेयर का उपयोग करके हम अनुमान लगा सकते हैं 2.12 होना. जोखिम अनुपात इस मान का घातीय है, . इसका कारण जानने के लिए, विशेष रूप से खतरों के अनुपात पर विचार करें:

इस प्रकार, अस्पताल ए और अस्पताल बी का जोखिम अनुपात है . एक पल के लिए सांख्यिकीय महत्व को अलग रखते हुए, हम यह कहते हुए एक बयान दे सकते हैं कि अस्पताल ए में मरीज़ अस्पताल बी की तुलना में किसी भी कम समय में मृत्यु के 8.3 गुना अधिक जोखिम से जुड़े हैं।

व्याख्या के बारे में उल्लेख करने योग्य महत्वपूर्ण चेतावनियाँ हैं:

  1. मृत्यु के 8.3 गुना अधिक जोखिम का मतलब यह नहीं है कि अस्पताल बी में 8.3 गुना अधिक मरीज मरेंगे: उत्तरजीविता विश्लेषण यह जांचता है कि घटनाएं कितनी जल्दी घटित होती हैं, न कि केवल यह कि वे घटित होती हैं या नहीं।
  2. अधिक विशेष रूप से, मृत्यु का जोखिम एक दर का माप है। दर में इकाइयाँ होती हैं, जैसे मीटर प्रति सेकंड। हालाँकि, एक सापेक्ष दर नहीं है: एक साइकिल किसी अन्य साइकिल (संदर्भ साइकिल) की तुलना में दो गुना तेज चल सकती है, बिना किसी इकाई को निर्दिष्ट किए। इसी तरह, अस्पताल में मृत्यु का जोखिम (मृत्यु की दर) अस्पताल बी (संदर्भ समूह) में मृत्यु के जोखिम की तुलना में 8.3 गुना अधिक (तेज़) है।
  3. व्युत्क्रम मात्रा, अस्पताल A के सापेक्ष अस्पताल B का जोखिम अनुपात है।
  4. हमने अस्पतालों के बीच जीवित रहने की संभावनाओं के बारे में कोई अनुमान नहीं लगाया है। ऐसा इसलिए है क्योंकि हमें आधारभूत जोखिम दर के अनुमान की आवश्यकता होगी, , साथ ही हमारा भी अनुमान लगाना। हालाँकि, कॉक्स आनुपातिक खतरा मॉडल का मानक अनुमान सीधे तौर पर आधारभूत खतरे की दर का अनुमान नहीं लगाता है।
  5. क्योंकि हमने मॉडल के एकमात्र समय-परिवर्तनशील घटक, आधारभूत जोखिम दर को नजरअंदाज कर दिया है, हमारा अनुमान टाइमस्केल-अपरिवर्तनीय है। उदाहरण के लिए, यदि हमने समय को महीनों के बजाय वर्षों में मापा होता, तो हमें वही अनुमान मिलता।
  6. यह कहना आकर्षक है कि अस्पताल ने दोनों समूहों के बीच खतरों में अंतर पैदा किया, लेकिन चूंकि हमारा अध्ययन कारणात्मक नहीं है (अर्थात्, हम नहीं जानते कि डेटा कैसे उत्पन्न हुआ), हम कायम हैं जैसी शब्दावली के साथ संबद्ध।

एक एकल सतत सहसंयोजक

उत्तरजीविता विश्लेषण के कम पारंपरिक उपयोग के मामले को प्रदर्शित करने के लिए, अगला उदाहरण एक अर्थशास्त्र प्रश्न होगा: कंपनियों के आईपीओ की 1 साल की सालगिरह पर मूल्य-से-आय अनुपात (पी/ई) और उनके भविष्य के अस्तित्व के बीच क्या संबंध है ? अधिक विशेष रूप से, यदि हम किसी कंपनी के जन्म की घटना को उनकी 1-वर्षीय आईपीओ वर्षगांठ मानते हैं, और किसी दिवालियापन, बिक्री, निजी होने आदि को कंपनी की मृत्यु की घटना मानते हैं, तो हम कंपनियों के पी के प्रभाव को जानना चाहेंगे। / उनके जन्म पर ई अनुपात (1-वर्ष आईपीओ वर्षगांठ) उनके जीवित रहने पर।

प्रदान किया गया एक (नकली) डेटासेट है जिसमें 12 कंपनियों के अस्तित्व डेटा हैं: T 1-वर्षीय आईपीओ वर्षगांठ और मृत्यु (या 2022-01-01 की अंतिम तिथि, यदि नहीं किया गया है) के बीच दिनों की संख्या का प्रतिनिधित्व करता है मरना)। सी दर्शाता है कि कंपनी 2022-01-01 से पहले समाप्त हो गई या नहीं। पी/ई कंपनियों की 1-वर्षीय आईपीओ वर्षगांठ पर मूल्य-से-आय अनुपात का प्रतिनिधित्व करता है।

Co. 1 year IPO date Death date* C T P/E
0 2000-11-05 2011-01-22 True 3730 9.7
1 2000-12-01 2003-03-30 True 849 12.0
2 2011-01-05 2012-03-30 True 450 3.0
3 2010-05-29 2011-02-22 True 269 5.3
4 2005-06-23 2022-01-01 False 6036 10.8
5 2000-06-10 2002-07-24 True 774 6.3
6 2011-07-11 2014-05-01 True 1025 11.6
7 2007-09-27 2022-01-01 False 5210 10.3
8 2006-07-30 2010-06-03 True 1404 8.0
9 2000-07-13 2001-07-19 True 371 4.0
10 2013-06-10 2018-10-10 True 1948 5.9
11 2011-07-16 2014-08-15 True 1126 8.3

पिछले उदाहरण के विपरीत जहां एक बाइनरी वैरिएबल था, इस डेटासेट में एक सतत वैरिएबल, पी/ई है। हालाँकि, मॉडल समान दिखता है:

कहाँ किसी कंपनी के पी/ई अनुपात का प्रतिनिधित्व करता है। कॉक्स मॉडल के माध्यम से इस डेटासेट को चलाने से अज्ञात के मूल्य का अनुमान उत्पन्न होता है , जो -0.34 है। इसलिए, संपूर्ण खतरे का एक अनुमान इस प्रकार है:

आधारभूत खतरे के बाद से, , अनुमान नहीं लगाया गया था, पूरे खतरे की गणना नहीं की जा सकी है। हालाँकि, कंपनियों i और j के खतरों के अनुपात पर विचार करें:

दाईं ओर सभी शर्तें ज्ञात हैं, इसलिए कंपनियों के बीच खतरों के अनुपात की गणना करना संभव है। चूँकि दाईं ओर कोई समय-निर्भर शब्द नहीं है (सभी पद स्थिर हैं), खतरे एक-दूसरे के लिए आनुपातिक हैं। उदाहरण के लिए, कंपनी 5 से कंपनी 2 का जोखिम अनुपात है . इसका मतलब यह है कि, अध्ययन के अंतराल के भीतर, कंपनी 5 की मृत्यु का जोखिम कंपनी 2 की मृत्यु के जोखिम के बराबर 0.33 ≈ 1/3 है।

व्याख्या के बारे में उल्लेख करने योग्य महत्वपूर्ण चेतावनियाँ हैं:

  1. खतरा अनुपात मात्रा है , जो है उपरोक्त उदाहरण में. उपरोक्त अंतिम गणना से, इसकी व्याख्या दो विषयों के बीच खतरों के अनुपात के रूप में होती है जिनके चर एक इकाई से भिन्न होते हैं: यदि , तब . एक इकाई द्वारा भिन्न का चुनाव सुविधा है, क्योंकि यह सटीक रूप से मूल्य का संचार करता है .
  2. बेसलाइन खतरे का प्रतिनिधित्व तब किया जा सकता है जब स्केलिंग फैक्टर 1 हो, यानी। . <पी>

    क्या हम बेसलाइन खतरे की व्याख्या उस बेसलाइन कंपनी के खतरे के रूप में कर सकते हैं जिसका पी/ई 0 है? आधारभूत विषय के खतरे के रूप में आधारभूत खतरे की यह व्याख्या अपूर्ण है, क्योंकि यह संभव है कि सहसंयोजक 0 होना असंभव है। इस एप्लिकेशन में, 0 का पी/ई अर्थहीन है (इसका मतलब है कि कंपनी का स्टॉक मूल्य 0 है, यानी, वे मर चुके हैं)। खतरे की अधिक उपयुक्त व्याख्या तब होगी जब सभी चर शून्य हों।
  3. जैसे मूल्य को समझना और व्याख्या करना आकर्षक है किसी कंपनी के खतरे का प्रतिनिधित्व करने के लिए। हालाँकि, विचार करें कि यह वास्तव में क्या दर्शाता है: . यहां खतरों का अनुपात स्पष्ट रूप से है, कंपनी के खतरे की तुलना 0 पी/ई वाली एक काल्पनिक बेसलाइन कंपनी से की जाती है। हालाँकि, जैसा कि ऊपर बताया गया है, इस एप्लिकेशन में 0 का पी/ई असंभव है इस उदाहरण में अर्थहीन है. हालाँकि, संभावित खतरों के बीच अनुपात सार्थक है।

समय-परिवर्तनशील भविष्यवक्ता और गुणांक

समय पर निर्भर चर, समय पर निर्भर स्तर और प्रति विषय कई घटनाओं के विस्तार को एंडरसन और गिल की गिनती प्रक्रिया सूत्रीकरण द्वारा शामिल किया जा सकता है।[8] समय-भिन्न प्रतिगामी के साथ जोखिम मॉडल के उपयोग का एक उदाहरण बेरोजगारी मंत्रों पर बेरोजगारी बीमा के प्रभाव का अनुमान लगाना है।[9][10] समय-भिन्न सहसंयोजकों (यानी, भविष्यवक्ताओं) की अनुमति देने के अलावा, कॉक्स मॉडल को समय-भिन्न गुणांकों के लिए भी सामान्यीकृत किया जा सकता है। अर्थात्, उपचार का आनुपातिक प्रभाव समय के साथ भिन्न हो सकता है; जैसे यदि कोई दवा रुग्णता के एक महीने के भीतर दी जाए तो वह बहुत प्रभावी हो सकती है, और समय बीतने के साथ कम प्रभावी हो जाती है। तब गुणांक के समय (स्थिरता) के साथ कोई परिवर्तन नहीं होने की परिकल्पना का परीक्षण किया जा सकता है। विवरण और सॉफ़्टवेयर (आर (प्रोग्रामिंग भाषा)#पैकेज) मार्टिनुसेन और शेइक (2006) में उपलब्ध हैं।[11][12] इस संदर्भ में, यह भी उल्लेख किया जा सकता है कि योगात्मक खतरों का उपयोग करके सहसंयोजकों के प्रभाव को निर्दिष्ट करना सैद्धांतिक रूप से संभव है,[13] यानी निर्दिष्ट करना

यदि ऐसे योगात्मक खतरों के मॉडल का उपयोग उन स्थितियों में किया जाता है जहां (लॉग-)संभावना अधिकतमकरण उद्देश्य है, तो इसे प्रतिबंधित करने के लिए सावधानी बरतनी चाहिए गैर-नकारात्मक मानों के लिए. शायद इसी जटिलता के परिणामस्वरूप ऐसे मॉडल कम ही देखने को मिलते हैं। यदि उद्देश्य न्यूनतम वर्ग है तो गैर-नकारात्मकता प्रतिबंध की सख्ती से आवश्यकता नहीं है।

बेसलाइन खतरा फ़ंक्शन निर्दिष्ट करना

कॉक्स मॉडल को विशिष्ट बनाया जा सकता है यदि यह मानने का कोई कारण मौजूद है कि आधारभूत खतरा एक विशेष रूप का अनुसरण करता है। इस मामले में, आधारभूत खतरा किसी दिए गए फ़ंक्शन द्वारा प्रतिस्थापित किया जाता है। उदाहरण के लिए, जोखिम फ़ंक्शन को वेइबुल वितरण#संचयी वितरण फ़ंक्शन मानने से वेइबुल आनुपातिक ख़तरा मॉडल मिलता है।

संयोग से, वेइबुल बेसलाइन खतरे का उपयोग करना एकमात्र परिस्थिति है जिसके तहत मॉडल आनुपातिक खतरों और त्वरित विफलता समय मॉडल मॉडल दोनों को संतुष्ट करता है।

सामान्य शब्द पैरामीट्रिक आनुपातिक खतरा मॉडल का उपयोग आनुपातिक खतरा मॉडल का वर्णन करने के लिए किया जा सकता है जिसमें खतरा कार्य निर्दिष्ट है। इसके विपरीत कॉक्स आनुपातिक ख़तरे मॉडल को कभी-कभी अर्धपैरामीट्रिक मॉडल कहा जाता है।

कुछ लेखक अंतर्निहित खतरे के कार्य को निर्दिष्ट करते समय भी कॉक्स आनुपातिक खतरा मॉडल शब्द का उपयोग करते हैं,[14] डेविड कॉक्स को पूरे क्षेत्र का ऋण स्वीकार करने के लिए।

कॉक्स रिग्रेशन मॉडल (आनुपातिक खतरों को छोड़ना) शब्द का उपयोग कभी-कभी समय-निर्भर कारकों को शामिल करने के लिए कॉक्स मॉडल के विस्तार का वर्णन करने के लिए किया जाता है। हालाँकि, यह उपयोग संभावित रूप से अस्पष्ट है क्योंकि कॉक्स आनुपातिक खतरे मॉडल को स्वयं एक प्रतिगमन मॉडल के रूप में वर्णित किया जा सकता है।

पॉइसन मॉडल से संबंध

आनुपातिक खतरों के मॉडल और पॉइसन प्रतिगमन मॉडल के बीच एक संबंध है जिसे कभी-कभी पॉइसन प्रतिगमन के लिए सॉफ़्टवेयर में अनुमानित आनुपातिक खतरों के मॉडल को फिट करने के लिए उपयोग किया जाता है। ऐसा करने का सामान्य कारण यह है कि गणना बहुत तेज होती है। धीमे कंप्यूटरों के दिनों में यह अधिक महत्वपूर्ण था लेकिन विशेष रूप से बड़े डेटा सेट या जटिल समस्याओं के लिए अभी भी उपयोगी हो सकता है। लैयर्ड और ओलिवियर (1981)[15] गणितीय विवरण प्रदान करें. वे ध्यान देते हैं, हम यह नहीं मानते हैं कि [पॉइसन मॉडल] सत्य है, लेकिन इसे केवल संभावना प्राप्त करने के लिए एक उपकरण के रूप में उपयोग करते हैं। मैक्कलघ और नेल्डर का[16] सामान्यीकृत रैखिक मॉडल पर पुस्तक में आनुपातिक खतरों के मॉडल को सामान्यीकृत रैखिक मॉडल में परिवर्तित करने पर एक अध्याय है।

उच्च-आयामी सेटअप के अंतर्गत

उच्च-आयाम में, जब नमूना आकार n की तुलना में सहसंयोजक p की संख्या बड़ी होती है, तो लैस्सो (सांख्यिकी) शास्त्रीय मॉडल-चयन रणनीतियों में से एक है। तिबशिरानी (1997) ने आनुपातिक खतरा प्रतिगमन पैरामीटर के लिए एक लासो प्रक्रिया प्रस्तावित की है।[17] प्रतिगमन पैरामीटर β के लैस्सो अनुमानक को L1-मानदंड|L के तहत कॉक्स आंशिक लॉग-संभावना के विपरीत के न्यूनतम के रूप में परिभाषित किया गया है।1-मानक प्रकार की बाधा।

इस विषय पर हाल ही में सैद्धांतिक प्रगति हुई है।[18]<रेफ नाम = ब्रैडिक और गाना (2012) >Bradić, J.; Song, R. (2015). "नॉनपैरामीट्रिक कॉक्स मॉडल में संरचित अनुमान". Electronic Journal of Statistics. 9 (1): 492–534. arXiv:1207.4510. doi:10.1214/15-EJS1004.</ref>[19][20]


सॉफ़्टवेयर कार्यान्वयन

  • गणित: CoxModelFit समारोह।[21]
  • आर: coxph() फ़ंक्शन, उत्तरजीविता पैकेज में स्थित है।
  • एसएएस: phreg प्रक्रिया
  • स्टेटा: stcox आज्ञा
  • पायथन: CoxPHFitter लाइफलाइन्स लाइब्रेरी में स्थित है। phreg स्टेटमॉडल लाइब्रेरी में।
  • एसपीएसएस: कॉक्स रिग्रेशन के अंतर्गत उपलब्ध है।
  • मतलब: coxphfit समारोह
  • जूलिया: Survival.jl लाइब्रेरी में उपलब्ध है।
  • जेएमपी: फिट आनुपातिक खतरों प्लेटफॉर्म में उपलब्ध है।
  • प्रिज्म: सर्वाइवल एनालिसिस और मल्टीपल वेरिएबल एनालिसिस में उपलब्ध

यह भी देखें

टिप्पणियाँ

  1. Breslow, N. E. (1975). "Analysis of Survival Data under the Proportional Hazards Model". International Statistical Review / Revue Internationale de Statistique. 43 (1): 45–57. doi:10.2307/1402659. JSTOR 1402659.
  2. Cox, David R (1972). "प्रतिगमन मॉडल और जीवन तालिका". Journal of the Royal Statistical Society, Series B. 34 (2): 187–220. JSTOR 2985181. MR 0341758.
  3. Kalbfleisch, John D.; Schaubel, Douglas E. (10 March 2023). "कॉक्स मॉडल के पचास वर्ष". Annual Review of Statistics and Its Application (in English). 10 (1): 1–23. doi:10.1146/annurev-statistics-033021-014043. ISSN 2326-8298.
  4. Reid, N. (1994). "A Conversation with Sir David Cox". Statistical Science. 9 (3): 439–455. doi:10.1214/ss/1177010394.
  5. Cox, D. R. (1997). Some remarks on the analysis of survival data. the First Seattle Symposium of Biostatistics: Survival Analysis.
  6. "Each failure contributes to the likelihood function", Cox (1972), page 191.
  7. Efron, Bradley (1974). "सेंसर किए गए डेटा के लिए कॉक्स के संभावना फ़ंक्शन की दक्षता". Journal of the American Statistical Association. 72 (359): 557–565. doi:10.1080/01621459.1977.10480613. JSTOR 2286217.
  8. Andersen, P.; Gill, R. (1982). "Cox's regression model for counting processes, a large sample study". Annals of Statistics. 10 (4): 1100–1120. doi:10.1214/aos/1176345976. JSTOR 2240714.
  9. Meyer, B. D. (1990). "बेरोजगारी बीमा और बेरोजगारी मंत्र" (PDF). Econometrica. 58 (4): 757–782. doi:10.2307/2938349. JSTOR 2938349.
  10. Bover, O.; Arellano, M.; Bentolila, S. (2002). "बेरोजगारी की अवधि, लाभ की अवधि और व्यापार चक्र" (PDF). The Economic Journal. 112 (479): 223–265. doi:10.1111/1468-0297.00034.
  11. Martinussen; Scheike (2006). उत्तरजीविता डेटा के लिए गतिशील प्रतिगमन मॉडल. Springer. doi:10.1007/0-387-33960-4. ISBN 978-0-387-20274-7.
  12. "timereg: Flexible Regression Models for Survival Data". CRAN.
  13. Cox, D. R. (1997). Some remarks on the analysis of survival data. the First Seattle Symposium of Biostatistics: Survival Analysis.
  14. Bender, R.; Augustin, T.; Blettner, M. (2006). "कॉक्स आनुपातिक खतरों के मॉडल का अनुकरण करने के लिए जीवित रहने का समय उत्पन्न करना". Statistics in Medicine. 24 (11): 1713–1723. doi:10.1002/sim.2369. PMID 16680804.
  15. Nan Laird and Donald Olivier (1981). "Covariance Analysis of Censored Survival Data Using Log-Linear Analysis Techniques". Journal of the American Statistical Association. 76 (374): 231–240. doi:10.2307/2287816. JSTOR 2287816.
  16. P. McCullagh and J. A. Nelder (2000). "Chapter 13: Models for Survival Data". Generalized Linear Models (Second ed.). Boca Raton, Florida: Chapman & Hall/CRC. ISBN 978-0-412-31760-6. (Second edition 1989; first CRC reprint 1999.)
  17. Tibshirani, R. (1997). "कॉक्स मॉडल में चर चयन के लिए लैस्सो विधि". Statistics in Medicine. 16 (4): 385–395. CiteSeerX 10.1.1.411.8024. doi:10.1002/(SICI)1097-0258(19970228)16:4<385::AID-SIM380>3.0.CO;2-3.
  18. Bradić, J.; Fan, J.; Jiang, J. (2011). "एनपी-आयामीता के साथ कॉक्स के आनुपातिक खतरों के मॉडल के लिए नियमितीकरण". Annals of Statistics. 39 (6): 3092–3120. arXiv:1010.5233. doi:10.1214/11-AOS911. PMC 3468162. PMID 23066171.
  19. Kong, S.; Nan, B. (2014). "लैस्सो के माध्यम से उच्च-आयामी कॉक्स प्रतिगमन के लिए गैर-स्पर्शोन्मुख दैवज्ञ असमानताएँ". Statistica Sinica. 24 (1): 25–42. arXiv:1204.1992. doi:10.5705/ss.2012.240. PMC 3916829. PMID 24516328.
  20. Huang, J.; Sun, T.; Ying, Z.; Yu, Y.; Zhang, C. H. (2011). "कॉक्स मॉडल में लैस्सो के लिए ओरेकल असमानताएँ". The Annals of Statistics. 41 (3): 1142–1165. arXiv:1306.4847. doi:10.1214/13-AOS1098. PMC 3786146. PMID 24086091.
  21. "कॉक्समॉडलफिट". Wolfram Language & System Documentation Center.


संदर्भ