आनुपातिक संकट नमूना

आनुपातिक ख़तरे मॉडल सांख्यिकी में उत्तरजीविता विश्लेषण का एक वर्ग है। उत्तरजीविता मॉडल किसी घटना के घटित होने से पहले बीतने वाले समय को एक या अधिक सहसंयोजकों से जोड़ते हैं जो उस समय की मात्रा के साथ जुड़ाव (सांख्यिकी) हो सकते हैं। आनुपातिक खतरों के मॉडल में, सहसंयोजक में एक इकाई वृद्धि का अनूठा प्रभाव खतरे की दर के संबंध में गुणक होता है। उदाहरण के लिए, दवा लेने से स्ट्रोक होने की जोखिम दर आधी हो सकती है, या, जिस सामग्री से निर्मित घटक का निर्माण किया जाता है उसे बदलने से विफलता की जोखिम दर दोगुनी हो सकती है। अन्य प्रकार के उत्तरजीविता मॉडल जैसे त्वरित विफलता समय मॉडल आनुपातिक खतरों को प्रदर्शित नहीं करते हैं। त्वरित विफलता समय मॉडल उस स्थिति का वर्णन करता है जहां किसी घटना का जैविक या यांत्रिक जीवन इतिहास त्वरित (या धीमा) हो जाता है।

पृष्ठभूमि
उत्तरजीविता मॉडल को दो भागों से मिलकर देखा जा सकता है: अंतर्निहित आधारभूत खतरा फ़ंक्शन, जिसे अक्सर दर्शाया जाता है $$\lambda_0(t)$$, यह वर्णन करते हुए कि सहसंयोजकों के आधारभूत स्तरों पर प्रति समय इकाई घटना का जोखिम समय के साथ कैसे बदलता है; और प्रभाव पैरामीटर, यह वर्णन करते हुए कि व्याख्यात्मक सहसंयोजकों की प्रतिक्रिया में खतरा कैसे भिन्न होता है। एक विशिष्ट चिकित्सा उदाहरण में परिवर्तनशीलता को कम करने और/या भ्रम को नियंत्रित करने के लिए सहसंयोजक जैसे उपचार असाइनमेंट, साथ ही रोगी की विशेषताएं जैसे अध्ययन की शुरुआत में उम्र, लिंग और अध्ययन की शुरुआत में अन्य बीमारियों की उपस्थिति शामिल होगी।

आनुपातिक खतरों की स्थिति बताता है कि सहसंयोजक खतरे से गुणात्मक रूप से संबंधित हैं। स्थिर गुणांक के सबसे सरल मामले में, उदाहरण के लिए, किसी दवा के साथ उपचार, किसी भी समय किसी विषय के खतरे को आधा कर सकता है $$t$$, जबकि आधारभूत खतरा भिन्न हो सकता है। हालाँकि, ध्यान दें कि इससे विषय का जीवनकाल दोगुना नहीं हो जाता है; जीवनकाल पर सहसंयोजकों का सटीक प्रभाव किस प्रकार पर निर्भर करता है $$\lambda_0(t)$$. सहसंयोजक द्विआधारी भविष्यवक्ताओं तक ही सीमित नहीं है; सतत सहसंयोजक के मामले में $$x$$, आमतौर पर यह माना जाता है कि खतरा तेजी से प्रतिक्रिया करता है; प्रत्येक इकाई में वृद्धि होती है $$x$$ इसके परिणामस्वरूप ख़तरा आनुपातिक रूप से बढ़ जाता है।

परिचय
डेविड कॉक्स (सांख्यिकीविद्) ने देखा कि यदि आनुपातिक खतरों की धारणा कायम है (या, कायम मानी जाती है) तो प्रभाव पैरामीटर का अनुमान लगाना संभव है, जिसे दर्शाया गया है $$\beta_i$$ नीचे, पूर्ण जोखिम फ़ंक्शन पर कोई विचार किए बिना। उत्तरजीविता डेटा के इस दृष्टिकोण को कॉक्स आनुपातिक खतरों मॉडल का अनुप्रयोग कहा जाता है, कभी-कभी इसे कॉक्स मॉडल या आनुपातिक ख़तरा मॉडल के रूप में संक्षिप्त किया जाता है। हालाँकि, कॉक्स ने यह भी कहा कि आनुपातिक खतरों की धारणा की जैविक व्याख्या काफी मुश्किल हो सकती है। होने देना $X_{i} = (X_{i1}, …, X_{ip})$ विषय i के लिए सहसंयोजकों के वास्तविक मूल्य बनें। कॉक्स आनुपातिक ख़तरे मॉडल के लिए ख़तरे फ़ंक्शन का रूप है



\begin{align} \lambda(t|X_i) &= \lambda_0(t)\exp(\beta_1X_{i1} + \cdots + \beta_pX_{ip}) \\ &= \lambda_0(t)\exp(X_i \cdot \beta) \end{align} $$ यह अभिव्यक्ति सहसंयोजक वेक्टर (व्याख्यात्मक चर) एक्स के साथ विषय i के लिए समय टी पर खतरा फ़ंक्शन देती हैi. ध्यान दें कि विषयों के बीच, आधारभूत खतरा $$\lambda_0(t)$$ समरूप है (i पर कोई निर्भरता नहीं है)। विषयों के खतरों के बीच एकमात्र अंतर बेसलाइन स्केलिंग कारक से आता है $$\exp(X_i \cdot \beta)$$.

इसे आनुपातिक क्यों कहा जाता है
आरंभ करने के लिए, मान लीजिए कि हमारे पास केवल एक ही सहसंयोजक है, $$x$$, और इसलिए एक एकल गुणांक, $$\beta_1$$. बढ़ने के प्रभाव पर विचार करें $$x$$ 1 द्वारा:



\begin{align} \lambda(t|x+1) &= \lambda_0(t)\exp(\beta_1(x+1)) \\ &= \lambda_0(t)\exp(\beta_1x+\beta_1)\\ &= \Bigl( \lambda_0(t)\exp(\beta_1x) \Bigr) \exp(\beta_1) \\ &= \lambda(t|x) \exp(\beta_1) \end{align} $$ हम देख सकते हैं कि एक सहसंयोजक को 1 से बढ़ाने से मूल खतरा स्थिरांक से बढ़ जाता है $$\exp(\beta_1)$$. चीजों को थोड़ा पुनर्व्यवस्थित करने पर, हम देखते हैं कि:



\frac{\lambda(t|x+1)}{\lambda(t|x)} = \exp(\beta_1) $$ दायीं ओर का भाग समय के साथ स्थिर रहता है (किसी भी पद का कोई मतलब नहीं है)। $$t$$ इस में)। यह रिश्ते, $$x/y = \text{constant}$$, को आनुपातिकता_(गणित) कहा जाता है।

अधिक सामान्यतः, सहसंयोजकों के साथ दो विषयों, i और j पर विचार करें $$X_i$$ और $$X_j$$ क्रमश। उनके खतरों के अनुपात पर विचार करें:



\begin{align} \frac{\lambda(t|X_i)}{\lambda(t|X_j)}&=\frac{\lambda_0(t)\exp(X_i \cdot \beta)}{\lambda_0(t)\exp(X_j \cdot \beta)}\\ &=\frac{\cancel{\lambda_0(t)}\exp(X_i \cdot \beta)}{\cancel{\lambda_0(t)}\exp(X_j \cdot \beta)}\\ &=\exp((X_i - X_j) \cdot \beta) \end{align} $$ दायीं ओर का भाग समय पर निर्भर नहीं है, केवल समय पर निर्भर कारक के रूप में, $$\lambda_0(t)$$, रद्द कर दिया गया। इस प्रकार दो विषयों के खतरों का अनुपात स्थिर है, यानी खतरे आनुपातिक हैं।

अवरोधन पद का अभाव
प्रतिगमन मॉडल में अक्सर एक अवरोधन शब्द (जिसे स्थिर शब्द या पूर्वाग्रह शब्द भी कहा जाता है) का उपयोग किया जाता है। कॉक्स मॉडल में आधारभूत खतरे के कारण एक का अभाव है, $$\lambda_0(t)$$, उसका स्थान ले लेता है। आइए देखें कि क्या होगा यदि हम किसी भी तरह से निरूपित एक अवरोधन शब्द शामिल करें $$\beta_0$$:



\begin{align} \lambda(t|X_i) &= \lambda_0(t)\exp(\beta_1X_{i1} + \cdots + \beta_pX_{ip} + \beta_0)\\ &= \lambda_0(t)\exp(X_i \cdot \beta)\exp(\beta_0) \\ &= \left ( \exp(\beta_0)\lambda_0(t)\right ) \exp(X_i \cdot \beta) \\ &= \lambda^*_0(t)\exp(X_i \cdot \beta) \end{align} $$ जहां हमने पुनः परिभाषित किया है $$\exp(\beta_0)\lambda_0(t)$$ एक नया आधारभूत ख़तरा बनना, $$\lambda^*_0(t)$$. इस प्रकार, आधारभूत खतरे में खतरे के सभी भाग शामिल होते हैं जो विषयों के सहसंयोजकों पर निर्भर नहीं होते हैं, जिसमें कोई भी अवरोधन शब्द शामिल होता है (जो परिभाषा के अनुसार सभी विषयों के लिए स्थिर है)।

अद्वितीय समय की संभावना
कॉक्स आंशिक संभावना, जो नीचे दिखाई गई है, बेसलाइन खतरा फ़ंक्शन के ब्रेस्लो के अनुमान का उपयोग करके प्राप्त की जाती है, इसे पूर्ण संभावना में प्लग किया जाता है और फिर यह देखा जाता है कि परिणाम दो कारकों का एक उत्पाद है। पहला कारक नीचे दिखाई गई आंशिक संभावना है, जिसमें आधारभूत खतरा रद्द हो गया है। दूसरा कारक प्रतिगमन गुणांक से मुक्त है और केवल सेंसरिंग (सांख्यिकी) के माध्यम से डेटा पर निर्भर करता है। किसी भी आनुपातिक खतरे मॉडल द्वारा अनुमानित सहसंयोजकों के प्रभाव को इस प्रकार खतरे के अनुपात के रूप में रिपोर्ट किया जा सकता है।

समय Y पर विषय i के लिए देखी जाने वाली घटना के घटित होने की संभावनाi इस प्रकार लिखा जा सकता है:

L_i(\beta) =\frac{\lambda(Y_i\mid X_i)}{\sum_{j:Y_j\ge Y_i}\lambda(Y_i\mid X_j)} =\frac{\lambda_0(Y_i)\theta_i}{\sum_{j:Y_j\ge Y_i}\lambda_0(Y_i)\theta_j} =\frac{\theta_i}{\sum_{j:Y_j\ge Y_i}\theta_j}, $$ कहाँ $θ_{j} = exp(X_{j} ⋅ β$) और सारांश विषयों j के सेट पर है जहां घटना समय Y से पहले नहीं हुई हैi (स्वयं विषय सहित)। जाहिर तौर पर 0 <Li(β) ≤ 1. यह एक संभावना फ़ंक्शन #आंशिक संभावना है: समय के साथ खतरे के परिवर्तन को मॉडल करने की आवश्यकता के बिना सहसंयोजकों के प्रभाव का अनुमान लगाया जा सकता है।

विषयों के साथ ऐसा व्यवहार करना जैसे कि वे सांख्यिकीय रूप से एक-दूसरे से स्वतंत्र हों, सभी वास्तविक घटनाओं की संयुक्त संभावना निम्नलिखित आंशिक संभावना है, जहां घटना की घटना सी द्वारा इंगित की जाती हैi = 1:

L(\beta) = \prod_{i:C_i=1} L_i(\beta). $$ संगत लॉग आंशिक संभावना है

\ell(\beta) = \sum_{i:C_i=1} \left(X_i \cdot \beta - \log \sum_{j:Y_j\ge Y_i}\theta_j\right). $$ मॉडल मापदंडों के अधिकतम आंशिक संभावना अनुमान उत्पन्न करने के लिए इस फ़ंक्शन को β से अधिक बढ़ाया जा सकता है।

आंशिक स्कोर (सांख्यिकी) है

\ell^\prime(\beta) = \sum_{i:C_i=1} \left(X_i - \frac{\sum_{j:Y_j\ge Y_i}\theta_jX_j}{\sum_{j:Y_j\ge Y_i}\theta_j}\right), $$ और आंशिक लॉग संभावना का हेस्सियन मैट्रिक्स  है

\ell^{\prime\prime}(\beta) = -\sum_{i:C_i=1} \left(\frac{\sum_{j:Y_j\ge Y_i}\theta_jX_jX_j^\prime}{\sum_{j:Y_j\ge Y_i}\theta_j} - \frac{\left[\sum_{j:Y_j\ge Y_i}\theta_jX_j\right] \left[\sum_{j:Y_j\ge Y_i}\theta_jX_j^\prime\right]}{\left[\sum_{j:Y_j\ge Y_i}\theta_j\right]^2}\right). $$ इस स्कोर फ़ंक्शन और हेस्सियन मैट्रिक्स का उपयोग करके, न्यूटन की विधि | न्यूटन-रेफसन एल्गोरिदम का उपयोग करके आंशिक संभावना को अधिकतम किया जा सकता है। हेसियन मैट्रिक्स का व्युत्क्रम, जिसका मूल्यांकन β के अनुमान पर किया जाता है, का उपयोग अनुमान के लिए अनुमानित विचरण-सहप्रसरण मैट्रिक्स के रूप में किया जा सकता है, और प्रतिगमन गुणांक के लिए अनुमानित मानक त्रुटियां उत्पन्न करने के लिए उपयोग किया जा सकता है।

संभावना जब बंधे हुए समय मौजूद हों
उन स्थितियों को संभालने के लिए कई दृष्टिकोण प्रस्तावित किए गए हैं जिनमें समय डेटा में संबंध हैं। ब्रेस्लो की विधि उस दृष्टिकोण का वर्णन करती है जिसमें ऊपर वर्णित प्रक्रिया को असंशोधित रूप से उपयोग किया जाता है, तब भी जब संबंध मौजूद हों। एक वैकल्पिक दृष्टिकोण जिसे बेहतर परिणाम देने वाला माना जाता है वह एफ्रॉन की विधि है। चलो टीj अद्वितीय समय को निरूपित करें, मान लीजिए Hj सूचकांकों के समुच्चय को इस प्रकार निरूपित करें कि Yi= टीj और सीi= 1, और चलो एमj= |एचj|. एफ्रॉन का दृष्टिकोण निम्नलिखित आंशिक संभावना को अधिकतम करता है।



L(\beta) = \prod_j \frac{\prod_{i\in H_j}\theta_i}{\prod_{\ell=0}^{m_j-1} \left[\sum_{i:Y_i\ge t_j}\theta_i - \frac{\ell}{m_j} \sum_{i\in H_j} \theta_i\right] }. $$ संगत लॉग आंशिक संभावना है



\ell(\beta) = \sum_j \left(\sum_{i\in H_j} X_i \cdot \beta -\sum_{\ell=0}^{m_j-1}\log\left(\sum_{i:Y_i\ge t_j}\theta_i - \frac{\ell}{m_j} \sum_{i\in H_j}\theta_i\right)\right), $$ स्कोर फ़ंक्शन है



\ell^\prime(\beta) = \sum_j \left(\sum_{i\in H_j} X_i -\sum_{\ell=0}^{m_j-1}\frac{\sum_{i:Y_i\ge t_j}\theta_iX_i - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_iX_i}{\sum_{i:Y_i\ge t_j}\theta_i - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_i}\right), $$ और हेस्सियन मैट्रिक्स है



\ell^{\prime\prime}(\beta) = -\sum_j \sum_{\ell=0}^{m_j-1} \left(\frac{\sum_{i:Y_i\ge t_j}\theta_iX_iX_i^\prime - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_iX_iX_i^\prime}{\phi_{j,\ell,m_j}} - \frac{Z_{j,\ell,m_j} Z_{j,\ell,m_j}^\prime}{\phi_{j,\ell,m_j}^2}\right), $$ कहाँ



\phi_{j,\ell,m_j} = \sum_{i:Y_i\ge t_j}\theta_i - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_i $$

Z_{j,\ell,m_j} = \sum_{i:Y_i\ge t_j}\theta_iX_i - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_iX_i. $$ ध्यान दें कि जब एचj खाली है (समय t के साथ सभी अवलोकनj सेंसर किया गया है), इन अभिव्यक्तियों में सारांश को शून्य माना जाता है।

उदाहरण
व्यवहार में कॉक्स मॉडल के कुछ व्यावहारिक उदाहरण नीचे दिए गए हैं।

एक एकल बाइनरी सहसंयोजक
मान लीजिए कि जिस अंतिम बिंदु में हम रुचि रखते हैं वह सर्जरी के बाद 5 साल की अवलोकन अवधि के दौरान रोगी का जीवित रहना है। मरीज़ 5 साल की अवधि के भीतर मर सकते हैं, और हम रिकॉर्ड करते हैं कि उनकी मृत्यु कब हुई, या मरीज़ 5 साल से अधिक जीवित रह सकते हैं, और हम केवल यह रिकॉर्ड करते हैं कि वे 5 साल से अधिक जीवित रहे। सर्जरी दो अस्पतालों, A या B में से एक में की गई थी, और हम जानना चाहेंगे कि क्या अस्पताल का स्थान 5 साल के जीवित रहने से जुड़ा है। विशेष रूप से, हम अस्पताल बी की तुलना में अस्पताल ए में की गई सर्जरी से खतरे में सापेक्ष वृद्धि (या कमी) जानना चाहेंगे। कुछ (नकली) डेटा प्रदान किया गया है, जहां प्रत्येक पंक्ति एक मरीज का प्रतिनिधित्व करती है: T यह दर्शाता है कि मृत्यु से पहले मरीज़ पर कितने समय तक निगरानी रखी गई थी या 5 साल (महीनों में मापा गया), और C दर्शाता है कि मरीज़ की मृत्यु 5 साल की अवधि में हुई थी या नहीं। हमने अस्पताल को एक बाइनरी वेरिएबल के रूप में एन्कोड किया है जिसे X दर्शाया गया है: 1 यदि अस्पताल A से है, 0 अस्पताल B से है।

हमारा एकल-सहसंयोजक कॉक्स आनुपातिक मॉडल निम्नलिखित जैसा दिखता है $$\beta_1$$ अस्पताल के प्रभाव का प्रतिनिधित्व करना, और i प्रत्येक रोगी को अनुक्रमित करना:

\overbrace{\lambda(t|X_{i})}^{\text{hazard for i}} = \underbrace{\lambda_0(t)}_{\text{baseline} \atop \text{hazard} }\cdot\overbrace{\exp(\beta_1 X_{i})}^{\text{scaling factor for i}} $$ सांख्यिकीय सॉफ्टवेयर का उपयोग करके हम अनुमान लगा सकते हैं $$\beta_1$$ 2.12 होना. जोखिम अनुपात इस मान का घातीय है, $$\exp(\beta_1) = \exp(2.12)$$. इसका कारण जानने के लिए, विशेष रूप से खतरों के अनुपात पर विचार करें:



\frac{\lambda(t|X=1)}{\lambda(t|X=0)} = \frac{\cancel{\lambda_0(t)}\exp(\beta_1 \cdot 1)}{\cancel{\lambda_0(t)}\exp(\beta_1 \cdot 0)} = \exp(\beta_1) $$ इस प्रकार, अस्पताल ए और अस्पताल बी का जोखिम अनुपात है $$\exp(2.12) = 8.32 $$. एक पल के लिए सांख्यिकीय महत्व को अलग रखते हुए, हम यह कहते हुए एक बयान दे सकते हैं कि अस्पताल ए में मरीज़ अस्पताल बी की तुलना में किसी भी कम समय में मृत्यु के 8.3 गुना अधिक जोखिम से जुड़े हैं।

व्याख्या के बारे में उल्लेख करने योग्य महत्वपूर्ण चेतावनियाँ हैं:


 * 1) मृत्यु के 8.3 गुना अधिक जोखिम का मतलब यह नहीं है कि अस्पताल बी में 8.3 गुना अधिक मरीज मरेंगे: उत्तरजीविता विश्लेषण यह जांचता है कि घटनाएं कितनी जल्दी घटित होती हैं, न कि केवल यह कि वे घटित होती हैं या नहीं।
 * 2) अधिक विशेष रूप से, मृत्यु का जोखिम एक दर का माप है। दर में इकाइयाँ होती हैं, जैसे मीटर प्रति सेकंड। हालाँकि, एक सापेक्ष दर नहीं है: एक साइकिल किसी अन्य साइकिल (संदर्भ साइकिल) की तुलना में दो गुना तेज चल सकती है, बिना किसी इकाई को निर्दिष्ट किए। इसी तरह, अस्पताल ए में मृत्यु का जोखिम (मृत्यु की दर) अस्पताल बी (संदर्भ समूह) में मृत्यु के जोखिम की तुलना में 8.3 गुना अधिक (तेज़) है।
 * 3) व्युत्क्रम मात्रा, $$ 1/8.32 = \frac{1}{\exp(2.12)} = \exp(-2.12) = 0.12$$ अस्पताल A के सापेक्ष अस्पताल B का जोखिम अनुपात है।
 * 4) हमने अस्पतालों के बीच जीवित रहने की संभावनाओं के बारे में कोई अनुमान नहीं लगाया है। ऐसा इसलिए है क्योंकि हमें आधारभूत जोखिम दर के अनुमान की आवश्यकता होगी, $$\lambda_0(t)$$, साथ ही हमारा भी $$\beta_1$$ अनुमान लगाना। हालाँकि, कॉक्स आनुपातिक खतरा मॉडल का मानक अनुमान सीधे तौर पर आधारभूत खतरे की दर का अनुमान नहीं लगाता है।
 * 5) क्योंकि हमने मॉडल के एकमात्र समय-परिवर्तनशील घटक, आधारभूत जोखिम दर को नजरअंदाज कर दिया है, हमारा अनुमान टाइमस्केल-अपरिवर्तनीय है। उदाहरण के लिए, यदि हमने समय को महीनों के बजाय वर्षों में मापा होता, तो हमें वही अनुमान मिलता।
 * 6) यह कहना आकर्षक है कि अस्पताल ने दोनों समूहों के बीच खतरों में अंतर पैदा किया, लेकिन चूंकि हमारा अध्ययन कारणात्मक नहीं है (अर्थात्, हम नहीं जानते कि डेटा कैसे उत्पन्न हुआ), हम कायम हैं जैसी शब्दावली के साथ संबद्ध।

एक एकल सतत सहसंयोजक
उत्तरजीविता विश्लेषण के कम पारंपरिक उपयोग के मामले को प्रदर्शित करने के लिए, अगला उदाहरण एक अर्थशास्त्र प्रश्न होगा: कंपनियों के आईपीओ की 1 साल की सालगिरह पर मूल्य-से-आय अनुपात (पी/ई) और उनके भविष्य के अस्तित्व के बीच क्या संबंध है ? अधिक विशेष रूप से, यदि हम किसी कंपनी के जन्म की घटना को उनकी 1-वर्षीय आईपीओ वर्षगांठ मानते हैं, और किसी दिवालियापन, बिक्री, निजी होने आदि को कंपनी की मृत्यु की घटना मानते हैं, तो हम कंपनियों के पी के प्रभाव को जानना चाहेंगे। / उनके जन्म पर ई अनुपात (1-वर्ष आईपीओ वर्षगांठ) उनके जीवित रहने पर।

प्रदान किया गया एक (नकली) डेटासेट है जिसमें 12 कंपनियों के अस्तित्व डेटा हैं: T 1-वर्षीय आईपीओ वर्षगांठ और मृत्यु (या 2022-01-01 की अंतिम तिथि, यदि नहीं किया गया है) के बीच दिनों की संख्या का प्रतिनिधित्व करता है मरना)। सी दर्शाता है कि कंपनी 2022-01-01 से पहले समाप्त हो गई या नहीं। पी/ई कंपनियों की 1-वर्षीय आईपीओ वर्षगांठ पर मूल्य-से-आय अनुपात का प्रतिनिधित्व करता है।

पिछले उदाहरण के विपरीत जहां एक बाइनरी वैरिएबल था, इस डेटासेट में एक सतत वैरिएबल, पी/ई है। हालाँकि, मॉडल समान दिखता है:



\lambda(t|P_{i}) = \lambda_0(t)\cdot\exp(\beta_1 P_{i}) $$ कहाँ $$P_i$$ किसी कंपनी के पी/ई अनुपात का प्रतिनिधित्व करता है। कॉक्स मॉडल के माध्यम से इस डेटासेट को चलाने से अज्ञात के मूल्य का अनुमान उत्पन्न होता है $$\beta_1$$, जो -0.34 है। इसलिए, संपूर्ण खतरे का एक अनुमान इस प्रकार है:



\lambda(t|P_{i}) = \lambda_0(t)\cdot\exp(-0.34 P_{i}) $$ आधारभूत खतरे के बाद से, $$\lambda_0(t)$$, अनुमान नहीं लगाया गया था, पूरे खतरे की गणना नहीं की जा सकी है। हालाँकि, कंपनियों i और j के खतरों के अनुपात पर विचार करें:



\begin{align} \frac{\lambda(t|P_{i})}{\lambda(t|P_{j})} &= \frac{ \cancel{\lambda_0(t)}\cdot\exp(-0.34 P_{i})}{\cancel{\lambda_0(t)}\cdot\exp(-0.34 P_{j})} \\ &= \exp(-0.34 (P_{i} - P_{j})) \end{align} $$ दाईं ओर सभी शर्तें ज्ञात हैं, इसलिए कंपनियों के बीच खतरों के अनुपात की गणना करना संभव है। चूँकि दाईं ओर कोई समय-निर्भर शब्द नहीं है (सभी पद स्थिर हैं), खतरे एक-दूसरे के लिए आनुपातिक हैं। उदाहरण के लिए, कंपनी 5 से कंपनी 2 का जोखिम अनुपात है $$\exp(-0.34 (6.3 - 3.0)) = 0.33$$. इसका मतलब यह है कि, अध्ययन के अंतराल के भीतर, कंपनी 5 की मृत्यु का जोखिम कंपनी 2 की मृत्यु के जोखिम के बराबर 0.33 ≈ 1/3 है।

व्याख्या के बारे में उल्लेख करने योग्य महत्वपूर्ण चेतावनियाँ हैं:

\lambda(t|P_{i}=0) = \lambda_0(t)\cdot\exp(-0.34 \cdot 0) = \lambda_0(t) $$ क्या हम बेसलाइन खतरे की व्याख्या उस बेसलाइन कंपनी के खतरे के रूप में कर सकते हैं जिसका पी/ई 0 है? आधारभूत विषय के खतरे के रूप में आधारभूत खतरे की यह व्याख्या अपूर्ण है, क्योंकि यह संभव है कि सहसंयोजक 0 होना असंभव है। इस एप्लिकेशन में, 0 का पी/ई अर्थहीन है (इसका मतलब है कि कंपनी का स्टॉक मूल्य 0 है, यानी, वे मर चुके हैं)। खतरे की अधिक उपयुक्त व्याख्या तब होगी जब सभी चर शून्य हों।
 * 1) खतरा अनुपात मात्रा है $$\exp(\beta_1)$$, जो है  $$\exp(-0.34) = 0.71$$ उपरोक्त उदाहरण में. उपरोक्त अंतिम गणना से, इसकी व्याख्या दो विषयों के बीच खतरों के अनुपात के रूप में होती है जिनके चर एक इकाई से भिन्न होते हैं: यदि $$P_{i} = P_{j} + 1$$, तब $$\exp(\beta_1 (P_{i} - P_{j}) = \exp(\beta_1 (1))$$. एक इकाई द्वारा भिन्न का चुनाव सुविधा है, क्योंकि यह सटीक रूप से मूल्य का संचार करता है $$\beta_1$$.
 * 2) बेसलाइन खतरे का प्रतिनिधित्व तब किया जा सकता है जब स्केलिंग फैक्टर 1 हो, यानी। $$P=0$$. <पी>$$
 * 1) जैसे मूल्य को समझना और व्याख्या करना आकर्षक है $$\exp(\beta_1 P_{i})$$ किसी कंपनी के खतरे का प्रतिनिधित्व करने के लिए। हालाँकि, विचार करें कि यह वास्तव में क्या दर्शाता है: $$\exp(\beta_1 P_{i}) = \exp(\beta_1 (P_{i}-0))= \frac{\exp(\beta_1 P_{i})}{\exp(\beta_1 0)} = \frac{\lambda(t|P_{i})}{\lambda(t|0)}$$. यहां खतरों का अनुपात स्पष्ट रूप से है, कंपनी के खतरे की तुलना 0 पी/ई वाली एक काल्पनिक बेसलाइन कंपनी से की जाती है। हालाँकि, जैसा कि ऊपर बताया गया है, इस एप्लिकेशन में 0 का पी/ई असंभव है $$\exp(\beta_1 P_{i})$$ इस उदाहरण में अर्थहीन है. हालाँकि, संभावित खतरों के बीच अनुपात सार्थक है।

समय-परिवर्तनशील भविष्यवक्ता और गुणांक
समय पर निर्भर चर, समय पर निर्भर स्तर और प्रति विषय कई घटनाओं के विस्तार को एंडरसन और गिल की गिनती प्रक्रिया सूत्रीकरण द्वारा शामिल किया जा सकता है। समय-भिन्न प्रतिगामी के साथ जोखिम मॉडल के उपयोग का एक उदाहरण बेरोजगारी मंत्रों पर बेरोजगारी बीमा के प्रभाव का अनुमान लगाना है। समय-भिन्न सहसंयोजकों (यानी, भविष्यवक्ताओं) की अनुमति देने के अलावा, कॉक्स मॉडल को समय-भिन्न गुणांकों के लिए भी सामान्यीकृत किया जा सकता है। अर्थात्, उपचार का आनुपातिक प्रभाव समय के साथ भिन्न हो सकता है; जैसे यदि कोई दवा रुग्णता के एक महीने के भीतर दी जाए तो वह बहुत प्रभावी हो सकती है, और समय बीतने के साथ कम प्रभावी हो जाती है। तब गुणांक के समय (स्थिरता) के साथ कोई परिवर्तन नहीं होने की परिकल्पना का परीक्षण किया जा सकता है। विवरण और सॉफ़्टवेयर (आर (प्रोग्रामिंग भाषा)#पैकेज) मार्टिनुसेन और शेइक (2006) में उपलब्ध हैं। इस संदर्भ में, यह भी उल्लेख किया जा सकता है कि योगात्मक खतरों का उपयोग करके सहसंयोजकों के प्रभाव को निर्दिष्ट करना सैद्धांतिक रूप से संभव है, यानी निर्दिष्ट करना

\lambda(t|X_i) = \lambda_0(t) + \beta_1X_{i1} + \cdots + \beta_pX_{ip} = \lambda_0(t) + X_i \cdot \beta. $$ यदि ऐसे योगात्मक खतरों के मॉडल का उपयोग उन स्थितियों में किया जाता है जहां (लॉग-)संभावना अधिकतमकरण उद्देश्य है, तो इसे प्रतिबंधित करने के लिए सावधानी बरतनी चाहिए $$\lambda(t\mid X_i)$$ गैर-नकारात्मक मानों के लिए. शायद इसी जटिलता के परिणामस्वरूप ऐसे मॉडल कम ही देखने को मिलते हैं। यदि उद्देश्य न्यूनतम वर्ग है तो गैर-नकारात्मकता प्रतिबंध की सख्ती से आवश्यकता नहीं है।

बेसलाइन खतरा फ़ंक्शन निर्दिष्ट करना
कॉक्स मॉडल को विशिष्ट बनाया जा सकता है यदि यह मानने का कोई कारण मौजूद है कि आधारभूत खतरा एक विशेष रूप का अनुसरण करता है। इस मामले में, आधारभूत खतरा $$\lambda_0(t)$$ किसी दिए गए फ़ंक्शन द्वारा प्रतिस्थापित किया जाता है। उदाहरण के लिए, जोखिम फ़ंक्शन को वेइबुल वितरण#संचयी वितरण फ़ंक्शन मानने से वेइबुल आनुपातिक ख़तरा मॉडल मिलता है।

संयोग से, वेइबुल बेसलाइन खतरे का उपयोग करना एकमात्र परिस्थिति है जिसके तहत मॉडल आनुपातिक खतरों और त्वरित विफलता समय मॉडल मॉडल दोनों को संतुष्ट करता है।

सामान्य शब्द पैरामीट्रिक आनुपातिक खतरा मॉडल का उपयोग आनुपातिक खतरा मॉडल का वर्णन करने के लिए किया जा सकता है जिसमें खतरा कार्य निर्दिष्ट है। इसके विपरीत कॉक्स आनुपातिक ख़तरे मॉडल को कभी-कभी अर्धपैरामीट्रिक मॉडल कहा जाता है।

कुछ लेखक अंतर्निहित खतरे के कार्य को निर्दिष्ट करते समय भी कॉक्स आनुपातिक खतरा मॉडल शब्द का उपयोग करते हैं, डेविड कॉक्स को पूरे क्षेत्र का ऋण स्वीकार करने के लिए।

कॉक्स रिग्रेशन मॉडल (आनुपातिक खतरों को छोड़ना) शब्द का उपयोग कभी-कभी समय-निर्भर कारकों को शामिल करने के लिए कॉक्स मॉडल के विस्तार का वर्णन करने के लिए किया जाता है। हालाँकि, यह उपयोग संभावित रूप से अस्पष्ट है क्योंकि कॉक्स आनुपातिक खतरे मॉडल को स्वयं एक प्रतिगमन मॉडल के रूप में वर्णित किया जा सकता है।

पॉइसन मॉडल से संबंध
आनुपातिक खतरों के मॉडल और पॉइसन प्रतिगमन मॉडल के बीच एक संबंध है जिसे कभी-कभी पॉइसन प्रतिगमन के लिए सॉफ़्टवेयर में अनुमानित आनुपातिक खतरों के मॉडल को फिट करने के लिए उपयोग किया जाता है। ऐसा करने का सामान्य कारण यह है कि गणना बहुत तेज होती है। धीमे कंप्यूटरों के दिनों में यह अधिक महत्वपूर्ण था लेकिन विशेष रूप से बड़े डेटा सेट या जटिल समस्याओं के लिए अभी भी उपयोगी हो सकता है। लैयर्ड और ओलिवियर (1981) गणितीय विवरण प्रदान करें. वे ध्यान देते हैं, हम यह नहीं मानते हैं कि [पॉइसन मॉडल] सत्य है, लेकिन इसे केवल संभावना प्राप्त करने के लिए एक उपकरण के रूप में उपयोग करते हैं। मैक्कलघ और नेल्डर का सामान्यीकृत रैखिक मॉडल पर पुस्तक में आनुपातिक खतरों के मॉडल को सामान्यीकृत रैखिक मॉडल में परिवर्तित करने पर एक अध्याय है।

उच्च-आयामी सेटअप के अंतर्गत
उच्च-आयाम में, जब नमूना आकार n की तुलना में सहसंयोजक p की संख्या बड़ी होती है, तो लैस्सो (सांख्यिकी) शास्त्रीय मॉडल-चयन रणनीतियों में से एक है। तिबशिरानी (1997) ने आनुपातिक खतरा प्रतिगमन पैरामीटर के लिए एक लासो प्रक्रिया प्रस्तावित की है। प्रतिगमन पैरामीटर β के लैस्सो अनुमानक को L1-मानदंड|L के तहत कॉक्स आंशिक लॉग-संभावना के विपरीत के न्यूनतम के रूप में परिभाषित किया गया है।1-मानक प्रकार की बाधा।



\ell(\beta) = \sum_j \left(\sum_{i\in H_j} X_i \cdot \beta -\sum_{\ell=0}^{m_j-1}\log\left(\sum_{i:Y_i\ge t_j}\theta_i - \frac{\ell}{m_j}\sum_{i\in H_j}\theta_i\right)\right) + \lambda \|\beta\|_1 , $$ इस विषय पर हाल ही में सैद्धांतिक प्रगति हुई है। <रेफ नाम = ब्रैडिक और गाना (2012) >

सॉफ़्टवेयर कार्यान्वयन

 * गणित:  समारोह।
 * आर:  फ़ंक्शन, उत्तरजीविता पैकेज में स्थित है।
 * एसएएस:  प्रक्रिया
 * स्टेटा:  आज्ञा
 * पायथन:  लाइफलाइन्स लाइब्रेरी में स्थित है।   स्टेटमॉडल लाइब्रेरी में।
 * एसपीएसएस: कॉक्स रिग्रेशन के अंतर्गत उपलब्ध है।
 * मतलब:  समारोह
 * जूलिया: Survival.jl लाइब्रेरी में उपलब्ध है।
 * जेएमपी: फिट आनुपातिक खतरों प्लेटफॉर्म में उपलब्ध है।
 * प्रिज्म: सर्वाइवल एनालिसिस और मल्टीपल वेरिएबल एनालिसिस में उपलब्ध

यह भी देखें

 * त्वरित विफलता समय मॉडल
 * दस में से एक नियम
 * वेइबुल वितरण