लॉगरैंक परीक्षण

लॉगरैंक परीक्षण दो प्रारूप के अनुमानक विश्लेषण वितरण की तुलना करने के लिए परिकल्पना परीक्षण है। यह अपैरामीट्रिक परीक्षण है और जब डेटा उत्तम रूप से सेंसरिंग (सांख्यिकी) किया गया हो तो इसका उपयोग करना उचित है (तकनीकी रूप से, सेंसरिंग गैर-जानकारीपूर्ण होनी चाहिए)। नियंत्रण उपचार की तुलना में नए उपचार की प्रभावकारिता स्थापित करने के लिए नैदानिक ​​​​परीक्षणों में इसका व्यापक रूप से उपयोग किया जाता है जब माप घटना का समय होता है (जैसे कि प्रारंभिक उपचार से हार्ट अटैक पड़ने तक का समय)। परीक्षण को कभी-कभी मेंटल-कॉक्स परीक्षण भी कहा जाता है। लॉगरैंक परीक्षण को समय-स्तरीकृत कोचरन-मेंटल-हेन्सज़ेल सांख्यिकी परीक्षण के रूप में भी देखा जा सकता है।

परीक्षण सबसे पूर्व नाथन मेंटल द्वारा प्रस्तावित की गई था और रिचर्ड द फिफ्थ और जूलियन पेटो द्वारा इसे लॉगरैंक परीक्षण नाम दिया गया था।

परिभाषा
लॉगरैंक परीक्षण आँकड़ा प्रत्येक देखे गए घटना समय पर दो समूहों आशंकाप्रद फलनों के अनुमानों की तुलना करता है। इसका निर्माण प्रत्येक देखे गए घटना समय पर किसी समूह में देखी गई और अपेक्षित घटनाओं की संख्या की गणना करके और फिर उन सभी समय बिंदुओं पर समग्र सारांश प्राप्त करने के लिए उन्हें जोड़कर किया जाता है जहां कोई घटना होती है।

रोगियों के दो समूहों पर विचार करें, उदाहरण के लिए, उपचार के प्रति नियंत्रण होना। मान लीजिये $$1, \ldots, J$$ किसी भी समूह में देखी गई घटनाओं का भिन्न-भिन्न समय होना चाहिए। मान लीजिये $$N_{1,j}$$ और $$N_{2,j}$$ अवधि के प्रारंभ में विषयों की संख्या (जिनका अभी तक कोई फलनक्रम नहीं हुआ है या सेंसर नहीं किया गया है)। $$j$$ क्रमशः समूहों में मान लीजिये $$O_{1,j}$$ और $$O_{2,j}$$ समय-समय पर समूहों में देखी गई घटनाओं की संख्या प्रदर्शित करता है। अंत में, $$j$$ द्वारा $$N_j = N_{1,j} + N_{2,j}$$ और $$O_j = O_{1,j} + O_{2,j}$$ परिभाषित किया गया है।

शून्य परिकल्पना यह है कि दोनों समूहों के हजार्ड फलन $$ H_0 : h_1(t) = h_2(t)$$ समान हैं, अत:, $$H_0$$ के अंतर्गत, प्रत्येक समूह के लिए $$i = 1, 2$$, $$O_{i,j}$$ पैरामीटरों के साथ हाइपरज्यामितीय वितरण का अनुसरण करता है, $$N_j$$, $$N_{i,j}$$, $$O_j$$ इस वितरण का अपेक्षित मान $$E_{i,j} = O_j \frac{N_{i,j}}{N_j}$$ और विचरण $$V_{i,j} = E_{i,j} \left( \frac{N_j - O_j}{N_j} \right) \left( \frac{N_j - N_{i,j}}{N_j - 1} \right)$$है।

सभी के लिए $$j = 1, \ldots, J$$, लॉगरैंक $$O_{i,j}$$ आँकड़ा तुलना करता है इसकी अपेक्षा के अनुरूप $$E_{i,j}$$ अंतर्गत $$H_0$$ इसे इस प्रकार परिभाषित किया गया है:


 * $$Z_i = \frac {\sum_{j=1}^J (O_{i,j} - E_{i,j})} {\sqrt {\sum_{j=1}^J V_{i,j}}}\ \xrightarrow{d}\ \mathcal N(0,1)$$ ($$i=1$$ या $$2$$)

केंद्रीय सीमा प्रमेय द्वारा, प्रत्येक का वितरण $$Z_i$$ मानक सामान्य वितरण के रूप में अभिसरण करता है $$J$$ अनंत तक पहुंचता है और इसलिए पर्याप्त रूप से बड़े मानक सामान्य वितरण द्वारा इसका अनुमान लगाया जा सकता है $$J$$ इस मात्रा को पूर्व चार क्षणों के युग्मन के साथ पियर्सन प्रकार I या II (बीटा) वितरण के समान उत्तम अनुमान प्राप्त किया जा सकता है, जैसा कि पेटो और पेटो पेपर के परिशिष्ट B में वर्णित है।

स्पर्शोन्मुख वितरण
यदि दोनों समूहों का अनुमानक फलन समान है, तो लॉगरैंक आँकड़ा लगभग मानक सामान्य है। स्तर $$\alpha$$ यदि परीक्षण शून्य परिकल्पना को अस्वीकार कर देगा $$Z>z_\alpha$$ जहाँ $$z_\alpha$$ ऊपरी है $$\alpha$$ मानक सामान्य वितरण की अल्फा मात्रा $$\lambda$$, हैं $$n$$ कुल विषय, $$d$$ यह संभावना है कि किसी भी समूह के किसी विषय में अंततः घटना होगी (जिससे $$nd$$ विश्लेषण के समय घटनाओं की अपेक्षित संख्या है), और प्रत्येक समूह में यादृच्छिक विषयों का अनुपात 50% है, तो लॉगरैंक आँकड़ा माध्य के साथ लगभग सामान्य है $$ (\log{\lambda}) \, \sqrt {\frac {n \, d} {4}} $$ और विचरण 1 की ओर स्तर के लिए शक्ति के साथ $$\alpha$$ परीक्षण $$1-\beta$$, आवश्यक प्रारूप आकार $$ n = \frac {4 \, (z_\alpha + z_\beta)^2 } {d\log^2{\lambda}}$$ है, जहाँ $$z_\alpha$$ और $$z_\beta$$ मानक सामान्य वितरण की मात्राएँ हैं।

संयुक्त वितरण
कल्पना करना $$ Z_1 $$ और $$ Z_2 $$ एक ही अध्ययन में दो भिन्न-भिन्न समय बिंदुओं पर लॉगरैंक आँकड़े हैं ($$ Z_1 $$ पूर्व)। फिर से, मान लीजिये कि दोनों समूहों के फलन के समानुपाती हैं $$\lambda$$, $$ d_1 $$ और $$ d_2 $$ संभावनाएँ हैं कि विषय में दो समय बिंदुओं $$ d_1 \leq d_2 $$ पर घटना होगी,  $$ Z_1 $$ और $$ Z_2 $$ माध्य के साथ लगभग द्विचर सामान्य हैं $$ \log{\lambda} \, \sqrt {\frac {n \, d_1} {4}} $$ और $$ \log{\lambda} \, \sqrt {\frac {n \, d_2} {4}} $$ और सहसंबंध $$\sqrt {\frac {d_1} {d_2}} $$ जब डेटा निरीक्षण समिति द्वारा अध्ययन के भीतर डेटा का कई बार परीक्षण किया जाता है, तो त्रुटि दर को उत्तम रूप से बनाए रखने के लिए संयुक्त वितरण से जुड़ी गणना की आवश्यकता होती है।

अन्य आँकड़ों से संबंध

 * लॉगरैंक आँकड़ा दो समूहों की तुलना करने वाले कॉक्स आनुपातिक मॉडल के लिए स्कोर परीक्षण के रूप में प्राप्त किया जा सकता है। इसलिए यह उस मॉडल पर आधारित संभावना अनुपात परीक्षण आँकड़ों के समानुपाती है।
 * लॉगरैंक आँकड़ा आनुपातिक विकल्प के साथ वितरण के किसी भी सदस्य के लिए संभावना अनुपात परीक्षण आँकड़ा के समान है। उदाहरण के लिए, यदि दो प्रारूप के डेटा में घातीय वितरण है।
 * यदि $$ Z $$ लॉगरैंक आँकड़ा है, $$ D $$ देखी गई घटनाओं की संख्या है, और $$\hat {\lambda} $$ के अनुपात का अनुमान $$ \log{\hat {\lambda}} \approx Z \, \sqrt{4/D} $$ है, यह संबंध तब उपयोगी होता है जब दो मात्राएँ ज्ञात हों (उदाहरण के लिए किसी प्रकाशित लेख से), किंतु तीसरी की आवश्यकता होती है।
 * जब टिप्पणियों को सेंसर किया जाता है तो लॉगरैंक आँकड़े का उपयोग किया जा सकता है। यदि डेटा में सेंसर की गई टिप्पणियाँ उपस्थित नहीं हैं तो विलकॉक्सन रैंक योग परीक्षण उपयुक्त है।
 * लॉगरैंक आँकड़ा सभी गणनाओं को समान महत्व देता है, चाहे कोई भी घटना घटित होने का समय कुछ भी हो। बड़ी संख्या में अवलोकन होने पर पेटो लॉगरैंक परीक्षण आँकड़े पूर्व की घटनाओं को अधिक महत्व देते हैं।

धारणाओं का परीक्षण करना
लॉगरैंक परीक्षण कपलान-मायर अनुमानक के समान मान्यताओं पर आधारित है- अर्थात्, सेंसरिंग पूर्वानुमान से असंबंधित है, अध्ययन में शीघ्र और देर से भर्ती किए गए विषयों के लिए जीवित रहने की संभावनाएं समान हैं, और घटनाएँ निर्दिष्ट समय पर हुईं। इन धारणाओं से विचलन सबसे अधिक महत्त्व रखते है यदि वे तुलना किए जा रहे समूहों में भिन्न-भिन्न विधियों से संतुष्ट हों, उदाहरण के लिए यदि समूह में दूसरे की तुलना में सेंसरिंग की अधिक संभावना है।

यह भी देखें

 * कपलान-मेयर अनुमानक
 * हजार्ड का अनुपात