पैनल डेटा

सांख्यिकी और अर्थमिति में, पट्टिका आँकड़ा और अनुदैर्ध्य आँकड़ा दोनों बहु-आयामी डेटा हैं जिनमें समय के साथ माप सम्मिलित हैं। पट्टिका आँकड़ा अनुदैर्ध्य डेटा का एक उपसमुच्चय है जहां अवलोकन हर बार समान विषयों के लिए होते हैं।

काल श्रेणी और अनुप्रस्थ काट डेटा को पट्टिका आँकड़ा की विशेष स्थित के रूप में माना जा सकता है जो केवल एक आयाम में हैं (एक पैनल सदस्य या पूर्व के लिए अलग अलग, बाद के लिए एक समय बिंदु)। एक साहित्य खोज में अक्सर समय श्रृंखला, अनुप्रस्थ काट या पट्टिका आँकड़ा सम्मिलित होते है। अनुप्रस्थ-पट्टिका आँकड़ा (सीपीडी) गणितीय और सांख्यिकीय विज्ञान में जानकारी का एक अभिनव अभी तक कम सराहना वाला स्रोत है। सीपीडी अन्य अनुसंधान प्रणालियों से अलग है क्योंकि यह स्पष्ट रूप से दिखाता है कि देशों के बीच स्वतंत्र और परतंत्र चर कैसे बदल सकते हैं। यह पट्टिका आँकड़ा संग्रह शोधकर्ताओं को कई अनुप्रस्थ काट और समय आवर्त में चर के बीच संबंध की जांच करने और अन्य देशों में नीतिगत कार्यों के परिणामों का विश्लेषण करने की अनुमति देता है।

पट्टिका आँकड़ा का उपयोग करने वाले अध्ययन को अनुदैर्ध्य अध्ययन या पट्टिका अध्ययन कहा जाता है।

उदाहरण
उपरोक्त एकाधिक प्रतिक्रिया क्रमचय प्रक्रिया (एमआरपीपी) उदाहरण में, पैनल संरचना वाले दो डेटासेट दिखाए गए हैं और इसका उद्देश्य यह परीक्षण करना है कि प्रतिचय डेटा में लोगों के बीच कोई महत्वपूर्ण अंतर है या नहीं। व्यक्तिगत विशेषताओं (आय, आयु, लिंग) को अलग-अलग व्यक्तियों और अलग-अलग वर्षों के लिए एकत्र किया जाता है। पहले डेटासेट में तीन वर्ष (2016, 2017, 2018) के लिए प्रत्येक वर्ष दो व्यक्तियों (1, 2) का अवलोकन किया जाता है। दूसरे डेटासेट में, तीन व्यक्तियों (1, 2, 3) को तीन वर्षों (2016, 2017, 2018) में क्रमशः दो बार (व्यक्ति 1), तीन बार (व्यक्ति 2), और एक बार (व्यक्ति 3) देखा गया है। विशेष रूप से, व्यक्ति 1 वर्ष 2018 में नहीं देखा गया है और व्यक्ति 3 2016 या 2018 में नहीं देखा गया है।

एक संतुलित पैनल (उदाहरण के लिए, उपरोक्त पहला डेटासेट) एक डेटासेट है जिसमें प्रत्येक पैनल सदस्य (अर्थात, व्यक्ति) प्रत्येक वर्ष मनाया जाता है। परिणामस्वरूप, यदि एक संतुलित पैनल में N पैनल के सदस्य और T आवर्त सम्मिलित हैं, तो डेटासेट में अवलोकनों की संख्या (n) आवश्यक रूप से $n = N&times;T$ है।

एक असंतुलित पैनल (जैसे, ऊपर दिया गया दूसरा डेटासेट) एक डेटासेट है जिसमें कम से कम एक पैनल सदस्य प्रत्येक अवधि में नहीं देखा जाता है। इसलिए, यदि एक असंतुलित पैनल में N पैनल के सदस्य और T अवधि सम्मिलित हैं, तो डेटासेट में प्रेक्षणों की संख्या (n) के लिए निम्न सख्त असमानता लागू होती ह, $n &lt; N&times;T$ ।

उपरोक्त दोनों डेटासेट लंबे प्रारूप में संरचित हैं, जहां एक पंक्ति प्रति समय एक अवलोकन रखती है। पट्टिका आँकड़ा की संरचना का एक अन्य तरीका व्यापक प्रारूप होगा जहां एक पंक्ति समय में सभी बिंदुओं के लिए एक अवलोकन इकाई का प्रतिनिधित्व करती है (उदाहरण के लिए, विस्तृत प्रारूप में डेटा केवल दो (पहला उदाहरण) या तीन (दूसरा उदाहरण) पंक्तियाँ होंगी, जिसमें प्रत्येक समय-भिन्न चर (आय, आयु)  के लिए अतिरिक्त स्तम्भ होंगे।)

विश्लेषण
एक पैनल का रूप


 * $$X_{it}, \quad i = 1, \dots, N, \quad t = 1, \dots, T, $$

है जहाँ $$i$$ व्यक्तिगत आयाम है और $$t$$ समय आयाम है। एक सामान्य पट्टिका आँकड़ा प्रतिगमन प्रारूप  $$y_{it} = \alpha + \beta' X_{it} + u_{it}.$$के रूप में लिखा जाता है।

इस सामान्य प्रारूप की सटीक संरचना पर विभिन्न धारणाएँ बनाई जा सकती हैं। निश्चित प्रभाव प्रारूप  और अनियमित प्रभाव प्रारूप दो महत्वपूर्ण प्रारूप हैं।

एक सामान्य पट्टिका आँकड़ा प्रारूप पर विचार करें,


 * $$y_{it} = \alpha + \beta' X_{it} + u_{it}, $$
 * $$u_{it} = \mu_i + v_{it}.$$

$$\mu_i$$ व्यक्तिगत-विशिष्ट, समय-अपरिवर्तनीय प्रभाव हैं (उदाहरण के लिए देशों के एक पैनल में इसमें भूगोल, जलवायु आदि सम्मिलित हो सकते हैं) जो समय के साथ तय होते हैं। जबकि $$v_{it}$$ एक समय-भिन्न यादृच्छिक घटक है।

यदि $$\mu_i$$ का अवलोकन नहीं किया गया है, और कम से कम एक स्वतंत्र चर के साथ सहसंबद्ध है, तो यह एक मानक ओएलएस प्रतिगमन में छोड़े गए चर पूर्वाग्रह का कारण होगा। हालाँकि, पट्टिका आँकड़ा विधियाँ, जैसे कि निश्चित प्रभाव अनुमानक या वैकल्पिक रूप से, प्रथम-अंतर अनुमानक का उपयोग इसे नियंत्रित करने के लिए किया जा सकता है।

यदि $$\mu_i$$ किसी भी स्वतंत्र चर के साथ सहसंबद्ध नहीं है, तो प्रतिगमन मापदंडों के निष्पक्ष और सुसंगत अनुमानों को प्राप्त करने के लिए साधारण न्यूनतम वर्ग रैखिक प्रतिगमन विधियों का उपयोग किया जा सकता है। हालाँकि, क्योंकि $$\mu_i$$ समय के साथ तय हो जाता है, यह प्रतिगमन की अशुद्धि आवर्त में क्रमिक सहसंबंध को प्रेरित करेगा। इसका मतलब है कि अधिक कुशल आकलन तकनीक उपलब्ध हैं। यादृच्छिक प्रभाव एक ऐसी विधि है, यह व्यवहार्य सामान्यीकृत कम से कम वर्गों की एक विशेष स्थिति है जो $$\mu_i$$ से प्रेरित अनुक्रमिक सहसंबंध की संरचना के लिए नियंत्रित करता है।

गतिशील पट्टिका आँकड़ा
गतिशील पट्टिका आँकड़ा उस स्थिति का वर्णन करता है जहां निर्भर चर के अंतराल को प्रतिगामी के रूप में उपयोग किया जाता है,


 * $$y_{it} = \alpha + \beta' X_{it} +\gamma y_{it-1}+ u_{it}, $$

लैग्ड निर्भर चर की उपस्थिति सख्त बहिर्जनिक का उल्लंघन करती है, यानी अंतर्जातता हो सकती है। निश्चित प्रभाव अनुमानक और प्रथम अंतर अनुमानक दोनों सख्त बहिर्जातता की धारणा पर भरोसा करते हैं। इसलिए, यदि $$u_{i}$$ को एक स्वतंत्र चर के साथ सहसंबद्ध माना जाता है, तो एक वैकल्पिक अनुमान तकनीक का उपयोग किया जाना चाहिए। इस स्थिति में वाद्य चर या जीएमएम तकनीकों जैसे कि अरेलानो-बॉन्ड अनुमानक का आमतौर पर उपयोग किया जाता है।

डेटा सेट जिनमें एक पैनल पारूप होता है

 * रूस अनुदैर्ध्य निगरानी सर्वेक्षण (आरएलएमएस)
 * जर्मन सामाजिक-आर्थिक पैनल (एसओईपी)
 * ऑस्ट्रेलिया सर्वेक्षण (हिल्डा) में घरेलू, आय और श्रम गतिशीलता
 * ब्रिटिश घरेलू पैनल सर्वेक्षण (बीएचपीएस)
 * पारिवारिक आय और रोजगार का सर्वेक्षण (सोफी)
 * आय और कार्यक्रम भागीदारी का सर्वेक्षण (एसआईपीपी)
 * आजीवन श्रम बाजार डाटाबेस (एलएलएमडीबी)
 * सामाजिक विज्ञान के लिए अनुदैर्ध्य इंटरनेट अध्ययन (एलआईएसएस)
 * आय गतिकी का पैनल अध्ययन (पीएसआईडी)
 * कोरियाई श्रम और आय पैनल अध्ययन (केएलआईपीएस)
 * चीन परिवार पैनल अध्ययन (सीएफपीएस)
 * जर्मन परिवार पैनल (पेयरफैम)
 * राष्ट्रीय अनुदैर्ध्य सर्वेक्षण (एनएलएसवाई)
 * श्रम बल सर्वेक्षण (एलएफएस)
 * कोरियाई युवा पैनल (वाईपी)
 * वृद्धावस्था का कोरियाई अनुदैर्ध्य अध्ययन (केएलओएसए)

डेटा सेट जिसमें बहु-आयामी पैनल प्रारूप होता है

बाहरी संबंध

 * PSID
 * KLIPS
 * pairfam
 * Korea Employment Survey