पैनल डेटा

सांख्यिकी और अर्थमिति में, पैनल डेटा और अनुदैर्ध्य डेटा दोनों बहु-आयामी डेटा सेट हैं जिनमें समय के साथ माप शामिल हैं। पैनल डेटा अनुदैर्ध्य डेटा का एक सबसेट है जहां अवलोकन हर बार समान विषयों के लिए होते हैं।

टाइम सीरीज़ और क्रास सेक्शनल डाटा को पैनल डेटा के विशेष मामलों के रूप में माना जा सकता है जो केवल एक आयाम में हैं (एक पैनल सदस्य या पूर्व के लिए व्यक्ति, बाद के लिए एक समय बिंदु)। एक साहित्य खोज में अक्सर समय श्रृंखला, क्रॉस-सेक्शनल या पैनल डेटा शामिल होता है। क्रॉस-पैनल डेटा (सीपीडी) गणितीय और सांख्यिकीय विज्ञान में जानकारी का एक अभिनव अभी तक कम सराहना वाला स्रोत है। CPD अन्य अनुसंधान विधियों से अलग है क्योंकि यह स्पष्ट रूप से दिखाता है कि देशों के बीच स्वतंत्र और निर्भर चर कैसे बदल सकते हैं। यह पैनल डेटा संग्रह शोधकर्ताओं को कई क्रॉस-सेक्शन और समय अवधि में चर के बीच संबंध की जांच करने और अन्य देशों में नीतिगत कार्यों के परिणामों का विश्लेषण करने की अनुमति देता है। पैनल डेटा का उपयोग करने वाले अध्ययन को अनुदैर्ध्य अध्ययन या पैनल अध्ययन कहा जाता है।

उदाहरण
उपरोक्त एकाधिक प्रतिक्रिया क्रमचय प्रक्रिया (MRPP) उदाहरण में, पैनल संरचना वाले दो डेटासेट दिखाए गए हैं और इसका उद्देश्य यह परीक्षण करना है कि नमूना डेटा में लोगों के बीच कोई महत्वपूर्ण अंतर है या नहीं। व्यक्तिगत विशेषताओं (आय, आयु, लिंग) को अलग-अलग व्यक्तियों और अलग-अलग वर्षों के लिए एकत्र किया जाता है। पहले डेटासेट में तीन साल (2016, 2017, 2018) तक हर साल दो व्यक्तियों (1, 2) का अवलोकन किया जाता है। दूसरे डेटासेट में, तीन व्यक्तियों (1, 2, 3) को तीन वर्षों (2016, 2017, 2018) में क्रमशः दो बार (व्यक्ति 1), तीन बार (व्यक्ति 2), और एक बार (व्यक्ति 3) देखा गया है। ; विशेष रूप से, व्यक्ति 1 वर्ष 2018 में नहीं देखा गया है और व्यक्ति 3 2016 या 2018 में नहीं देखा गया है।

एक संतुलित पैनल (उदाहरण के लिए, उपरोक्त पहला डेटासेट) एक डेटासेट है जिसमें प्रत्येक पैनल सदस्य (अर्थात, व्यक्ति) प्रत्येक वर्ष मनाया जाता है। नतीजतन, यदि एक संतुलित पैनल में एन पैनल के सदस्य और टी अवधि शामिल हैं, तो डेटासेट में टिप्पणियों की संख्या (एन) जरूरी है $n = N&times;T$.

एक असंतुलित पैनल (उदाहरण के लिए, ऊपर दिया गया दूसरा डेटासेट) एक डेटासेट है जिसमें हर अवधि में कम से कम एक पैनल सदस्य नहीं देखा जाता है। इसलिए, यदि एक असंतुलित पैनल में एन पैनल के सदस्य और टी अवधि शामिल हैं, तो निम्नलिखित सख्त असमानता डेटासेट में टिप्पणियों की संख्या (एन) के लिए लागू होती है: $n &lt; N&times;T$.

उपरोक्त दोनों डेटासेट लंबे प्रारूप में संरचित हैं, जहां एक पंक्ति प्रति समय एक अवलोकन रखती है। पैनल डेटा की संरचना का एक अन्य तरीका व्यापक प्रारूप होगा जहां एक पंक्ति समय में सभी बिंदुओं के लिए एक अवलोकन इकाई का प्रतिनिधित्व करती है (उदाहरण के लिए, विस्तृत प्रारूप में केवल दो (पहला उदाहरण) या तीन (दूसरा उदाहरण) पंक्तियां होंगी प्रत्येक समय-भिन्न चर (आय, आयु) के लिए अतिरिक्त कॉलम वाले डेटा।

विश्लेषण
एक पैनल का रूप है


 * $$X_{it}, \quad i = 1, \dots, N, \quad t = 1, \dots, T, $$

कहाँ $$i$$ व्यक्तिगत आयाम है और $$t$$ समय आयाम है। एक सामान्य पैनल डेटा प्रतिगमन मॉडल के रूप में लिखा गया है $$y_{it} = \alpha + \beta' X_{it} + u_{it}.$$ इस सामान्य मॉडल की सटीक संरचना पर विभिन्न धारणाएँ बनाई जा सकती हैं। निश्चित प्रभाव मॉडल और यादृच्छिक प्रभाव मॉडल दो महत्वपूर्ण मॉडल हैं।

एक सामान्य पैनल डेटा मॉडल पर विचार करें:


 * $$y_{it} = \alpha + \beta' X_{it} + u_{it}, $$
 * $$u_{it} = \mu_i + v_{it}.$$

$$\mu_i$$ व्यक्तिगत-विशिष्ट, समय-अपरिवर्तनीय प्रभाव हैं (उदाहरण के लिए देशों के एक पैनल में इसमें भूगोल, जलवायु आदि शामिल हो सकते हैं) जो समय के साथ तय होते हैं। जबकि $$v_{it}$$ एक समय-भिन्न यादृच्छिक घटक है।

अगर $$\mu_i$$ अप्रमाणित है, और कम से कम एक स्वतंत्र चर के साथ सहसंबद्ध है, तो यह एक मानक सामान्य न्यूनतम वर्ग प्रतिगमन में छोड़े गए चर पूर्वाग्रह का कारण होगा। हालाँकि, पैनल डेटा विधियाँ, जैसे कि निश्चित प्रभाव अनुमानक या वैकल्पिक रूप से, प्रथम-अंतर अनुमानक का उपयोग इसे नियंत्रित करने के लिए किया जा सकता है।

अगर $$\mu_i$$ किसी भी स्वतंत्र चर के साथ सहसंबद्ध नहीं है, साधारण न्यूनतम वर्ग रैखिक प्रतिगमन विधियों का उपयोग प्रतिगमन मापदंडों के निष्पक्ष और सुसंगत अनुमानों को प्राप्त करने के लिए किया जा सकता है। हालाँकि, क्योंकि $$\mu_i$$ समय के साथ तय हो जाता है, यह प्रतिगमन की त्रुटि अवधि में क्रमिक सहसंबंध को प्रेरित करेगा। इसका मतलब है कि अधिक कुशल आकलन तकनीक उपलब्ध हैं। यादृच्छिक प्रभाव एक ऐसी विधि है: यह व्यवहार्य सामान्यीकृत कम से कम वर्गों का एक विशेष मामला है जो अनुक्रमिक सहसंबंध की संरचना के लिए नियंत्रित करता है जो प्रेरित होता है $$\mu_i$$.

गतिशील पैनल डेटा
डायनेमिक पैनल डेटा उस मामले का वर्णन करता है जहां आश्रित चर के लैग ऑपरेटर को प्रतिगामी के रूप में उपयोग किया जाता है:


 * $$y_{it} = \alpha + \beta' X_{it} +\gamma y_{it-1}+ u_{it}, $$

लैग्ड डिपेंडेंट वेरिएबल की उपस्थिति सख्त एक्सोजेनिटी (अर्थमिति) का उल्लंघन करती है, यानी एंडोजीनिटी (अर्थमिति) हो सकती है। निश्चित प्रभाव अनुमानक और प्रथम अंतर अनुमानक दोनों सख्त बहिर्जातता की धारणा पर भरोसा करते हैं। इसलिए, अगर $$u_{i}$$ माना जाता है कि एक स्वतंत्र चर के साथ सहसंबद्ध है, एक वैकल्पिक अनुमान तकनीक का उपयोग किया जाना चाहिए। इस स्थिति में वाद्य चर या GMM तकनीकों का आमतौर पर उपयोग किया जाता है, जैसे कि अरेलानो-बॉन्ड अनुमानक।

डेटा सेट जिनमें एक पैनल डिज़ाइन है

 * रूस अनुदैर्ध्य निगरानी सर्वेक्षण (आरएलएमएस)
 * जर्मन सामाजिक-आर्थिक पैनल (एसओईपी)
 * ऑस्ट्रेलिया सर्वेक्षण में घरेलू, आय और श्रम गतिशीलता (हिल्डा)
 * ब्रिटिश घरेलू पैनल सर्वेक्षण (बीएचपीएस)
 * पारिवारिक आय और रोजगार का सर्वेक्षण (SoFIE)
 * आय और कार्यक्रम भागीदारी का सर्वेक्षण (एसआईपीपी)
 * एलएलएमडीबी (एलएलएमडीबी)
 * लॉन्गिट्यूडिनल इंटरनेट स्टडीज फॉर द सोशल साइंसेज (एलआईएसएस)
 * आय गतिकी का पैनल अध्ययन (PSID)
 * कोरियाई श्रम और आय पैनल अध्ययन (केएलआईपीएस)
 * चीन परिवार पैनल अध्ययन (सीएफपीएस)
 * जर्मन परिवार पैनल (पेयरफैम)
 * राष्ट्रीय अनुदैर्ध्य सर्वेक्षण (एनएलएसवाई)
 * श्रम बल सर्वेक्षण (एलएफएस)
 * कोरियाई युवा पैनल (YP)
 * उम्र बढ़ने का कोरियाई अनुदैर्ध्य अध्ययन (केएलओएसए)

डेटा सेट जिनमें बहु-आयामी पैनल डिज़ाइन
है

बाहरी संबंध

 * PSID
 * KLIPS
 * pairfam
 * Korea Employment Survey