पैनल डेटा

सांख्यिकी और अर्थमिति में, पैनल आँकड़े और अनुदैर्ध्य आँकड़े दोनों बहु-आयामी आँकड़े  हैं जिनमें समय के साथ माप शामिल हैं। पैनल आँकड़े अनुदैर्ध्य आँकड़े का एक उपसमुच्चय है जहां अवलोकन हर बार समान विषयों के लिए होते हैं।

टाइम सीरीज़ और क्रास सेक्शनल डाटा को पैनल आँकड़े के विशेष मामलों के रूप में माना जा सकता है जो केवल एक आयाम में हैं (एक पैनल सदस्य या पूर्व के लिए अलग अलग, बाद के लिए एक समय बिंदु)। एक साहित्य खोज में अक्सर समय श्रृंखला, क्रॉस-सेक्शनल या पैनल आँकड़े शामिल होते है। क्रॉस-पैनल आँकड़े (CPD) गणितीय और सांख्यिकीय विज्ञान में जानकारी का एक नवीन अभी तक कम अप्रमाणित वाला स्रोत है। CPD अन्य अनुसंधान प्रणालियों से अलग है क्योंकि यह स्पष्ट रूप से दिखाता है कि देशों के बीच स्वतंत्र और परतंत्र चर कैसे बदल सकते हैं। यह पैनल आँकड़े संग्रह शोधकर्ताओं को कई क्रॉस-सेक्शन और समय आवर्त में चर के बीच संबंध की जांच करने और अन्य देशों में नीतिगत कार्यों के परिणामों का विश्लेषण करने की अनुमति देता है।

पैनल आँकड़े का उपयोग करने वाले अध्ययन को अनुदैर्ध्य अध्ययन या पैनल अध्ययन कहा जाता है।

उदाहरण
उपरोक्त एकाधिक प्रतिक्रिया क्रमचय प्रक्रिया (MRPP) उदाहरण में, पैनल संरचना वाले दो डेटासेट दिखाए गए हैं और इसका उद्देश्य यह परीक्षण करना है कि प्रतिचय आँकड़े में लोगों के बीच कोई सार्थकता अंतर है या नहीं। व्यक्तिगत विशेषताओं (आय, आयु, लिंग) को अलग-अलग व्यक्तियों और अलग-अलग वर्षों के लिए संकलित किया जाता है। पहले डेटासेट में तीन वर्ष (2016, 2017, 2018) के लिए प्रत्येक वर्ष दो व्यक्तियों (1, 2) का अवलोकन किया जाता है। दूसरे डेटासेट में, तीन व्यक्तियों (1, 2, 3) को तीन वर्षों (2016, 2017, 2018) में क्रमशः दो बार (व्यक्ति 1), तीन बार (व्यक्ति 2), और एक बार (व्यक्ति 3) देखा गया है। ; विशेष रूप से, व्यक्ति 1 वर्ष 2018 में नहीं देखा गया है और व्यक्ति 3 2016 या 2018 में नहीं देखा गया है।

एक संतुलित पैनल (उदाहरण के लिए, उपरोक्त पहला डेटासेट) एक डेटासेट है जिसमें प्रत्येक पैनल सदस्य (अर्थात, व्यक्ति) प्रत्येक वर्ष मनाया जाता है। परिणामस्वरूप, यदि एक संतुलित पैनल में N पैनल के सदस्य और T आवर्त शामिल हैं, तो डेटासेट में अवलोकनों की संख्या (n) जरूरी है $n = N&times;T$.

एक असंतुलित पैनल (जैसे, ऊपर दिया गया दूसरा डेटासेट) एक डेटासेट है जिसमें कम से कम एक पैनल सदस्य प्रत्येक आवर्त में नहीं देखा जाता है। इसलिए, यदि एक असंतुलित पैनल में N पैनल के सदस्य और T आवर्त शामिल हैं, तो निम्नलिखित पूर्णतः असमानता डेटासेट में अवलोकनों की संख्या (n) के लिए लागू होती है: $n &lt; N&times;T$.

उपरोक्त दोनों डेटासेट लंबे प्रारूप में संरचित हैं, जहां एक पंक्ति प्रति समय एक अवलोकन रखती है। पैनल आँकड़े की संरचना का एक अन्य तरीका व्यापक प्रारूप होगा जहां एक पंक्ति समय में सभी बिंदुओं के लिए एक अवलोकन इकाई का प्रतिनिधित्व करती है (उदाहरण के लिए, विस्तृत प्रारूप में आँकड़े केवल दो (पहला उदाहरण) या तीन (दूसरा उदाहरण) पंक्तियां होंगी प्रत्येक समय-परिवर्तनशील चर (आय, आयु) के लिए अतिरिक्त कॉलम।

विश्लेषण
एक पैनल का रूप है


 * $$X_{it}, \quad i = 1, \dots, N, \quad t = 1, \dots, T, $$

कहाँ $$i$$ व्यक्तिगत आयाम है और $$t$$ समय आयाम है। एक सामान्य पैनल आँकड़े परावर्तन आकार के रूप में लिखा गया है $$y_{it} = \alpha + \beta' X_{it} + u_{it}.$$

इस सामान्य आकार की स्पष्ट संरचना पर विभिन्न अवलोकनाये बनाई जा सकती हैं। निश्चित प्रभाव आकार और अनियमित प्रभाव आकार दो महत्वपूर्ण आकार हैं।

एक सामान्य पैनल आँकड़े आकार पर विचार करें:


 * $$y_{it} = \alpha + \beta' X_{it} + u_{it}, $$
 * $$u_{it} = \mu_i + v_{it}.$$

$$\mu_i$$ व्यक्तिगत-विशिष्ट, समय-अपरिवर्तनीय प्रभाव हैं (उदाहरण के लिए देशों के एक पैनल में इसमें भूगोल, जलवायु आदि शामिल हो सकते हैं) जो समय के साथ तय होते हैं। जबकि $$v_{it}$$ एक समय-परिवर्तनशील अनियमित घटक है।

यदि $$\mu_i$$ अप्रमाणित है, और कम से कम एक स्वतंत्र चर के साथ सहसंबद्ध है, तो यह एक मानक OLS प्रतिगमन में छोड़े गए चर पूर्वाग्रह का कारण होगा। हालाँकि, पैनल आँकड़े विधियाँ, जैसे कि निश्चित प्रभाव अनुमानक या वैकल्पिक रूप से, प्रथम-अंतर अनुमानक का उपयोग इसे नियंत्रित करने के लिए किया जा सकता है।

यदि $$\mu_i$$ किसी भी स्वतंत्र चर के साथ सहसंबद्ध नहीं है, तो प्रतिगमन मापदंडों के निष्पक्ष और सुसंगत अनुमानों को प्राप्त करने के लिए साधारण न्यूनतम वर्ग रैखिक प्रतिगमन विधियों का उपयोग किया जा सकता है। हालाँकि, क्योंकि $$\mu_i$$ समय के साथ तय हो जाता है, यह प्रतिगमन की अशुद्धि आवर्त में क्रमिक सहसंबंध को प्रेरित करेगा। इसका मतलब है कि अधिक कुशल आकलन तकनीक उपलब्ध हैं। अनियमित प्रभाव एक ऐसी विधि है, यह व्यवहार्य सामान्यीकृत कम से कम वर्गों का एक विशेष मामला है जो अनुक्रमिक सहसंबंध की संरचना के लिए नियंत्रित करता है जो प्रेरित होता है $$\mu_i$$.

गतिशील पैनल आँकड़े
डायनेमिक पैनल आँकड़े उस मामले का वर्णन करता है जहां परतंत्र चर के लैग को प्रतिगामी के रूप में उपयोग किया जाता है:


 * $$y_{it} = \alpha + \beta' X_{it} +\gamma y_{it-1}+ u_{it}, $$

लैग्ड परतंत्र चर की उपस्थिति सख्त एक्सोजेनिटी (अर्थमिति) का उल्लंघन करती है, यानी एंडोजीनिटी (अर्थमिति) हो सकती है। निश्चित प्रभाव अनुमानक और प्रथम अंतर अनुमानक दोनों सख्त बहिर्जातता की धारणा पर भरोसा करते हैं। इसलिए, अगर $$u_{i}$$ माना जाता है कि एक स्वतंत्र चर के साथ सहसंबद्ध माना जाता है, एक वैकल्पिक अनुमान तकनीक का उपयोग किया जाना चाहिए। इस स्थिति में सहायक चर या GMM तकनीकों का आमतौर पर उपयोग किया जाता है, जैसे कि अरेलानो-बॉन्ड अनुमानक।

आँकड़े सेट जिनमें एक पैनल डिज़ाइन है

 * रूस अनुदैर्ध्य निगरानी सर्वेक्षण (आरएलएमएस)
 * जर्मन सामाजिक-आर्थिक पैनल (एसओईपी)
 * ऑस्ट्रेलिया सर्वेक्षण में घरेलू, आय और श्रम गतिशीलता (हिल्डा)
 * ब्रिटिश घरेलू पैनल सर्वेक्षण (बीएचपीएस)
 * पारिवारिक आय और रोजगार का सर्वेक्षण (SoFIE)
 * आय और कार्यक्रम भागीदारी का सर्वेक्षण (एसआईपीपी)
 * एलएलएमडीबी (एलएलएमडीबी)
 * लॉन्गिट्यूडिनल इंटरनेट स्टडीज फॉर द सोशल साइंसेज (एलआईएसएस)
 * आय गतिकी का पैनल अध्ययन (PSID)
 * कोरियाई श्रम और आय पैनल अध्ययन (केएलआईपीएस)
 * चीन परिवार पैनल अध्ययन (सीएफपीएस)
 * जर्मन परिवार पैनल (पेयरफैम)
 * राष्ट्रीय अनुदैर्ध्य सर्वेक्षण (एनएलएसवाई)
 * श्रम बल सर्वेक्षण (एलएफएस)
 * कोरियाई युवा पैनल (YP)
 * उम्र बढ़ने का कोरियाई अनुदैर्ध्य अध्ययन (केएलओएसए)

आँकड़े सेट जिनमें बहु-आयामी पैनल डिज़ाइन
है

बाहरी संबंध

 * PSID
 * KLIPS
 * pairfam
 * Korea Employment Survey