पेरेटो वितरण

पेरेटो वितरण, जिसका नाम इतालवी सिविल इंजीनियर, अर्थशास्त्री और समाजशास्त्री विल्फ्रेडो पेरेटो के नाम पर रखा गया है |  ), शक्ति-कानून संभाव्यता वितरण है जो कि है सामाजिक, गुणवत्ता नियंत्रण, वैज्ञानिक,भूभौतिकीय, बीमांकिक और कई अन्य प्रकार की अवलोकन योग्य घटनाओं के विवरण में उपयोग किया जाता है; यह सिद्धांत मूल रूप से किसी समाज में धन के वितरण का वर्णन करने के लिए लागू किया गया था, जो इस प्रवृत्ति के अनुरूप है कि धन का बड़ा हिस्सा आबादी के छोटे से हिस्से के पास होता है। पेरेटो सिद्धांत या "80-20 नियम" जिसमें कहा गया है कि 80% परिणाम 20% कारणों से होते हैं, पेरेटो के सम्मान में नामित किया गया था, लेकिन अवधारणाएं अलग हैं, और केवल लॉग 45 ≈ 1.16 के आकार मान (α) के साथ पेरेटो वितरण इसे सटीक रूप से प्रतिबिंबित करें। अनुभवजन्य अवलोकन से पता चला है कि यह 80-20 वितरण प्राकृतिक घटनाओं और मानवीय गतिविधियों सहित मामलों की विस्तृत श्रृंखला में फिट बैठता है।

परिभाषाएँ
यदि X पेरेटो (प्रकार I) वितरण के साथ यादृच्छिक चर है, तो संभावना है कि


 * $$\overline{F}(x) = \Pr(X>x) = \begin{cases}

\left(\frac{x_\mathrm{m}}{x}\right)^\alpha & x\ge x_\mathrm{m}, \\ 1 & x < x_\mathrm{m}, \end{cases} $$

जहां xm X का (आवश्यक रूप से सकारात्मक) न्यूनतम संभव मान है, और α सकारात्मक पैरामीटर है। पेरेटो टाइप I वितरण की विशेषता स्केल पैरामीटर xm और आकार पैरामीटर α है, जिसे टेल इंडेक्स के रूप में जाना जाता है। जब इस वितरण का उपयोग धन के वितरण को मॉडल करने के लिए किया जाता है, तो पैरामीटर α को पेरेटो सूचकांक कहा जाता है।

संचयी वितरण फलन
परिभाषा से, पैरामीटर α और xm के साथ पेरेटो यादृच्छिक चर का संचयी वितरण फ़ंक्शन है


 * $$F_X(x) = \begin{cases}

1-\left(\frac{x_\mathrm{m}}{x}\right)^\alpha & x \ge x_\mathrm{m}, \\ 0 & x < x_\mathrm{m}. \end{cases}$$

संभावना घनत्व फ़ंक्शन
यह इस प्रकार है (विभेदन द्वारा) कि संभाव्यता घनत्व फ़ंक्शन है


 * $$f_X(x)= \begin{cases} \frac{\alpha x_\mathrm{m}^\alpha}{x^{\alpha+1}} & x \ge x_\mathrm{m}, \\ 0 & x < x_\mathrm{m}. \end{cases} $$

जब रैखिक अक्षों पर प्लॉट किया जाता है, तो वितरण परिचित जे-आकार के वक्र को मानता है जो प्रत्येक ऑर्थोगोनल अक्षों पर स्पर्शोन्मुख रूप से पहुंचता है। वक्र के सभी खंड स्व-समान हैं (उचित स्केलिंग कारकों के अधीन)। जब लॉग-लॉग प्लॉट में प्लॉट किया जाता है, तो वितरण को सीधी रेखा द्वारा दर्शाया जाता है।

क्षण और विशेषता कार्य

 * पेरेटो वितरण के बाद यादृच्छिक चर का अपेक्षित मूल्य है
 * $$\operatorname{E}(X)= \begin{cases} \infty & \alpha\le 1, \\
 * $$\operatorname{E}(X)= \begin{cases} \infty & \alpha\le 1, \\

\frac{\alpha x_\mathrm{m}}{\alpha-1} & \alpha>1. \end{cases}$$
 * पेरेटो वितरण के बाद यादृच्छिक चर का प्रसरण है


 * $$\operatorname{Var}(X)= \begin{cases}

\infty & \alpha\in(1,2], \\ \left(\frac{x_\mathrm{m}}{\alpha-1}\right)^2 \frac{\alpha}{\alpha-2} & \alpha>2. \end{cases}$$
 * (यदि α ≤ 1, तो विचरण मौजूद नहीं है।)


 * कच्चा क्षण (गणित) हैं


 * $$\mu_n'= \begin{cases} \infty & \alpha\le n, \\ \frac{\alpha x_\mathrm{m}^n}{\alpha-n} & \alpha>n. \end{cases}$$


 * क्षण उत्पन्न करने वाला कार्य केवल गैर-सकारात्मक मान t ≤ 0 के लिए परिभाषित किया गया है


 * $$M\left(t;\alpha,x_\mathrm{m}\right) = \operatorname{E} \left [e^{tX} \right ] = \alpha(-x_\mathrm{m} t)^\alpha\Gamma(-\alpha,-x_\mathrm{m} t)$$
 * $$M\left(0,\alpha,x_\mathrm{m}\right)=1.$$

इस प्रकार, चूँकि अपेक्षा $$t=0$$ वाले खुले अंतराल पर अभिसरण नहीं होती है, हम कहते हैं कि क्षण उत्पन्न करने वाला फ़ंक्शन मौजूद नहीं है।
 * विशेषता फलन (संभावना सिद्धांत) द्वारा दिया गया हैं


 * $$\varphi(t;\alpha,x_\mathrm{m})=\alpha(-ix_\mathrm{m} t)^\alpha\Gamma(-\alpha,-ix_\mathrm{m} t),$$
 * जहां Γ(a, x) अधूरा गामा फ़ंक्शन है।

क्षणों की विधि (सांख्यिकी) का उपयोग करके मापदंडों को हल किया जा सकता है।

सशर्त वितरण
पेरेटो-वितरित यादृच्छिक चर का सशर्त संभाव्यता वितरण, इस घटना को देखते हुए कि यह किसी विशेष संख्या $$x_1$$ $$x_\text{m}$$ से अधिक या उसके बराबर है, समान पेरेटो सूचकांक $$\alpha$$ के साथ पेरेटो वितरण है लेकिन न्यूनतम $$x_1$$ के बजाय $$x_\text{m}$$ इसका तात्पर्य है कि सशर्त अपेक्षित मूल्य (यदि यह परिमित है, यानी $$\alpha>1$$ आनुपातिक है $$x_1$$ यादृच्छिक चर के मामले में जो किसी वस्तु के जीवनकाल का वर्णन करता है, इसका मतलब है कि जीवन प्रत्याशा आनुपातिक है उम्र बढ़ने के लिए, और इसे लिंडी प्रभाव या लिंडी का नियम कहा जाता है।

एक लक्षण वर्णन प्रमेय
मान लीजिए$$X_1, X_2, X_3, \dotsc$$ स्वतंत्र समान रूप से वितरित यादृच्छिक चर हैं जिनकी संभाव्यता वितरण कुछ $$x_\text{m}>0$$ के लिए अंतराल $$[x_\text{m},\infty)$$ पर समर्थित है। मान लीजिए कि सभी $$n$$ के लिए दो यादृच्छिक चर$$\min\{X_1,\dotsc,X_n\}$$ और $$(X_1+\dotsb+X_n)/\min\{X_1,\dotsc,X_n\}$$ स्वतंत्र हैं। फिर सामान्य वितरण पेरेटो वितरण है।

ज्यामितीय माध्य
ज्यामितीय माध्य (G) है
 * $$ G = x_\text{m} \exp \left( \frac{1}{\alpha} \right).$$

अनुकूल माध्य
हार्मोनिक माध्य (H) है


 * $$ H = x_\text{m} \left( 1 + \frac{ 1 }{ \alpha } \right).$$

चित्रमय प्रतिनिधित्व
रैखिक पैमाने पर प्लॉट किए जाने पर विशेषता घुमावदार 'लंबी पूंछ' वितरण, लॉग-लॉग ग्राफ़ पर प्लॉट किए जाने पर फ़ंक्शन की अंतर्निहित सादगी को छुपाता है, जो तब नकारात्मक ढाल के साथ सीधी रेखा का रूप लेता है: यह सूत्र से अनुसरण करता है संभाव्यता घनत्व फ़ंक्शन कि x ≥ xm के लिए,


 * $$\log f_X(x)= \log \left(\alpha\frac{x_\mathrm{m}^\alpha}{x^{\alpha+1}}\right) = \log (\alpha x_\mathrm{m}^\alpha) - (\alpha+1) \log x.$$

चूँकि α धनात्मक है, ग्रेडिएंट -(α+1) ऋणात्मक है।

सामान्यीकृत पेरेटो वितरण
पेरेटो वितरण का पदानुक्रम है जिसे पेरेटो प्रकार I, II, III, IV और फेलर-पेरेटो वितरण के रूप में जाना जाता है। पेरेटो टाइप IV में पेरेटो टाइप I-III विशेष मामलों के रूप में शामिल है। फेलर-पेरेटो वितरण पेरेटो प्रकार IV को सामान्यीकृत करता है।

पेरेटो प्रकार I-IV
पेरेटो वितरण पदानुक्रम को उत्तरजीविता कार्यों (पूरक सीडीएफ) की तुलना करते हुए अगली तालिका में संक्षेपित किया गया है।

जब μ = 0, पेरेटो वितरण प्रकार II को लोमैक्स वितरण के रूप में भी जाना जाता है।

इस अनुभाग में, x के न्यूनतम मान को इंगित करने के लिए पहले इस्तेमाल किए गए प्रतीक xm को σ द्वारा प्रतिस्थापित किया गया है।

आकार पैरामीटर α टेल सूचकांक है, μ स्थान है, σ स्केल है, γ असमानता पैरामीटर है। पेरेटो प्रकार (IV) के कुछ विशेष मामले है


 * $$ P(IV)(\sigma, \sigma, 1, \alpha) = P(I)(\sigma, \alpha),$$
 * $$ P(IV)(\mu, \sigma, 1, \alpha) = P(II)(\mu, \sigma, \alpha),$$
 * $$ P(IV)(\mu, \sigma, \gamma, 1) = P(III)(\mu, \sigma, \gamma).$$

माध्य की परिमितता, और अस्तित्व और विचरण की परिमितता टेल इंडेक्स α (असमानता सूचकांक γ) पर निर्भर करती है। विशेष रूप से, आंशिक δ-क्षण कुछ δ > 0 के लिए सीमित हैं, जैसा कि नीचे दी गई तालिका में दिखाया गया है, जहां δ आवश्यक रूप से पूर्णांक नहीं है।

फेलर-पेरेटो वितरण
फेलर बीटा वितरण यादृच्छिक चर Y के परिवर्तन U = Y−1 − 1 द्वारा पेरेटो चर को परिभाषित करता है, जिसकी संभाव्यता घनत्व फ़ंक्शन है


 * $$ f(y) = \frac{y^{\gamma_1-1} (1-y)^{\gamma_2-1}}{B(\gamma_1, \gamma_2)}, \qquad 00,$$

जहां B बीटा फ़ंक्शन है। अगर


 * $$ W = \mu + \sigma(Y^{-1}-1)^\gamma, \qquad \sigma>0, \gamma>0,$$

तब W के पास फेलर-पेरेटो वितरण FP(μ, σ, γ, γ1, γ2) है।

यदि $$U_1 \sim \Gamma(\delta_1, 1)$$ और $$U_2 \sim \Gamma(\delta_2, 1)$$ स्वतंत्र गामा वितरण चर हैं, तो फेलर-पेरेटो (एफपी) चर का और निर्माण है |
 * $$W = \mu + \sigma \left(\frac{U_1}{U_2}\right)^\gamma$$

और हम W ~ FP(μ, σ, γ, δ1, δ2) लिखते हैं। फेलर-पेरेटो वितरण के विशेष मामले हैं


 * $$FP(\sigma, \sigma, 1, 1, \alpha) = P(I)(\sigma, \alpha)$$
 * $$FP(\mu, \sigma, 1, 1, \alpha) = P(II)(\mu, \sigma, \alpha)$$
 * $$FP(\mu, \sigma, \gamma, 1, 1) = P(III)(\mu, \sigma, \gamma)$$
 * $$FP(\mu, \sigma, \gamma, 1, \alpha) = P(IV)(\mu, \sigma, \gamma, \alpha).$$

व्युत्क्रम-पेरेटो वितरण / विद्युत वितरण
जब यादृच्छिक चर $$Y                                                                                                                                                                                                                             $$ पेरेटो वितरण का अनुसरण करता है, तो इसका व्युत्क्रम $$X=1/Y$$ व्युत्क्रम पेरेटो वितरण का अनुसरण करता है। व्युत्क्रम पेरेटो वितरण विद्युत वितरण (सांख्यिकी) के समतुल्य है |
 * $$Y\sim \mathrm{Pa}(\alpha, x_m) = \frac{\alpha x_m^\alpha}{y^{\alpha+1}} \quad (y \ge x_m) \quad \Leftrightarrow \quad X\sim \mathrm{iPa}(\alpha, x_m) = \mathrm{Power}(x_m^{-1}, \alpha) = \frac{\alpha x^{\alpha-1}}{(x_m^{-1})^\alpha} \quad (0< x \le x_m^{-1})$$

घातांकीय वितरण से संबंध
पेरेटो वितरण घातीय वितरण से निम्नानुसार संबंधित है। यदि X न्यूनतम xm और सूचकांक α के साथ पेरेटो-वितरित है, तो


 * $$ Y = \log\left(\frac{X}{x_\mathrm{m}}\right) $$

दर पैरामीटर α के साथ तेजी से वितरित किया जाता है। समान रूप से, यदि Y को दर α के साथ चरघातांकीय रूप से वितरित किया जाता है, तो


 * $$ x_\mathrm{m} e^Y$$

न्यूनतम xm और सूचकांक α के साथ पेरेटो-वितरित है।

इसे मानक परिवर्तन-परिवर्तन तकनीकों का उपयोग करके दिखाया जा सकता है:



\begin{align} \Pr(Y<y) & = \Pr\left(\log\left(\frac{X}{x_\mathrm{m}}\right)<y\right) \\ & = \Pr(X<x_\mathrm{m} e^y) = 1-\left(\frac{x_\mathrm{m}}{x_\mathrm{m}e^y}\right)^\alpha=1-e^{-\alpha y}. \end{align} $$ अंतिम अभिव्यक्ति दर α के साथ घातीय वितरण का संचयी वितरण फ़ंक्शन है।

पेरेटो वितरण का निर्माण पदानुक्रमित घातीय वितरण द्वारा किया जा सकता है। चलो $$\phi | a \sim \text{Exp}(a)$$ और $$\eta | \phi \sim \text{Exp}(\phi) $$। तब हमारे पास $$p(\eta | a) = \frac{a}{(a+\eta)^2}$$ और, परिणाम स्वरूप इसमें ,$$a+\eta \sim \text{Pareto}(a, 1)$$ है।

अधिक,सामान्यतः, यदि $$\lambda \sim \text{Gamma}(\alpha, \beta)$$ (आकार-दर पैरामीट्रिजेशन) और $$\eta | \lambda \sim \text{Exp}(\lambda) $$, तब $$\beta + \eta \sim \text{Pareto}(\beta, \alpha)$$.

समान रूप से, यदि $$Y \sim \text{Gamma}(\alpha,1) $$ और $$X \sim \text{Exp}(1)$$, तब $$x_{\text{m}} \! \left(1 + \frac{X}{Y}\right) \sim \text{Pareto}(x_{\text{m}}, \alpha)$$.

लॉग-[[सामान्य वितरण]] से संबंध
पेरेटो वितरण और लॉग-सामान्य वितरण समान प्रकार की मात्राओं का वर्णन करने के लिए वैकल्पिक वितरण हैं। दोनों के बीच संबंध यह है कि वे दोनों अन्य सामान्य वितरणों के अनुसार वितरित यादृच्छिक चर के घातांक के वितरण हैं, क्रमशः घातीय वितरण और सामान्य वितरण। (या घातीय_वितरण_से_संबंध_देखें।)

सामान्यीकृत पेरेटो वितरण से संबंध
पारेतो वितरण सामान्यीकृत पारेतो वितरण का विशेष मामला है, जो समान रूप के वितरणों का परिवार है, लेकिन इसमें अतिरिक्त पैरामीटर इस तरह से होता है कि वितरण का समर्थन या तो नीचे (एक परिवर्तनीय बिंदु पर) सीमित होता है, या विशेष मामले के रूप में लोमैक्स वितरण के साथ, ऊपर और नीचे (जहां दोनों परिवर्तनशील हैं) दोनों से घिरा हुआ है। इस परिवार में अस्थानांतरित और स्थानांतरित दोनों घातीय वितरण भी शामिल हैं।

पैमाने के साथ पेरेटो वितरण $$x_m$$ और आकार $$\alpha$$ स्थान के साथ सामान्यीकृत पेरेटो वितरण के बराबर है $$\mu=x_m$$, पैमाना $$\sigma=x_m/\alpha$$ और आकार $$\xi=1/\alpha$$. इसके विपरीत कोई भी जीपीडी से पैरेटो वितरण प्राप्त कर सकता है $$x_m = \sigma/\xi$$ और $$\alpha=1/\xi$$.

बंधित पेरेटो वितरण
परिबद्ध (या काटे गए) पेरेटो वितरण के तीन पैरामीटर हैं: α, L और H. जैसा कि मानक पेरेटो वितरण में α आकार निर्धारित करता है। L न्यूनतम मान को दर्शाता है, और H अधिकतम मान को दर्शाता है।

संभाव्यता घनत्व फ़ंक्शन है


 * $$\frac{\alpha L^\alpha x^{-\alpha - 1}}{1-\left(\frac{L}{H}\right)^\alpha}$$,

जहां L ≤ x ≤ H, और α > 0।

बंधे हुए पेरेटो यादृच्छिक चर उत्पन्न करना
यदि यू (0, 1) पर समान वितरण (निरंतर) है, तो व्युत्क्रम-परिवर्तन विधि लागू करना
 * $$U = \frac{1 - L^\alpha x^{-\alpha}}{1 - (\frac{L}{H})^\alpha}$$
 * $$x = \left(-\frac{U H^\alpha - U L^\alpha - H^\alpha}{H^\alpha L^\alpha}\right)^{-\frac{1}{\alpha}}$$

एक परिबद्ध पेरेटो-वितरित है।

सममित पेरेटो वितरण
सममित पेरेटो वितरण और शून्य सममित पेरेटो वितरण का उद्देश्य तीव्र संभाव्यता शिखर और सममित लंबी संभाव्यता पूंछ के साथ कुछ विशेष सांख्यिकीय वितरण को पकड़ना है। ये दोनों वितरण पेरेटो वितरण से प्राप्त हुए हैं। लम्बी संभाव्यता टेल का आम तौर पर अर्थ यह होता है कि संभाव्यता धीरे-धीरे कम होती जाती है। पेरेटो वितरण कई मामलों में उचित कार्य करता है। लेकिन यदि वितरण में दो धीमी गति से क्षय होने वाली पूँछों के साथ सममित संरचना है, तो पेरेटो ऐसा नहीं कर सका। फिर इसके स्थान पर सममित पैरेटो या शून्य सममित पैरेटो वितरण लागू किया जाता है। सममित पेरेटो वितरण के संचयी वितरण फ़ंक्शन (सीडीएफ) को निम्नलिखित के रूप में परिभाषित किया गया है:

$$F(X) = P(x < X ) = \begin{cases} \tfrac{1}{2}({b \over 2b-X}) ^a & X<b \\ 1- \tfrac{1}{2}(\tfrac{b}{X})^a& X\geq b \end{cases}$$

संबंधित संभाव्यता घनत्व फ़ंक्शन (पीडीएफ) है:

$$p(x) = {ab^a \over 2(b+\left\vert x-b \right\vert)^{a+1}},X\in R$$

इस वितरण के दो पैरामीटर हैं: ए और बी। यह b द्वारा सममित है। तब गणितीय अपेक्षा b है। कब, इसमें निम्नलिखित प्रकार का भिन्नता है:

$$E((x-b)^2)=\int_{-\infty}^{\infty} (x-b)^2p(x)dx={2b^2 \over (a-2)(a-1) }

$$

शून्य सममित पेरेटो (जेडएसपी) वितरण के सीडीएफ को निम्नलिखित के रूप में परिभाषित किया गया है:

$$F(X) = P(x < X ) = \begin{cases} \tfrac{1}{2}({b \over b-X}) ^a & X<0 \\ 1- \tfrac{1}{2}(\tfrac{b}{b+X})^a& X\geq 0 \end{cases}$$

संबंधित पीडीएफ है:

$$p(x) = {ab^a \over 2(b+\left\vert x \right\vert)^{a+1}},X\in R$$ यह वितरण शून्य से सममित है। पैरामीटर a संभाव्यता की क्षय दर से संबंधित है और (a/2b) संभाव्यता के चरम परिमाण का प्रतिनिधित्व करता है।

बहुभिन्नरूपी पेरेटो वितरण
अविभाज्य पेरेटो वितरण को बहुभिन्नरूपी पेरेटो वितरण तक बढ़ा दिया गया है।

पैरामीटर का अनुमान
पेरेटो वितरण पैरामीटर α और x के लिए संभावना फ़ंक्शनm, स्वतंत्र नमूना (सांख्यिकी) x = (x) दिया गया है1, एक्स2, ..., एक्सn), है


 * $$L(\alpha, x_\mathrm{m}) = \prod_{i=1}^n \alpha \frac {x_\mathrm{m}^\alpha} {x_i^{\alpha+1}} = \alpha^n x_\mathrm{m}^{n\alpha} \prod_{i=1}^n \frac {1}{x_i^{\alpha+1}}.$$

इसलिए, लघुगणक संभावना फ़ंक्शन है


 * $$\ell(\alpha, x_\mathrm{m}) = n \ln \alpha + n\alpha \ln x_\mathrm{m} - (\alpha + 1) \sum_{i=1} ^n \ln x_i.$$

यह देखा जा सकता है $$\ell(\alpha, x_\mathrm{m})$$ x के साथ नीरस रूप से बढ़ रहा हैm, अर्थात x का मान जितना अधिक होगाm, संभावना फ़ंक्शन का मान जितना अधिक होगा। इसलिए, चूँकि x ≥ xm, हम यह निष्कर्ष निकालते हैं


 * $$\widehat x_\mathrm{m} = \min_i {x_i}.$$

α के लिए अनुमानक खोजने के लिए, हम संबंधित आंशिक व्युत्पन्न की गणना करते हैं और निर्धारित करते हैं कि यह शून्य कहां है:


 * $$\frac{\partial \ell}{\partial \alpha} = \frac{n}{\alpha} + n \ln x_\mathrm{m} - \sum _{i=1}^n \ln x_i = 0.$$

इस प्रकार α के लिए अधिकतम संभावना अनुमानक है:


 * $$\widehat \alpha = \frac{n}{\sum _i \ln (x_i/\widehat x_\mathrm{m}) }.$$

अपेक्षित सांख्यिकीय त्रुटि है:
 * $$\sigma = \frac {\widehat \alpha} {\sqrt n}. $$

मलिक (1970) का सटीक संयुक्त वितरण देता है $$(\hat{x}_\mathrm{m},\hat\alpha)$$. विशेष रूप से, $$\hat{x}_\mathrm{m}$$ और $$\hat\alpha$$ स्वतंत्रता (संभावना सिद्धांत) और हैं $$\hat{x}_\mathrm{m}$$ स्केल पैरामीटर x के साथ पेरेटो हैm और आकार पैरामीटर nα, जबकि $$\hat\alpha$$ इसमें क्रमशः आकार और स्केल पैरामीटर n − 1 और nα के साथ व्युत्क्रम-गामा वितरण है।

सामान्य
विल्फ्रेडो पेरेटो ने मूल रूप से इस वितरण का उपयोग व्यक्तियों के बीच धन के वितरण का वर्णन करने के लिए किया था क्योंकि यह काफी अच्छी तरह से दिखाता है कि किसी भी समाज की संपत्ति का बड़ा हिस्सा उस समाज के छोटे प्रतिशत लोगों के स्वामित्व में है। उन्होंने इसका उपयोग आय के वितरण का वर्णन करने के लिए भी किया। इस विचार को कभी-कभी पेरेटो सिद्धांत या 80-20 नियम के रूप में अधिक सरल रूप से व्यक्त किया जाता है जो कहता है कि 20% आबादी 80% धन को नियंत्रित करती है। हालाँकि, 80-20 नियम α के विशेष मूल्य से मेल खाता है, और वास्तव में, अपने कोर्ट्स डी इकोनोमी पॉलिटिक में ब्रिटिश आयकर पर पेरेटो के डेटा से संकेत मिलता है कि लगभग 30% आबादी के पास लगभग 70% आय थी। इस लेख की शुरुआत में संभाव्यता घनत्व फ़ंक्शन (पीडीएफ) ग्राफ़ से पता चलता है कि जनसंख्या की संभावना या अंश जिसके पास प्रति व्यक्ति थोड़ी मात्रा में धन है, वह काफी अधिक है, और फिर धन बढ़ने के साथ-साथ लगातार घटता जाता है। (हालाँकि, पेरेटो वितरण निचले तबके के लिए धन के लिए यथार्थवादी नहीं है। वास्तव में, निवल मूल्य नकारात्मक भी हो सकता है।) यह वितरण केवल धन या आय का वर्णन करने तक ही सीमित नहीं है, बल्कि कई स्थितियों तक है जिसमें संतुलन पाया जाता है छोटे से बड़े का वितरण. निम्नलिखित उदाहरणों को कभी-कभी लगभग पेरेटो-वितरित के रूप में देखा जाता है:

फ़ाइल:FitParetoDistr.tif|thumb|250px|CumFreq का उपयोग करके अधिकतम दिवसीय वर्षा के लिए संचयी Pareto (Lomax) वितरण फिट किया गया, वितरण फिटिंग भी देखें
 * मानव बस्तियों का आकार (कुछ शहर, कई बस्तियाँ/गाँव)
 * इंटरनेट ट्रैफ़िक का फ़ाइल आकार वितरण जो टीसीपी प्रोटोकॉल का उपयोग करता है (कई छोटी फ़ाइलें, कुछ बड़ी) * हार्ड डिस्क ड्राइव त्रुटि दर
 * बोस-आइंस्टीन के समूह परम शून्य के निकट संघनित होते हैं
 * तेल क्षेत्रों में तेल भंडार का मूल्य (कुछ विशाल तेल और गैस क्षेत्र, कई स्ट्रिपर कुएं) * सुपर कंप्यूटरों को सौंपे गए कार्यों में लंबाई वितरण (कुछ बड़े वाले, कई छोटे वाले)
 * व्यक्तिगत स्टॉक पर मानकीकृत मूल्य रिटर्न * रेत के कणों का आकार * उल्कापिंड का आकार
 * सामान्य दायित्व, वाणिज्यिक ऑटो और श्रमिकों के मुआवजे जैसे व्यवसाय के कुछ क्षेत्रों के लिए बड़ी हताहत (व्यक्ति) हानि की गंभीरता।
 * स्टीम (सेवा) पर उपयोगकर्ता द्वारा विभिन्न गेम खेलने में बिताया गया समय। (कुछ गेम बहुत खेले जाते हैं, लेकिन अधिकांश लगभग कभी नहीं खेले जाते।)
 * जल विज्ञान में पेरेटो वितरण को चरम घटनाओं जैसे सालाना अधिकतम दिवसीय वर्षा और नदी निर्वहन पर लागू किया जाता है। नीली तस्वीर पेरेटो वितरण को सालाना अधिकतम दिवसीय वर्षा के अनुसार फिट करने का उदाहरण दिखाती है, जो द्विपद वितरण के आधार पर 90% आत्मविश्वास बेल्ट भी दिखाती है। संचयी आवृत्ति विश्लेषण के भाग के रूप में वर्षा के आंकड़ों को प्लॉटिंग स्थितियों द्वारा दर्शाया जाता है।
 * विद्युत उपयोगिता वितरण विश्वसनीयता में (किसी दिए गए वर्ष में लगभग 20% दिनों में 80% ग्राहक मिनट बाधित होते हैं)।

जिपफ के नियम से संबंध
पेरेटो वितरण सतत संभाव्यता वितरण है। जिपफ का नियम, जिसे कभी-कभी जीटा वितरण भी कहा जाता है, अलग वितरण है, जो मूल्यों को सरल रैंकिंग में अलग करता है। दोनों नकारात्मक घातांक के साथ सरल शक्ति कानून हैं, जिसे स्केल किया गया है ताकि उनका संचयी वितरण 1 के बराबर हो। ज़िपफ को पेरेटो वितरण से प्राप्त किया जा सकता है यदि $$x$$ मूल्यों (आय) को इसमें जोड़ दिया गया है $$N$$ रैंक ताकि प्रत्येक बिन में लोगों की संख्या 1/रैंक पैटर्न का पालन करे। वितरण को परिभाषित करके सामान्यीकृत किया जाता है $$x_m$$ ताकि $$\alpha x_\mathrm{m}^\alpha = \frac{1}{H(N,\alpha-1)}$$ कहाँ $$H(N,\alpha-1)$$ हार्मोनिक संख्यायासामान्यीकृत हार्मोनिक संख्या है। यह Zipf के संभाव्यता घनत्व फ़ंक्शन को पेरेटो से व्युत्पन्न बनाता है।


 * $$f(x) = \frac{\alpha x_\mathrm{m}^\alpha}{x^{\alpha+1}} = \frac{1}{x^s H(N,s)}$$

कहाँ $$s = \alpha-1$$ और $$x$$ पूर्णांक है जो 1 से N तक रैंक का प्रतिनिधित्व करता है जहां N उच्चतम आय वर्ग है। तो किसी जनसंख्या (या भाषा, इंटरनेट, या देश) से बेतरतीब ढंग से चुने गए व्यक्ति (या शब्द, वेबसाइट लिंक, या शहर) के पास है $$f(x)$$ रैंकिंग की संभावना $$x$$.

पेरेटो सिद्धांत से संबंध
पेरेटो सिद्धांत|80-20 कानून, जिसके अनुसार सभी लोगों में से 20% को सभी आय का 80% प्राप्त होता है, और सबसे समृद्ध 20% में से 20% को उस 80% का 80% प्राप्त होता है, और इसी तरह, ठीक तब लागू होता है जब पेरेटो सूचकांक है $$\alpha = \log_4 5 = \cfrac{\log_{10} 5}{\log_{10} 4} \approx 1.161$$. यह परिणाम नीचे दिए गए लोरेंज वक्र सूत्र से प्राप्त किया जा सकता है। इसके अलावा, निम्नलिखित दिखाया गया है गणितीय रूप से समतुल्य होना:
 * आय को पेरेटो वितरण के अनुसार सूचकांक α > 1 के अनुसार वितरित किया जाता है।
 * कुछ ऐसी संख्या है 0 ≤ p ≤ 1/2 जिससे सभी लोगों में से 100p % को सभी आय का 100(1 − p)% प्राप्त होता है, और इसी तरह प्रत्येक वास्तविक (जरूरी नहीं कि पूर्णांक) n > 0, 100p के लिएn% सभी लोगों को 100(1 -पी) प्राप्त होता हैnसभी आय का प्रतिशत। α और p किससे संबंधित हैं?
 * $$1-\frac{1}{\alpha}=\frac{\ln(1-p)}{\ln(p)}=\frac{\ln((1-p)^n)}{\ln(p^n)}$$

यह केवल आय पर ही लागू नहीं होता है, बल्कि धन, या किसी अन्य चीज़ पर भी लागू होता है जिसे इस वितरण द्वारा प्रतिरूपित किया जा सकता है।

इसमें पेरेटो वितरण शामिल नहीं है जिसमें 0 < α ≤ 1, जैसा कि ऊपर बताया गया है, अनंत अपेक्षित मूल्य है, और इसलिए उचित रूप से आय वितरण को मॉडल नहीं कर सकता है।

मूल्य के नियम से संबंध
डेरेक जे. डी सोला प्राइसयावैज्ञानिक योगदान|प्राइस का वर्गमूल नियम कभी-कभी पेरेटो वितरण की संपत्ति के रूप में या उसके समान पेश किया जाता है। हालाँकि, कानून केवल उस मामले में ही मान्य है $$\alpha=1$$. ध्यान दें कि इस मामले में, धन की कुल और अपेक्षित मात्रा परिभाषित नहीं की गई है, और नियम केवल यादृच्छिक नमूनों पर स्पर्शोन्मुख रूप से लागू होता है। ऊपर उल्लिखित विस्तारित पेरेटो सिद्धांत कहीं अधिक सामान्य नियम है।

लोरेंज़ वक्र और गिनी गुणांक
लोरेन्ज़ वक्र का उपयोग अक्सर आय और धन वितरण को चिह्नित करने के लिए किया जाता है। किसी भी वितरण के लिए, लॉरेंज वक्र एल(एफ) को पीडीएफ एफ या सीडीएफ एफ के रूप में लिखा जाता है


 * $$L(F)=\frac{\int_{x_\mathrm{m}}^{x(F)}xf(x)\,dx}{\int_{x_\mathrm{m}}^\infty xf(x)\,dx} =\frac{\int_0^F x(F')\,dF'}{\int_0^1 x(F')\,dF'}$$

जहां x(F) CDF का व्युत्क्रम है। पेरेटो वितरण के लिए,


 * $$x(F)=\frac{x_\mathrm{m}}{(1-F)^{\frac{1}{\alpha}}}$$

और लोरेन्ज़ वक्र की गणना की जाती है


 * $$L(F) = 1-(1-F)^{1-\frac{1}{\alpha}},$$

के लिए $$0<\alpha\le 1$$ हर अनंत है, जिससे L=0 प्राप्त होता है। कई पेरेटो वितरणों के लिए लॉरेन्ज़ वक्र के उदाहरण दाईं ओर ग्राफ़ में दिखाए गए हैं।

ऑक्सफेम (2016) के अनुसार सबसे अमीर 62 लोगों के पास दुनिया की सबसे गरीब आधी आबादी के बराबर संपत्ति है। हम पेरेटो सूचकांक का अनुमान लगा सकते हैं जो इस स्थिति पर लागू होगा। ε को बराबर देना $$62/(7\times 10^9)$$ अपने पास:
 * $$L(1/2)=1-L(1-\varepsilon)$$

या
 * $$1-(1/2)^{1-\frac{1}{\alpha}}=\varepsilon^{1-\frac{1}{\alpha}}$$

समाधान यह है कि α लगभग 1.15 के बराबर है, और लगभग 9% संपत्ति दोनों समूहों में से प्रत्येक के पास है। लेकिन वास्तव में दुनिया की सबसे गरीब 69% वयस्क आबादी के पास केवल 3% संपत्ति है। गिनी गुणांक समवितरण रेखा से लोरेंज वक्र के विचलन का माप है जो [0,0] और [1,1] को जोड़ने वाली रेखा है, जिसे लोरेंज प्लॉट में काले (α=∞) में दिखाया गया है। सही। विशेष रूप से, गिनी गुणांक लोरेंज वक्र और समान वितरण रेखा के बीच के क्षेत्र का दोगुना है। पेरेटो वितरण के लिए गिनी गुणांक की गणना तब की जाती है (के लिए)। $$\alpha\ge 1$$) होना


 * $$G = 1-2 \left (\int_0^1L(F) \, dF \right ) = \frac{1}{2\alpha-1}$$

(एबर्ज 2005 देखें)।

यादृच्छिक भिन्न पीढ़ी
व्युत्क्रम परिवर्तन नमूनाकरण का उपयोग करके यादृच्छिक नमूने उत्पन्न किए जा सकते हैं। इकाई अंतराल (0,1] पर समान वितरण (निरंतर) से खींचे गए यादृच्छिक चर यू को देखते हुए, चर टी द्वारा दिया गया है


 * $$T=\frac{x_\mathrm{m}}{U^{1/\alpha}}$$

पेरेटो-वितरित है। यदि यू को [0, 1) पर समान रूप से वितरित किया जाता है, तो इसे (1-यू) के साथ बदला जा सकता है।

यह भी देखें

 * ब्रैडफोर्ड का नियम
 * गुटेनबर्ग-रिक्टर कानून
 * मैथ्यू प्रभाव
 * पेरेटो विश्लेषण
 * पेरेटो दक्षता
 * पेरेटो इंटरपोलेशन
 * शक्ति कानूनयाशक्ति-कानून संभाव्यता वितरण
 * स्टर्जन का नियम
 * ट्रैफ़िक जनरेशन मॉडल
 * जिपफ का नियम
 * भारी पूंछ वाला वितरण

टिप्पणियाँ




बाहरी संबंध





 * syntraf1.c is a C program to generate synthetic packet traffic with bounded Pareto burst size and exponential interburst time.