एच सूचकांक

एच-इंडेक्स एक लेखक-स्तरीय मीट्रिक है जो [[वैज्ञानिक प्रकाशन]] की उत्पादकता और उद्धरण प्रभाव दोनों को मापता है, जिसका उपयोग शुरुआत में एक व्यक्तिगत वैज्ञानिक या विद्वान के लिए किया जाता है। एच-सूचकांक सफलता संकेतकों से संबंधित है जैसे नोबेल पुरस्कार जीतना, अनुसंधान फेलोशिप के लिए स्वीकार किया जाना और शीर्ष विश्वविद्यालयों में पद धारण करना। सूचकांक वैज्ञानिकों के सबसे उद्धृत पत्रों के सेट और अन्य प्रकाशनों में उन्हें प्राप्त उद्धरणों की संख्या पर आधारित है। सूचकांक को हाल ही में एक विद्वान पत्रिका की उत्पादकता और प्रभाव पर लागू किया गया है साथ ही वैज्ञानिकों का एक समूह, जैसे कोई विभाग या विश्वविद्यालय या देश। सैद्धांतिक भौतिकी की सापेक्ष गुणवत्ता निर्धारित करने के लिए एक उपकरण के रूप में, सूचकांक का सुझाव 2005 में कैलिफ़ोर्निया विश्वविद्यालय, सैन डिएगो के भौतिक विज्ञानी जॉर्ज ई. हिर्श द्वारा दिया गया था। और इसे कभी-कभी हिर्श सूचकांक या हिर्श संख्या भी कहा जाता है।

परिभाषा और उद्देश्य
एच-इंडेक्स को एच के अधिकतम मूल्य के रूप में परिभाषित किया गया है जैसे कि दिए गए लेखक/पत्रिका ने कम से कम एच पेपर प्रकाशित किए हैं जिनमें से प्रत्येक को कम से कम एच बार उद्धृत किया गया है। सूचकांक को उद्धरणों या प्रकाशनों की कुल संख्या जैसे सरल उपायों में सुधार करने के लिए डिज़ाइन किया गया है। एक ही क्षेत्र में काम करने वाले विद्वानों की तुलना करते समय सूचकांक सबसे अच्छा काम करता है, क्योंकि विभिन्न क्षेत्रों में उद्धरण परंपराएं व्यापक रूप से भिन्न होती हैं।

गणना
एच-इंडेक्स सबसे बड़ी संख्या एच है जैसे कि प्रत्येक लेख में कम से कम एच उद्धरण हों। उदाहरण के लिए, यदि किसी लेखक के पास 9, 7, 6, 2, और 1 उद्धरणों के साथ पांच प्रकाशन हैं (अधिकतम से न्यूनतम तक क्रमबद्ध), तो लेखक का एच-इंडेक्स 3 है, क्योंकि लेखक के पास 3 या अधिक उद्धरणों के साथ तीन प्रकाशन हैं।. हालाँकि, लेखक के पास 4 या अधिक उद्धरणों वाले चार प्रकाशन नहीं हैं।

स्पष्ट रूप से, किसी लेखक का एच-इंडेक्स उतना ही बड़ा हो सकता है जितनी उनके प्रकाशनों की संख्या। उदाहरण के लिए, केवल एक प्रकाशन वाले लेखक का अधिकतम एच-इंडेक्स 1 हो सकता है (यदि उनके प्रकाशन में 1 या अधिक उद्धरण हैं)। दूसरी ओर, कई प्रकाशनों वाले लेखक, जिनमें से प्रत्येक में केवल 1 उद्धरण है, का एच-इंडेक्स भी 1 होगा।

औपचारिक रूप से, यदि f वह फ़ंक्शन है जो प्रत्येक प्रकाशन के लिए उद्धरणों की संख्या से मेल खाता है, तो हम h-सूचकांक की गणना निम्नानुसार करते हैं: सबसे पहले हम f के मानों को सबसे बड़े से निम्नतम मान तक क्रमित करते हैं। फिर, हम अंतिम स्थिति की तलाश करते हैं जिसमें f, से बड़ा या उसके बराबर है स्थिति (हम इस स्थिति को h कहते हैं)। उदाहरण के लिए, यदि हमारे पास 5 प्रकाशनों ए, बी, सी, डी और ई के साथ क्रमशः 10, 8, 5, 4 और 3 उद्धरणों वाला एक शोधकर्ता है, तो एच-इंडेक्स 4 के बराबर है क्योंकि चौथे प्रकाशन में 4 हैं। उद्धरण और 5वें में केवल 3 हैं। इसके विपरीत, यदि समान प्रकाशनों में 25, 8, 5, 3, और 3 उद्धरण हैं, तो सूचकांक 3 है (अर्थात तीसरा स्थान) क्योंकि चौथे पेपर में केवल 3 उद्धरण हैं।


 * f(A)=10, f(B)=8, f(C)=5, f(D)=4, f(E)=3　→ h-index=4
 * f(A)=25, f(B)=8, f(C)=5, f(D)=3, f(E)=3　→ h-index=3

यदि हमारे पास फ़ंक्शन f को सबसे बड़े से घटते क्रम में क्रमबद्ध किया गया है सबसे कम मूल्य पर, हम एच-इंडेक्स की गणना इस प्रकार कर सकते हैं:


 * एच-सूचकांक (एफ) = $$\max\{i\in\N: f(i)\ge i\}$$

हिर्श इंडेक्स साइकिल चलाने के लिए आर्थर एडिंगटन # एडिंगटन नंबर के अनुरूप है, जो साइकिल चालकों के मूल्यांकन के लिए इस्तेमाल किया जाने वाला एक पुराना मीट्रिक है। एच-इंडेक्स व्यापक सुगेनो और क्यू फैन मेट्रिक से भी संबंधित है। एच-इंडेक्स किसी विशेष शोधकर्ता के काम के प्रभाव के मूल्यांकन में अधिक पारंपरिक जर्नल प्रभाव कारक मेट्रिक्स के विकल्प के रूप में कार्य करता है। चूँकि केवल सर्वाधिक उद्धृत लेख ही एच-इंडेक्स में योगदान करते हैं, इसलिए इसका निर्धारण एक सरल प्रक्रिया है। हिर्श ने प्रदर्शित किया है कि किसी वैज्ञानिक ने राष्ट्रीय अकादमी सदस्यता या नोबेल पुरस्कार जैसे सम्मान जीते हैं या नहीं, इसके लिए h का उच्च पूर्वानुमानित मूल्य है। जैसे-जैसे उद्धरण जमा होते जाते हैं, एच-इंडेक्स बढ़ता जाता है और इस प्रकार यह एक शोधकर्ता की शैक्षणिक उम्र पर निर्भर करता है।

इनपुट डेटा
एच-इंडेक्स को उद्धरण डेटाबेस का उपयोग करके या स्वचालित टूल का उपयोग करके मैन्युअल रूप से निर्धारित किया जा सकता है। स्कोपस और वेब ऑफ़ साइंस जैसे सदस्यता-आधारित डेटाबेस स्वचालित कैलकुलेटर प्रदान करते हैं। जुलाई 2011 से Google ने अपने स्वयं के Google Scholar प्रोफ़ाइल में स्वचालित रूप से गणना की गई h-index और i10-index प्रदान की है। इसके अलावा, विशिष्ट डेटाबेस, जैसे INSPIRE-HEP डेटाबेस, उच्च ऊर्जा भौतिकी में काम करने वाले शोधकर्ताओं के लिए स्वचालित रूप से एच-इंडेक्स की गणना कर सकते हैं।

अलग-अलग कवरेज के कारण, प्रत्येक डेटाबेस एक ही विद्वान के लिए एक अलग एच उत्पन्न करने की संभावना रखता है। एक विस्तृत अध्ययन से पता चला है कि वेब ऑफ साइंस में जर्नल प्रकाशनों की मजबूत कवरेज है, लेकिन उच्च प्रभाव वाले सम्मेलनों की कमजोर कवरेज है। स्कोपस के पास सम्मेलनों का बेहतर कवरेज है, लेकिन 1996 से पहले के प्रकाशनों का कवरेज खराब है; Google Scholar के पास सम्मेलनों और अधिकांश पत्रिकाओं (हालांकि सभी नहीं) का सबसे अच्छा कवरेज है, लेकिन स्कोपस की तरह 1990 से पहले के प्रकाशनों का कवरेज सीमित है। कंप्यूटर विज्ञान के विद्वानों के लिए सम्मेलन कार्यवाही पत्रों का बहिष्कार एक विशेष समस्या है, जहां सम्मेलन कार्यवाही को साहित्य का एक महत्वपूर्ण हिस्सा माना जाता है। Google Scholar की उद्धरण गणना में ग्रे साहित्य समेत प्रेत उद्धरण तैयार करने और खोज शब्दों को संयोजित करते समय बूलियन तर्क के नियमों का पालन करने में विफल रहने के लिए आलोचना की गई है। उदाहरण के लिए, मेहो और यांग अध्ययन में पाया गया कि Google Scholar ने वेब ऑफ साइंस और स्कोपस की तुलना में 53% अधिक उद्धरणों की पहचान की, लेकिन ध्यान दिया कि क्योंकि Google Scholar द्वारा रिपोर्ट किए गए अधिकांश अतिरिक्त उद्धरण कम प्रभाव वाली पत्रिकाओं या सम्मेलन की कार्यवाही से थे, इसलिए उन्होंने ऐसा किया। व्यक्तियों की सापेक्ष रैंकिंग में महत्वपूर्ण परिवर्तन नहीं होता। यह सुझाव दिया गया है कि संभावित उद्धरण डेटाबेस में मापे गए एकल अकादमिक के लिए एच में कभी-कभी व्यापक भिन्नता से निपटने के लिए, किसी को यह मान लेना चाहिए कि डेटाबेस में गलत नकारात्मक गलत सकारात्मक की तुलना में अधिक समस्याग्रस्त हैं और एक अकादमिक के लिए मापा गया अधिकतम एच लेना चाहिए।.

उदाहरण
विभिन्न संस्थानों, राष्ट्रों, समयों और शैक्षणिक क्षेत्रों में एच-इंडेक्स कैसे व्यवहार करता है, इस पर बहुत कम व्यवस्थित जांच की गई है। हिर्श ने सुझाव दिया कि, भौतिकविदों के लिए, प्रमुख [यूएस] अनुसंधान विश्वविद्यालयों में कार्यकाल (एसोसिएट प्रोफेसर) की उन्नति के लिए लगभग 12 का h मान विशिष्ट हो सकता है। लगभग 18 के मान का मतलब पूर्ण प्रोफेसरशिप हो सकता है, 15-20 का मतलब अमेरिकन फिजिकल सोसायटी  में फेलोशिप हो सकता है, और 45 या उससे अधिक का मतलब यूनाइटेड स्टेट्स नेशनल एकेडमी ऑफ साइंसेज में सदस्यता हो सकता है। हिर्श ने अनुमान लगाया कि 20 वर्षों के बाद एक सफल वैज्ञानिक का एच-इंडेक्स 20 होगा, एक उत्कृष्ट वैज्ञानिक का एच-इंडेक्स 40 होगा, और वास्तव में अद्वितीय व्यक्ति का एच-इंडेक्स 60 होगा।

1983-2002 की अवधि में सबसे अधिक उद्धृत वैज्ञानिकों के लिए, हिर्श ने जीवन विज्ञान में शीर्ष 10 की पहचान की (घटते एच के क्रम में): सोलोमन एच. स्नाइडर, एच = 191; डेविड बाल्टीमोर, एच = 160; रॉबर्ट सी. गैलो, एच = 154; पियरे चैंबोन, एच = 153; बर्ट वोगेलस्टीन, एच = 151; साल्वाडोर मोनकाडा, एच = 143; चार्ल्स ए. डिनारेलो, एच = 138; तदामित्सु किशिमोटो, एच = 134; रोनाल्ड एम. इवांस, एच = 127; और राल्फ एल ब्रिंस्टर, एच = 126। 2005 में जैविक और बायोमेडिकल विज्ञान में नेशनल एकेडमी ऑफ साइंसेज में 36 नए शामिल लोगों में, औसत एच-सूचकांक 57 था। हालाँकि, हिर्श ने कहा कि अलग-अलग क्षेत्रों में h का मान अलग-अलग होगा।

आवश्यक विज्ञान संकेतक उद्धरण सीमा में सूचीबद्ध 22 वैज्ञानिक विषयों में [इस प्रकार गैर-विज्ञान शिक्षाविदों को छोड़कर], अंतरिक्ष विज्ञान के बाद भौतिकी में दूसरा सबसे अधिक उद्धरण है। 1 जनवरी, 2000 - 28 फरवरी, 2010 की अवधि के दौरान, एक भौतिक विज्ञानी को दुनिया के सबसे अधिक उद्धृत 1% भौतिकविदों में से एक होने के लिए 2073 उद्धरण प्राप्त करने थे। अंतरिक्ष विज्ञान के लिए सीमा उच्चतम (2236 उद्धरण) है, और भौतिकी के बाद नैदानिक ​​​​चिकित्सा (1390) और आणविक जीव विज्ञान और आनुवंशिकी (1229) का स्थान आता है। अधिकांश विषयों, जैसे पर्यावरण/पारिस्थितिकी (390) में कम वैज्ञानिक, कम पेपर और कम उद्धरण हैं। इसलिए, इन विषयों में आवश्यक विज्ञान संकेतकों में उद्धरण सीमा कम है, सामाजिक विज्ञान (154), कंप्यूटर विज्ञान (149), और बहु-विषयक विज्ञान (147) में उद्धरण सीमा सबसे कम देखी गई है।

सामाजिक विज्ञान विषयों में संख्याएं बहुत भिन्न हैं: लंदन स्कूल ऑफ इकोनॉमिक्स में सामाजिक विज्ञान टीम के प्रभाव ने पाया कि यूनाइटेड किंगडम में सामाजिक वैज्ञानिकों का औसत एच-सूचकांक कम था। गूगल स्कॉलर डेटा के आधार पर (पूर्ण) प्रोफेसरों के लिए एच-सूचकांक 2.8 (कानून में), 3.4 (राजनीति विज्ञान में), 3.7 (समाजशास्त्र में), 6.5 (भूगोल में) और 7.6 (अर्थशास्त्र में) तक था। सभी विषयों में औसतन, सामाजिक विज्ञान के एक प्रोफेसर का एच-इंडेक्स एक व्याख्याता या एक वरिष्ठ व्याख्याता की तुलना में लगभग दोगुना था, हालांकि भूगोल में यह अंतर सबसे छोटा था।

लाभ
हिर्श ने एच-इंडेक्स का उद्देश्य अन्य ग्रंथसूची संकेतकों के मुख्य नुकसान को संबोधित करना था। पेपर मीट्रिक की कुल संख्या वैज्ञानिक प्रकाशनों की गुणवत्ता के लिए जिम्मेदार नहीं है। दूसरी ओर, उद्धरण मेट्रिक की कुल संख्या, प्रमुख प्रभाव वाले एकल प्रकाशन में भागीदारी से भारी रूप से प्रभावित हो सकती है (उदाहरण के लिए, सफल नई तकनीकों, विधियों या अनुमानों का प्रस्ताव करने वाले पद्धति संबंधी कागजात, जो बड़ी संख्या में उद्धरण उत्पन्न कर सकते हैं)। एच-इंडेक्स का उद्देश्य वैज्ञानिक आउटपुट की गुणवत्ता और मात्रा को एक साथ मापना है। 2010 तक एच-इंडेक्स ने केंडल रैंक सहसंबंध गुणांक दिखाया|वैज्ञानिक पुरस्कारों के साथ केंडल का सहसंबंध 0.3 से 0.4 था।

आलोचना
ऐसी कई स्थितियाँ हैं जिनमें एच किसी वैज्ञानिक के आउटपुट के बारे में भ्रामक जानकारी प्रदान कर सकता है। एच-इंडेक्स के व्यापक उपयोग के बाद 2010 से एच-इंडेक्स और वैज्ञानिक पुरस्कारों के बीच संबंध में काफी गिरावट आई है, गुडहार्ट के नियम का पालन करते हुए। सहसंबंध में कमी आंशिक रूप से प्रति पेपर 100 से अधिक सह-लेखकों के साथ हाइपरऑथरशिप के प्रसार के लिए जिम्मेदार है।

निम्नलिखित में से कुछ विफलताएं एच-इंडेक्स के लिए विशिष्ट नहीं हैं, बल्कि अन्य लेखक-स्तरीय मेट्रिक्स#आलोचना|लेखक-स्तरीय मेट्रिक्स के साथ साझा की जाती हैं:
 * एच-इंडेक्स किसी पेपर के लेखकों की संख्या को ध्यान में नहीं रखता है। मूल पेपर में, हिर्श ने सह-लेखकों के बीच उद्धरणों को विभाजित करने का सुझाव दिया। ऐसा ही एक भिन्नात्मक सूचकांक h-frac।
 * एच-इंडेक्स विभिन्न क्षेत्रों में उद्धरणों की अलग-अलग विशिष्ट संख्या को ध्यान में नहीं रखता है, उदाहरण के लिए। सैद्धांतिक से अधिक प्रयोगात्मक। सामान्य तौर पर उद्धरण व्यवहार क्षेत्र-निर्भर कारकों से प्रभावित होता है, जो न केवल सभी विषयों में बल्कि एक ही अनुशासन के अनुसंधान के विभिन्न क्षेत्रों में भी तुलना को अमान्य कर सकता है। * एच-इंडेक्स लेखकों की सूची में लेखक प्लेसमेंट में निहित जानकारी को खारिज कर देता है, जो कुछ वैज्ञानिक क्षेत्रों में महत्वपूर्ण है, हालांकि अन्य में यह नहीं है। * एच-इंडेक्स एक पूर्णांक है, जो इसकी भेदभावपूर्ण शक्ति को कम करता है। फ्रांसिस पी. रुआन और रिचर्ड टोल इसलिए एक परिमेय संख्या एच-सूचकांक का प्रस्ताव करते हैं जो एच और एच + 1 के बीच अंतरण करता है।

हेराफेरी की संभावना
कमजोरियाँ वैज्ञानिक या अकादमिक आउटपुट की विशुद्ध मात्रात्मक गणना पर लागू होती हैं। अन्य मेट्रिक्स की तरह जो उद्धरणों की गिनती करते हैं, एच-इंडेक्स को ज़बरदस्ती उद्धरण द्वारा हेरफेर किया जा सकता है, एक अभ्यास जिसमें एक पत्रिका का संपादक लेखकों को अपने स्वयं के लेखों में नकली उद्धरण जोड़ने के लिए मजबूर करता है, इससे पहले कि पत्रिका इसे प्रकाशित करने के लिए सहमत हो। स्व-उद्धरण के माध्यम से एच-इंडेक्स में हेरफेर किया जा सकता है,  और यदि Google Scholar आउटपुट पर आधारित है, तो उस उद्देश्य के लिए कंप्यूटर-जनरेटेड दस्तावेज़ों का भी उपयोग किया जा सकता है, उदाहरण के लिए SCIgen का उपयोग करना। एच-इंडेक्स को हाइपरऑथरशिप द्वारा भी हेरफेर किया जा सकता है। हाल के शोध से स्पष्ट रूप से पता चलता है कि वैज्ञानिक समुदाय द्वारा मान्यता का संकेत देने वाले पुरस्कारों के साथ एच-इंडेक्स के सहसंबंध में काफी गिरावट आई है।

अन्य कमियाँ
एक अध्ययन में एच-इंडेक्स को प्रति पेपर माध्य उद्धरणों के सरल माप की तुलना में थोड़ा कम पूर्वानुमानित सटीकता और परिशुद्धता पाया गया है। हालाँकि, इस निष्कर्ष का हिर्श के एक अन्य अध्ययन द्वारा खंडन किया गया था। एच-इंडेक्स किसी विद्वान के लिए उद्धरणों की कुल संख्या की तुलना में प्रभाव का अधिक सटीक माप प्रदान नहीं करता है। विशेष रूप से, कागजात के बीच उद्धरणों के वितरण को एक यादृच्छिक पूर्णांक विभाजन के रूप में और एच-इंडेक्स को विभाजन के डर्फी वर्ग के रूप में मॉडलिंग करके, योंग सूत्र पर पहुंचे $$h\approx 0.54\sqrt N$$, जहां एन उद्धरणों की कुल संख्या है, जो कि नेशनल एकेडमी ऑफ साइंसेज के गणित सदस्यों के लिए, ज्यादातर मामलों में एच-इंडेक्स का सटीक (आमतौर पर 10-20 प्रतिशत के भीतर त्रुटियों के साथ) अनुमान प्रदान करता है।

विकल्प और संशोधन
विभिन्न विशेषताओं पर जोर देने के लिए एच-इंडेक्स को संशोधित करने के विभिन्न प्रस्ताव बनाए गए हैं।  <रेफरी नाम= एंडरसन हैंकिन किलवर्थ पीपी. 577-588 > इनमें से कई वेरिएंट, जैसे कि  जी सूचकांक, मूल एच-इंडेक्स के साथ अत्यधिक सहसंबद्ध हैं और इसलिए अनावश्यक हैं। एक मेट्रिक्स, जो वर्तमान में एच-इंडेक्स के साथ अत्यधिक सहसंबद्ध नहीं है और वैज्ञानिक पुरस्कारों के साथ सहसंबद्ध है, एच-फ्रैक है।

अनुप्रयोग
एच-इंडेक्स के समान सूचकांकों को लेखक या जर्नल मूल्यांकन के बाहर लागू किया गया है।

एच-इंडेक्स को यूट्यूब चैनलों जैसे इंटरनेट मीडिया पर लागू किया गया है। इसे ≥ h × 10 वाले वीडियो की संख्या के रूप में परिभाषित किया गया है5व्यू. जब किसी वीडियो निर्माता की कुल दृश्य संख्या के साथ तुलना की जाती है, तो एच-इंडेक्स और जी-इंडेक्स एक ही मीट्रिक में उत्पादकता और प्रभाव दोनों को बेहतर ढंग से कैप्चर करते हैं। संस्थानों के लिए एक क्रमिक हिर्श-प्रकार सूचकांक भी तैयार किया गया है। एक वैज्ञानिक संस्थान में i का क्रमिक हिर्श-प्रकार सूचकांक होता है, जब उस संस्थान के कम से कम i शोधकर्ताओं के पास कम से कम i का h-सूचकांक होता है।

यह भी देखें

 * ग्रंथ सूची
 * अनुसंधान नेटवर्किंग टूल और अनुसंधान प्रोफाइलिंग सिस्टम की तुलना

बाहरी संबंध

 * Google Scholar Metrics
 * H-index for computer science and electronics
 * H-index for economists
 * H-index for computer science researchers
 * H - index for computer scientists from Google Scholar
 * H-index for astronomers
 * Publication and Citation-based Impact, listing 252 impact measures for one researcher with link to source code