एच सूचकांक

एच-सूचकांक ऐसा लेखक-स्तरीय सूचकांक है, जो [[वैज्ञानिक प्रकाशन]] की उत्पादकता और उद्धरण प्रभाव दोनों को मापता है, जिसका उपयोग प्रारंभिक समय में व्यक्तिगत वैज्ञानिक या विद्वान के लिए किया जाता है। इस प्रकार एच-सूचकांक सफलता के संकेतकों से संबंधित होता है जैसे नोबेल पुरस्कार जीतना, अनुसंधान फेलोशिप के लिए स्वीकार किया जाना और शीर्ष विश्वविद्यालयों में पद धारण करना इसका प्रमुख उदाहरण हैं। इस प्रकार सूचकांक वैज्ञानिकों के सबसे उद्धृत पत्रों के समूहों और अन्य प्रकाशनों में उन्हें प्राप्त उद्धरणों की संख्या पर आधारित होता है। इस प्रकार इन सूचकांकों को वर्तमान समय में विद्वान पत्रिका की उत्पादकता और प्रभाव पर लागू किया गया है, इसके साथ ही वैज्ञानिकों का समूह, जैसे कोई विभाग या विश्वविद्यालय या देश पर इसे प्रदर्शित किया गया हैं। इस प्रकार सैद्धांतिक भौतिकी की सापेक्ष गुणवत्ता निर्धारित करने के लिए उपकरण के रूप में, सूचकांक का सुझाव 2005 में कैलिफ़ोर्निया विश्वविद्यालय, सैन डिएगो के भौतिक विज्ञानी जॉर्ज ई. हिर्श द्वारा दिया गया था। और इसके साथ ही इसे कभी-कभी हिर्श सूचकांक या हिर्श संख्या भी कहा जाता है।

परिभाषा और उद्देश्य
एच-सूचकांक को एच के अधिकतम मान के रूप में परिभाषित किया गया है, जैसे कि दिए गए लेखक/पत्रिका ने कम से कम एच पेपर प्रकाशित किए गए हैं, जिनमें से प्रत्येक को कम से कम एच बार उद्धृत किया गया है। इस प्रकार सूचकांक को उद्धरणों या प्रकाशनों की कुल संख्या जैसे सरल उपायों में सुधार करने के लिए डिज़ाइन किया गया है। इस क्षेत्र में कार्य करने वाले विद्वानों की तुलना करते समय सूचकांक सबसे अच्छा कार्य करता है, क्योंकि इस प्रकार विभिन्न क्षेत्रों में उद्धरण परंपराएं व्यापक रूप से भिन्न होती हैं।

गणना
एच-सूचकांक सबसे बड़ी संख्या एच है, जैसे कि प्रत्येक लेख में कम से कम एच उद्धरण रहती हैं। उदाहरण के लिए, यदि किसी लेखक के पास 9, 7, 6, 2, और 1 उद्धरणों के साथ पांच प्रकाशन हैं, ( इस प्रकार अधिकतम से न्यूनतम तक क्रमबद्ध रहती हैं), तो इस प्रकार लेखक का एच-सूचकांक 3 है, क्योंकि लेखक के पास 3 या अधिक उद्धरणों के साथ तीन प्रकाशन हैं। चूंकि, लेखक के पास 4 या अधिक उद्धरणों वाले चार प्रकाशन नहीं हैं।

स्पष्ट रूप से, किसी लेखक का एच-सूचकांक उतना ही बड़ा हो सकता है, जितनी उनके प्रकाशनों की संख्या हो सकती हैं। उदाहरण के लिए, केवल प्रकाशन वाले लेखक का अधिकतम एच-सूचकांक 1 हो सकता है, ( इस प्रकार यदि उनके प्रकाशन में 1 या अधिक उद्धरण हैं)। दूसरी ओर, कई प्रकाशनों वाले लेखक, जिनमें से प्रत्येक में केवल 1 उद्धरण है, जिसका एच-सूचकांक भी 1 होगा।

औपचारिक रूप से, यदि एफ वह फलन है जो प्रत्येक प्रकाशन के लिए उद्धरणों की संख्या से मेल खाता है, तो इस प्रकार हम एच-सूचकांक की गणना निम्नानुसार करते हैं: सबसे पहले हम एफ के मानों को सबसे बड़े से निम्नतम मान तक क्रमित करते हैं। इस प्रकार पुनः हम अंतिम स्थिति की खोज करते हैं जिसमें एफ से बड़ा या उसके समान होता है।

इस स्थिति में हम इस स्थिति को एच कहते हैं। उदाहरण के लिए, यदि हमारे पास 5 प्रकाशनों ए, बी, सी, डी और ई के साथ क्रमशः 10, 8, 5, 4 और 3 उद्धरणों वाला शोधकर्ता है, तो एच-सूचकांक 4 के बराबर है, क्योंकि चौथे प्रकाशन में यह 4 के समान हैं। इस प्रकार उद्धरण और 5वें में केवल 3 हैं। इसके विपरीत, यदि समान प्रकाशनों में 25, 8, 5, 3, और 3 उद्धरण हैं, तो सूचकांक 3 है (अर्थात तीसरा स्थान) क्योंकि चौथे पेपर में केवल 3 उद्धरण हैं।


 * f(A)=10, f(B)=8, f(C)=5, f(D)=4, f(E)=3　→ h-index=4
 * f(A)=25, f(B)=8, f(C)=5, f(D)=3, f(E)=3　→ h-index=3

यदि हमारे पास फलन एफ को सबसे बड़े से घटते क्रम में क्रमबद्ध किया गया है।

सबसे कम मान पर, हम एच-सूचकांक की गणना इस प्रकार कर सकते हैं:


 * h-index (f) = $$\max\{i\in\N: f(i)\ge i\}$$

हिर्श सूचकांक साइकिल चलाने के लिए आर्थर एडिंगटन नंबर के अनुरूप है, जो इस प्रकार साइकिल चालकों के मानांकन के लिए उपयोग किया जाने वाला पुराना सूचकांक है। इस प्रकार एच-सूचकांक व्यापक सुगेनो और क्यू फैन आव्यूह से भी संबंधित है। इसके आधार पर एच-सूचकांक किसी विशेष शोधकर्ता के कार्य के प्रभाव के मानांकन में अधिक पारंपरिक साधारण प्रभाव के कारक के लिए आव्यूह के विकल्प के रूप में कार्य करता है। चूँकि केवल सर्वाधिक उद्धृत लेख ही एच-सूचकांक में योगदान करते हैं, इसलिए इसका निर्धारण सरल प्रक्रिया है। इस प्रकार हिर्श ने प्रदर्शित किया है कि किसी वैज्ञानिक ने राष्ट्रीय अकादमी सदस्यता या नोबेल पुरस्कार जैसे सम्मान जीते हैं या नहीं, इसके लिए h का उच्च पूर्वानुमानित मान है। इस प्रकार जैसे-जैसे उद्धरण एकत्रित होते जाते हैं, उसी प्रकार एच-सूचकांक बढ़ता जाता है और इस प्रकार यह शोधकर्ता की शैक्षणिक उम्र पर निर्भर करता है।

इनपुट डेटा
एच-सूचकांक को उद्धरण डेटाबेस का उपयोग करके या स्वचालित टूल का उपयोग करके मैन्युअल रूप से निर्धारित किया जा सकता है। स्कोपस और वेब ऑफ़ साइंस जैसे सदस्यता-आधारित डेटाबेस स्वचालित कैलकुलेटर प्रदान करते हैं। इस प्रकार जुलाई 2011 से गूगल ने अपने स्वयं के गूगल स्काॅलर प्रोफ़ाइल में स्वचालित रूप से गणना की गई एच-सूचकांक और आई10-सूचकांक प्रदान की गयी है। इसके अतिरिक्त, विशिष्ट डेटाबेस, जैसे इंस्पायर-एचईपी डेटाबेस, उच्च ऊर्जा भौतिकी में कार्य करने वाले शोधकर्ताओं के लिए स्वचालित रूप से एच-सूचकांक की गणना कर सकते हैं।

अलग-अलग कवरेज के कारण, प्रत्येक डेटाबेस ही विद्वान के लिए अलग एच उत्पन्न करने की संभावना रखता है। इसके विस्तृत अध्ययन से पता चला है कि वेब ऑफ साइंस में साधारण प्रकाशनों की उत्तम कवरेज है, अपितु इस प्रकार उच्च प्रभाव वाले सम्मेलनों की कमजोर कवरेज है। इस प्रकार स्कोपस के पास सम्मेलनों का उत्तम कवरेज है, अपितु 1996 से पहले के प्रकाशनों का कवरेज अनुपयोगी है, इस प्रकार गूगल स्काॅलर के पास सम्मेलनों और अधिकांश पत्रिकाओं (चूंकि सभी नहीं) का सबसे अच्छा कवरेज है, अपितु इस प्रकार स्कोपस के समान 1990 से पहले के प्रकाशनों का कवरेज सीमित किया जाता है। कंप्यूटर विज्ञान के विद्वानों के लिए सम्मेलन प्रतिक्रिया पत्रों का बहिष्कार विशेष समस्या है, जहां सम्मेलन प्रतिक्रिया को साहित्य का महत्वपूर्ण भाग माना जाता है। इस प्रकार गूगल स्काॅलर की उद्धरण गणना में ग्रे साहित्य समेत इस उद्धरण को तैयार करने और खोज शब्दों को संयोजित करते समय बूलियन तर्क के नियमों का पालन करने में विफल रहने के लिए आलोचना की गई है। इस प्रकार उदाहरण के लिए, मेहो और यांग अध्ययन में पाया गया कि गूगल स्काॅलर ने वेब ऑफ साइंस और स्कोपस की तुलना में 53% अधिक उद्धरणों की पहचान की, अपितु ध्यान दिया कि क्योंकि गूगल स्काॅलर द्वारा रिपोर्ट किए गए अधिकांश अतिरिक्त उद्धरण कम प्रभाव वाली पत्रिकाओं या सम्मेलन की प्रतिक्रिया से थे, इसलिए उन्होंने ऐसा किया था। इस प्रकार व्यक्तियों की सापेक्ष रैंकिंग में महत्वपूर्ण परिवर्तन नहीं होती हैं। इस प्रकार यह सुझाव दिया गया है कि संभावित उद्धरण डेटाबेस में मापे गए एकल अकादमिक के लिए एच में कभी-कभी व्यापक भिन्नता से निपटने के लिए, किसी को यह मान लेना चाहिए कि डेटाबेस में असत्य ऋणात्मक तथा असत्य धनात्मक की तुलना में अधिक समस्याग्रस्त हैं और इसके कारण अकादमिक के लिए मापा गया अधिकतम एच लेना चाहिए।

उदाहरण
विभिन्न संस्थानों, राष्ट्रों, समयों और शैक्षणिक क्षेत्रों में एच-सूचकांक कैसे व्यवहार करता है, इस पर बहुत कम व्यवस्थित जांच की गई है। इस प्रकार हिर्श ने सुझाव दिया कि, भौतिकविदों के लिए, प्रमुख [यूएस] अनुसंधान विश्वविद्यालयों में कार्यकाल (एसोसिएट प्रोफेसर) की उन्नति के लिए लगभग 12 का एच मान विशिष्ट हो सकता है। इस प्रकार लगभग 18 के मान का अर्थ पूर्ण प्रोफेसरशिप हो सकता है, 15-20 का अर्थ अमेरिकन फिजिकल सोसायटी में फेलोशिप हो सकता है, और 45 या उससे अधिक का अर्थ यूनाइटेड स्टेट्स नेशनल एकेडमी ऑफ साइंसेज में सदस्यता हो सकता है। इस प्रकार हिर्श ने अनुमान लगाया कि 20 वर्षों के बाद सफल वैज्ञानिक का एच-सूचकांक 20 होगा, उत्कृष्ट वैज्ञानिक का एच-सूचकांक 40 होगा, और वास्तव में अद्वितीय व्यक्ति का एच-सूचकांक 60 होगा।

1983-2002 की अवधि में सबसे अधिक उद्धृत वैज्ञानिकों के लिए, हिर्श ने जीवन विज्ञान में शीर्ष 10 की पहचान की (घटते एच के क्रम में): सोलोमन एच. स्नाइडर, एच = 191, डेविड बाल्टीमोर, एच = 160, रॉबर्ट सी. गैलो, एच = 154, पियरे चैंबोन, एच = 153, बर्ट वोगेलस्टीन, एच = 151, साल्वाडोर मोनकाडा, एच = 143. चार्ल्स ए. डिनारेलो, एच = 138, तदामित्सु किशिमोटो, एच = 134, रोनाल्ड एम. इवांस, एच = 127, और राल्फ एल ब्रिंस्टर, एच = 126 या 2005 में जैविक और बायोमेडिकल विज्ञान में नेशनल एकेडमी ऑफ साइंसेज में 36 नए शामिल लोगों में, औसत एच-सूचकांक 57 था। चूंकि इस प्रकार हिर्श ने कहा कि अलग-अलग क्षेत्रों में एच का मान अलग-अलग होगा।

आवश्यक विज्ञान संकेतक उद्धरण सीमा में सूचीबद्ध 22 वैज्ञानिक विषयों में [इस प्रकार गैर-विज्ञान शिक्षाविदों को छोड़कर] अंतरिक्ष विज्ञान के पश्चात भौतिकी में दूसरा सबसे अधिक उद्धरण है। 1 जनवरी, 2000 - 28 फरवरी, 2010 की अवधि के समय, भौतिक विज्ञानी को संसार के सबसे अधिक उद्धृत 1% भौतिकविदों में से होने के लिए 2073 उद्धरण प्राप्त करने थे। इस प्रकार अंतरिक्ष विज्ञान के लिए सीमा उच्चतम (2236 उद्धरण) है, और भौतिकी के बाद नैदानिक ​​​​चिकित्सा (1390) और आणविक जीव विज्ञान और आनुवंशिकी (1229) का स्थान आता है। इस प्रकार अधिकांश विषयों, जैसे पर्यावरण/पारिस्थितिकी (390) में कम वैज्ञानिक, कम पेपर और कम उद्धरण हैं। इसलिए, इन विषयों में आवश्यक विज्ञान संकेतकों में उद्धरण सीमा कम है, इस प्रकार सामाजिक विज्ञान (154), कंप्यूटर विज्ञान (149), और बहु-विषयक विज्ञान (147) में उद्धरण सीमा सबसे कम देखी गई है।

सामाजिक विज्ञान विषयों में संख्याएं बहुत भिन्न हैं: लंदन स्कूल ऑफ इकोनॉमिक्स में सामाजिक विज्ञान टीम के प्रभाव ने पाया कि यूनाइटेड किंगडम में सामाजिक वैज्ञानिकों का औसत एच-सूचकांक कम था। इसके आधार पर गूगल स्कॉलर डेटा के आधार पर (पूर्ण) प्रोफेसरों के लिए एच-सूचकांक 2.8 (कानून में), 3.4 (राजनीति विज्ञान में), 3.7 (समाजशास्त्र में), 6.5 (भूगोल में) और 7.6 (अर्थशास्त्र में) तक था। इस प्रकार सभी विषयों में औसतन, सामाजिक विज्ञान के प्रोफेसर का एच-सूचकांक व्याख्याता या वरिष्ठ व्याख्याता की तुलना में लगभग दोगुना था, चूंकि भूगोल में यह अंतर सबसे कम था।

लाभ
हिर्श ने एच-सूचकांक का उद्देश्य अन्य ग्रंथसूची संकेतकों के मुख्य हानि को संबोधित करना था। इस प्रकार पेपर सूचकांक की कुल संख्या वैज्ञानिक प्रकाशनों की गुणवत्ता के लिए उत्तरदायी नहीं है। दूसरी ओर उद्धरण आव्यूह की कुल संख्या, प्रमुख प्रभाव वाले एकल प्रकाशन में भागीदारी से भारी रूप से प्रभावित हो सकती है, (उदाहरण के लिए, सफल नई तकनीकों, विधियों या अनुमानों का प्रस्ताव करने वाले पद्धति संबंधी कागजात, जो बड़ी संख्या में उद्धरण उत्पन्न कर सकते हैं)। इस प्रकार एच-सूचकांक का उद्देश्य वैज्ञानिक आउटपुट की गुणवत्ता और मात्रा को साथ मापना है। इस प्रकार 2010 तक एच-सूचकांक ने केंडल रैंक सहसंबंध गुणांक दिखाया था, इस प्रकार वैज्ञानिकों के पुरस्कारों के साथ केंडल का सहसंबंध 0.3 से 0.4 था।

आलोचना
ऐसी कई स्थितियाँ हैं जिनमें एच किसी वैज्ञानिक के आउटपुट के बारे में भ्रामक जानकारी प्रदान कर सकता है। एच-सूचकांक के व्यापक उपयोग के बाद 2010 से एच-सूचकांक और वैज्ञानिक पुरस्कारों के बीच संबंध में काफी गिरावट आई है, इसके आधार पर गुडहार्ट के नियम का पालन करते हुए सहसंबंध में कमी आंशिक रूप से प्रति पेपर 100 से अधिक सह-लेखकों के साथ हाइपरऑथरशिप के प्रसार के लिए उत्तरदायी है।

निम्नलिखित में से कुछ विफलताएं एच-सूचकांक के लिए विशिष्ट नहीं हैं, अपितु अन्य लेखक-स्तरीय आव्यूह आलोचना या लेखक-स्तरीय आव्यूह के साथ साझा की जाती हैं:
 * एच-सूचकांक किसी पेपर के लेखकों की संख्या को ध्यान में नहीं रखता है। इस प्रकार मूल पेपर में, हिर्श ने सह-लेखकों के बीच उद्धरणों को विभाजित करने का सुझाव दिया था। ऐसे ही भिन्नात्मक सूचकांक एच-फ्रैक्शन के समान हैं।
 * एच-सूचकांक विभिन्न क्षेत्रों में उद्धरणों की अलग-अलग विशिष्ट संख्या को ध्यान में नहीं रखता है, उदाहरण के लिए सैद्धांतिक रूप से अधिक प्रयोगात्मक या सामान्यतः उद्धरण व्यवहार क्षेत्र-निर्भर कारकों से प्रभावित होता है, जो न केवल सभी विषयों में अपितु अनुशासन के अनुसंधान के विभिन्न क्षेत्रों में भी तुलना को अमान्य कर सकता है।
 * एच-सूचकांक लेखकों की सूची में लेखक प्लेसमेंट में निहित जानकारी को निरस्त कर देता है, इस प्रकार जो कुछ वैज्ञानिक क्षेत्रों में महत्वपूर्ण है, चूंकि अन्य प्लेसमेंट में यह निहित नहीं है।
 * एच-सूचकांक पूर्णांक है, जो इसकी भेदभावपूर्ण शक्ति को कम करता है। फ्रांसिस पी रुआन और रिचर्ड टोल इसलिए परिमेय संख्या एच-सूचकांक का प्रस्ताव करते हैं, जो इस प्रकार एच और एच + 1 के बीच अंतरण करता है।

प्रवृत्त संभावना
इस प्रकार पायी जाने वाली कमियों के लिए वैज्ञानिक या अकादमिक आउटपुट की विशुद्ध मात्रात्मक गणना पर लागू होती हैं। इसके कारण अन्य आव्यूह के समान जो उद्धरणों की गिनती करते हैं, इनमें एच-सूचकांक को बलपूर्वक उद्धरण द्वारा प्रवृत्त किया जा सकता है, अभ्यास जिसमें पत्रिका का संपादक लेखकों को अपने स्वयं के लेखों में असत्य उद्धरण जोड़ने के लिए मजबूर करता है, इससे पहले कि पत्रिका इसे प्रकाशित करने के लिए सहमत हो जाती हैं। इस प्रकार स्व-उद्धरण के माध्यम से एच-सूचकांक में प्रवृत्त किया जा सकता है,  और इस प्रकार यदि गूगल स्काॅलर आउटपुट पर आधारित है, तो उस उद्देश्य के लिए कंप्यूटर प्रकाशित डाॅक्यूमेंट्स का भी उपयोग किया जा सकता है, इस प्रकार उदाहरण के लिए साईजेन का उपयोग करता हैं। इसके कारण एच-सूचकांक को हाइपरऑथरशिप द्वारा भी प्रवृत्त किया जा सकता है। वर्तमान समय में शोध द्वारा स्पष्ट रूप से यह पता चला है कि वैज्ञानिक समुदाय द्वारा मान्यता का संकेत देने वाले पुरस्कारों के साथ एच-सूचकांक के सहसंबंध में अधिक गिरावट आई है।

अन्य कमियाँ
एक अध्ययन में एच-सूचकांक को प्रति पेपर माध्य उद्धरणों के सरल माप की तुलना में थोड़ा कम पूर्वानुमानित सटीकता और परिशुद्धता पाया गया है। चूंकि, इस निष्कर्ष का हिर्श के अन्य अध्ययन द्वारा खंडन किया गया था। इस प्रकार एच-सूचकांक किसी विद्वान के लिए उद्धरणों की कुल संख्या की तुलना में प्रभाव का अधिक सटीक माप प्रदान नहीं करता है। विशेष रूप से डाॅक्यूमेंट्स के बीच उद्धरणों के वितरण को यादृच्छिक पूर्णांक विभाजन के रूप में और एच-सूचकांक को विभाजन के डर्फी वर्ग के रूप में मॉडलिंग करके, योंग सूत्र $$h\approx 0.54\sqrt N$$ पर पहुंचे थे, जहाँ इस प्रकार एन उद्धरणों की कुल संख्या है, जो कि नेशनल एकेडमी ऑफ साइंसेज के गणित सदस्यों के लिए अधिकांश स्थितियों में एच-सूचकांक का सटीक (सामान्यतः 10-20 प्रतिशत के भीतर त्रुटियों के साथ) अनुमान प्रदान करता है।

विकल्प और संशोधन
विभिन्न विशेषताओं पर जोर देने के लिए एच-सूचकांक को संशोधित करने के विभिन्न प्रस्ताव बनाए गए हैं।  इनमें से कई वेरिएंट, जैसे कि जी सूचकांक, मूल एच-सूचकांक के साथ अत्यधिक सहसंबद्ध हैं और इसलिए अनावश्यक हैं। इसके आधार पर वे आव्यूह जो वर्तमान समय में एच-सूचकांक के साथ अत्यधिक सहसंबद्ध नहीं है और वैज्ञानिक पुरस्कारों के साथ सहसंबद्ध है, वे एच-फ्रैक है।

अनुप्रयोग
एच-सूचकांक के समान सूचकांकों को लेखक या सामान्य मानांकन के बाहर लागू किया गया है।

एच-सूचकांक को यूट्यूब चैनलों जैसे इंटरनेट मीडिया पर लागू किया गया है। इसे इस प्रकार ≥ h × 105व्यू वाले वीडियो की संख्या के रूप में परिभाषित किया गया है, जब किसी वीडियो निर्माता की कुल दृश्य संख्या के साथ तुलना की जाती है, तो इस प्रकार एच-सूचकांक और जी-सूचकांक ही सूचकांक में उत्पादकता और प्रभाव दोनों को उत्तम विधि से कैप्चर किया जाता हैं।

संस्थानों के लिए क्रमिक हिर्श-प्रकार सूचकांक भी तैयार किया गया है। इस प्रकार वैज्ञानिक संस्थान में आई का क्रमिक हिर्श-प्रकार सूचकांक होता है, जब इस संस्थान के कम से कम आई शोधकर्ताओं के पास कम से कम आई का एच-सूचकांक होता है।

यह भी देखें

 * ग्रंथ सूची
 * अनुसंधान नेटवर्किंग टूल और अनुसंधान प्रोफाइलिंग सिस्टम की तुलना

बाहरी संबंध

 * गूगल स्काॅलर Metrics
 * H-index for computer science and electronics
 * H-index for economists
 * H-index for computer science researchers
 * H - index for computer scientists from गूगल स्काॅलर
 * H-index for astronomers
 * Publication and Citation-based Impact, listing 252 impact measures for one researcher with link to source code