डेटा विज्ञान

From Vigyanwiki

धूमकेतु निओवाइज (यहां लाल बिंदुओं की एक श्रृंखला के रूप में दर्शाया गया है) के अस्तित्व की खोज अंतरिक्ष दूरबीन, वाइड-फील्ड इन्फ्रारेड सर्वे एक्सप्लोरर द्वारा प्राप्त खगोलीय सर्वेक्षण डेटा का विश्लेषण करके की गई थी।

सूचना विज्ञान एक अंतःविषय शैक्षणिक क्षेत्र है [1] जो नॉइज़, संरचित और असंरचित डेटा से अवबोधन और अंतर्दृष्टि निकालने या बहिर्वेशन करने के लिए सांख्यिकी, वैज्ञानिक कंप्यूटिंग, वैज्ञानिक विधियों, प्रक्रियाओं, कलन विधि और प्रणाली का उपयोग करता है। [2] सूचना विज्ञान अंतर्निहित एप्लिकेशन कार्यक्षेत्र (जैसे, प्राकृतिक विज्ञान, सूचना प्रौद्योगिकी और चिकित्सा) से कार्यक्षेत्र ज्ञान को भी एकीकृत करता है। [3] डेटा विज्ञान बहुआयामी है और इसे एक विज्ञान, शोध प्रतिमान, शोध पद्धति, अनुशासन, एक कार्यप्रवाह और एक व्यवसाय के रूप में वर्णित किया जा सकता है।[4]

सूचना विज्ञान डेटा के साथ वास्तविक घटनाओं को समझने और उनका विश्लेषण करने के लिए सांख्यिकी, डेटा विश्लेषण, सूचना विज्ञान और उनसे संबंधित वैज्ञानिक तरीकों को एकीकृत करने की एक अवधारणा है। [5] यह गणित, सांख्यिकी, कंप्यूटर विज्ञान, सूचना विज्ञान और कार्यक्षेत्र ज्ञान के संदर्भ में कई क्षेत्रों से ली गई तकनीकों और सिद्धांतों का उपयोग करता है। [6] हालाँकि, डेटा विज्ञान कंप्यूटर विज्ञान और सूचना विज्ञान से अलग है। ट्यूरिंग पुरस्कार विजेता जिम ग्रे (कंप्यूटर वैज्ञानिक) ने विज्ञान के चौथे प्रतिमान (अनुभवजन्य अनुसंधान, बुनियादी अनुसंधान, कम्प्यूटेशनल विज्ञान, और अब डेटा-संचालित) के रूप में डेटा विज्ञान की कल्पना की और दावा किया कि सूचना प्रौद्योगिकी के प्रभाव के कारण विज्ञान के बारे में सब कुछ बदल रहा है ।[7][8]

डेटा वैज्ञानिक एक व्य्वसायी है जो प्रोग्रामिंग कोड बनाता है और डेटा से अंतर्दृष्टि बनाने के लिए इसे सांख्यिकीय ज्ञान के साथ जोड़ता है।[9]


नींव

सूचना विज्ञान एक अंतर्विषयक अकादमिक अनुशासन है [10] सामान्यतः बड़े डेटा सेट से ज्ञान निकालने और उस डेटा से अवबोधन और अंतर्दृष्टि को आवेदन कार्यक्षेत्र की एक विस्तृत श्रृंखला में समस्या-समाधान पर लागू करने पर केंद्रित है। [11] क्षेत्र में विश्लेषण के लिए डेटा तैयार करना, डेटा विज्ञान की समस्याओं को तैयार करना, विश्लेषण डेटा, डेटा-संचालित समाधान विकसित करना और आवेदन कार्यक्षेत्र की एक विस्तृत श्रृंखला में उच्च-स्तरीय निर्णयों को सूचित करने के लिए निष्कर्ष प्रस्तुत करना सम्मिलित है। जैसे, यह कंप्यूटर विज्ञान, सांख्यिकी, सूचना विज्ञान, गणित, डेटा विज़ुअलाइजेशन, सूचना विज़ुअलाइजेशन, डेटा सोनिफिकेशन, डेटा एकीकरण, ग्राफ़िक डिज़ाइन, जटिल प्रणाली, संचार और व्यवसाय से कौशल को सम्मिलित करता है। [12][13] सांख्यिकीविद् नाथन याउ, बेन फ्राई पर आरेखण, डेटा विज्ञान को मानव-कंप्यूटर पारस्परिक प्रभाव से भी जोड़ता है: उपयोगकर्ताओं को सहजता से डेटा को नियंत्रित करने और अन्वेषण करने में सक्षम होना चाहिए। [14][15] 2015 में, अमेरिकी सांख्यिकीय संघ ने डेटाबेस प्रबंधन, सांख्यिकी और यंत्र अधिगम, और वितरित कंप्यूटिंग को तीन उभरते मूलभूत व्यावसायिक समुदायों के रूप में पहचाना था। [16]


आँकड़ों से संबंध

नैट सिल्वर सहित कई सांख्यिकीविदों ने तर्क दिया है कि डेटा विज्ञान कोई नया क्षेत्र नहीं है, बल्कि सांख्यिकी का दूसरा नाम है। [17] दूसरों का तर्क है कि डेटा विज्ञान सांख्यिकी से अलग है क्योंकि यह डिजिटल डेटा के लिए अद्वितीय समस्याओं और तकनीकों पर केंद्रित है।[18] वसंत धार लिखते हैं कि सांख्यिकी मात्रात्मक डेटा और विवरण पर जोर देती है। इसके विपरीत, डेटा विज्ञान मात्रात्मक और गुणात्मक डेटा (जैसे छवियों, पाठ, सेंसर, लेनदेन, ग्राहक जानकारी आदि) से संबंधित है और भविष्यवाणी और कार्रवाई पर जोर देता है।[19] कोलंबिया विश्वविद्यालय के एंड्रयू गेलमैन ने सांख्यिकी को डेटा विज्ञान का एक गैर-आवश्यक हिस्सा बताया है।[20]

स्टैनफोर्ड के प्रोफेसर डेविड डोनोहो लिखते हैं कि डेटा विज्ञान को डेटासेट के आकार या कंप्यूटिंग के उपयोग से आँकड़ों से अलग नहीं किया जाता है और कई स्नातक कार्यक्रम डेटा-विज्ञान कार्यक्रम के सार के रूप में अपने एनालिटिक्स और सांख्यिकी प्रशिक्षण को भ्रामक रूप से विज्ञापित करते हैं। वह सूचना विज्ञान को पारंपरिक आंकड़ों से विकसित होने वाले एक अनुप्रयुक्त क्षेत्र के रूप में वर्णित करता है।[21]


व्युत्पत्ति

प्रारंभिक उपयोग

1962 में,जॉन टुकी ने एक क्षेत्र का वर्णन किया जिसे उन्होंने डेटा विश्लेषण कहा, जो आधुनिक डेटा विज्ञान से मिलता जुलता है। [21] 1985 में, बीजिंग में चाइनीज एकेडमी ऑफ साइंसेज को दिए गए एक व्याख्यान में, सी. एफ. जेफ वू ने आंकड़ों के वैकल्पिक नाम के रूप में पहली बार सूचना विज्ञान शब्द का उपयोग किया।[22] बाद में, मोंटपेलियर II विश्वविद्यालय में 1992 के सांख्यिकी संगोष्ठी में उपस्थित लोगों ने कंप्यूटिंग के साथ सांख्यिकी और डेटा विश्लेषण की स्थापित अवधारणाओं और सिद्धांतों के संयोजन, विभिन्न मूल और रूपों के डेटा पर केंद्रित एक नए अनुशासन के उद्भव को स्वीकार किया।[23][24]

सूचना विज्ञान शब्द का पता 1974 में लगाया गया है, जब पीटर नौर ने इसे कंप्यूटर साइंस के वैकल्पिक नाम के रूप में प्रस्तावित किया था। [6] 1996 में, इंटरनेशनल फेडरेशन ऑफ क्लासिफिकेशन सोसाइटीज विशेष रूप से सूचना विज्ञान को एक विषय के रूप में प्रस्तुत करने वाला पहला सम्मेलन बन गया। [6] हालाँकि, परिभाषा अभी भी प्रवाह में थी। बीजिंग में चाइनीज एकेडमी ऑफ साइंसेज में 1985 के व्याख्यान के बाद, 1997 में सी. एफ. जेफ वू ने फिर से सुझाव दिया कि सांख्यिकी का नाम बदलकर सूचना विज्ञान होना चाहिए। उन्होंने तर्क दिया कि एक नया नाम आँकड़ों को गलत रूढ़िवादिता को दूर करने में सहायता करेगा, जैसे कि लेखांकन का पर्यायवाची होना या डेटा का वर्णन करने तक सीमित होना। [25] 1998 में, हयाशी चिकियो ने सूचना विज्ञान के लिए एक नई, अंतःविषय अवधारणा के रूप में तीन पहलुओं के साथ तर्क दिया: डेटा डिज़ाइन, संग्रह और विश्लेषण।[24]

1990 के दशक के दौरान, डेटासेट (जो तीव्रता से बड़े होते जा रहे थे) में प्रतिरूप खोजने की प्रक्रिया के लिए लोकप्रिय शब्दों में ज्ञान की खोज और डेटा खनन सम्मिलित थे।[6][26]


आधुनिक उपयोग

2012 में, प्रौद्योगिकीविद् थॉमस एच. डेवनपोर्ट और डीजे पाटिल ने डेटा साइंटिस्ट: द सेक्सिएस्ट जॉब ऑफ़ द 21 सेंचुरी की घोषणा की, [27] एक कैच-वाक्यांश जिसे न्यूयॉर्क टाइम्स और बोस्टन ग्लोब जैसे प्रमुख शहर के समाचार पत्रों द्वारा भी उठाया गया था। [28] [29] एक दशक बाद, उन्होंने यह कहते हुए इसकी फिर से पुष्टि की कि नियोक्ताओं के बीच नौकरी की पहले से कहीं अधिक मांग है। [30] एक स्वतंत्र विषय के रूप में डेटा विज्ञान की आधुनिक अवधारणा का श्रेय कभी-कभी विलियम एस. क्लीवलैंड को दिया जाता है। [31] 2001 के एक पत्र में, उन्होंने सिद्धांत से परे तकनीकी क्षेत्रों में सांख्यिकी के विस्तार की वकालत की; क्योंकि इससे क्षेत्र में काफी बदलाव आएगा, इसने एक नए नाम की प्रत्याभुति दी थी। [26] अगले कुछ वर्षों में सूचना विज्ञान का अधिक व्यापक रूप से उपयोग किया जाने लगा: 2002 में, विज्ञान और प्रौद्योगिकी के लिए डेटा संबंधी समिति ने सूचना विज्ञान जर्नल प्रक्षेपित किया था। 2003 में, कोलंबिया विश्वविद्यालय ने द जर्नल ऑफ़ सूचना विज्ञान प्रक्षेपित किया था। [26] 2014 में, अमेरिकन स्टैटिस्टिकल एसोसिएशन के सेक्शन ऑन स्टैटिस्टिकल लर्निंग एंड डेटा माइनिंग ने अपना नाम बदलकर स्टैटिस्टिकल लर्निंग एंड सूचना विज्ञान कर लिया, जो सूचना विज्ञान की बढ़ती लोकप्रियता को दर्शाता है।[32]

2008 में डेटा वैज्ञानिक के व्यावसायिक खिताब का श्रेय डीजे पाटिल और जेफ हैमरबैकर को दिया गया था। [33] हालांकि राष्ट्रीय विज्ञान बोर्ड द्वारा अपनी 2005 की विवरणी लॉन्ग-लिव डिजिटल डेटा कलेक्शंस: इनेबलिंग रिसर्च एंड एजुकेशन इन द ट्वेंटी फर्स्ट सेंचुरी में इसका उपयोग किया गया था, लेकिन यह स्थूलतः डिजिटल डेटा संग्रह के प्रबंधन में किसी भी महत्वपूर्ण भूमिका को संदर्भित करता है। [34] डेटा विज्ञान की परिभाषा पर अभी भी कोई सामान्य सहमति नहीं है, और कुछ लोगों द्वारा इसे मूलमंत्र माना जाता है। [35] बिग डेटा एक संबंधित विपणन शब्द है। [36] डेटा वैज्ञानिक बड़े डेटा को प्रयोग करने योग्य जानकारी में तोड़ने और सॉफ़्टवेयर और कलन विधि बनाने के लिए त्तर्दायी हैं जो कंपनियों और संगठनों को इष्टतम संचालन निर्धारित करने में सहायता करते हैं।[37]


यह भी देखें

संदर्भ

  1. Donoho, David (2017). "50 Years of Data Science". Journal of Computational and Graphical Statistics. 26 (4): 745–766. doi:10.1080/10618600.2017.1384734. S2CID 114558008.
  2. Dhar, V. (2013). "डेटा विज्ञान और भविष्यवाणी". Communications of the ACM. 56 (12): 64–73. doi:10.1145/2500499. S2CID 6107147. Archived from the original on 9 November 2014. Retrieved 2 September 2015.
  3. Danyluk, A.; Leidig, P. (2021). अंडरग्रेजुएट डेटा साइंस पाठ्यक्रम के लिए कम्प्यूटिंग दक्षताएं (PDF). ACM Data Science Task Force Final Report (Report).
  4. Mike, Koby; Hazzan, Orit (20 January 2023). "What is Data Science?". Communications of the ACM. 66 (2): 12–13. doi:10.1145/3575663. ISSN 0001-0782.
  5. Hayashi, Chikio (1 January 1998). "What is Data Science? Fundamental Concepts and a Heuristic Example". In Hayashi, Chikio; Yajima, Keiji; Bock, Hans-Hermann; Ohsumi, Noboru; Tanaka, Yutaka; Baba, Yasumasa (eds.). डेटा विज्ञान, वर्गीकरण और संबंधित तरीके. Studies in Classification, Data Analysis, and Knowledge Organization (in English). Springer Japan. pp. 40–51. doi:10.1007/978-4-431-65950-1_3. ISBN 9784431702085.
  6. 6.0 6.1 6.2 6.3 Cao, Longbing (29 June 2017). "Data Science: A Comprehensive Overview". ACM Computing Surveys. 50 (3): 43:1–43:42. doi:10.1145/3076253. ISSN 0360-0300. S2CID 207595944.
  7. Tony Hey; Stewart Tansley; Kristin Michele Tolle (2009). The Fourth Paradigm: Data-intensive Scientific Discovery. Microsoft Research. ISBN 978-0-9825442-0-4. Archived from the original on 20 March 2017.
  8. Bell, G.; Hey, T.; Szalay, A. (2009). "Computer Science: Beyond the Data Deluge". Science. 323 (5919): 1297–1298. doi:10.1126/science.1170411. ISSN 0036-8075. PMID 19265007. S2CID 9743327.
  9. Davenport, Thomas H.; Patil, D. J. (October 2012). "Data Scientist: The Sexiest Job of the 21st Century". Harvard Business Review. 90 (10): 70–76, 128. PMID 23074866. Retrieved 18 January 2016.
  10. Emmert-Streib, Frank; Dehmer, Matthias (2018). "समुदाय के डेटा-संचालित परिमाणीकरण द्वारा डेटा विज्ञान को परिभाषित करना". Machine Learning and Knowledge Extraction. 1: 235–251. doi:10.3390/make1010015.
  11. "डेटा साइंस के बारे में". Data Science Association. Archived from the original on 10 August 2020. Retrieved 3 April 2020.
  12. "1. Introduction: What Is Data Science?". Doing Data Science [Book] (in English). O’Reilly. Retrieved 3 April 2020.
  13. "डेटा गीक्स के तीन सेक्सी कौशल". m.e.driscoll: data utopian (in English). 27 May 2009. Retrieved 3 April 2020.
  14. Yau, Nathan (4 June 2009). "डेटा साइंटिस्ट का उदय". FlowingData (in English). Retrieved 3 April 2020.
  15. "मूल उदाहरण". benfry.com. Retrieved 3 April 2020.
  16. "डेटा विज्ञान में सांख्यिकी की भूमिका पर एएसए वक्तव्य". AmStatNews. American Statistical Association. 1 October 2015. Archived from the original on 20 June 2019. Retrieved 29 May 2019.
  17. "Nate Silver: What I need from statisticians". Statistics Views. Retrieved 3 April 2020.
  18. "What's the Difference Between Data Science and Statistics?". Priceonomics (in English). 13 October 2015. Retrieved 3 April 2020.
  19. Vasant Dhar (1 December 2013). "डेटा विज्ञान और भविष्यवाणी". Communications of the ACM (in English). 56 (12): 64–73. doi:10.1145/2500499. S2CID 6107147.
  20. "Statistics is the least important part of data science « Statistical Modeling, Causal Inference, and Social Science". statmodeling.stat.columbia.edu. Retrieved 3 April 2020.
  21. 21.0 21.1 Donoho, David (18 September 2015). "50 years of Data Science" (PDF). Retrieved 2 April 2020.
  22. Wu, C. F. Jeff (1986). "Future directions of statistical research in China: a historical perspective" (PDF). Application of Statistics and Management. 1: 1–7. Retrieved 29 November 2020.
  23. Escoufier, Yves; Hayashi, Chikio; Fichet, Bernard, eds. (1995). डेटा विज्ञान और इसके अनुप्रयोग. Tokyo: Academic Press/Harcourt Brace. ISBN 0-12-241770-4. OCLC 489990740.
  24. 24.0 24.1 Murtagh, Fionn; Devlin, Keith (2018). "The Development of Data Science: Implications for Education, Employment, Research, and the Data Revolution for Sustainable Development". Big Data and Cognitive Computing (in English). 2 (2): 14. doi:10.3390/bdcc2020014.
  25. Wu, C. F. Jeff. "Statistics=Data Science?" (PDF). Retrieved 2 April 2020.
  26. 26.0 26.1 26.2 Press, Gil. "डेटा विज्ञान का एक बहुत छोटा इतिहास". Forbes (in English). Retrieved 3 April 2020.
  27. Davenport, Thomas (1 October 2012). "Data Scientist: The Sexiest Job of the 21st Century". Harvard Business Review. Retrieved 10 October 2022.
  28. Miller, Claire (4 April 2013). "Data Science: The Numbers of Our Lives". New York Times. New York City. Retrieved 10 October 2022.
  29. Borchers, Callum (11 November 2015). "Behind the scenes of the 'sexiest job of the 21st century'". Boston Globe. Boston. Retrieved 10 October 2022.
  30. Davenport, Thomas (15 July 2022). "Is Data Scientist Still the Sexiest Job of the 21st Century?". Harvard Business Review. Retrieved 10 October 2022.
  31. Gupta, Shanti (11 December 2015). "विलियम एस क्लीवलैंड". Retrieved 2 April 2020.
  32. Talley, Jill (1 June 2016). "एएसए ने डेटा साइंस में स्कोप, आउटरीच टू फोस्टर ग्रोथ, सहयोग का विस्तार किया". Amstat News. American Statistical Association.
  33. Davenport, Thomas H.; Patil, D. J. (1 October 2012). "Data Scientist: The Sexiest Job of the 21st Century". Harvard Business Review. No. October 2012. ISSN 0017-8012. Retrieved 3 April 2020.
  34. "US NSF – NSB-05-40, Long-Lived Digital Data Collections Enabling Research and Education in the 21st Century". www.nsf.gov. Retrieved 3 April 2020.
  35. Press, Gil. "Data Science: What's The Half-Life of a Buzzword?". Forbes (in English). Retrieved 3 April 2020.
  36. Pham, Peter. "बिग डेटा के प्रभाव जिनके बारे में आपने शायद नहीं सुना होगा". Forbes (in English). Retrieved 3 April 2020.
  37. Martin, Sophia (20 September 2019). "How Data Science will Impact Future of Businesses?". Medium (in English). Retrieved 3 April 2020.