डेटा विज्ञान: Difference between revisions

From Vigyanwiki
(Created page with "{{short description|Interdisciplinary field of study on deriving knowledge and insights from data}} {{Distinguish|information science}} {{Use dmy dates|date=August 2021}} Fi...")
 
(text)
Line 1: Line 1:
{{short description|Interdisciplinary field of study on deriving knowledge and insights from data}}
{{short description|Interdisciplinary field of study on deriving knowledge and insights from data}}
{{Distinguish|information science}}
{{Distinguish|सूचना विज्ञान}}
{{Use dmy dates|date=August 2021}}
{{Use dmy dates|date=August 2021}}
[[File: PIA23792-1600x1200(1).jpg|thumb|[[धूमकेतु NEOWISE]] (यहां लाल डॉट्स की एक श्रृंखला के रूप में दर्शाया गया है) के अस्तित्व की खोज [[अंतरिक्ष दूरबीन]], [[वाइड-फील्ड इन्फ्रारेड सर्वे एक्सप्लोरर]] द्वारा प्राप्त [[खगोलीय सर्वेक्षण]] डेटा का विश्लेषण करके की गई थी।]]डेटा साइंस एक [[अंतःविषय]] शैक्षणिक क्षेत्र है <ref>{{Cite journal |last1=Donoho |first1=David |title=50 Years of Data Science |doi=10.1080/10618600.2017.1384734 |journal=[[Journal of Computational and Graphical Statistics]] |year=2017 |volume=26 |issue=4 |pages=745–766 |s2cid=114558008 |doi-access=free}}</ref> जो शोर, संरचित और [[असंरचित डेटा]] से [[ज्ञान]] और अंतर्दृष्टि निकालने या एक्सट्रपलेशन करने के लिए सांख्यिकी, [[वैज्ञानिक कंप्यूटिंग]], [[वैज्ञानिक विधि]]यों, प्रक्रियाओं, [[कलन विधि]] और सिस्टम का उपयोग करता है।<ref>{{Cite journal |last1=Dhar |first1=V. |title=डेटा विज्ञान और भविष्यवाणी|doi=10.1145/2500499 |journal=Communications of the ACM |volume=56 |issue=12 |pages=64–73 |year=2013 |s2cid=6107147 |url=http://cacm.acm.org/magazines/2013/12/169933-data-science-and-prediction/fulltext |access-date=2 September 2015 |archive-url=https://web.archive.org/web/20141109113411/http://cacm.acm.org/magazines/2013/12/169933-data-science-and-prediction/fulltext |archive-date=9 November 2014 |url-status=live}}</ref> डेटा साइंस अंतर्निहित एप्लिकेशन डोमेन (जैसे, प्राकृतिक विज्ञान, सूचना प्रौद्योगिकी और चिकित्सा) से डोमेन ज्ञान को भी एकीकृत करता है।<ref>{{cite report |last1=Danyluk |first1=A. |last2=Leidig |first2=P. |date=2021 |title=अंडरग्रेजुएट डेटा साइंस पाठ्यक्रम के लिए कम्प्यूटिंग दक्षताएं|work=ACM Data Science Task Force Final Report |url=https://dstf.acm.org/DSTF_Final_Report.pdf}}</ref> डेटा विज्ञान बहुआयामी है और इसे एक विज्ञान, एक शोध प्रतिमान, एक शोध पद्धति, एक अनुशासन, एक कार्यप्रवाह और एक पेशे के रूप में वर्णित किया जा सकता है।<ref>{{Cite journal |last=Mike |first=Koby |last2=Hazzan |first2=Orit |date=2023-01-20 |title=What is Data Science? |url=https://doi.org/10.1145/3575663 |journal=Communications of the ACM |volume=66 |issue=2 |pages=12–13 |doi=10.1145/3575663 |issn=0001-0782}}</ref>
[[File: PIA23792-1600x1200(1).jpg|thumb|[[धूमकेतु NEOWISE|धूमकेतु निओवाइज]] (यहां लाल बिंदुओं की एक श्रृंखला के रूप में दर्शाया गया है) के अस्तित्व की खोज [[अंतरिक्ष दूरबीन]], [[वाइड-फील्ड इन्फ्रारेड सर्वे एक्सप्लोरर]] द्वारा प्राप्त [[खगोलीय सर्वेक्षण]] डेटा का विश्लेषण करके की गई थी।]]सूचना विज्ञान एक [[अंतःविषय]] शैक्षणिक क्षेत्र है <ref>{{Cite journal |last1=Donoho |first1=David |title=50 Years of Data Science |doi=10.1080/10618600.2017.1384734 |journal=[[Journal of Computational and Graphical Statistics]] |year=2017 |volume=26 |issue=4 |pages=745–766 |s2cid=114558008 |doi-access=free}}</ref> जो शोर, संरचित और [[असंरचित डेटा]] से अवबोधन और अंतर्दृष्टि निकालने या बहिर्वेशन करने के लिए सांख्यिकी, [[वैज्ञानिक कंप्यूटिंग]], [[वैज्ञानिक विधि]]यों, प्रक्रियाओं, [[कलन विधि]] और प्रणाली का उपयोग करता है। <ref>{{Cite journal |last1=Dhar |first1=V. |title=डेटा विज्ञान और भविष्यवाणी|doi=10.1145/2500499 |journal=Communications of the ACM |volume=56 |issue=12 |pages=64–73 |year=2013 |s2cid=6107147 |url=http://cacm.acm.org/magazines/2013/12/169933-data-science-and-prediction/fulltext |access-date=2 September 2015 |archive-url=https://web.archive.org/web/20141109113411/http://cacm.acm.org/magazines/2013/12/169933-data-science-and-prediction/fulltext |archive-date=9 November 2014 |url-status=live}}</ref> सूचना विज्ञान अंतर्निहित एप्लिकेशन कार्यक्षेत्र (जैसे, प्राकृतिक विज्ञान, सूचना प्रौद्योगिकी और चिकित्सा) से कार्यक्षेत्र ज्ञान को भी एकीकृत करता है। <ref>{{cite report |last1=Danyluk |first1=A. |last2=Leidig |first2=P. |date=2021 |title=अंडरग्रेजुएट डेटा साइंस पाठ्यक्रम के लिए कम्प्यूटिंग दक्षताएं|work=ACM Data Science Task Force Final Report |url=https://dstf.acm.org/DSTF_Final_Report.pdf}}</ref> डेटा विज्ञान बहुआयामी है और इसे एक विज्ञान, एक शोध प्रतिमान, एक शोध पद्धति, एक अनुशासन, एक कार्यप्रवाह और एक व्यवसाय के रूप में वर्णित किया जा सकता है।<ref>{{Cite journal |last=Mike |first=Koby |last2=Hazzan |first2=Orit |date=2023-01-20 |title=What is Data Science? |url=https://doi.org/10.1145/3575663 |journal=Communications of the ACM |volume=66 |issue=2 |pages=12–13 |doi=10.1145/3575663 |issn=0001-0782}}</ref>
[[आंकड़े]] विज्ञान डेटा के साथ वास्तविक [[घटना]]ओं को समझने और उनका विश्लेषण करने के लिए सांख्यिकी, [[डेटा विश्लेषण]], [[सूचना विज्ञान]] और उनसे संबंधित वैज्ञानिक तरीकों को एकीकृत करने की एक अवधारणा है।<ref>{{Cite book |chapter-url=https://www.springer.com/book/9784431702085 |title=डेटा विज्ञान, वर्गीकरण और संबंधित तरीके|last=Hayashi |first=Chikio |date=1998-01-01 |publisher=Springer Japan |isbn=9784431702085 |editor-last=Hayashi |editor-first=Chikio |series=Studies in Classification, Data Analysis, and Knowledge Organization |pages=40–51 |language=en |chapter=What is Data Science? Fundamental Concepts and a Heuristic Example |doi=10.1007/978-4-431-65950-1_3 |editor-last2=Yajima |editor-first2=Keiji |editor-last3=Bock |editor-first3=Hans-Hermann |editor-last4=Ohsumi |editor-first4=Noboru |editor-last5=Tanaka |editor-first5=Yutaka |editor-last6=Baba |editor-first6=Yasumasa}}</ref> यह गणित, सांख्यिकी, [[कंप्यूटर विज्ञान]], [[सूचना विज्ञान]] और डोमेन ज्ञान के संदर्भ में कई क्षेत्रों से ली गई तकनीकों और सिद्धांतों का उपयोग करता है।<ref name=":2">{{Cite journal |last=Cao |first=Longbing |date=2017-06-29 |title=Data Science: A Comprehensive Overview |journal=ACM Computing Surveys |volume=50 |issue=3 |pages=43:1–43:42 |doi=10.1145/3076253 |s2cid=207595944 |issn=0360-0300|doi-access=free }}</ref> हालाँकि, डेटा विज्ञान कंप्यूटर विज्ञान और सूचना विज्ञान से अलग है। [[ट्यूरिंग अवार्ड]] विजेता [[जिम ग्रे (कंप्यूटर वैज्ञानिक)]] ने विज्ञान के चौथे प्रतिमान (अनुभवजन्य अनुसंधान, [[बुनियादी अनुसंधान]], [[कम्प्यूटेशनल विज्ञान]], और अब डेटा-संचालित) के रूप में डेटा विज्ञान की कल्पना की और दावा किया कि सूचना प्रौद्योगिकी के प्रभाव के कारण विज्ञान के बारे में सब कुछ बदल रहा है और [[सूचना विस्फोट]]।<ref name="TansleyTolle2009">{{cite book |author1=Tony Hey |author2=Stewart Tansley |author3=Kristin Michele Tolle |title=The Fourth Paradigm: Data-intensive Scientific Discovery |url=https://books.google.com/books?id=oGs_AQAAIAAJ |year=2009 |publisher=Microsoft Research |isbn=978-0-9825442-0-4 |archive-url=https://web.archive.org/web/20170320193019/https://books.google.com/books?id=oGs_AQAAIAAJ |archive-date=20 March 2017 |url-status=live}}</ref><ref name="BellHey2009">{{cite journal |last1=Bell |first1=G. |last2=Hey |first2=T. |last3=Szalay |first3=A. |title=Computer Science: Beyond the Data Deluge |journal=Science |volume=323 |issue=5919 |year=2009 |pages=1297–1298 |issn=0036-8075 |doi=10.1126/science.1170411 |pmid=19265007 |s2cid=9743327}}</ref>
सूचना विज्ञान डेटा के साथ वास्तविक [[घटना]]ओं को समझने और उनका विश्लेषण करने के लिए सांख्यिकी, [[डेटा विश्लेषण]], [[सूचना विज्ञान]] और उनसे संबंधित वैज्ञानिक तरीकों को एकीकृत करने की एक अवधारणा है। <ref>{{Cite book |chapter-url=https://www.springer.com/book/9784431702085 |title=डेटा विज्ञान, वर्गीकरण और संबंधित तरीके|last=Hayashi |first=Chikio |date=1998-01-01 |publisher=Springer Japan |isbn=9784431702085 |editor-last=Hayashi |editor-first=Chikio |series=Studies in Classification, Data Analysis, and Knowledge Organization |pages=40–51 |language=en |chapter=What is Data Science? Fundamental Concepts and a Heuristic Example |doi=10.1007/978-4-431-65950-1_3 |editor-last2=Yajima |editor-first2=Keiji |editor-last3=Bock |editor-first3=Hans-Hermann |editor-last4=Ohsumi |editor-first4=Noboru |editor-last5=Tanaka |editor-first5=Yutaka |editor-last6=Baba |editor-first6=Yasumasa}}</ref> यह गणित, सांख्यिकी, [[कंप्यूटर विज्ञान]], [[सूचना विज्ञान]] और कार्यक्षेत्र ज्ञान के संदर्भ में कई क्षेत्रों से ली गई तकनीकों और सिद्धांतों का उपयोग करता है। <ref name=":2">{{Cite journal |last=Cao |first=Longbing |date=2017-06-29 |title=Data Science: A Comprehensive Overview |journal=ACM Computing Surveys |volume=50 |issue=3 |pages=43:1–43:42 |doi=10.1145/3076253 |s2cid=207595944 |issn=0360-0300|doi-access=free }}</ref> हालाँकि, डेटा विज्ञान कंप्यूटर विज्ञान और सूचना विज्ञान से अलग है। [[ट्यूरिंग अवार्ड]] विजेता [[जिम ग्रे (कंप्यूटर वैज्ञानिक)]] ने विज्ञान के चौथे प्रतिमान (अनुभवजन्य अनुसंधान, [[बुनियादी अनुसंधान]], [[कम्प्यूटेशनल विज्ञान]], और अब डेटा-संचालित) के रूप में डेटा विज्ञान की कल्पना की और दावा किया कि सूचना प्रौद्योगिकी के प्रभाव के कारण विज्ञान के बारे में सब कुछ बदल रहा है ।<ref name="TansleyTolle2009">{{cite book |author1=Tony Hey |author2=Stewart Tansley |author3=Kristin Michele Tolle |title=The Fourth Paradigm: Data-intensive Scientific Discovery |url=https://books.google.com/books?id=oGs_AQAAIAAJ |year=2009 |publisher=Microsoft Research |isbn=978-0-9825442-0-4 |archive-url=https://web.archive.org/web/20170320193019/https://books.google.com/books?id=oGs_AQAAIAAJ |archive-date=20 March 2017 |url-status=live}}</ref><ref name="BellHey2009">{{cite journal |last1=Bell |first1=G. |last2=Hey |first2=T. |last3=Szalay |first3=A. |title=Computer Science: Beyond the Data Deluge |journal=Science |volume=323 |issue=5919 |year=2009 |pages=1297–1298 |issn=0036-8075 |doi=10.1126/science.1170411 |pmid=19265007 |s2cid=9743327}}</ref>
एक डेटा वैज्ञानिक एक पेशेवर है जो प्रोग्रामिंग कोड बनाता है और डेटा से अंतर्दृष्टि बनाने के लिए इसे सांख्यिकीय ज्ञान के साथ जोड़ता है।<ref>{{Cite journal |title=Data Scientist: The Sexiest Job of the 21st Century |url=https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century/ |journal=[[Harvard Business Review]] |date=October 2012 |access-date=2016-01-18 |last1=Davenport |first1=Thomas H. |last2=Patil |first2=D. J. |volume=90 |issue=10 |pages=70–76, 128 |pmid=23074866}}</ref>
 
डेटा वैज्ञानिक एक व्य्वसायी है जो प्रोग्रामिंग कोड बनाता है और डेटा से अंतर्दृष्टि बनाने के लिए इसे सांख्यिकीय ज्ञान के साथ जोड़ता है।<ref>{{Cite journal |title=Data Scientist: The Sexiest Job of the 21st Century |url=https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century/ |journal=[[Harvard Business Review]] |date=October 2012 |access-date=2016-01-18 |last1=Davenport |first1=Thomas H. |last2=Patil |first2=D. J. |volume=90 |issue=10 |pages=70–76, 128 |pmid=23074866}}</ref>
 




== नींव ==
== नींव ==
डेटा साइंस एक [[अंतर्विषयक]] अकादमिक अनुशासन है<ref>{{Cite journal |title=समुदाय के डेटा-संचालित परिमाणीकरण द्वारा डेटा विज्ञान को परिभाषित करना|journal=Machine Learning and Knowledge Extraction |year=2018 |doi=10.3390/make1010015 |doi-access=free |last1=Emmert-Streib |first1=Frank |last2=Dehmer |first2=Matthias |volume=1 |pages=235–251 }}</ref> आम तौर पर बड़े डेटा [[डेटा सेट]] से ज्ञान निकालने और उस डेटा से ज्ञान और अंतर्दृष्टि को आवेदन डोमेन की एक विस्तृत श्रृंखला में समस्या-समाधान पर लागू करने पर केंद्रित है।<ref>{{Cite web |url=http://www.datascienceassn.org/about-data-science |title=डेटा साइंस के बारे में|website=Data Science Association |access-date=2020-04-03 |archive-date=10 August 2020 |archive-url=https://web.archive.org/web/20200810114002/http://www.datascienceassn.org/about-data-science |url-status=dead}}</ref> क्षेत्र में [[विश्लेषण]] के लिए डेटा तैयार करना, डेटा विज्ञान की समस्याओं को तैयार करना, विश्लेषण डेटा, डेटा-संचालित समाधान विकसित करना और आवेदन डोमेन की एक विस्तृत श्रृंखला में उच्च-स्तरीय निर्णयों को सूचित करने के लिए निष्कर्ष प्रस्तुत करना शामिल है। जैसे, यह कंप्यूटर विज्ञान, सांख्यिकी, सूचना विज्ञान, गणित, [[डेटा विज़ुअलाइज़ेशन]], सूचना विज़ुअलाइज़ेशन, [[डेटा सोनिफिकेशन]], डेटा [[डेटा एकीकरण]], [[ग्राफ़िक डिज़ाइन]], जटिल सिस्टम, [[संचार]] और [[व्यवसाय]] से कौशल को शामिल करता है।<ref>{{Cite web |url=https://www.oreilly.com/library/view/doing-data-science/9781449363871/ch01.html |title=1. Introduction: What Is Data Science? |work=Doing Data Science [Book] |publisher=O’Reilly |language=en |access-date=2020-04-03}}</ref><ref>{{Cite web |url=https://medriscoll.com/post/4740157098/the-three-sexy-skills-of-data-geeks |title=डेटा गीक्स के तीन सेक्सी कौशल|website=m.e.driscoll: data utopian |date=27 May 2009 |language=en |access-date=2020-04-03}}</ref> सांख्यिकीविद् [[नाथन याउ]], [[बेन फ्राई]] पर आरेखण, डेटा विज्ञान को मानव-कंप्यूटर इंटरैक्शन से भी जोड़ता है: उपयोगकर्ताओं को सहजता से डेटा को नियंत्रित करने और [[अन्वेषण]] करने में सक्षम होना चाहिए।<ref>{{Cite web |url=https://flowingdata.com/2009/06/04/rise-of-the-data-scientist/ |title=डेटा साइंटिस्ट का उदय|last=Yau |first=Nathan |date=2009-06-04 |website=FlowingData |language=en |access-date=2020-04-03}}</ref><ref>{{Cite web |url=https://benfry.com/phd/dissertation/2.html |title=मूल उदाहरण|website=benfry.com |access-date=2020-04-03}}</ref> 2015 में, [[ अमेरिकी सांख्यिकीय संघ ]] ने [[डेटाबेस]] प्रबंधन, सांख्यिकी और [[ यंत्र अधिगम ]], और वितरित कंप्यूटिंग को तीन उभरते मूलभूत पेशेवर समुदायों के रूप में पहचाना।<ref>{{Cite web |url=https://magazine.amstat.org/blog/2015/10/01/asa-statement-on-the-role-of-statistics-in-data-science/ |title=डेटा विज्ञान में सांख्यिकी की भूमिका पर एएसए वक्तव्य|date=2015-10-01 |website=AmStatNews |publisher=[[American Statistical Association]] |access-date=2019-05-29 |archive-url=https://web.archive.org/web/20190620184935/https://magazine.amstat.org/blog/2015/10/01/asa-statement-on-the-role-of-statistics-in-data-science/ |archive-date=20 June 2019 |url-status=live}}</ref>
सूचना विज्ञान एक [[अंतर्विषयक]] अकादमिक अनुशासन है <ref>{{Cite journal |title=समुदाय के डेटा-संचालित परिमाणीकरण द्वारा डेटा विज्ञान को परिभाषित करना|journal=Machine Learning and Knowledge Extraction |year=2018 |doi=10.3390/make1010015 |doi-access=free |last1=Emmert-Streib |first1=Frank |last2=Dehmer |first2=Matthias |volume=1 |pages=235–251 }}</ref> सामान्यतः बड़े [[डेटा सेट]] से ज्ञान निकालने और उस डेटा से अवबोधन और अंतर्दृष्टि को आवेदन कार्यक्षेत्र की एक विस्तृत श्रृंखला में समस्या-समाधान पर लागू करने पर केंद्रित है।<ref>{{Cite web |url=http://www.datascienceassn.org/about-data-science |title=डेटा साइंस के बारे में|website=Data Science Association |access-date=2020-04-03 |archive-date=10 August 2020 |archive-url=https://web.archive.org/web/20200810114002/http://www.datascienceassn.org/about-data-science |url-status=dead}}</ref> क्षेत्र में [[विश्लेषण]] के लिए डेटा तैयार करना, डेटा विज्ञान की समस्याओं को तैयार करना, विश्लेषण डेटा, डेटा-संचालित समाधान विकसित करना और आवेदन कार्यक्षेत्र की एक विस्तृत श्रृंखला में उच्च-स्तरीय निर्णयों को सूचित करने के लिए निष्कर्ष प्रस्तुत करना सम्मिलित है। जैसे, यह कंप्यूटर विज्ञान, सांख्यिकी, सूचना विज्ञान, गणित, [[डेटा विज़ुअलाइज़ेशन|डेटा मानसिक चित्रण]], सूचना मानसिक चित्रण, [[डेटा सोनिफिकेशन]], [[डेटा एकीकरण]], [[ग्राफ़िक डिज़ाइन]], जटिल प्रणाली, [[संचार]] और [[व्यवसाय]] से कौशल को सम्मिलित करता है।<ref>{{Cite web |url=https://www.oreilly.com/library/view/doing-data-science/9781449363871/ch01.html |title=1. Introduction: What Is Data Science? |work=Doing Data Science [Book] |publisher=O’Reilly |language=en |access-date=2020-04-03}}</ref><ref>{{Cite web |url=https://medriscoll.com/post/4740157098/the-three-sexy-skills-of-data-geeks |title=डेटा गीक्स के तीन सेक्सी कौशल|website=m.e.driscoll: data utopian |date=27 May 2009 |language=en |access-date=2020-04-03}}</ref> सांख्यिकीविद् [[नाथन याउ]], [[बेन फ्राई]] पर आरेखण, डेटा विज्ञान को मानव-कंप्यूटर पारस्परिक प्रभाव से भी जोड़ता है: उपयोगकर्ताओं को सहजता से डेटा को नियंत्रित करने और [[अन्वेषण]] करने में सक्षम होना चाहिए। <ref>{{Cite web |url=https://flowingdata.com/2009/06/04/rise-of-the-data-scientist/ |title=डेटा साइंटिस्ट का उदय|last=Yau |first=Nathan |date=2009-06-04 |website=FlowingData |language=en |access-date=2020-04-03}}</ref><ref>{{Cite web |url=https://benfry.com/phd/dissertation/2.html |title=मूल उदाहरण|website=benfry.com |access-date=2020-04-03}}</ref> 2015 में, [[ अमेरिकी सांख्यिकीय संघ | अमेरिकी सांख्यिकीय संघ]] ने [[डेटाबेस]] प्रबंधन, सांख्यिकी और [[ यंत्र अधिगम |यंत्र अधिगम]], और वितरित कंप्यूटिंग को तीन उभरते मूलभूत व्यावसायिक समुदायों के रूप में पहचाना। <ref>{{Cite web |url=https://magazine.amstat.org/blog/2015/10/01/asa-statement-on-the-role-of-statistics-in-data-science/ |title=डेटा विज्ञान में सांख्यिकी की भूमिका पर एएसए वक्तव्य|date=2015-10-01 |website=AmStatNews |publisher=[[American Statistical Association]] |access-date=2019-05-29 |archive-url=https://web.archive.org/web/20190620184935/https://magazine.amstat.org/blog/2015/10/01/asa-statement-on-the-role-of-statistics-in-data-science/ |archive-date=20 June 2019 |url-status=live}}</ref>




=== आँकड़ों से संबंध ===
=== आँकड़ों से संबंध ===
[[नैट सिल्वर]] सहित कई सांख्यिकीविदों ने तर्क दिया है कि डेटा विज्ञान कोई नया क्षेत्र नहीं है, बल्कि सांख्यिकी का दूसरा नाम है।<ref>{{Cite web |url=https://www.statisticsviews.com/article/nate-silver-what-i-need-from-statisticians/ |title=Nate Silver: What I need from statisticians |website=Statistics Views |access-date=2020-04-03}}</ref> दूसरों का तर्क है कि डेटा विज्ञान सांख्यिकी से अलग है क्योंकि यह डिजिटल डेटा के लिए अद्वितीय समस्याओं और तकनीकों पर केंद्रित है।<ref>{{Cite web |url=http://priceonomics.com/whats-the-difference-between-data-science-and/ |title=What's the Difference Between Data Science and Statistics? |website=Priceonomics |date=13 October 2015 |language=en |access-date=2020-04-03}}</ref> [[वसंत धार]] लिखते हैं कि सांख्यिकी मात्रात्मक डेटा और विवरण पर जोर देती है। इसके विपरीत, डेटा विज्ञान मात्रात्मक और गुणात्मक डेटा (जैसे छवियों, पाठ, सेंसर, लेनदेन, ग्राहक जानकारी आदि) से संबंधित है और भविष्यवाणी और कार्रवाई पर जोर देता है।<ref>{{Cite journal |author=Vasant Dhar |date=2013-12-01 |title=डेटा विज्ञान और भविष्यवाणी|journal=Communications of the ACM |volume=56 |issue=12 |pages=64–73 |language=en |doi=10.1145/2500499 |s2cid=6107147|url=http://archive.nyu.edu/handle/2451/31553 }}</ref> कोलंबिया विश्वविद्यालय के [[एंड्रयू गेलमैन]] ने सांख्यिकी को डेटा विज्ञान का एक गैर-जरूरी हिस्सा बताया है।<ref>{{Cite web |url=https://statmodeling.stat.columbia.edu/2013/11/14/statistics-least-important-part-data-science/ |title=Statistics is the least important part of data science « Statistical Modeling, Causal Inference, and Social Science |website=statmodeling.stat.columbia.edu |access-date=2020-04-03}}</ref>
[[नैट सिल्वर]] सहित कई सांख्यिकीविदों ने तर्क दिया है कि डेटा विज्ञान कोई नया क्षेत्र नहीं है, बल्कि सांख्यिकी का दूसरा नाम है। <ref>{{Cite web |url=https://www.statisticsviews.com/article/nate-silver-what-i-need-from-statisticians/ |title=Nate Silver: What I need from statisticians |website=Statistics Views |access-date=2020-04-03}}</ref> दूसरों का तर्क है कि डेटा विज्ञान सांख्यिकी से अलग है क्योंकि यह डिजिटल डेटा के लिए अद्वितीय समस्याओं और तकनीकों पर केंद्रित है।<ref>{{Cite web |url=http://priceonomics.com/whats-the-difference-between-data-science-and/ |title=What's the Difference Between Data Science and Statistics? |website=Priceonomics |date=13 October 2015 |language=en |access-date=2020-04-03}}</ref> [[वसंत धार]] लिखते हैं कि सांख्यिकी मात्रात्मक डेटा और विवरण पर जोर देती है। इसके विपरीत, डेटा विज्ञान मात्रात्मक और गुणात्मक डेटा (जैसे छवियों, पाठ, सेंसर, लेनदेन, ग्राहक जानकारी आदि) से संबंधित है और भविष्यवाणी और कार्रवाई पर जोर देता है।<ref>{{Cite journal |author=Vasant Dhar |date=2013-12-01 |title=डेटा विज्ञान और भविष्यवाणी|journal=Communications of the ACM |volume=56 |issue=12 |pages=64–73 |language=en |doi=10.1145/2500499 |s2cid=6107147|url=http://archive.nyu.edu/handle/2451/31553 }}</ref> कोलंबिया विश्वविद्यालय के [[एंड्रयू गेलमैन]] ने सांख्यिकी को डेटा विज्ञान का एक गैर-जरूरी हिस्सा बताया है।<ref>{{Cite web |url=https://statmodeling.stat.columbia.edu/2013/11/14/statistics-least-important-part-data-science/ |title=Statistics is the least important part of data science « Statistical Modeling, Causal Inference, and Social Science |website=statmodeling.stat.columbia.edu |access-date=2020-04-03}}</ref>
स्टैनफोर्ड के प्रोफेसर [[डेविड डोनोहो]] लिखते हैं कि डेटा विज्ञान को डेटासेट के आकार या कंप्यूटिंग के उपयोग से आँकड़ों से अलग नहीं किया जाता है और कई स्नातक कार्यक्रम डेटा-विज्ञान कार्यक्रम के सार के रूप में अपने एनालिटिक्स और सांख्यिकी प्रशिक्षण को भ्रामक रूप से विज्ञापित करते हैं। वह डेटा साइंस को पारंपरिक आंकड़ों से विकसित होने वाले एक अनुप्रयुक्त क्षेत्र के रूप में वर्णित करता है।<ref name=":7" />
 
स्टैनफोर्ड के प्रोफेसर [[डेविड डोनोहो]] लिखते हैं कि डेटा विज्ञान को डेटासेट के आकार या कंप्यूटिंग के उपयोग से आँकड़ों से अलग नहीं किया जाता है और कई स्नातक कार्यक्रम डेटा-विज्ञान कार्यक्रम के सार के रूप में अपने एनालिटिक्स और सांख्यिकी प्रशिक्षण को भ्रामक रूप से विज्ञापित करते हैं। वह सूचना विज्ञान को पारंपरिक आंकड़ों से विकसित होने वाले एक अनुप्रयुक्त क्षेत्र के रूप में वर्णित करता है।<ref name=":7" />
 




Line 19: Line 23:


=== प्रारंभिक उपयोग ===
=== प्रारंभिक उपयोग ===
1962 में, [[ जॉन टुकी ]] ने एक क्षेत्र का वर्णन किया जिसे उन्होंने डेटा विश्लेषण कहा, जो आधुनिक डेटा विज्ञान से मिलता जुलता है।<ref name=":7">{{Cite web |url=http://courses.csail.mit.edu/18.337/2015/docs/50YearsDataScience.pdf |title=50 years of Data Science |last=Donoho |first=David |date=18 September 2015 |access-date=2 April 2020}}</ref> 1985 में, बीजिंग में चाइनीज एकेडमी ऑफ साइंसेज को दिए गए एक व्याख्यान में, सी. एफ. जेफ वू ने आंकड़ों के वैकल्पिक नाम के रूप में पहली बार डेटा साइंस शब्द का इस्तेमाल किया।<ref>{{Cite journal |url=https://www2.isye.gatech.edu/~jeffwu/publications/fazhan.pdf |title=Future directions of statistical research in China: a historical perspective |last1=Wu |first1=C. F. Jeff |journal=[[Application of Statistics and Management]] |volume=1 |year=1986 |pages=1–7 |access-date=29 November 2020}}</ref> बाद में, मोंटपेलियर 2 विश्वविद्यालय|मोंटपेलियर II विश्वविद्यालय में 1992 के सांख्यिकी संगोष्ठी में उपस्थित लोगों ने कंप्यूटिंग के साथ सांख्यिकी और डेटा विश्लेषण की स्थापित अवधारणाओं और सिद्धांतों के संयोजन, विभिन्न मूल और रूपों के डेटा पर केंद्रित एक नए अनुशासन के उद्भव को स्वीकार किया।<ref>{{Cite book |title=डेटा विज्ञान और इसके अनुप्रयोग|publisher=Academic Press/Harcourt Brace |editor-last1=Escoufier |editor-first1=Yves |editor-last2=Hayashi |editor-first2=Chikio |editor-last3=Fichet |editor-first3=Bernard |year=1995 |isbn=0-12-241770-4 |location=Tokyo |oclc=489990740}}</ref><ref name="Murtagh 2018 14">{{Cite journal |last1=Murtagh |first1=Fionn |last2=Devlin |first2=Keith |date=2018 |title=The Development of Data Science: Implications for Education, Employment, Research, and the Data Revolution for Sustainable Development |journal=Big Data and Cognitive Computing |language=en |volume=2 |issue=2 |pages=14 |doi=10.3390/bdcc2020014 |doi-access=free}}</ref>
1962 में,[[ जॉन टुकी ]]ने एक क्षेत्र का वर्णन किया जिसे उन्होंने डेटा विश्लेषण कहा, जो आधुनिक डेटा विज्ञान से मिलता जुलता है। <ref name=":7">{{Cite web |url=http://courses.csail.mit.edu/18.337/2015/docs/50YearsDataScience.pdf |title=50 years of Data Science |last=Donoho |first=David |date=18 September 2015 |access-date=2 April 2020}}</ref> 1985 में, बीजिंग में चाइनीज एकेडमी ऑफ साइंसेज को दिए गए एक व्याख्यान में, सी. एफ. जेफ वू ने आंकड़ों के वैकल्पिक नाम के रूप में पहली बार सूचना विज्ञान शब्द का उपयोग किया।<ref>{{Cite journal |url=https://www2.isye.gatech.edu/~jeffwu/publications/fazhan.pdf |title=Future directions of statistical research in China: a historical perspective |last1=Wu |first1=C. F. Jeff |journal=[[Application of Statistics and Management]] |volume=1 |year=1986 |pages=1–7 |access-date=29 November 2020}}</ref> बाद में, मोंटपेलियर II विश्वविद्यालय में 1992 के सांख्यिकी संगोष्ठी में उपस्थित लोगों ने कंप्यूटिंग के साथ सांख्यिकी और डेटा विश्लेषण की स्थापित अवधारणाओं और सिद्धांतों के संयोजन, विभिन्न मूल और रूपों के डेटा पर केंद्रित एक नए अनुशासन के उद्भव को स्वीकार किया।<ref>{{Cite book |title=डेटा विज्ञान और इसके अनुप्रयोग|publisher=Academic Press/Harcourt Brace |editor-last1=Escoufier |editor-first1=Yves |editor-last2=Hayashi |editor-first2=Chikio |editor-last3=Fichet |editor-first3=Bernard |year=1995 |isbn=0-12-241770-4 |location=Tokyo |oclc=489990740}}</ref><ref name="Murtagh 2018 14">{{Cite journal |last1=Murtagh |first1=Fionn |last2=Devlin |first2=Keith |date=2018 |title=The Development of Data Science: Implications for Education, Employment, Research, and the Data Revolution for Sustainable Development |journal=Big Data and Cognitive Computing |language=en |volume=2 |issue=2 |pages=14 |doi=10.3390/bdcc2020014 |doi-access=free}}</ref>
डेटा साइंस शब्द का पता 1974 में लगाया गया है, जब [[पीटर नौर]] ने इसे कंप्यूटर साइंस के वैकल्पिक नाम के रूप में प्रस्तावित किया था।<ref name=":2" />1996 में, इंटरनेशनल फेडरेशन ऑफ क्लासिफिकेशन सोसाइटीज विशेष रूप से डेटा साइंस को एक विषय के रूप में पेश करने वाला पहला सम्मेलन बन गया।<ref name=":2" />हालाँकि, परिभाषा अभी भी प्रवाह में थी। बीजिंग में चाइनीज एकेडमी ऑफ साइंसेज में 1985 के व्याख्यान के बाद, 1997 में सी. एफ. जेफ वू ने फिर से सुझाव दिया कि सांख्यिकी का नाम बदलकर डेटा साइंस होना चाहिए। उन्होंने तर्क दिया कि एक नया नाम आँकड़ों को गलत रूढ़िवादिता को दूर करने में मदद करेगा, जैसे कि लेखांकन का पर्यायवाची होना या डेटा का वर्णन करने तक सीमित होना।<ref>{{Cite web |url=http://www2.isye.gatech.edu/~jeffwu/presentations/datascience.pdf |title=Statistics=Data Science? |last=Wu |first=C.&nbsp;F. Jeff |access-date=2 April 2020}}</ref> 1998 में, हयाशी चिकियो ने डेटा साइंस के लिए एक नई, अंतःविषय अवधारणा के रूप में तीन पहलुओं के साथ तर्क दिया: डेटा डिज़ाइन, संग्रह और विश्लेषण।<ref name="Murtagh 2018 14"/>
 
सूचना विज्ञान शब्द का पता 1974 में लगाया गया है, जब [[पीटर नौर]] ने इसे कंप्यूटर साइंस के वैकल्पिक नाम के रूप में प्रस्तावित किया था। <ref name=":2" /> 1996 में, इंटरनेशनल फेडरेशन ऑफ क्लासिफिकेशन सोसाइटीज विशेष रूप से सूचना विज्ञान को एक विषय के रूप में प्रस्तुत करने वाला पहला सम्मेलन बन गया। <ref name=":2" /> हालाँकि, परिभाषा अभी भी प्रवाह में थी। बीजिंग में चाइनीज एकेडमी ऑफ साइंसेज में 1985 के व्याख्यान के बाद, 1997 में सी. एफ. जेफ वू ने फिर से सुझाव दिया कि सांख्यिकी का नाम बदलकर सूचना विज्ञान होना चाहिए। उन्होंने तर्क दिया कि एक नया नाम आँकड़ों को गलत रूढ़िवादिता को दूर करने में सहायता करेगा, जैसे कि लेखांकन का पर्यायवाची होना या डेटा का वर्णन करने तक सीमित होना। <ref>{{Cite web |url=http://www2.isye.gatech.edu/~jeffwu/presentations/datascience.pdf |title=Statistics=Data Science? |last=Wu |first=C.&nbsp;F. Jeff |access-date=2 April 2020}}</ref> 1998 में, हयाशी चिकियो ने सूचना विज्ञान के लिए एक नई, अंतःविषय अवधारणा के रूप में तीन पहलुओं के साथ तर्क दिया: डेटा डिज़ाइन, संग्रह और विश्लेषण।<ref name="Murtagh 2018 14" />
 
1990 के दशक के दौरान, डेटासेट (जो तीव्रता से बड़े होते जा रहे थे) में प्रतिरूप खोजने की प्रक्रिया के लिए लोकप्रिय शब्दों में ज्ञान की खोज और [[डेटा खनन]] सम्मिलित थे।<ref name=":2" /><ref name=":1">{{Cite web |url=https://www.forbes.com/sites/gilpress/2013/05/28/a-very-short-history-of-data-science/ |title=डेटा विज्ञान का एक बहुत छोटा इतिहास|last=Press |first=Gil |website=Forbes |language=en |access-date=2020-04-03}}</ref>


1990 के दशक के दौरान, डेटासेट (जो तेजी से बड़े होते जा रहे थे) में पैटर्न खोजने की प्रक्रिया के लिए लोकप्रिय शब्दों में ज्ञान की खोज और [[डेटा खनन]] शामिल थे।<ref name=":2" /><ref name=":1">{{Cite web |url=https://www.forbes.com/sites/gilpress/2013/05/28/a-very-short-history-of-data-science/ |title=डेटा विज्ञान का एक बहुत छोटा इतिहास|last=Press |first=Gil |website=Forbes |language=en |access-date=2020-04-03}}</ref>




=== आधुनिक उपयोग ===
=== आधुनिक उपयोग ===
2012 में, प्रौद्योगिकीविद् थॉमस एच. डेवनपोर्ट और [[डीजे पाटिल]] ने डेटा साइंटिस्ट: द सेक्सिएस्ट जॉब ऑफ़ द 21 सेंचुरी की घोषणा की,<ref>{{cite magazine |last=Davenport |first=Thomas |date=2012-10-01 |title=Data Scientist: The Sexiest Job of the 21st Century |url=https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century |magazine=[[Harvard Business Review]] |access-date=2022-10-10}}</ref> एक कैच-वाक्यांश जिसे [[न्यूयॉर्क टाइम्स]] जैसे प्रमुख शहर के समाचार पत्रों द्वारा भी उठाया गया था<ref>{{cite news |last=Miller |first=Claire |date=2013-04-04 |title=Data Science: The Numbers of Our Lives |url=https://www.nytimes.com/2013/04/14/education/edlife/universities-offer-courses-in-a-hot-new-field-data-science.html |work=[[New York Times]] |location=[[New York City]] |access-date=2022-10-10}}</ref> और [[बोस्टन ग्लोब]]।<ref>{{cite news |last=Borchers |first=Callum |date=2015-11-11 |title=Behind the scenes of the 'sexiest job of the 21st century' |url=https://www.bostonglobe.com/business/2015/11/11/behind-scenes-sexiest-job-century/Kc1cvXIu31DfHhVmyRQeIJ/story.html |work=[[Boston Globe]] |location=[[Boston]] |access-date=2022-10-10}}</ref> एक दशक बाद, उन्होंने यह कहते हुए इसकी फिर से पुष्टि की कि नियोक्ताओं के बीच नौकरी की पहले से कहीं अधिक मांग है।<ref>{{cite magazine |last=Davenport |first=Thomas |date=2022-07-15 |title=Is Data Scientist Still the Sexiest Job of the 21st Century? |url=https://hbr.org/2022/07/is-data-scientist-still-the-sexiest-job-of-the-21st-century |magazine=[[Harvard Business Review]] |access-date=2022-10-10}}</ref>
2012 में, प्रौद्योगिकीविद् थॉमस एच. डेवनपोर्ट और [[डीजे पाटिल]] ने डेटा साइंटिस्ट: द सेक्सिएस्ट जॉब ऑफ़ द 21 सेंचुरी की घोषणा की, <ref>{{cite magazine |last=Davenport |first=Thomas |date=2012-10-01 |title=Data Scientist: The Sexiest Job of the 21st Century |url=https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century |magazine=[[Harvard Business Review]] |access-date=2022-10-10}}</ref> एक कैच-वाक्यांश जिसे [[न्यूयॉर्क टाइम्स]] और [[बोस्टन ग्लोब]] जैसे प्रमुख शहर के समाचार पत्रों द्वारा भी उठाया गया था। <ref>{{cite news |last=Miller |first=Claire |date=2013-04-04 |title=Data Science: The Numbers of Our Lives |url=https://www.nytimes.com/2013/04/14/education/edlife/universities-offer-courses-in-a-hot-new-field-data-science.html |work=[[New York Times]] |location=[[New York City]] |access-date=2022-10-10}}</ref> <ref>{{cite news |last=Borchers |first=Callum |date=2015-11-11 |title=Behind the scenes of the 'sexiest job of the 21st century' |url=https://www.bostonglobe.com/business/2015/11/11/behind-scenes-sexiest-job-century/Kc1cvXIu31DfHhVmyRQeIJ/story.html |work=[[Boston Globe]] |location=[[Boston]] |access-date=2022-10-10}}</ref> एक दशक बाद, उन्होंने यह कहते हुए इसकी फिर से पुष्टि की कि नियोक्ताओं के बीच नौकरी की पहले से कहीं अधिक मांग है। <ref>{{cite magazine |last=Davenport |first=Thomas |date=2022-07-15 |title=Is Data Scientist Still the Sexiest Job of the 21st Century? |url=https://hbr.org/2022/07/is-data-scientist-still-the-sexiest-job-of-the-21st-century |magazine=[[Harvard Business Review]] |access-date=2022-10-10}}</ref>
एक स्वतंत्र विषय के रूप में डेटा विज्ञान की आधुनिक अवधारणा का श्रेय कभी-कभी विलियम एस. क्लीवलैंड को दिया जाता है।<ref>{{Cite web |url=https://www.stat.purdue.edu/~wsc/ |title=विलियम एस क्लीवलैंड|last=Gupta |first=Shanti |date=11 December 2015 |access-date=2 April 2020}}</ref> 2001 के एक पत्र में, उन्होंने सिद्धांत से परे तकनीकी क्षेत्रों में सांख्यिकी के विस्तार की वकालत की; क्योंकि इससे क्षेत्र में काफी बदलाव आएगा, इसने एक नए नाम की गारंटी दी।<ref name=":1" />अगले कुछ वर्षों में डेटा साइंस का अधिक व्यापक रूप से उपयोग किया जाने लगा: 2002 में, [[विज्ञान और प्रौद्योगिकी के लिए डेटा संबंधी समिति]] ने डेटा साइंस जर्नल लॉन्च किया। 2003 में, कोलंबिया विश्वविद्यालय ने द जर्नल ऑफ़ डेटा साइंस लॉन्च किया।<ref name=":1" />2014 में, अमेरिकन स्टैटिस्टिकल एसोसिएशन के सेक्शन ऑन स्टैटिस्टिकल लर्निंग एंड डेटा माइनिंग ने अपना नाम बदलकर स्टैटिस्टिकल लर्निंग एंड डेटा साइंस पर सेक्शन कर लिया, जो डेटा साइंस की बढ़ती लोकप्रियता को दर्शाता है।<ref>{{Cite news |last=Talley |first=Jill |url=https://magazine.amstat.org/blog/2016/06/01/datascience-2/ |title=एएसए ने डेटा साइंस में स्कोप, आउटरीच टू फोस्टर ग्रोथ, सहयोग का विस्तार किया|date=1 June 2016 |work=Amstat News |publisher=[[American Statistical Association]]}}</ref>
एक स्वतंत्र विषय के रूप में डेटा विज्ञान की आधुनिक अवधारणा का श्रेय कभी-कभी विलियम एस. क्लीवलैंड को दिया जाता है। <ref>{{Cite web |url=https://www.stat.purdue.edu/~wsc/ |title=विलियम एस क्लीवलैंड|last=Gupta |first=Shanti |date=11 December 2015 |access-date=2 April 2020}}</ref> 2001 के एक पत्र में, उन्होंने सिद्धांत से परे तकनीकी क्षेत्रों में सांख्यिकी के विस्तार की वकालत की; क्योंकि इससे क्षेत्र में काफी बदलाव आएगा, इसने एक नए नाम की प्रत्याभुति दी।<ref name=":1" /> अगले कुछ वर्षों में सूचना विज्ञान का अधिक व्यापक रूप से उपयोग किया जाने लगा: 2002 में, [[विज्ञान और प्रौद्योगिकी के लिए डेटा संबंधी समिति]] ने सूचना विज्ञान जर्नल प्रक्षेपित किया। 2003 में, कोलंबिया विश्वविद्यालय ने द जर्नल ऑफ़ सूचना विज्ञान प्रक्षेपित किया। <ref name=":1" /> 2014 में, अमेरिकन स्टैटिस्टिकल एसोसिएशन के सेक्शन ऑन स्टैटिस्टिकल लर्निंग एंड डेटा माइनिंग ने अपना नाम बदलकर स्टैटिस्टिकल लर्निंग एंड सूचना विज्ञान कर लिया, जो सूचना विज्ञान की बढ़ती लोकप्रियता को दर्शाता है।<ref>{{Cite news |last=Talley |first=Jill |url=https://magazine.amstat.org/blog/2016/06/01/datascience-2/ |title=एएसए ने डेटा साइंस में स्कोप, आउटरीच टू फोस्टर ग्रोथ, सहयोग का विस्तार किया|date=1 June 2016 |work=Amstat News |publisher=[[American Statistical Association]]}}</ref>
2008 में डेटा वैज्ञानिक के पेशेवर खिताब का श्रेय डीजे पाटिल और [[जेफ हैमरबैकर]] को दिया गया।<ref>{{Cite news |last1=Davenport |first1=Thomas H. |url=https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century |title=Data Scientist: The Sexiest Job of the 21st Century |date=2012-10-01 |work=Harvard Business Review |access-date=2020-04-03 |last2=Patil |first2=D. J. |issue=October 2012 |issn=0017-8012}}</ref> हालांकि [[राष्ट्रीय विज्ञान बोर्ड]] द्वारा अपनी 2005 की रिपोर्ट लॉन्ग-लिव डिजिटल डेटा कलेक्शंस: इनेबलिंग रिसर्च एंड एजुकेशन इन द ट्वेंटी फर्स्ट सेंचुरी में इसका इस्तेमाल किया गया था, लेकिन यह मोटे तौर पर डिजिटल डेटा संग्रह के प्रबंधन में किसी भी महत्वपूर्ण भूमिका को संदर्भित करता है।<ref>{{Cite web |url=https://www.nsf.gov/pubs/2005/nsb0540/ |title=US NSF – NSB-05-40, Long-Lived Digital Data Collections Enabling Research and Education in the 21st Century |website=www.nsf.gov |access-date=2020-04-03}}</ref>
 
डेटा विज्ञान की परिभाषा पर अभी भी कोई आम सहमति नहीं है, और कुछ लोगों द्वारा इसे [[मूलमंत्र]] माना जाता है।<ref>{{Cite web |url=https://www.forbes.com/sites/gilpress/2013/08/19/data-science-whats-the-half-life-of-a-buzzword/ |title=Data Science: What's The Half-Life of a Buzzword? |last=Press |first=Gil |website=[[Forbes]] |language=en |access-date=2020-04-03}}</ref> बिग डेटा एक संबंधित मार्केटिंग टर्म है।<ref name=":5">{{Cite web |url=https://www.forbes.com/sites/peterpham/2015/08/28/the-impacts-of-big-data-that-you-may-not-have-heard-of/ |title=बिग डेटा के प्रभाव जिनके बारे में आपने शायद नहीं सुना होगा|last=Pham |first=Peter |website=Forbes |language=en |access-date=2020-04-03}}</ref> डेटा वैज्ञानिक बड़े डेटा को प्रयोग करने योग्य जानकारी में तोड़ने और सॉफ़्टवेयर और एल्गोरिदम बनाने के लिए ज़िम्मेदार हैं जो कंपनियों और संगठनों को इष्टतम संचालन निर्धारित करने में सहायता करते हैं।<ref name=":6">{{Cite web |url=https://towardsdatascience.com/how-data-science-will-impact-future-of-businesses-7f11f5699c4d |title=How Data Science will Impact Future of Businesses? |last=Martin |first=Sophia |date=2019-09-20 |website=Medium |language=en |access-date=2020-04-03}}</ref>
2008 में डेटा वैज्ञानिक के व्यावसायिक खिताब का श्रेय डीजे पाटिल और [[जेफ हैमरबैकर]] को दिया गया। <ref>{{Cite news |last1=Davenport |first1=Thomas H. |url=https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century |title=Data Scientist: The Sexiest Job of the 21st Century |date=2012-10-01 |work=Harvard Business Review |access-date=2020-04-03 |last2=Patil |first2=D. J. |issue=October 2012 |issn=0017-8012}}</ref> हालांकि [[राष्ट्रीय विज्ञान बोर्ड]] द्वारा अपनी 2005 की विवरणी लॉन्ग-लिव डिजिटल डेटा कलेक्शंस: इनेबलिंग रिसर्च एंड एजुकेशन इन द ट्वेंटी फर्स्ट सेंचुरी में इसका उपयोग किया गया था, लेकिन यह स्थूलतः डिजिटल डेटा संग्रह के प्रबंधन में किसी भी महत्वपूर्ण भूमिका को संदर्भित करता है। <ref>{{Cite web |url=https://www.nsf.gov/pubs/2005/nsb0540/ |title=US NSF – NSB-05-40, Long-Lived Digital Data Collections Enabling Research and Education in the 21st Century |website=www.nsf.gov |access-date=2020-04-03}}</ref> डेटा विज्ञान की परिभाषा पर अभी भी कोई सामान्य सहमति नहीं है, और कुछ लोगों द्वारा इसे [[मूलमंत्र]] माना जाता है। <ref>{{Cite web |url=https://www.forbes.com/sites/gilpress/2013/08/19/data-science-whats-the-half-life-of-a-buzzword/ |title=Data Science: What's The Half-Life of a Buzzword? |last=Press |first=Gil |website=[[Forbes]] |language=en |access-date=2020-04-03}}</ref> बिग डेटा एक संबंधित विपणन शब्द है। <ref name=":5">{{Cite web |url=https://www.forbes.com/sites/peterpham/2015/08/28/the-impacts-of-big-data-that-you-may-not-have-heard-of/ |title=बिग डेटा के प्रभाव जिनके बारे में आपने शायद नहीं सुना होगा|last=Pham |first=Peter |website=Forbes |language=en |access-date=2020-04-03}}</ref> डेटा वैज्ञानिक बड़े डेटा को प्रयोग करने योग्य जानकारी में तोड़ने और सॉफ़्टवेयर और कलन विधि बनाने के लिए त्तर्दायी हैं जो कंपनियों और संगठनों को इष्टतम संचालन निर्धारित करने में सहायता करते हैं।<ref name=":6">{{Cite web |url=https://towardsdatascience.com/how-data-science-will-impact-future-of-businesses-7f11f5699c4d |title=How Data Science will Impact Future of Businesses? |last=Martin |first=Sophia |date=2019-09-20 |website=Medium |language=en |access-date=2020-04-03}}</ref>
 





Revision as of 11:54, 18 May 2023

धूमकेतु निओवाइज (यहां लाल बिंदुओं की एक श्रृंखला के रूप में दर्शाया गया है) के अस्तित्व की खोज अंतरिक्ष दूरबीन, वाइड-फील्ड इन्फ्रारेड सर्वे एक्सप्लोरर द्वारा प्राप्त खगोलीय सर्वेक्षण डेटा का विश्लेषण करके की गई थी।

सूचना विज्ञान एक अंतःविषय शैक्षणिक क्षेत्र है [1] जो शोर, संरचित और असंरचित डेटा से अवबोधन और अंतर्दृष्टि निकालने या बहिर्वेशन करने के लिए सांख्यिकी, वैज्ञानिक कंप्यूटिंग, वैज्ञानिक विधियों, प्रक्रियाओं, कलन विधि और प्रणाली का उपयोग करता है। [2] सूचना विज्ञान अंतर्निहित एप्लिकेशन कार्यक्षेत्र (जैसे, प्राकृतिक विज्ञान, सूचना प्रौद्योगिकी और चिकित्सा) से कार्यक्षेत्र ज्ञान को भी एकीकृत करता है। [3] डेटा विज्ञान बहुआयामी है और इसे एक विज्ञान, एक शोध प्रतिमान, एक शोध पद्धति, एक अनुशासन, एक कार्यप्रवाह और एक व्यवसाय के रूप में वर्णित किया जा सकता है।[4]

सूचना विज्ञान डेटा के साथ वास्तविक घटनाओं को समझने और उनका विश्लेषण करने के लिए सांख्यिकी, डेटा विश्लेषण, सूचना विज्ञान और उनसे संबंधित वैज्ञानिक तरीकों को एकीकृत करने की एक अवधारणा है। [5] यह गणित, सांख्यिकी, कंप्यूटर विज्ञान, सूचना विज्ञान और कार्यक्षेत्र ज्ञान के संदर्भ में कई क्षेत्रों से ली गई तकनीकों और सिद्धांतों का उपयोग करता है। [6] हालाँकि, डेटा विज्ञान कंप्यूटर विज्ञान और सूचना विज्ञान से अलग है। ट्यूरिंग अवार्ड विजेता जिम ग्रे (कंप्यूटर वैज्ञानिक) ने विज्ञान के चौथे प्रतिमान (अनुभवजन्य अनुसंधान, बुनियादी अनुसंधान, कम्प्यूटेशनल विज्ञान, और अब डेटा-संचालित) के रूप में डेटा विज्ञान की कल्पना की और दावा किया कि सूचना प्रौद्योगिकी के प्रभाव के कारण विज्ञान के बारे में सब कुछ बदल रहा है ।[7][8]

डेटा वैज्ञानिक एक व्य्वसायी है जो प्रोग्रामिंग कोड बनाता है और डेटा से अंतर्दृष्टि बनाने के लिए इसे सांख्यिकीय ज्ञान के साथ जोड़ता है।[9]


नींव

सूचना विज्ञान एक अंतर्विषयक अकादमिक अनुशासन है [10] सामान्यतः बड़े डेटा सेट से ज्ञान निकालने और उस डेटा से अवबोधन और अंतर्दृष्टि को आवेदन कार्यक्षेत्र की एक विस्तृत श्रृंखला में समस्या-समाधान पर लागू करने पर केंद्रित है।[11] क्षेत्र में विश्लेषण के लिए डेटा तैयार करना, डेटा विज्ञान की समस्याओं को तैयार करना, विश्लेषण डेटा, डेटा-संचालित समाधान विकसित करना और आवेदन कार्यक्षेत्र की एक विस्तृत श्रृंखला में उच्च-स्तरीय निर्णयों को सूचित करने के लिए निष्कर्ष प्रस्तुत करना सम्मिलित है। जैसे, यह कंप्यूटर विज्ञान, सांख्यिकी, सूचना विज्ञान, गणित, डेटा मानसिक चित्रण, सूचना मानसिक चित्रण, डेटा सोनिफिकेशन, डेटा एकीकरण, ग्राफ़िक डिज़ाइन, जटिल प्रणाली, संचार और व्यवसाय से कौशल को सम्मिलित करता है।[12][13] सांख्यिकीविद् नाथन याउ, बेन फ्राई पर आरेखण, डेटा विज्ञान को मानव-कंप्यूटर पारस्परिक प्रभाव से भी जोड़ता है: उपयोगकर्ताओं को सहजता से डेटा को नियंत्रित करने और अन्वेषण करने में सक्षम होना चाहिए। [14][15] 2015 में, अमेरिकी सांख्यिकीय संघ ने डेटाबेस प्रबंधन, सांख्यिकी औ