डेटा गुणवत्ता: Difference between revisions

From Vigyanwiki
(Created page with "{{Short description|State of qualitative or quantitative pieces of information}} डेटा गुणवत्ता गुणात्मक डेटा या सूच...")
 
No edit summary
Line 1: Line 1:
{{Short description|State of qualitative or quantitative pieces of information}}
{{Short description|State of qualitative or quantitative pieces of information}}
डेटा गुणवत्ता गुणात्मक डेटा या सूचना के [[मात्रात्मक डेटा]] टुकड़ों की स्थिति को संदर्भित करती है। डेटा गुणवत्ता की कई परिभाषाएँ हैं, लेकिन डेटा को आम तौर पर उच्च गुणवत्ता वाला माना जाता है यदि यह व्यावसायिक संचालन, निर्णय लेने और [[योजना]] में [इसके] इच्छित उपयोग के लिए उपयुक्त है।<ref name="Redman2013">{{cite book |first=Thomas C. |last=Redman|title=Data Driven: Profiting from Your Most Important Business Asset |url={{google books |plainurl=y |id=Q5CJJ2wVkYAC}} |date=30 December 2013 |publisher=Harvard Business Press |isbn=978-1-4221-6364-1}}</ref><ref name="Fadahunsi e024722">{{Cite journal|last1=Fadahunsi|first1=Kayode Philip|last2=Akinlua|first2=James Tosin|last3=O’Connor|first3=Siobhan|last4=Wark|first4=Petra A |last5=Gallagher |first5=Joseph |last6=Carroll |first6=Christopher |last7=Majeed |first7=Azeem |last8=O’Donoghue |first8=John |date=March 2019 |title=ई-स्वास्थ्य में सूचना गुणवत्ता ढांचे की एक व्यवस्थित समीक्षा और गुणात्मक संश्लेषण के लिए प्रोटोकॉल|journal=BMJ Open |volume=9 |issue=3 |pages=e024722 |doi=10.1136/bmjopen-2018-024722 |pmid=30842114 |pmc=6429947 |issn=2044-6055}}</ref><ref>{{Cite journal|last1=Fadahunsi|first1=Kayode Philip|last2=O'Connor|first2=Siobhan|last3=Akinlua|first3=James Tosin|last4=Wark|first4=Petra A.|last5=Gallagher|first5=Joseph|last6=Carroll|first6=Christopher|last7=Car|first7=Josip|last8=Majeed|first8=Azeem|last9=O'Donoghue|first9=John|date=2021-05-17|title=Information Quality Frameworks for Digital Health Technologies: Systematic Review|url=https://www.jmir.org/2021/5/e23479|journal=Journal of Medical Internet Research|language=EN|volume=23|issue=5|pages=e23479|doi=10.2196/23479|pmid=33835034|pmc=8167621}}</ref> इसके अलावा, डेटा को उच्च गुणवत्ता वाला माना जाता है यदि यह वास्तविक दुनिया के निर्माण का सही ढंग से प्रतिनिधित्व करता है जिससे यह संदर्भित होता है। इसके अलावा, इन परिभाषाओं के अलावा, जैसे-जैसे डेटा स्रोतों की संख्या बढ़ती है, किसी विशेष बाहरी उद्देश्य के लिए उपयुक्तता की परवाह किए बिना, आंतरिक डेटा स्थिरता का प्रश्न महत्वपूर्ण हो जाता है। डेटा गुणवत्ता पर लोगों के विचार अक्सर असहमत हो सकते हैं, यहां तक ​​कि समान उद्देश्य के लिए उपयोग किए गए डेटा के समान सेट पर चर्चा करते समय भी। जब ऐसा होता है, तो डेटा गुणवत्ता के लिए स्वीकृत परिभाषाओं और मानकों को बनाने के लिए [[सामग्री संचालन]] का उपयोग किया जाता है। ऐसे मामलों में, डेटा गुणवत्ता सुनिश्चित करने के लिए मानकीकरण सहित [[डेटा सफाई]] की आवश्यकता हो सकती है।<ref name="SmallwoodInfo14">{{cite book |url=https://books.google.com/books?id=m5U6AwAAQBAJ&pg=PA110 |title=Information Governance: Concepts, Strategies, and Best Practices |author=Smallwood, R.F. |publisher=John Wiley and Sons |page=110 |year=2014 |isbn=9781118218303 |quote=एक मानकीकृत डेटा गवर्नेंस प्रोग्राम होने का अर्थ है दूषित या डुप्लिकेट डेटा को साफ करना और उपयोगकर्ताओं को लाइन-ऑफ़-बिज़नेस सॉफ़्टवेयर अनुप्रयोगों के आधार के रूप में और व्यावसायिक इंटेलिजेंस (BI) अनुप्रयोगों में निर्णय समर्थन विश्लेषण के लिए स्वच्छ, सटीक डेटा प्रदान करना।|access-date=2020-04-18 |archive-date=2020-07-30 |archive-url=https://web.archive.org/web/20200730001620/https://books.google.com/books?id=m5U6AwAAQBAJ&pg=PA110 |url-status=live }}</ref>
डेटा गुणवत्ता गुणात्मक डेटा या सूचना के [[मात्रात्मक डेटा]] टुकड़ों या खण्डों की स्थिति को संदर्भित करती है। डेटा गुणवत्ता की कई परिभाषाएँ हैं, लेकिन डेटा को सामान्यतः उच्च गुणवत्ता वाला माना जाता है यदि यह व्यावसायिक संचालन, निर्णय लेने और [[योजना]] में इसके इच्छित उपयोग के लिए उपयुक्त है।<ref name="Redman2013">{{cite book |first=Thomas C. |last=Redman|title=Data Driven: Profiting from Your Most Important Business Asset |url={{google books |plainurl=y |id=Q5CJJ2wVkYAC}} |date=30 December 2013 |publisher=Harvard Business Press |isbn=978-1-4221-6364-1}}</ref><ref name="Fadahunsi e024722">{{Cite journal|last1=Fadahunsi|first1=Kayode Philip|last2=Akinlua|first2=James Tosin|last3=O’Connor|first3=Siobhan|last4=Wark|first4=Petra A |last5=Gallagher |first5=Joseph |last6=Carroll |first6=Christopher |last7=Majeed |first7=Azeem |last8=O’Donoghue |first8=John |date=March 2019 |title=ई-स्वास्थ्य में सूचना गुणवत्ता ढांचे की एक व्यवस्थित समीक्षा और गुणात्मक संश्लेषण के लिए प्रोटोकॉल|journal=BMJ Open |volume=9 |issue=3 |pages=e024722 |doi=10.1136/bmjopen-2018-024722 |pmid=30842114 |pmc=6429947 |issn=2044-6055}}</ref><ref>{{Cite journal|last1=Fadahunsi|first1=Kayode Philip|last2=O'Connor|first2=Siobhan|last3=Akinlua|first3=James Tosin|last4=Wark|first4=Petra A.|last5=Gallagher|first5=Joseph|last6=Carroll|first6=Christopher|last7=Car|first7=Josip|last8=Majeed|first8=Azeem|last9=O'Donoghue|first9=John|date=2021-05-17|title=Information Quality Frameworks for Digital Health Technologies: Systematic Review|url=https://www.jmir.org/2021/5/e23479|journal=Journal of Medical Internet Research|language=EN|volume=23|issue=5|pages=e23479|doi=10.2196/23479|pmid=33835034|pmc=8167621}}</ref> इसके अतिरिक्त, डेटा को उच्च गुणवत्ता वाला माना जाता है यदि यह वास्तविक दुनिया के निर्माण का सही ढंग से प्रतिनिधित्व करता है जिससे यह संदर्भित होता है। इसके अतिरिक्त, इन परिभाषाओं के अतिरिक्त, जैसे-जैसे डेटा स्रोतों की संख्या बढ़ती है, किसी विशेष बाहरी उद्देश्य के लिए उपयुक्तता की परवाह किए बिना, आंतरिक डेटा स्थिरता का प्रश्न महत्वपूर्ण हो जाता है। डेटा गुणवत्ता पर लोगों के विचार प्रायः असहमत हो सकते हैं, यहां तक ​​कि समान उद्देश्य के लिए उपयोग किए गए डेटा के समान सेट पर चर्चा करते समय भी जब ऐसा होता है, तो डेटा गुणवत्ता के लिए स्वीकृत परिभाषाओं और मानकों को बनाने के लिए [[सामग्री संचालन]] का उपयोग किया जाता है। ऐसे सन्दर्भों में, डेटा गुणवत्ता सुनिश्चित करने के लिए मानकीकरण सहित [[डेटा सफाई]] की आवश्यकता हो सकती है।<ref name="SmallwoodInfo14">{{cite book |url=https://books.google.com/books?id=m5U6AwAAQBAJ&pg=PA110 |title=Information Governance: Concepts, Strategies, and Best Practices |author=Smallwood, R.F. |publisher=John Wiley and Sons |page=110 |year=2014 |isbn=9781118218303 |quote=एक मानकीकृत डेटा गवर्नेंस प्रोग्राम होने का अर्थ है दूषित या डुप्लिकेट डेटा को साफ करना और उपयोगकर्ताओं को लाइन-ऑफ़-बिज़नेस सॉफ़्टवेयर अनुप्रयोगों के आधार के रूप में और व्यावसायिक इंटेलिजेंस (BI) अनुप्रयोगों में निर्णय समर्थन विश्लेषण के लिए स्वच्छ, सटीक डेटा प्रदान करना।|access-date=2020-04-18 |archive-date=2020-07-30 |archive-url=https://web.archive.org/web/20200730001620/https://books.google.com/books?id=m5U6AwAAQBAJ&pg=PA110 |url-status=live }}</ref>




Line 6: Line 6:
डेटा की गुणवत्ता को परिभाषित करना मुश्किल है क्योंकि कई संदर्भों में डेटा का उपयोग किया जाता है, साथ ही अंतिम उपयोगकर्ताओं, उत्पादकों और डेटा के संरक्षकों के बीच अलग-अलग दृष्टिकोण होते हैं।<ref name="FürberData15">{{cite book |chapter-url=https://books.google.com/books?id=nLQvCwAAQBAJ&pg=PA20 |chapter=3. Data Quality |title=सिमेंटिक टेक्नोलॉजीज के साथ डेटा गुणवत्ता प्रबंधन|author=Fürber, C. |publisher=Springer |pages=20–55 |year=2015 |isbn=9783658122249 |access-date=18 April 2020 |archive-date=31 July 2020 |archive-url=https://web.archive.org/web/20200731140320/https://books.google.com/books?id=nLQvCwAAQBAJ&pg=PA20 |url-status=live }}</ref>
डेटा की गुणवत्ता को परिभाषित करना मुश्किल है क्योंकि कई संदर्भों में डेटा का उपयोग किया जाता है, साथ ही अंतिम उपयोगकर्ताओं, उत्पादकों और डेटा के संरक्षकों के बीच अलग-अलग दृष्टिकोण होते हैं।<ref name="FürberData15">{{cite book |chapter-url=https://books.google.com/books?id=nLQvCwAAQBAJ&pg=PA20 |chapter=3. Data Quality |title=सिमेंटिक टेक्नोलॉजीज के साथ डेटा गुणवत्ता प्रबंधन|author=Fürber, C. |publisher=Springer |pages=20–55 |year=2015 |isbn=9783658122249 |access-date=18 April 2020 |archive-date=31 July 2020 |archive-url=https://web.archive.org/web/20200731140320/https://books.google.com/books?id=nLQvCwAAQBAJ&pg=PA20 |url-status=live }}</ref>


उपभोक्ता दृष्टिकोण से, डेटा गुणवत्ता है:<ref name="FürberData15" />
उपभोक्ता दृष्टिकोण से, डेटा की गुणवत्ता है:<ref name="FürberData15" />


* डेटा जो डेटा उपभोक्ताओं द्वारा उपयोग के लिए उपयुक्त हैं
* डेटा जो डेटा उपभोक्ताओं द्वारा उपयोग के लिए उपयुक्त हैं
Line 14: Line 14:
व्यावसायिक दृष्टिकोण से, डेटा गुणवत्ता है:
व्यावसायिक दृष्टिकोण से, डेटा गुणवत्ता है:


* डेटा जो अपने इच्छित संचालन, निर्णय लेने और अन्य भूमिकाओं में 'उपयोग के लिए फिट' हैं या जो 'मानकों के अनुरूप' प्रदर्शित करते हैं, ताकि उपयोग के लिए फिटनेस हासिल की जा सके<ref name="HerzogData07">{{cite book |chapter-url=https://books.google.com/books?id=iofCetdcJSoC&pg=PA7 |chapter=Chapter 2: What is data quality and why should we care? |title=डेटा गुणवत्ता और रिकॉर्ड लिंकेज तकनीकें|author=Herzog, T.N.; Scheuren, F.J.; Winkler, W.E. |publisher=Springer Science & Business Media |pages=7–15 |year=2007 |isbn=9780387695020 |access-date=18 April 2020 |archive-date=31 July 2020 |archive-url=https://web.archive.org/web/20200731163052/https://books.google.com/books?id=iofCetdcJSoC&pg=PA7 |url-status=live }}</ref>
* डेटा जो अपने इच्छित संचालन, निर्णय लेने और अन्य भूमिकाओं में 'उपयोग के लिए उपयुक्त' हैं या जो 'मानकों के अनुरूप' मान प्रदर्शित करते हैं, ताकि उपयोग के लिए उपयुक्तता प्राप्त की जा सके<ref name="HerzogData07">{{cite book |chapter-url=https://books.google.com/books?id=iofCetdcJSoC&pg=PA7 |chapter=Chapter 2: What is data quality and why should we care? |title=डेटा गुणवत्ता और रिकॉर्ड लिंकेज तकनीकें|author=Herzog, T.N.; Scheuren, F.J.; Winkler, W.E. |publisher=Springer Science & Business Media |pages=7–15 |year=2007 |isbn=9780387695020 |access-date=18 April 2020 |archive-date=31 July 2020 |archive-url=https://web.archive.org/web/20200731163052/https://books.google.com/books?id=iofCetdcJSoC&pg=PA7 |url-status=live }}</ref>
* डेटा जो संचालन, निर्णय लेने और योजना में उनके इच्छित उपयोग के लिए उपयुक्त हैं<ref name="FleckensteinModern18">{{cite book |chapter-url=https://books.google.com/books?id=DOBLDwAAQBAJ&pg=PA101 |chapter=Chapter 11: Data Quality |title=आधुनिक डेटा रणनीति|author=Fleckenstein, M.; Fellows, L. |publisher=Springer |pages=101–120 |year=2018 |isbn=9783319689920 |access-date=18 April 2020 |archive-date=31 July 2020 |archive-url=https://web.archive.org/web/20200731140512/https://books.google.com/books?id=DOBLDwAAQBAJ&pg=PA101 |url-status=live }}</ref>
* डेटा जो संचालन, निर्णय लेने और योजना में उनके इच्छित उपयोग के लिए उपयुक्त हैं<ref name="FleckensteinModern18">{{cite book |chapter-url=https://books.google.com/books?id=DOBLDwAAQBAJ&pg=PA101 |chapter=Chapter 11: Data Quality |title=आधुनिक डेटा रणनीति|author=Fleckenstein, M.; Fellows, L. |publisher=Springer |pages=101–120 |year=2018 |isbn=9783319689920 |access-date=18 April 2020 |archive-date=31 July 2020 |archive-url=https://web.archive.org/web/20200731140512/https://books.google.com/books?id=DOBLDwAAQBAJ&pg=PA101 |url-status=live }}</ref>
* किसी उद्यम के बताए गए व्यवसाय, प्रणाली और तकनीकी आवश्यकताओं को पूरा करने के लिए डेटा की क्षमता<ref name="MahantiData19">{{cite book |url=https://books.google.com/books?id=THeSDwAAQBAJ |chapter=Chapter 1: Data, Data Quality, and Cost of Poor Data Quality |title=Data Quality: Dimensions, Measurement, Strategy, Management, and Governance |author=Mahanti, R. |publisher=Quality Press |pages=5–6 |year=2019 |isbn=9780873899772 |access-date=18 April 2020 |archive-date=23 November 2020 |archive-url=https://web.archive.org/web/20201123180313/https://books.google.com/books?id=THeSDwAAQBAJ |url-status=live }}</ref>
* किसी उद्यम के बताए गए व्यवसाय, प्रणाली और तकनीकी आवश्यकताओं को पूरा करने के लिए डेटा की क्षमता<ref name="MahantiData19">{{cite book |url=https://books.google.com/books?id=THeSDwAAQBAJ |chapter=Chapter 1: Data, Data Quality, and Cost of Poor Data Quality |title=Data Quality: Dimensions, Measurement, Strategy, Management, and Governance |author=Mahanti, R. |publisher=Quality Press |pages=5–6 |year=2019 |isbn=9780873899772 |access-date=18 April 2020 |archive-date=23 November 2020 |archive-url=https://web.archive.org/web/20201123180313/https://books.google.com/books?id=THeSDwAAQBAJ |url-status=live }}</ref>
मानक-आधारित दृष्टिकोण से, डेटा गुणवत्ता है:
मानक-आधारित दृष्टिकोण से, डेटा गुणवत्ता है:


* वह डिग्री जिस तक किसी वस्तु (डेटा) की अंतर्निहित विशेषताओं (गुणवत्ता आयामों) का एक सेट आवश्यकताओं को पूरा करता है<ref name="ISO9000_15">{{cite web |url=https://www.iso.org/obp/ui/#iso:std:iso:9000:ed-4:v1:en |title=आईएसओ 9000: 2015 (एन) गुणवत्ता प्रबंधन प्रणाली - बुनियादी बातों और शब्दावली|author=International Organization for Standardization |publisher=International Organization for Standardization |date=September 2015 |access-date=18 April 2020 |archive-date=19 May 2020 |archive-url=https://web.archive.org/web/20200519100721/https://www.iso.org/obp/ui/#iso:std:iso:9000:ed-4:v1:en |url-status=live }}</ref><ref name="FürberData15" />* इसके आवेदन के लिए डेटा की उपयोगिता, सटीकता और शुद्धता<ref name="NISTBig19">{{cite journal |url=https://nvlpubs.nist.gov/nistpubs/SpecialPublications/NIST.SP.1500-4r2.pdf |title=NIST Big Data Interoperability Framework: Volume 4, Security and Privacy |journal=NIST Special Publication 1500-4r2 |author=NIST Big Data Public Working Group, Definitions and Taxonomies Subgroup |publisher=National Institute of Standards and Technology |edition=3rd |date=October 2019 |doi=10.6028/NIST.SP.1500-4r2 |quote=वैधता का तात्पर्य इसके अनुप्रयोग के लिए डेटा की उपयोगिता, सटीकता और शुद्धता से है। परंपरागत रूप से, इसे डेटा गुणवत्ता के रूप में संदर्भित किया गया है।|access-date=18 April 2020 |archive-date=9 May 2020 |archive-url=https://web.archive.org/web/20200509103951/https://nvlpubs.nist.gov/nistpubs/SpecialPublications/NIST.SP.1500-4r2.pdf |url-status=live |doi-access=free }}</ref>
* वह डिग्री जिस तक किसी वस्तु (डेटा) की अंतर्निहित विशेषताओं (गुणवत्ता आयामों) का एक सेट आवश्यकताओं को पूरा करता है<ref name="ISO9000_15">{{cite web |url=https://www.iso.org/obp/ui/#iso:std:iso:9000:ed-4:v1:en |title=आईएसओ 9000: 2015 (एन) गुणवत्ता प्रबंधन प्रणाली - बुनियादी बातों और शब्दावली|author=International Organization for Standardization |publisher=International Organization for Standardization |date=September 2015 |access-date=18 April 2020 |archive-date=19 May 2020 |archive-url=https://web.archive.org/web/20200519100721/https://www.iso.org/obp/ui/#iso:std:iso:9000:ed-4:v1:en |url-status=live }}</ref><ref name="FürberData15" />, इसके आवेदन के लिए डेटा की उपयोगिता, सटीकता और शुद्धता की प्रमाणता सिद्ध करता है।<ref name="NISTBig19">{{cite journal |url=https://nvlpubs.nist.gov/nistpubs/SpecialPublications/NIST.SP.1500-4r2.pdf |title=NIST Big Data Interoperability Framework: Volume 4, Security and Privacy |journal=NIST Special Publication 1500-4r2 |author=NIST Big Data Public Working Group, Definitions and Taxonomies Subgroup |publisher=National Institute of Standards and Technology |edition=3rd |date=October 2019 |doi=10.6028/NIST.SP.1500-4r2 |quote=वैधता का तात्पर्य इसके अनुप्रयोग के लिए डेटा की उपयोगिता, सटीकता और शुद्धता से है। परंपरागत रूप से, इसे डेटा गुणवत्ता के रूप में संदर्भित किया गया है।|access-date=18 April 2020 |archive-date=9 May 2020 |archive-url=https://web.archive.org/web/20200509103951/https://nvlpubs.nist.gov/nistpubs/SpecialPublications/NIST.SP.1500-4r2.pdf |url-status=live |doi-access=free }}</ref>
तार्किक रूप से, इन सभी मामलों में, डेटा की गुणवत्ता डेटा के किसी विशेष सेट की वास्तविक स्थिति की वांछित स्थिति से तुलना है, वांछित स्थिति को विशेष रूप से उपयोग के लिए फिट के रूप में संदर्भित किया जाता है, उपभोक्ता अपेक्षाओं को पूरा करता है, दोष से मुक्त , या आवश्यकताओं को पूरा करना। ये अपेक्षाएं, विनिर्देश और आवश्यकताएं आमतौर पर एक या अधिक व्यक्तियों या समूहों, मानक संगठनों, कानूनों और विनियमों, व्यावसायिक नीतियों या सॉफ़्टवेयर विकास नीतियों द्वारा परिभाषित की जाती हैं।<ref name="FürberData15" />
तार्किक रूप से, इन सभी सन्दर्भों में, डेटा की गुणवत्ता डेटा के किसी विशेष सेट की वास्तविक स्थिति की वांछित स्थिति से तुलना है, वांछित स्थिति को विशेष रूप से उपयोग के लिए उपयुक्त के रूप में संदर्भित किया जाता है, उपभोक्ता अपेक्षाओं को पूरा करता है, दोष से मुक्त, या आवश्यकताओं को पूरा करना, ये अपेक्षाएं, विनिर्देश और आवश्यकताएं सामान्यतः एक या अधिक व्यक्तियों या समूहों, मानक संगठनों, कानूनों और विनियमों, व्यावसायिक नीतियों या सॉफ़्टवेयर विकास नीतियों द्वारा परिभाषित की जाती हैं।<ref name="FürberData15" />




== डेटा गुणवत्ता के आयाम ==
== डेटा गुणवत्ता के आयाम ==
और अधिक गहराई से देखने पर, उन अपेक्षाओं, विशिष्टताओं और आवश्यकताओं को डेटा की विशेषताओं या आयामों के संदर्भ में बताया गया है, जैसे:<ref name="FürberData15" /><ref name="HerzogData07" /><ref name="FleckensteinModern18" /><ref name="MahantiData19" /><ref name=":0" />
अधिक गहराई से देखने पर, उन अपेक्षाओं, विशिष्टताओं और आवश्यकताओं को डेटा की विशेषताओं या आयामों के संदर्भ में बताया गया है, जैसे:<ref name="FürberData15" /><ref name="HerzogData07" /><ref name="FleckensteinModern18" /><ref name="MahantiData19" /><ref name=":0" />


* पहुंच या उपलब्धता
* पहुंच या उपलब्धता
Line 43: Line 43:


== इतिहास ==
== इतिहास ==
सस्ते [[कंप्यूटर डेटा भंडारण]] के उदय से पहले, बड़े पैमाने पर [[मेनफ़्रेम कंप्यूटर]] कंप्यूटरों का उपयोग वितरण सेवाओं के लिए नाम और पता डेटा बनाए रखने के लिए किया जाता था। ऐसा इसलिए था ताकि मेल को उसके गंतव्य तक ठीक से भेजा जा सके। मेनफ्रेम ने नाम और पते के डेटा में सामान्य गलत वर्तनी और टाइपोग्राफ़िकल त्रुटियों को ठीक करने के साथ-साथ उन ग्राहकों को ट्रैक करने के लिए व्यावसायिक नियमों का उपयोग किया जो चले गए, मर गए, जेल गए, विवाहित, तलाकशुदा, या अन्य जीवन-परिवर्तनकारी घटनाओं का अनुभव किया। सरकारी एजेंसियों ने नेशनल चेंज ऑफ़ एड्रेस रजिस्ट्री [[संयुक्त राज्य डाक सेवा]]|(NCOA) के साथ ग्राहक डेटा को क्रॉस-रेफ़रेंस करने के लिए कुछ सेवा कंपनियों को डाक डेटा उपलब्ध कराना शुरू किया। ग्राहक डेटा के मैन्युअल सुधार की तुलना में इस तकनीक ने बड़ी कंपनियों के लाखों डॉलर बचाए। बड़ी कंपनियों ने डाक पर बचत की, क्योंकि बिल और प्रत्यक्ष विपणन सामग्री ने इच्छित ग्राहक तक अधिक सटीक रूप से अपना रास्ता बनाया। प्रारंभ में एक सेवा के रूप में बेचा गया, डेटा गुणवत्ता निगमों की दीवारों के अंदर चली गई, क्योंकि कम लागत वाली और शक्तिशाली सर्वर तकनीक उपलब्ध हो गई।{{citation needed|date=May 2015}}
'''सस्ते [[कंप्यूटर डेटा भंडारण]] के उदय से पहले''', बड़े पैमाने पर [[मेनफ़्रेम कंप्यूटर]] कंप्यूटरों का उपयोग वितरण सेवाओं के लिए नाम और पता डेटा बनाए रखने के लिए किया जाता था। ऐसा इसलिए था ताकि मेल को उसके गंतव्य तक ठीक से भेजा जा सके। मेनफ्रेम ने नाम और पते के डेटा में सामान्य गलत वर्तनी और टाइपोग्राफ़िकल त्रुटियों को ठीक करने के साथ-साथ उन ग्राहकों को ट्रैक करने के लिए व्यावसायिक नियमों का उपयोग किया जो चले गए, मर गए, जेल गए, विवाहित, तलाकशुदा, या अन्य जीवन-परिवर्तनकारी घटनाओं का अनुभव किया। सरकारी एजेंसियों ने नेशनल चेंज ऑफ़ एड्रेस रजिस्ट्री [[संयुक्त राज्य डाक सेवा]]|(NCOA) के साथ ग्राहक डेटा को क्रॉस-रेफ़रेंस करने के लिए कुछ सेवा कंपनियों को डाक डेटा उपलब्ध कराना शुरू किया। ग्राहक डेटा के मैन्युअल सुधार की तुलना में इस तकनीक ने बड़ी कंपनियों के लाखों डॉलर बचाए। बड़ी कंपनियों ने डाक पर बचत की, क्योंकि बिल और प्रत्यक्ष विपणन सामग्री ने इच्छित ग्राहक तक अधिक सटीक रूप से अपना रास्ता बनाया। प्रारंभ में एक सेवा के रूप में बेचा गया, डेटा गुणवत्ता निगमों की दीवारों के अंदर चली गई, क्योंकि कम लागत वाली और शक्तिशाली सर्वर तकनीक उपलब्ध हो गई।{{citation needed|date=May 2015}}


मार्केटिंग पर जोर देने वाली कंपनियां अक्सर अपने गुणवत्ता प्रयासों को नाम और पते की जानकारी पर केंद्रित करती हैं, लेकिन डेटा गुणवत्ता को मान्यता दी जाती है{{by whom|date=May 2015}} सभी प्रकार के डेटा की एक महत्वपूर्ण संपत्ति के रूप में। डेटा गुणवत्ता के सिद्धांतों को आपूर्ति श्रृंखला डेटा, लेन-देन संबंधी डेटा और पाए जाने वाले लगभग हर दूसरे श्रेणी के डेटा पर लागू किया जा सकता है। उदाहरण के लिए, आपूर्ति श्रृंखला डेटा को एक निश्चित मानक के अनुरूप बनाने से संगठन के लिए मूल्य होता है: 1) समान लेकिन थोड़े अलग स्टॉक के ओवरस्टॉकिंग से बचना; 2) झूठे स्टॉक-आउट से बचना; 3) वॉल्यूम छूट पर बातचीत करने के लिए विक्रेता खरीद की समझ में सुधार; और 4) एक बड़े संगठन में स्टॉकिंग और शिपिंग भागों में रसद लागत से बचना।{{citation needed|date=May 2015}}
मार्केटिंग पर जोर देने वाली कंपनियां प्रायः अपने गुणवत्ता प्रयासों को नाम और पते की जानकारी पर केंद्रित करती हैं, लेकिन डेटा गुणवत्ता को मान्यता दी जाती है{{by whom|date=May 2015}} सभी प्रकार के डेटा की एक महत्वपूर्ण संपत्ति के रूप में। डेटा गुणवत्ता के सिद्धांतों को आपूर्ति श्रृंखला डेटा, लेन-देन संबंधी डेटा और पाए जाने वाले लगभग हर दूसरे श्रेणी के डेटा पर लागू किया जा सकता है। उदाहरण के लिए, आपूर्ति श्रृंखला डेटा को एक निश्चित मानक के अनुरूप बनाने से संगठन के लिए मूल्य होता है: 1) समान लेकिन थोड़े अलग स्टॉक के ओवरस्टॉकिंग से बचना; 2) झूठे स्टॉक-आउट से बचना; 3) वॉल्यूम छूट पर बातचीत करने के लिए विक्रेता खरीद की समझ में सुधार; और 4) एक बड़े संगठन में स्टॉकिंग और शिपिंग भागों में रसद लागत से बचना।{{citation needed|date=May 2015}}


महत्वपूर्ण अनुसंधान प्रयासों वाली कंपनियों के लिए, डेटा की गुणवत्ता में अनुसंधान विधियों के लिए विकासशील [[प्रोटोकॉल (प्राकृतिक विज्ञान)]] शामिल हो सकते हैं, [[माप त्रुटि]] को कम करना, डेटा की [[सीमा जाँच]], क्रॉस सारणीकरण, मॉडलिंग और बाहरी पहचान, डेटा अखंडता की पुष्टि करना आदि शामिल हो सकते हैं।{{citation needed|date=May 2015}}
महत्वपूर्ण अनुसंधान प्रयासों वाली कंपनियों के लिए, डेटा की गुणवत्ता में अनुसंधान विधियों के लिए विकासशील [[प्रोटोकॉल (प्राकृतिक विज्ञान)]] शामिल हो सकते हैं, [[माप त्रुटि]] को कम करना, डेटा की [[सीमा जाँच]], क्रॉस सारणीकरण, मॉडलिंग और बाहरी पहचान, डेटा अखंडता की पुष्टि करना आदि शामिल हो सकते हैं।{{citation needed|date=May 2015}}
Line 56: Line 56:
[[MIT]] का एक सूचना गुणवत्ता (MITIQ) कार्यक्रम है, जिसका नेतृत्व प्रोफेसर रिचर्ड वांग करते हैं, जो बड़ी संख्या में प्रकाशनों का निर्माण करता है और इस क्षेत्र में एक महत्वपूर्ण अंतर्राष्ट्रीय सम्मेलन (सूचना गुणवत्ता पर अंतर्राष्ट्रीय सम्मेलन, ICIQ) की मेजबानी करता है। यह प्रोग्राम हैनसेन द्वारा जीरो डिफेक्ट डेटा फ्रेमवर्क (हैनसेन, 1991) पर किए गए कार्य से विकसित हुआ।
[[MIT]] का एक सूचना गुणवत्ता (MITIQ) कार्यक्रम है, जिसका नेतृत्व प्रोफेसर रिचर्ड वांग करते हैं, जो बड़ी संख्या में प्रकाशनों का निर्माण करता है और इस क्षेत्र में एक महत्वपूर्ण अंतर्राष्ट्रीय सम्मेलन (सूचना गुणवत्ता पर अंतर्राष्ट्रीय सम्मेलन, ICIQ) की मेजबानी करता है। यह प्रोग्राम हैनसेन द्वारा जीरो डिफेक्ट डेटा फ्रेमवर्क (हैनसेन, 1991) पर किए गए कार्य से विकसित हुआ।


व्यवहार में, डेटा गुणवत्ता सूचना प्रणाली की एक विस्तृत श्रृंखला से जुड़े पेशेवरों के लिए एक चिंता का विषय है, जिसमें [[डेटा भण्डारण]] और [[ व्यापारिक सूचना ]] से लेकर [[ग्राहक संबंध प्रबंधन]] और [[आपूर्ति श्रृंखला प्रबंधन]] शामिल हैं। एक उद्योग अध्ययन ने अनुमान लगाया कि डेटा गुणवत्ता की समस्याओं की अमेरिकी अर्थव्यवस्था की कुल लागत यूएस $600 बिलियन प्रति वर्ष से अधिक है (एकर्सन, 2002)। गलत डेटा - जिसमें अमान्य और पुरानी जानकारी शामिल है - डेटा प्रविष्टि, या [[आंकड़ों का विस्थापन]] और रूपांतरण परियोजनाओं के माध्यम से - विभिन्न डेटा स्रोतों से उत्पन्न हो सकता है।<ref>{{cite web|url=http://www.information-management.com/issues/20060801/1060128-1.html|title=दायित्व और उत्तोलन - डेटा गुणवत्ता के लिए एक मामला|publisher=Information Management|date=August 2006|access-date=2010-06-25|archive-date=2011-01-27|archive-url=https://web.archive.org/web/20110127183533/http://www.information-management.com/issues/20060801/1060128-1.html|url-status=live}}</ref>
व्यवहार में, डेटा गुणवत्ता सूचना प्रणाली की एक विस्तृत श्रृंखला से जुड़े पेशेवरों के लिए एक चिंता का विषय है, जिसमें [[डेटा भण्डारण]] और [[ व्यापारिक सूचना |व्यापारिक सूचना]] से लेकर [[ग्राहक संबंध प्रबंधन]] और [[आपूर्ति श्रृंखला प्रबंधन]] शामिल हैं। एक उद्योग अध्ययन ने अनुमान लगाया कि डेटा गुणवत्ता की समस्याओं की अमेरिकी अर्थव्यवस्था की कुल लागत यूएस $600 बिलियन प्रति वर्ष से अधिक है (एकर्सन, 2002)। गलत डेटा - जिसमें अमान्य और पुरानी जानकारी शामिल है - डेटा प्रविष्टि, या [[आंकड़ों का विस्थापन]] और रूपांतरण परियोजनाओं के माध्यम से - विभिन्न डेटा स्रोतों से उत्पन्न हो सकता है।<ref>{{cite web|url=http://www.information-management.com/issues/20060801/1060128-1.html|title=दायित्व और उत्तोलन - डेटा गुणवत्ता के लिए एक मामला|publisher=Information Management|date=August 2006|access-date=2010-06-25|archive-date=2011-01-27|archive-url=https://web.archive.org/web/20110127183533/http://www.information-management.com/issues/20060801/1060128-1.html|url-status=live}}</ref>
2002 में, यूएसपीएस और प्राइसवाटरहाउसकूपर्स ने एक रिपोर्ट जारी की जिसमें कहा गया था कि भेजे गए सभी अमेरिकी मेलों में से 23.6 प्रतिशत को गलत तरीके से संबोधित किया गया है।<ref>{{cite web|url=http://www.directionsmag.com/article.php?article_id=509|title=मेल-ऑर्डर और रिटेल के लिए पता प्रबंधन|publisher=Directions Magazine|access-date=2010-06-25|archive-url=https://web.archive.org/web/20050428233613/http://www.directionsmag.com/article.php?article_id=509|archive-date=2005-04-28|url-status=dead}}</ref>
2002 में, यूएसपीएस और प्राइसवाटरहाउसकूपर्स ने एक रिपोर्ट जारी की जिसमें कहा गया था कि भेजे गए सभी अमेरिकी मेलों में से 23.6 प्रतिशत को गलत तरीके से संबोधित किया गया है।<ref>{{cite web|url=http://www.directionsmag.com/article.php?article_id=509|title=मेल-ऑर्डर और रिटेल के लिए पता प्रबंधन|publisher=Directions Magazine|access-date=2010-06-25|archive-url=https://web.archive.org/web/20050428233613/http://www.directionsmag.com/article.php?article_id=509|archive-date=2005-04-28|url-status=dead}}</ref>
औसत डेटाबेस में एक कारण संपर्क डेटा बहुत जल्दी पुराना हो जाता है - हर साल 45 मिलियन से अधिक अमेरिकी अपना पता बदलते हैं।<ref>{{Cite web | url=http://ribbs.usps.gov/move_update/documents/tech_guides/PUB363.pdf | title=USPS &#124; PostalPro | access-date=2010-06-25 | archive-date=2010-02-15 | archive-url=https://web.archive.org/web/20100215172806/http://ribbs.usps.gov/move_update/documents/tech_guides/PUB363.pdf | url-status=live }}</ref>
औसत डेटाबेस में एक कारण संपर्क डेटा बहुत जल्दी पुराना हो जाता है - हर साल 45 मिलियन से अधिक अमेरिकी अपना पता बदलते हैं।<ref>{{Cite web | url=http://ribbs.usps.gov/move_update/documents/tech_guides/PUB363.pdf | title=USPS &#124; PostalPro | access-date=2010-06-25 | archive-date=2010-02-15 | archive-url=https://web.archive.org/web/20100215172806/http://ribbs.usps.gov/move_update/documents/tech_guides/PUB363.pdf | url-status=live }}</ref>
Line 66: Line 66:
डेटा गुणवत्ता आश्वासन प्रदान करने के लिए बाजार किसी तरह जा रहा है। खराब गुणवत्ता वाले डेटा का विश्लेषण और मरम्मत करने के लिए कई विक्रेता उपकरण बनाते हैं, सेवा प्रदाता अनुबंध के आधार पर डेटा को साफ़ कर सकते हैं और सलाहकार डेटा गुणवत्ता की समस्याओं से बचने के लिए प्रक्रियाओं या प्रणालियों को ठीक करने की सलाह दे सकते हैं। अधिकांश डेटा गुणवत्ता उपकरण डेटा में सुधार के लिए उपकरणों की एक श्रृंखला प्रदान करते हैं, जिनमें निम्न में से कुछ या सभी शामिल हो सकते हैं:
डेटा गुणवत्ता आश्वासन प्रदान करने के लिए बाजार किसी तरह जा रहा है। खराब गुणवत्ता वाले डेटा का विश्लेषण और मरम्मत करने के लिए कई विक्रेता उपकरण बनाते हैं, सेवा प्रदाता अनुबंध के आधार पर डेटा को साफ़ कर सकते हैं और सलाहकार डेटा गुणवत्ता की समस्याओं से बचने के लिए प्रक्रियाओं या प्रणालियों को ठीक करने की सलाह दे सकते हैं। अधिकांश डेटा गुणवत्ता उपकरण डेटा में सुधार के लिए उपकरणों की एक श्रृंखला प्रदान करते हैं, जिनमें निम्न में से कुछ या सभी शामिल हो सकते हैं:


# [[डेटा प्रोफाइलिंग]] - शुरुआत में इसकी वर्तमान स्थिति को समझने के लिए डेटा का आकलन करना, अक्सर मूल्य वितरण सहित
# [[डेटा प्रोफाइलिंग]] - शुरुआत में इसकी वर्तमान स्थिति को समझने के लिए डेटा का आकलन करना, प्रायः मूल्य वितरण सहित
# डेटा मानकीकरण - एक व्यवसाय नियम इंजन जो यह सुनिश्चित करता है कि डेटा मानकों के अनुरूप है
# डेटा मानकीकरण - एक व्यवसाय नियम इंजन जो यह सुनिश्चित करता है कि डेटा मानकों के अनुरूप है
# जियोकोडिंग - नाम और पता डेटा के लिए। डेटा को यू.एस. और विश्वव्यापी भौगोलिक मानकों के अनुसार ठीक करता है
# जियोकोडिंग - नाम और पता डेटा के लिए। डेटा को यू.एस. और विश्वव्यापी भौगोलिक मानकों के अनुसार ठीक करता है
# [[रिकॉर्ड लिंकेज]] - डेटा की तुलना करने का एक तरीका ताकि समान, लेकिन थोड़े अलग रिकॉर्ड को संरेखित किया जा सके। मिलान डेटा में डुप्लीकेट खोजने के लिए फ़ज़ी लॉजिक का उपयोग कर सकता है। यह अक्सर पहचानता है कि बॉब और बो एक ही व्यक्ति हो सकते हैं। उदाहरण के लिए, यह गृहस्थी का प्रबंधन करने, या एक ही पते पर पति-पत्नी के बीच संबंध खोजने में सक्षम हो सकता है। अंत में, यह अक्सर कई डेटा स्रोतों से सर्वोत्तम घटकों को लेकर और एक एकल सुपर-रिकॉर्ड का निर्माण करते हुए, नस्ल का सर्वश्रेष्ठ रिकॉर्ड बना सकता है।
# [[रिकॉर्ड लिंकेज]] - डेटा की तुलना करने का एक तरीका ताकि समान, लेकिन थोड़े अलग रिकॉर्ड को संरेखित किया जा सके। मिलान डेटा में डुप्लीकेट खोजने के लिए फ़ज़ी लॉजिक का उपयोग कर सकता है। यह प्रायः पहचानता है कि बॉब और बो एक ही व्यक्ति हो सकते हैं। उदाहरण के लिए, यह गृहस्थी का प्रबंधन करने, या एक ही पते पर पति-पत्नी के बीच संबंध खोजने में सक्षम हो सकता है। अंत में, यह प्रायः कई डेटा स्रोतों से सर्वोत्तम घटकों को लेकर और एक एकल सुपर-रिकॉर्ड का निर्माण करते हुए, नस्ल का सर्वश्रेष्ठ रिकॉर्ड बना सकता है।
# मॉनिटरिंग - समय के साथ डेटा की गुणवत्ता पर नज़र रखना और डेटा की गुणवत्ता में बदलाव की रिपोर्ट करना। सॉफ़्टवेयर पूर्व-निर्धारित व्यावसायिक नियमों के आधार पर विविधताओं को स्वतः ठीक भी कर सकता है।
# मॉनिटरिंग - समय के साथ डेटा की गुणवत्ता पर नज़र रखना और डेटा की गुणवत्ता में बदलाव की रिपोर्ट करना। सॉफ़्टवेयर पूर्व-निर्धारित व्यावसायिक नियमों के आधार पर विविधताओं को स्वतः ठीक भी कर सकता है।
# बैच और वास्तविक समय - एक बार जब डेटा [[अध्यापक]] में साफ (बैच) हो जाता है, तो कंपनियां अक्सर इसे साफ रखने के लिए प्रक्रियाओं को उद्यम अनुप्रयोगों में बनाना चाहती हैं।
# बैच और वास्तविक समय - एक बार जब डेटा [[अध्यापक]] में साफ (बैच) हो जाता है, तो कंपनियां प्रायः इसे साफ रखने के लिए प्रक्रियाओं को उद्यम अनुप्रयोगों में बनाना चाहती हैं।


कई प्रसिद्ध लेखक और स्वयंभू विशेषज्ञ हैं, जिनमें लैरी इंग्लिश शायद सबसे लोकप्रिय गुरु हैं। इसके अलावा, [http://iaidq.org/ IQ International - The International Association for Information and Data Quality] की स्थापना 2004 में की गई थी ताकि इस क्षेत्र में पेशेवरों और शोधकर्ताओं को केंद्र बिंदु प्रदान किया जा सके।
कई प्रसिद्ध लेखक और स्वयंभू विशेषज्ञ हैं, जिनमें लैरी इंग्लिश शायद सबसे लोकप्रिय गुरु हैं। इसके अतिरिक्त, [http://iaidq.org/ IQ International - The International Association for Information and Data Quality] की स्थापना 2004 में की गई थी ताकि इस क्षेत्र में पेशेवरों और शोधकर्ताओं को केंद्र बिंदु प्रदान किया जा सके।


[[आईएसओ 8000]] डेटा गुणवत्ता के लिए एक अंतरराष्ट्रीय मानक है।<ref>{{Cite web|url=http://www.iso.org/iso/home/store/catalogue_tc/catalogue_detail.htm?csnumber=50798|title=ISO/TS 8000-1:2011 Data quality -- Part 1: Overview|publisher=International Organization for Standardization|access-date=8 December 2016|archive-date=21 December 2016|archive-url=https://web.archive.org/web/20161221003448/http://www.iso.org/iso/home/store/catalogue_tc/catalogue_detail.htm?csnumber=50798|url-status=live}}</ref>
[[आईएसओ 8000]] डेटा गुणवत्ता के लिए एक अंतरराष्ट्रीय मानक है।<ref>{{Cite web|url=http://www.iso.org/iso/home/store/catalogue_tc/catalogue_detail.htm?csnumber=50798|title=ISO/TS 8000-1:2011 Data quality -- Part 1: Overview|publisher=International Organization for Standardization|access-date=8 December 2016|archive-date=21 December 2016|archive-url=https://web.archive.org/web/20161221003448/http://www.iso.org/iso/home/store/catalogue_tc/catalogue_detail.htm?csnumber=50798|url-status=live}}</ref>
Line 79: Line 79:


== डेटा गुणवत्ता आश्वासन ==
== डेटा गुणवत्ता आश्वासन ==
डेटा गुणवत्ता आश्वासन डेटा में विसंगतियों और अन्य विसंगतियों की खोज करने के साथ-साथ डेटा सफाई करने के लिए डेटा प्रोफाइलिंग की प्रक्रिया है।<ref>{{cite web|url=https://spotlessdata.com/blog/can-you-trust-quality-your-data|archive-url=https://web.archive.org/web/20170211081434/https://spotlessdata.com/blog/can-you-trust-quality-your-data|url-status=dead|archive-date=2017-02-11|title=Can you trust the quality of your data?|publisher=spotlessdata.com}}</ref><ref>{{cite web|url=https://www.edq.com/glossary/data-cleansing/|title=What is Data Cleansing? - Experian Data Quality|date=13 February 2015|access-date=9 February 2017|archive-date=11 February 2017|archive-url=https://web.archive.org/web/20170211080019/https://www.edq.com/glossary/data-cleansing/|url-status=live}}</ref> डेटा की गुणवत्ता में सुधार के लिए गतिविधियाँ (जैसे [[बाहरी कारकों के कारण]] को हटाना, लापता डेटा [[ प्रक्षेप ]])।
डेटा गुणवत्ता आश्वासन डेटा में विसंगतियों और अन्य विसंगतियों की खोज करने के साथ-साथ डेटा सफाई करने के लिए डेटा प्रोफाइलिंग की प्रक्रिया है।<ref>{{cite web|url=https://spotlessdata.com/blog/can-you-trust-quality-your-data|archive-url=https://web.archive.org/web/20170211081434/https://spotlessdata.com/blog/can-you-trust-quality-your-data|url-status=dead|archive-date=2017-02-11|title=Can you trust the quality of your data?|publisher=spotlessdata.com}}</ref><ref>{{cite web|url=https://www.edq.com/glossary/data-cleansing/|title=What is Data Cleansing? - Experian Data Quality|date=13 February 2015|access-date=9 February 2017|archive-date=11 February 2017|archive-url=https://web.archive.org/web/20170211080019/https://www.edq.com/glossary/data-cleansing/|url-status=live}}</ref> डेटा की गुणवत्ता में सुधार के लिए गतिविधियाँ (जैसे [[बाहरी कारकों के कारण]] को हटाना, लापता डेटा [[ प्रक्षेप |प्रक्षेप]] )।


इन गतिविधियों को डेटा वेयरहाउसिंग के हिस्से के रूप में या [[अनुप्रयोग प्रक्रिया सामग्री]] के मौजूदा भाग के डेटाबेस प्रशासन के हिस्से के रूप में किया जा सकता है।<ref>{{Cite web|url=http://globletrainings.com/watch-video-tutorial-data-warehousing-lecture-23-download/|title=Lecture 23 Data Quality Concepts Tutorial – Data Warehousing|publisher=Watch Free Video Training Online|archive-url=https://web.archive.org/web/20161221155208/http://globletrainings.com/watch-video-tutorial-data-warehousing-lecture-23-download/|access-date=8 December 2016|archive-date=2016-12-21}}</ref>
इन गतिविधियों को डेटा वेयरहाउसिंग के हिस्से के रूप में या [[अनुप्रयोग प्रक्रिया सामग्री]] के मौजूदा भाग के डेटाबेस प्रशासन के हिस्से के रूप में किया जा सकता है।<ref>{{Cite web|url=http://globletrainings.com/watch-video-tutorial-data-warehousing-lecture-23-download/|title=Lecture 23 Data Quality Concepts Tutorial – Data Warehousing|publisher=Watch Free Video Training Online|archive-url=https://web.archive.org/web/20161221155208/http://globletrainings.com/watch-video-tutorial-data-warehousing-lecture-23-download/|access-date=8 December 2016|archive-date=2016-12-21}}</ref>
Line 107: Line 107:
नीचे डेटा प्रवाह के कुछ क्षेत्र दिए गए हैं जिन्हें बारहमासी DQ जाँच की आवश्यकता हो सकती है:
नीचे डेटा प्रवाह के कुछ क्षेत्र दिए गए हैं जिन्हें बारहमासी DQ जाँच की आवश्यकता हो सकती है:


प्रत्येक स्रोत प्रणाली से प्रत्येक अनिवार्य विशेषता के लिए प्रविष्टि के बिंदु पर सभी डेटा पर पूर्णता और सटीक डीक्यू जांच की जा सकती है। लेन-देन के प्रारंभिक निर्माण के बाद कुछ विशेषता मान बनाए जाते हैं; ऐसे मामलों में, इन जांचों को प्रशासित करना मुश्किल हो जाता है और उस विशेषता के स्रोत की परिभाषित घटना और लेन-देन की अन्य मुख्य विशेषता शर्तों के पूरा होने के तुरंत बाद किया जाना चाहिए।
प्रत्येक स्रोत प्रणाली से प्रत्येक अनिवार्य विशेषता के लिए प्रविष्टि के बिंदु पर सभी डेटा पर पूर्णता और सटीक डीक्यू जांच की जा सकती है। लेन-देन के प्रारंभिक निर्माण के बाद कुछ विशेषता मान बनाए जाते हैं; ऐसे सन्दर्भों में, इन जांचों को प्रशासित करना मुश्किल हो जाता है और उस विशेषता के स्रोत की परिभाषित घटना और लेन-देन की अन्य मुख्य विशेषता शर्तों के पूरा होने के तुरंत बाद किया जाना चाहिए।


संगठन में 'संदर्भ डेटा'' का संदर्भ देने वाले सभी डेटा को वैधता डीक्यू जांच के माध्यम से नए या विसंगतिपूर्ण मूल्यों की खोज के लिए संदर्भ डेटा के अच्छी तरह से परिभाषित वैध मूल्यों के सेट के खिलाफ मान्य किया जा सकता है। परिणामों का उपयोग ''मास्टर डेटा प्रबंधन (एमडीएम)'' के अंतर्गत प्रशासित ''संदर्भ डेटा'' को अपडेट करने के लिए किया जा सकता है।
संगठन में 'संदर्भ डेटा'' का संदर्भ देने वाले सभी डेटा को वैधता डीक्यू जांच के माध्यम से नए या विसंगतिपूर्ण मूल्यों की खोज के लिए संदर्भ डेटा के अच्छी तरह से परिभाषित वैध मूल्यों के सेट के खिलाफ मान्य किया जा सकता है। परिणामों का उपयोग ''मास्टर डेटा प्रबंधन (एमडीएम)'' के अंतर्गत प्रशासित ''संदर्भ डेटा'' को अपडेट करने के लिए किया जा सकता है।
Line 117: Line 117:
जैसा कि डेटा बदलता है, कई टाइमस्टैम्प और उस टाइमस्टैम्प की स्थिति पर कब्जा कर लिया जाता है और एक परिभाषित एसएलए (सर्विस लेवल एग्रीमेंट) के खिलाफ इसके मूल्य, क्षय, परिचालन महत्व को मान्य करने के लिए एक दूसरे के साथ तुलना की जा सकती है। इस समयबद्धता DQ जाँच का उपयोग डेटा मूल्य क्षय दर को कम करने और डेटा संचलन समयरेखा की नीतियों को अनुकूलित करने के लिए किया जा सकता है।
जैसा कि डेटा बदलता है, कई टाइमस्टैम्प और उस टाइमस्टैम्प की स्थिति पर कब्जा कर लिया जाता है और एक परिभाषित एसएलए (सर्विस लेवल एग्रीमेंट) के खिलाफ इसके मूल्य, क्षय, परिचालन महत्व को मान्य करने के लिए एक दूसरे के साथ तुलना की जा सकती है। इस समयबद्धता DQ जाँच का उपयोग डेटा मूल्य क्षय दर को कम करने और डेटा संचलन समयरेखा की नीतियों को अनुकूलित करने के लिए किया जा सकता है।


एक संगठन में जटिल तर्क को आमतौर पर कई प्रक्रियाओं में सरल तर्क में अलग किया जाता है। तर्कसंगतता ऐसे जटिल तर्क पर डीक्यू जांच मूल्यों या स्थिर अंतर्संबंधों (एकत्रित व्यावसायिक नियम) की एक विशिष्ट श्रेणी के भीतर एक तार्किक परिणाम देने के लिए जटिल लेकिन महत्वपूर्ण व्यावसायिक प्रक्रियाओं और डेटा के आउटलेयर की खोज के लिए मान्य हो सकती है, बीएयू (व्यापार हमेशा की तरह) से इसका बहाव ) उम्मीदें हैं, और संभावित अपवाद प्रदान कर सकते हैं जिसके परिणामस्वरूप अंततः डेटा समस्याएं हो सकती हैं। यह जाँच डेटा के बड़े हिस्से से घिरा एक सामान्य सामान्य एकत्रीकरण नियम हो सकता है या यह संगठन के मुख्य व्यवसाय से संबंधित लेनदेन की विशेषताओं के समूह पर एक जटिल तर्क हो सकता है। इस डीक्यू चेक के लिए उच्च स्तर के व्यावसायिक ज्ञान और कौशल की आवश्यकता होती है। तर्कसंगतता के मुद्दों की खोज व्यापार या डेटा शासन या दोनों द्वारा नीति और रणनीति में बदलाव के लिए सहायता कर सकती है।
एक संगठन में जटिल तर्क को सामान्यतः कई प्रक्रियाओं में सरल तर्क में अलग किया जाता है। तर्कसंगतता ऐसे जटिल तर्क पर डीक्यू जांच मूल्यों या स्थिर अंतर्संबंधों (एकत्रित व्यावसायिक नियम) की एक विशिष्ट श्रेणी के भीतर एक तार्किक परिणाम देने के लिए जटिल लेकिन महत्वपूर्ण व्यावसायिक प्रक्रियाओं और डेटा के आउटलेयर की खोज के लिए मान्य हो सकती है, बीएयू (व्यापार हमेशा की तरह) से इसका बहाव ) उम्मीदें हैं, और संभावित अपवाद प्रदान कर सकते हैं जिसके परिणामस्वरूप अंततः डेटा समस्याएं हो सकती हैं। यह जाँच डेटा के बड़े हिस्से से घिरा एक सामान्य सामान्य एकत्रीकरण नियम हो सकता है या यह संगठन के मुख्य व्यवसाय से संबंधित लेनदेन की विशेषताओं के समूह पर एक जटिल तर्क हो सकता है। इस डीक्यू चेक के लिए उच्च स्तर के व्यावसायिक ज्ञान और कौशल की आवश्यकता होती है। तर्कसंगतता के मुद्दों की खोज व्यापार या डेटा शासन या दोनों द्वारा नीति और रणनीति में बदलाव के लिए सहायता कर सकती है।


अनुरूपता जांच और अखंडता जांच को सभी व्यावसायिक जरूरतों में शामिल करने की आवश्यकता नहीं है, यह सख्ती से डेटाबेस आर्किटेक्चर के विवेक के तहत है।
अनुरूपता जांच और अखंडता जांच को सभी व्यावसायिक जरूरतों में शामिल करने की आवश्यकता नहीं है, यह सख्ती से डेटाबेस आर्किटेक्चर के विवेक के तहत है।
Line 123: Line 123:
डेटा संचलन में ऐसे कई स्थान हैं जहाँ DQ जाँच की आवश्यकता नहीं हो सकती है। उदाहरण के लिए, डेटाबेस से प्राप्त डेटा के लिए शून्य-शून्य कॉलम पर पूर्णता और सटीकता के लिए डीक्यू जांच अनावश्यक है। इसी तरह, डेटा को उसकी सटीकता के लिए उस समय के संबंध में मान्य किया जाना चाहिए जब डेटा को अलग-अलग स्रोतों से जोड़ा जाता है। हालाँकि, यह एक व्यावसायिक नियम है और DQ के दायरे में नहीं होना चाहिए।{{Citation needed|date=May 2015}}
डेटा संचलन में ऐसे कई स्थान हैं जहाँ DQ जाँच की आवश्यकता नहीं हो सकती है। उदाहरण के लिए, डेटाबेस से प्राप्त डेटा के लिए शून्य-शून्य कॉलम पर पूर्णता और सटीकता के लिए डीक्यू जांच अनावश्यक है। इसी तरह, डेटा को उसकी सटीकता के लिए उस समय के संबंध में मान्य किया जाना चाहिए जब डेटा को अलग-अलग स्रोतों से जोड़ा जाता है। हालाँकि, यह एक व्यावसायिक नियम है और DQ के दायरे में नहीं होना चाहिए।{{Citation needed|date=May 2015}}


दुर्भाग्य से, एक सॉफ्टवेयर विकास के नजरिए से, DQ को अक्सर एक गैर-कार्यात्मक आवश्यकता के रूप में देखा जाता है। और इस तरह, प्रमुख डेटा गुणवत्ता जांच/प्रक्रियाओं को अंतिम सॉफ़्टवेयर समाधान में शामिल नहीं किया जाता है। हेल्थकेयर, पहनने योग्य तकनीक या [[बॉडी एरिया नेटवर्क]] के भीतर, बड़ी मात्रा में डेटा उत्पन्न होता है।<ref>O'Donoghue, John, and John Herbert. "Data management within mHealth environments: Patient sensors, mobile devices, and databases". ''Journal of Data and Information Quality'' (''JDIQ'') 4.1 (2012): 5.</ref> डेटा की गुणवत्ता सुनिश्चित करने के लिए आवश्यक विवरण का स्तर अत्यंत उच्च है और अक्सर इसे कम करके आंका जाता है। यह अधिकांश [[एमहेल्थ]] ऐप्स, [[इलेक्ट्रॉनिक स्वास्थ्य रिकॉर्ड]] और अन्य स्वास्थ्य संबंधी सॉफ़्टवेयर समाधानों के लिए भी सही है। हालाँकि, कुछ ओपन सोर्स टूल मौजूद हैं जो डेटा गुणवत्ता की जांच करते हैं।<ref>{{cite journal|last1=Huser|first1=Vojtech|last2=DeFalco|first2=Frank J|last3=Schuemie|first3=Martijn|last4=Ryan|first4=Patrick B|last5=Shang|first5=Ning|last6=Velez|first6=Mark|last7=Park|first7=Rae Woong|last8=Boyce|first8=Richard D|last9=Duke|first9=Jon|last10=Khare|first10=Ritu|last11=Utidjian|first11=Levon|last12=Bailey|first12=Charles|title=रोगी-स्तरीय क्लिनिकल डेटासेट के लिए डेटा गुणवत्ता उपकरण का मल्टीसाइट मूल्यांकन|journal=eGEMs |date=30 November 2016|volume=4|issue=1|pages=24|doi=10.13063/2327-9214.1239|pmid=28154833|pmc=5226382}}</ref> इसका प्राथमिक कारण, शामिल अतिरिक्त लागत से उपजा है, सॉफ्टवेयर आर्किटेक्चर के भीतर उच्च स्तर की कठोरता को जोड़ा गया है।
दुर्भाग्य से, एक सॉफ्टवेयर विकास के नजरिए से, DQ को प्रायः एक गैर-कार्यात्मक आवश्यकता के रूप में देखा जाता है। और इस तरह, प्रमुख डेटा गुणवत्ता जांच/प्रक्रियाओं को अंतिम सॉफ़्टवेयर समाधान में शामिल नहीं किया जाता है। हेल्थकेयर, पहनने योग्य तकनीक या [[बॉडी एरिया नेटवर्क]] के भीतर, बड़ी मात्रा में