यथार्थता एवं परिशुद्धता

परिशुद्धता और यथार्थता अवलोकन संबंधी त्रुटि के दो उपाय हैं। सटीकता यह है कि माप (अवलोकन या रीडिंग) के दिए गए सेट उनके वास्तविक मूल्य के कितने करीब हैं, जबकि परिशुद्धता मापन एक दूसरे के कितने करीब हैं।

दूसरे शब्दों में, सटीकता यादृच्छिक त्रुटियों का विवरण है, सांख्यिकीय परिवर्तनशीलता का एक उपाय है। सटीकता की दो परिभाषाएँ हैं: उपरोक्त "सटीकता" की पहली, अधिक सामान्य परिभाषा में, अवधारणा "परिशुद्धता" से स्वतंत्र है, इसलिए डेटा के एक विशेष सेट को सटीक, सटीक, दोनों या दोनों में से कोई भी नहीं कहा जा सकता है।
 * 1) अधिक सामान्यतः, यह केवल व्यवस्थित त्रुटियों का विवरण है, केंद्रीय प्रवृत्ति के दिए गए माप के सांख्यिकीय पूर्वाग्रह का एक उपाय है; कम सटीकता परिणाम और वास्तविक मान के बीच अंतर का कारण बनती है, आईएसओ इसे 'सत्यता' कहता है।
 * 2) वैकल्पिक रूप से, आईएसओ दोनों प्रकार की अवलोकन संबंधी त्रुटि (यादृच्छिक और व्यवस्थित) के संयोजन का वर्णन करने के रूप में सटीकता को परिभाषित करता है इसलिए उच्च सटीकता के लिए उच्च सटीकता और उच्च सत्यता दोनों की आवश्यकता होती है।

सरल शब्दों में, एक ही मात्रा के बार-बार माप से एक सांख्यिकीय नमूना या डेटा बिंदुओं का सेट दिया जाता है, नमूना या सेट को सटीक कहा जा सकता है यदि उनका औसत मापी जाने वाली मात्रा के सही मूल्य के करीब है, जबकि सेट कर सकते हैं सटीक कहा जा सकता है यदि उनका मानक विचलन अपेक्षाकृत छोटा है।

सामान्य तकनीकी परिभाषा
विज्ञान और अभियांत्रिकी के क्षेत्र में, माप प्रणाली की सटीकता किसी मात्रा के माप की उस मात्रा के वास्तविक मान (गणित) निकटता की डिग्री है। पुनरुत्पादनीयता और पुनरावर्तनीयता से संबंधित एक माप प्रणाली की सटीकता, वह डिग्री है जिस पर अपरिवर्तित स्थितियों के तहत दोहराए गए माप समान परिणाम दिखाते हैं। यद्यपि बोलचाल के उपयोग में सटीकता और सटीकता दो शब्द समानार्थक हो सकते हैं, लेकिन वैज्ञानिक पद्धति के संदर्भ में जानबूझकर इसके विपरीत किया जाता है।

आँकड़ों का क्षेत्र, जहाँ माप की व्याख्या एक केंद्रीय भूमिका निभाती है, सटीकता और सटीकता के बजाय पूर्वाग्रह और परिवर्तनशीलता का उपयोग करना पसंद करती है: पूर्वाग्रह अशुद्धि की मात्रा है और परिवर्तनशीलता अशुद्धि की मात्रा है।

एक माप प्रणाली सटीक हो सकती है लेकिन सटीक नहीं, सटीक लेकिन सटीक नहीं, न तो, या दोनों। उदाहरण के लिए, यदि किसी प्रयोग में एक व्यवस्थित त्रुटि होती है, तो नमूना आकार बढ़ाने से आमतौर पर सटीकता बढ़ जाती है लेकिन सटीकता में सुधार नहीं होता है। परिणाम त्रुटिपूर्ण प्रयोग से परिणामों की एक सुसंगत लेकिन गलत स्ट्रिंग होगी। व्यवस्थित त्रुटि को खत्म करने से सटीकता में सुधार होता है लेकिन सटीकता में बदलाव नहीं होता है।

एक माप प्रणाली को वैध माना जाता है यदि यह सटीक और सटीक दोनों है। संबंधित शब्दों में पूर्वाग्रह (गैर-यादृच्छिक या निर्देशित प्रभाव एक कारक या स्वतंत्र चर से असंबंधित कारकों के कारण) और त्रुटि (यादृच्छिक परिवर्तनशीलता) शामिल हैं।

शब्दावली को अप्रत्यक्ष मापों पर भी लागू किया जाता है - अर्थात, देखे गए डेटा से कम्प्यूटेशनल प्रक्रिया द्वारा प्राप्त मान।

सटीकता और सटीकता के अलावा, मापन में माप संकल्प भी हो सकता है, जो अंतर्निहित भौतिक मात्रा में सबसे छोटा परिवर्तन है जो माप में प्रतिक्रिया उत्पन्न करता है।

संख्यात्मक विश्लेषण में, सटीकता भी सही मूल्य की गणना की मंहगाई है; जबकि परिशुद्धता प्रतिनिधित्व का संकल्प है, आमतौर पर दशमलव या बाइनरी अंकों की संख्या द्वारा परिभाषित किया जाता है।

न्य दृष्टि से, सटीकता मुख्य रूप से आग की सटीकता (जस्टसी डी टीआईआर) को संदर्भित करती है, लक्ष्य के केंद्र में और उसके आसपास शॉट्स के समूह की निकटता द्वारा व्यक्त की गई आग की सटीकता।

परिमाणीकरण
औद्योगिक उपकरण में, सटीकता माप की सहनशीलता, या उपकरण का संचरण है और जब उपकरण सामान्य परिचालन स्थितियों में उपयोग किया जाता है तो त्रुटियों की सीमा को परिभाषित करता है।

आदर्श रूप से एक माप उपकरण सटीक और सटीक दोनों है, माप के साथ सभी वास्तविक मूल्य के करीब और कसकर क्लस्टर किए गए हैं। माप प्रक्रिया की सटीकता और सटीकता आमतौर पर कुछ ट्रेस करने योग्य संदर्भ मानक को बार-बार मापने के द्वारा स्थापित की जाती है। इस तरह के मानकों को इंटरनेशनल सिस्टम ऑफ यूनिट्स (फ्रेंच से संक्षिप्त एसआई: सिस्टेम इंटरनेशनल डी'यूनिट्स) में परिभाषित किया गया है और संयुक्त राज्य अमेरिका में नेशनल इंस्टीट्यूट ऑफ स्टैंडर्ड्स एंड टेक्नोलॉजी जैसे राष्ट्रीय मानक संगठनों द्वारा बनाए रखा जाता है।

यह तब भी लागू होता है जब माप दोहराए जाते हैं और औसत होते हैं। उस मामले में, शब्द मानक त्रुटि ठीक से लागू होती है: औसत की शुद्धता औसत माप की संख्या के वर्गमूल से विभाजित प्रक्रिया के ज्ञात मानक विचलन के बराबर होती है। इसके अलावा, केंद्रीय सीमा प्रमेय से पता चलता है कि औसत मापों की संभाव्यता वितरण व्यक्तिगत मापों की तुलना में सामान्य वितरण के करीब होगा।

सटीकता के संबंध में हम भेद कर सकते हैं:
 * माप के माध्य और संदर्भ मान के बीच का अंतर, अनुमानक का पूर्वाग्रह। अंशांकन के लिए पूर्वाग्रह की स्थापना और सुधार आवश्यक है।
 * उस और परिशुद्धता का संयुक्त प्रभाव।

विज्ञान और इंजीनियरिंग में एक सामान्य परिपाटी महत्वपूर्ण अंकों के माध्यम से सटीकता और/या सटीक रूप से व्यक्त करना है। जहां स्पष्ट रूप से नहीं कहा गया है, त्रुटि का मार्जिन अंतिम महत्वपूर्ण स्थान के मूल्य का आधा समझा जाता है। उदाहरण के लिए, 843.6 मीटर, या 843.0 मीटर, या 800.0 मीटर की रिकॉर्डिंग में 0.05 मीटर का मार्जिन होगा (अंतिम महत्वपूर्ण स्थान दसवां स्थान है), जबकि 843 मीटर की रिकॉर्डिंग में 0.5 मीटर की त्रुटि का मार्जिन होगा (अंतिम महत्वपूर्ण अंक इकाइयां हैं)।

अनुगामी शून्य और कोई दशमलव बिंदु के साथ 8,000 मीटर की रीडिंग अस्पष्ट है; अनुगामी शून्य महत्वपूर्ण आंकड़े के रूप में आशयित हो भी सकते हैं और नहीं भी। इस अस्पष्टता से बचने के लिए, संख्या को वैज्ञानिक संकेतन में प्रदर्शित किया जा सकता है: 8.0 × 103 m इंगित करता है कि पहला शून्य महत्वपूर्ण है (इसलिए 50 मीटर का मार्जिन) जबकि 8.000 × 103 m इंगित करता है कि सभी तीन शून्य महत्वपूर्ण हैं, जो मार्जिन देते हैं 0.5 मी। इसी तरह, कोई बुनियादी माप इकाई के गुणकों का उपयोग कर सकता है: 8.0 किमी 8.0 × 103 m के बराबर है। यह 0.05 किमी (50 मीटर) के मार्जिन को इंगित करता है। हालांकि, इस सम्मेलन पर निर्भरता से उन स्रोतों से डेटा स्वीकार करते समय गलत सटीक त्रुटियां हो सकती हैं जो इसका पालन नहीं करते हैं। उदाहरण के लिए, 153,753 जैसी संख्या की रिपोर्ट करने वाला स्रोत सटीकता +/- 5,000 के साथ ऐसा लगता है कि इसमें सटीकता +/- 0.5 है। अधिवेशन के तहत इसे 154,000 तक गोल किया गया होगा।

वैकल्पिक रूप से, एक वैज्ञानिक संदर्भ में, यदि त्रुटि के मार्जिन को अधिक सटीकता के साथ इंगित करना वांछित है, तो एक संकेतन का उपयोग किया जा सकता है जैसे 7.54398(23) × 10−10 m का उपयोग किया जा सकता है, मतलब बीच की एक सीमा 7.54375 और 7.54421 × 10−10 m.

परिशुद्धता में शामिल हैं: इंजीनियरिंग में, सटीकता को अक्सर लिए गए मापों के तीन गुना मानक विचलन के रूप में लिया जाता है, जो उस सीमा का प्रतिनिधित्व करता है जिसमें 99.73% माप हो सकते हैं। उदाहरण के लिए, मानव शरीर को मापने वाला एक एर्गोनोमिस्ट आश्वस्त हो सकता है कि उनके निकाले गए माप का 99.73% ± 0.7 सेमी के भीतर आता है - अगर GRYPHON प्रसंस्करण प्रणाली का उपयोग कर रहा है - या ± 13 सेमी - अगर असंसाधित डेटा का उपयोग कर रहा है।
 * पुनरावृत्ति - एक ही उपकरण और ऑपरेटर का उपयोग करके स्थितियों को स्थिर रखने के लिए सभी प्रयास किए जाने और कम समय अवधि के दौरान दोहराए जाने पर होने वाली भिन्नता, और
 * पुनरुत्पादन - विभिन्न उपकरणों और ऑपरेटरों के बीच एक ही माप प्रक्रिया का उपयोग करके उत्पन्न होने वाली भिन्नता, और लंबी अवधि होती है।

1994 में आईएसओ 5725 श्रृंखला के मानकों के प्रकाशन के साथ इन शब्दों के अर्थ में एक बदलाव दिखाई दिया, जो 2008 के "बीआईपीएम इंटरनेशनल वोकैबुलरी ऑफ मेट्रोलॉजी" (वीआईएम), आइटम 2.13 और 2.14 के अंक में भी परिलक्षित होता है।

आईएसओ 5725-1 के अनुसार, सामान्य शब्द "सटीकता" का उपयोग वास्तविक मूल्य के माप की निकटता का वर्णन करने के लिए किया जाता है। जब शब्द समान माप के माप के सेट पर लागू होता है, तो इसमें यादृच्छिक त्रुटि का एक घटक और व्यवस्थित त्रुटि का एक घटक शामिल होता है। इस मामले में ट्रूनेस माप परिणामों के एक सेट के वास्तविक (ट्रू) मान के माध्य की निकटता है और सटीकता परिणामों के एक सेट के बीच समझौते की निकटता है।

आईएसओ 5725-1 और वीआईएम भी "पूर्वाग्रह" शब्द के प्रयोग से बचते हैं, जिसे पहले बीएस 5497-1 में निर्दिष्ट किया गया था, क्योंकि चिकित्सा और कानून के रूप में विज्ञान और इंजीनियरिंग के क्षेत्र के बाहर इसके अलग-अलग अर्थ हैं।

बाइनरी वर्गीकरण में
सटीकता का उपयोग एक सांख्यिकीय माप के रूप में भी किया जाता है कि बाइनरी वर्गीकरण परीक्षण कितनी अच्छी तरह से किसी स्थिति को सही ढंग से पहचानता है या बाहर करता है। यानी, जांच किए गए मामलों की कुल संख्या के बीच सटीक भविष्यवाणियों (वास्तविक सकारात्मक और वास्तविक नकारात्मक दोनों) का अनुपात सटीकता है। [9] जैसे, यह पूर्व और परीक्षण के बाद की संभाव्यता के अनुमानों की तुलना करता है। शब्दार्थ द्वारा संदर्भ को स्पष्ट करने के लिए, इसे अक्सर "रैंड सटीकता" या "रैंड इंडेक्स" के रूप में संदर्भित किया जाता है।  यह परीक्षण का एक पैरामीटर है। बाइनरी सटीकता को मापने का सूत्र है:$$\text{Accuracy}=\frac{TP+TN}{TP+TN+FP+FN}$$

जहां टीपी = सही सकारात्मक; एफपी = झूठी सकारात्मक; टीएन = सही नकारात्मक; FN = मिथ्या नकारात्मक

ध्यान दें कि, इस संदर्भ में, ISO 5725-1 द्वारा परिभाषित सत्यता और परिशुद्धता की अवधारणाएं लागू नहीं होती हैं। एक कारण यह है कि मात्रा का एक "सही मूल्य" नहीं है, बल्कि हर मामले के लिए दो संभावित वास्तविक मूल्य हैं, जबकि सटीकता सभी मामलों में औसत है और इसलिए दोनों मूल्यों को ध्यान में रखा जाता है। हालाँकि, इस संदर्भ में सटीक और याद शब्द का उपयोग सूचना पुनर्प्राप्ति के क्षेत्र से उत्पन्न एक अलग मीट्रिक के अर्थ के लिए किया जाता है (नीचे देखें)।

मल्टीक्लास वर्गीकरण में
मल्टीक्लास वर्गीकरण में सटीकता की गणना करते समय, सटीकता केवल सही वर्गीकरण का अंश है: $$\text{Accuracy}=\frac{\text{correct classifications}}{\text{all classifications}}$$ यह आमतौर पर प्रतिशत के रूप में व्यक्त किया जाता है। उदाहरण के लिए, यदि कोई क्लासिफायर दस भविष्यवाणियां करता है और उनमें से नौ सही हैं, तो सटीकता 90% है।

सटीकता को शीर्ष-5 सटीकता से अलग करने के लिए शीर्ष-1 सटीकता भी कहा जाता है, जो दृढ़ तंत्रिका नेटवर्क मूल्यांकन में सामान्य है। शीर्ष -5 सटीकता का मूल्यांकन करने के लिए, क्लासिफायर को प्रत्येक वर्ग के लिए सापेक्ष संभावनाएँ प्रदान करनी चाहिए। जब इन्हें क्रमबद्ध किया जाता है, तो एक वर्गीकरण को सही माना जाता है यदि सही वर्गीकरण नेटवर्क द्वारा की गई शीर्ष 5 भविष्यवाणियों में कहीं भी आता है। इमेजनेट चुनौती द्वारा शीर्ष-5 सटीकता को लोकप्रिय बनाया गया था। यह आमतौर पर शीर्ष -1 सटीकता से अधिक है, क्योंकि दूसरे से पांचवें स्थान तक कोई भी सही भविष्यवाणी शीर्ष -1 स्कोर में सुधार नहीं करेगी, लेकिन शीर्ष -5 स्कोर में सुधार करेगी।

साइकोमेट्रिक्स और साइकोफिज़िक्स में
साइकोमेट्रिक्स और साइकोफिज़िक्स में, सटीकता शब्द का प्रयोग वैधता और निरंतर त्रुटि के साथ किया जाता है। परिशुद्धता विश्वसनीयता और परिवर्तनशील त्रुटि का पर्याय है। माप उपकरण या मनोवैज्ञानिक परीक्षण की वैधता प्रयोग या व्यवहार के साथ सहसंबंध के माध्यम से स्थापित की जाती है। विभिन्न प्रकार की सांख्यिकीय तकनीकों के साथ विश्वसनीयता स्थापित की जाती है, शास्त्रीय रूप से क्रोनबैक के अल्फा जैसे आंतरिक स्थिरता परीक्षण के माध्यम से यह सुनिश्चित करने के लिए कि संबंधित प्रश्नों के सेट से संबंधित प्रतिक्रियाएं हैं, और फिर संदर्भ और लक्षित आबादी के बीच उन संबंधित प्रश्नों की तुलना करें। इलेक्ट्रॉनिक सर्किट सिमुलेशन

तर्क अनुकरण में
तर्क अनुकरण में, सटीक मॉडल के मूल्यांकन में एक सामान्य गलती एक इलेक्ट्रॉनिक सर्किट सिमुलेशन मॉडल की तुलना ट्रांजिस्टर सर्किट सिमुलेशन मॉडल से करता है। यह सटीकता में अंतर की तुलना है, सटीकता की नहीं। सटीकता को विस्तार के संबंध में मापा जाता है और सटीकता को वास्तविकता के संबंध में मापा जाता है।

सूचना प्रणाली में
सूचना पुनर्प्राप्ति प्रणाली, जैसे कि डेटाबेस और वेब सर्च इंजन, का मूल्यांकन कई अलग-अलग मेट्रिक्स द्वारा किया जाता है, जिनमें से कुछ भ्रम मैट्रिक्स से प्राप्त होते हैं, जो परिणामों को सही सकारात्मक (दस्तावेज़ों को सही ढंग से पुनर्प्राप्त), सच्चे नकारात्मक (दस्तावेज़ों को सही ढंग से पुनर्प्राप्त नहीं किया गया) में विभाजित करते हैं। झूठे सकारात्मक (दस्तावेज़ गलत तरीके से पुनर्प्राप्त), और झूठे नकारात्मक (दस्तावेज़ गलत तरीके से पुनर्प्राप्त नहीं किए गए)। आमतौर पर उपयोग किए जाने वाले मेट्रिक्स में सटीकता और रिकॉल की धारणाएं शामिल हैं। इस संदर्भ में, सटीकता को पुनः प्राप्त दस्तावेजों के अंश के रूप में परिभाषित किया गया है जो मानव द्वारा चुने गए जमीनी सच्चाई प्रासंगिक परिणामों के एक सेट का उपयोग करके क्वेरी के लिए प्रासंगिक हैं (सच्चे सकारात्मक को सही + गलत सकारात्मक से विभाजित किया गया है)। रिकॉल को प्रासंगिक दस्तावेजों की कुल संख्या की तुलना में पुनर्प्राप्त किए गए प्रासंगिक दस्तावेजों के अंश के रूप में परिभाषित किया गया है (वास्तविक सकारात्मक सकारात्मक सकारात्मक + गलत नकारात्मक द्वारा विभाजित)। आमतौर पर, सटीकता की मीट्रिक का उपयोग किया जाता है, इसे दस्तावेजों की कुल संख्या से विभाजित सही वर्गीकरणों (वास्तविक सकारात्मक और वास्तविक नकारात्मक) की कुल संख्या के रूप में परिभाषित किया जाता है।

इनमें से कोई भी मेट्रिक्स परिणामों की रैंकिंग को ध्यान में नहीं रखता है। वेब खोज इंजनों के लिए रैंकिंग बहुत महत्वपूर्ण है क्योंकि पाठक शायद ही कभी परिणामों के पहले पृष्ठ से आगे जाते हैं, और वेब पर बहुत सारे दस्तावेज़ मैन्युअल रूप से उन सभी को वर्गीकृत करने के लिए हैं कि क्या उन्हें किसी खोज से शामिल किया जाना चाहिए या बाहर रखा जाना चाहिए। परिणामों की एक विशेष संख्या में कटऑफ जोड़ने से रैंकिंग को कुछ हद तक ध्यान में रखा जाता है। उदाहरण के लिए, k पर माप सटीकता, केवल शीर्ष दस (k=10) खोज परिणामों को देखते हुए परिशुद्धता का माप है। अधिक परिष्कृत मेट्रिक्स, जैसे कि रियायती संचयी लाभ, प्रत्येक व्यक्तिगत रैंकिंग को ध्यान में रखते हैं, और आमतौर पर इसका उपयोग तब किया जाता है जब यह महत्वपूर्ण होता है।

संज्ञानात्मक प्रणालियों में
संज्ञानात्मक प्रणालियों में, जैविक या कृत्रिम संस्थाओं द्वारा निष्पादित एक संज्ञानात्मक प्रक्रिया के परिणामों को चिह्नित करने और मापने के लिए सटीकता और सटीकता का उपयोग किया जाता है जहां एक संज्ञानात्मक प्रक्रिया डेटा, सूचना, ज्ञान या ज्ञान का एक उच्च-मूल्यवान रूप में परिवर्तन है। (DIKW पिरामिड) कभी-कभी, एक संज्ञानात्मक प्रक्रिया सटीक रूप से इच्छित या वांछित आउटपुट उत्पन्न करती है लेकिन कभी-कभी इच्छित या वांछित से बहुत दूर आउटपुट उत्पन्न करती है। इसके अलावा, एक संज्ञानात्मक प्रक्रिया की पुनरावृत्ति हमेशा एक ही परिणाम नहीं देती है। संज्ञानात्मक सटीकता (सीA) इच्छित या वांछित आउटपुट का उत्पादन करने के लिए एक संज्ञानात्मक प्रक्रिया की प्रवृत्ति है। संज्ञानात्मक परिशुद्धता (सीP) केवल अभीष्ट या वांछित परिणाम उत्पन्न करने के लिए एक संज्ञानात्मक प्रक्रिया की प्रवृत्ति है।  मानव/कोग पहनावा में संवर्धित अनुभूति को मापने के लिए, जहां एक या अधिक मनुष्य एक या एक से अधिक संज्ञानात्मक प्रणालियों (कोग) के साथ मिलकर काम करते हैं, संज्ञानात्मक सटीकता में वृद्धि होती है और संज्ञानात्मक वृद्धि की डिग्री को मापने में संज्ञानात्मक सटीकता सहायता करती है।

यह भी देखें

 * सांख्यिकी और मशीन लर्निंग में बाईस-वैरिएंस ट्रेडऑफ़
 * स्वीकृत और प्रायोगिक मूल्य
 * आधार सामग्री की गुणवत्ता
 * इंजीनियरिंग सहिष्णुता
 * सटीकता (बहुविकल्पी)
 * प्रायोगिक अनिश्चितता विश्लेषण
 * एफ-स्कोर
 * बाइनरी क्लासिफायर का मूल्यांकन # सिंगल मेट्रिक्स
 * सूचना गुणवत्ता
 * माप अनिश्चितता
 * प्रेसिजन (सांख्यिकी)
 * संभावना
 * यादृच्छिक और व्यवस्थित त्रुटियाँ
 * संवेदनशीलता और विशिष्टता
 * महत्वपूर्ण लोग
 * आंकड़ों की महत्ता

बाहरी संबंध

 * BIPM - Guides in metrology, Guide to the Expression of Uncertainty in Measurement (GUM) and International Vocabulary of Metrology (VIM)
 * "Beyond NIST Traceability: What really creates accuracy", Controlled Environments magazine
 * Precision and Accuracy with Three Psychophysical Methods
 * Appendix D.1: Terminology, Guidelines for Evaluating and Expressing the Uncertainty of NIST Measurement Results
 * Accuracy and Precision
 * Accuracy vs Precision — a brief video by Matt Parker
 * What's the difference between accuracy and precision? by Matt Anticole at TED-Ed