परिशुद्धता और यथार्थता

परिशुद्धता और यथार्थता अवलोकन संबंधी त्रुटि के दो उपाय है। सटीकता यह है कि माप (अवलोकन या रीडिंग) के दिए गए सेट उनके वास्तविक मूल्य के कितने करीब होते है, जबकि परिशुद्धता मापन एक दूसरे के कितने करीब होते है।

दूसरे शब्दों में, सटीकता यादृच्छिक त्रुटियों का विवरण है, सांख्यिकीय परिवर्तनशीलता का एक उपाय होता है। सटीकता की दो परिभाषाएँ है: उपरोक्त "सटीकता" की पहली, अधिक सामान्य परिभाषा में, अवधारणा "परिशुद्धता" से स्वतंत्र है, इसलिए डेटा के एक विशेष सेट को सटीक नहीं कहा जा सकता है।
 * 1) अधिक सामान्यतः, यह केवल व्यवस्थित त्रुटियों का विवरण है, केंद्रीय प्रवृत्ति के दिए गए माप के सांख्यिकीय पूर्वाग्रह का एक उपाय होता है कम सटीकता परिणाम और वास्तविक मान के बीच के अंतर का कारण बनती है, आईएसओ इसे 'सत्यता' कहता है।
 * 2) वैकल्पिक रूप से, आईएसओ दोनों प्रकार की अवलोकन संबंधी त्रुटि (यादृच्छिक और व्यवस्थित) के संयोजन का वर्णन करने के रूप में सटीकता को परिभाषित करता है इसलिए उच्च सटीकता और उच्च सत्यता दोनों की आवश्यकता होती है।

सरल शब्दों में, एक ही मात्रा के बार-बार माप से एक सांख्यिकीय नमूना या डेटा बिंदुओं का सेट दिया जाता है, नमूना या सेट को सटीक कहा जा सकता है यदि उनका औसत मापी जाने वाली मात्रा के सही मूल्य के करीब होता है, जबकि सटीक सेट कर सकते है कहा जा सकता है यदि उनका मानक विचलन अपेक्षाकृत छोटा होता है।

सामान्य तकनीकी परिभाषा
विज्ञान और अभियांत्रिकी के क्षेत्र में, माप प्रणाली की सटीकता किसी मात्रा के माप की उस मात्रा के वास्तविक मान के निकटता की डिग्री होती है। पुनरुत्पादनीयता और पुनरावर्तनीयता से संबंधित एक माप प्रणाली की सटीकता, वह डिग्री है जिस पर अपरिवर्तित स्थितियों के अनुसार दोहराए गए माप समान परिणाम दिखाते है। यद्यपि बोलचाल के उपयोग में सटीकता के दो शब्द समानार्थक हो सकते है, लेकिन वैज्ञानिक पद्धति के संदर्भ में जानबूझकर इसको विपरीत किया जाता है।

आँकड़ों का क्षेत्र, जहाँ माप की व्याख्या एक केंद्रीय भूमिका निभाती है, सटीकता के अतिरिक्त पूर्वाग्रह और परिवर्तनशीलता का उपयोग करना पसंद करती है: पूर्वाग्रह अशुद्धि की मात्रा होती है और परिवर्तनशीलता भी अशुद्धि की मात्रा होती है।

एक माप प्रणाली सटीक हो सकती है या सटीक नहीं भी हो सकती है, या दोनों हो सकते है। उदाहरण के लिए, यदि किसी प्रयोग में एक व्यवस्थित त्रुटि होती है, तो नमूना आकार बढ़ाने से सामान्यतः सटीकता बढ़ जाती है लेकिन सटीकता में सुधार नहीं होता है। परिणाम त्रुटिपूर्ण प्रयोग से परिणामों की एक सुसंगत लेकिन गलत स्ट्रिंग होती है। व्यवस्थित त्रुटि को खत्म करने से सटीकता में सुधार होता है लेकिन सटीकता में बदलाव नहीं होता है।

एक माप प्रणाली को वैध माना जाता है यह सटीक हो सकते है या सटीक नहीं भी हो सकते है। संबंधित शब्दों में पूर्वाग्रह (गैर-यादृच्छिक या निर्देशित प्रभाव एक कारक या स्वतंत्र चर से असंबंधित कारकों के कारण) और त्रुटि (यादृच्छिक परिवर्तनशीलता) सम्मलित होते है।

शब्दावली को अप्रत्यक्ष मापों पर भी लागू किया जाता है - अर्थात, देखे गए डेटा से कम्प्यूटेशनल प्रक्रिया द्वारा प्राप्त मान होता है।

सटीकता के अतिरिक्त, मापन में माप संकल्प भी हो सकता है, जो अंतर्निहित भौतिक मात्रा में सबसे छोटा परिवर्तन होता है जो माप में प्रतिक्रिया उत्पन्न करता है।

संख्यात्मक विश्लेषण में, सटीकता भी सही मूल्य की गणना की मंहगाई है, जबकि परिशुद्धता प्रतिनिधित्व का संकल्प है, सामान्यतः दशमलव या बाइनरी अंकों की संख्या द्वारा परिभाषित किया जाता है।

न्य दृष्टि से, सटीकता मुख्य रूप से आग की सटीकता (जस्टसी डी टीआईआर) को संदर्भित करती है, लक्ष्य के केंद्र में और उसके आसपास शॉट्स के समूह की निकटता द्वारा व्यक्त की गई आग की सटीकता है।

परिमाणीकरण
औद्योगिक उपकरण में, सटीकता माप की सहनशीलता, या उपकरण का संचरण होता है और जब उपकरण सामान्य परिचालन स्थितियों में उपयोग किया जाता है तो त्रुटियों की सीमा को परिभाषित करता है।

आदर्श रूप से एक माप उपकरण सटीक है, माप के साथ सभी वास्तविक मूल्य के करीब और कसकर क्लस्टर किए गए है। माप प्रक्रिया की सटीकता सामान्यतः कुछ ट्रेस करने योग्य संदर्भ मानक को बार-बार मापने के द्वारा स्थापित की जाती है। इस तरह के मानकों को इंटरनेशनल सिस्टम ऑफ यूनिट्स (फ्रेंच से संक्षिप्त एसआई: सिस्टेम इंटरनेशनल डी'यूनिट्स) में परिभाषित किया गया था और संयुक्त राज्य अमेरिका में नेशनल इंस्टीट्यूट ऑफ स्टैंडर्ड्स एंड टेक्नोलॉजी जैसे राष्ट्रीय मानक संगठनों द्वारा बनाए रखा गया था।

यह तब भी लागू होता है जब माप दोहराए जाते है और औसत होते है। उस स्थिति में, शब्द मानक त्रुटि ठीक से लागू होती है: औसत की शुद्धता औसत माप की संख्या के वर्गमूल से विभाजित प्रक्रिया के ज्ञात मानक विचलन के बराबर होती है। इसके अतिरिक्त, केंद्रीय सीमा प्रमेय से पता चलता है कि औसत मापों की संभाव्यता वितरण व्यक्तिगत मापों की तुलना में सामान्य वितरण के करीब होता है।

सटीकता के संबंध में हम भेद कर सकते है:
 * माप के माध्य और संदर्भ मान के बीच का अंतर, अनुमानक का पूर्वाग्रह। अंशांकन के लिए पूर्वाग्रह की स्थापना और सुधार आवश्यक है।
 * उस और परिशुद्धता का संयुक्त प्रभाव।

विज्ञान और अभियांत्रिकी में एक सामान्य परिपाटी महत्वपूर्ण अंकों के माध्यम से सटीक रूप से व्यक्त करता है। जहां स्पष्ट रूप से नहीं कहा गया है, त्रुटि का मार्जिन अंतिम महत्वपूर्ण स्थान के मूल्य का आधा समझा जाता है। उदाहरण के लिए, 843.6 मीटर, या 843.0 मीटर, या 800.0 मीटर की रिकॉर्डिंग में 0.05 मीटर का मार्जिन होता है (अंतिम महत्वपूर्ण स्थान दसवां स्थान है), जबकि 843 मीटर की रिकॉर्डिंग में 0.5 मीटर की त्रुटि का मार्जिन होता है।

अनुगामी शून्य और कोई दशमलव बिंदु के साथ 8,000 मीटर की रीडिंग अस्पष्ट है, अनुगामी शून्य महत्वपूर्ण आंकड़े के रूप में आशयित हो भी सकते है और नहीं भी हो सकते है। इस अस्पष्टता से बचने के लिए, संख्या को वैज्ञानिक संकेतन में प्रदर्शित किया जा सकता है: 8.0 × 103 m इंगित करता है कि पहला शून्य महत्वपूर्ण है (इसलिए 50 मीटर का मार्जिन) जबकि 8.000 × 103 m इंगित करता है कि सभी तीन शून्य महत्वपूर्ण है, जो 0.5 मी मार्जिन देते है। इसी तरह, कोई बुनियादी माप इकाई के गुणकों का उपयोग कर सकता है: 8.0 किमी 8.0 × 103 m के बराबर होता है। यह 0.05 किमी (50 मीटर) के मार्जिन को इंगित करता है। चूंकि, इस सम्मेलन पर निर्भरता से उन स्रोतों से डेटा स्वीकार करते समय गलत सटीक त्रुटियां हो सकती है जो इसका पालन नहीं करते है। उदाहरण के लिए, 153,753 जैसी संख्या की रिपोर्ट करने वाला स्रोत सटीकता +/- 5,000 के साथ ऐसा लगता है कि इसमें सटीकता +/- 0.5 है। अधिवेशन के अनुसार इसे 154,000 तक गोल किया गया है।

वैकल्पिक रूप से, एक वैज्ञानिक संदर्भ में, यदि त्रुटि के मार्जिन को अधिक सटीकता के साथ इंगित करना वांछित है, तो एक संकेतन का उपयोग किया जा सकता है जैसे 7.54398(23) × 10−10 m का उपयोग किया जा सकता है, मतलब बीच की एक सीमा 7.54375 और 7.54421 × 10−10 m.

परिशुद्धता में सम्मलित है: अभियांत्रिकी में, सटीकता को अधिकांशतः लिए गए मापों के तीन गुना मानक विचलन के रूप में लिया जाता है, जो उस सीमा का प्रतिनिधित्व करता है जिसमें 99.73% माप हो सकते है। उदाहरण के लिए, मानव शरीर को मापने वाला एक एर्गोनोमिस्ट आश्वस्त हो सकता है कि उनके निकाले गए माप का 99.73% ± 0.7 सेमी के भीतर आता है - यदि GRYPHON प्रसंस्करण प्रणाली का उपयोग कर रहा है - या ± 13 सेमी - यदि असंसाधित डेटा का उपयोग कर रहा है।
 * पुनरावृत्ति - एक ही उपकरण और ऑपरेटर का उपयोग करके स्थितियों को स्थिर रखने के लिए सभी प्रयास किए जाने और कम समय अवधि के दौरान दोहराए जाने पर होने वाली भिन्नता, और
 * पुनरुत्पादन - विभिन्न उपकरणों और ऑपरेटरों के बीच एक ही माप प्रक्रिया का उपयोग करके उत्पन्न होने वाली भिन्नता, और लंबी अवधि होना है।

1994 में आईएसओ 5725 श्रृंखला के मानकों के प्रकाशन के साथ इन शब्दों के अर्थ में एक बदलाव दिखाई दिया था, जो 2008 के "बीआईपीएम इंटरनेशनल वोकैबुलरी ऑफ मेट्रोलॉजी" (वीआईएम), आइटम 2.13 और 2.14 के अंक में भी परिलक्षित हुआ था।

आईएसओ 5725-1 के अनुसार, सामान्य शब्द "सटीकता" का उपयोग वास्तविक मूल्य के माप की निकटता का वर्णन करने के लिए किया जाता है। जब शब्द समान माप के माप के सेट पर लागू होता है, तो उसमें यादृच्छिक त्रुटि का एक घटक और व्यवस्थित त्रुटि का एक घटक सम्मलित होता है। इस स्थिति में ट्रूनेस माप परिणामों के एक सेट के वास्तविक (ट्रू) मान के माध्य की निकटता होती है और सटीकता परिणामों के एक सेट के बीच समझौते की निकटता होती है।

आईएसओ 5725-1 और वीआईएम भी "पूर्वाग्रह" शब्द के प्रयोग से बचते है, जिसे पहले बीएस 5497-1 में निर्दिष्ट किया गया था, क्योंकि चिकित्सा और कानून के रूप में विज्ञान और अभियांत्रिकी के क्षेत्र के बाहर इसके अलग-अलग अर्थ है।

बाइनरी वर्गीकरण में
सटीकता का उपयोग एक सांख्यिकीय माप के रूप में भी किया जाता है कि बाइनरी वर्गीकरण परीक्षण कितनी अच्छी तरह से किसी स्थिति को सही ढंग से पहचानता है या बाहर करता है। अर्थात, जांच किए गए स्थितियों की कुल संख्या के बीच सटीक भविष्यवाणियों (वास्तविक सकारात्मक और वास्तविक नकारात्मक दोनों) का अनुपात सटीकता होता है। जैसे, यह पूर्व और परीक्षण के बाद की संभाव्यता के अनुमानों की तुलना करता है। शब्दार्थ द्वारा संदर्भ को स्पष्ट करने के लिए, इसे अधिकांशतः "रैंड सटीकता" या "रैंड इंडेक्स" के रूप में संदर्भित किया जाता है।  यह परीक्षण का एक पैरामीटर होता है। बाइनरी सटीकता को मापने का सूत्र है:$$\text{Accuracy}=\frac{TP+TN}{TP+TN+FP+FN}$$

जहां टीपी = सही सकारात्मक; एफपी = झूठी सकारात्मक; टीएन = सही नकारात्मक; एफएन = मिथ्या नकारात्मक

ध्यान दें कि, इस संदर्भ में, ISO 5725-1 द्वारा परिभाषित सत्यता और परिशुद्धता की अवधारणाएं लागू नहीं होती है। एक कारण यह है कि मात्रा का एक "सही मूल्य" नहीं है, जबकि हर स्थिति के लिए दो संभावित वास्तविक मूल्य होते है, जबकि सटीकता सभी स्थितियों में औसत होती है और इसलिए दोनों मूल्यों को ध्यान में रखा जाता है। चूँकि, इस संदर्भ में सटीक और याद शब्द का उपयोग सूचना पुनर्प्राप्ति के क्षेत्र से उत्पन्न एक अलग मीट्रिक के अर्थ के लिए किया जाता है।

मल्टीक्लास वर्गीकरण में
मल्टीक्लास वर्गीकरण में सटीकता की गणना करते समय, सटीकता केवल सही वर्गीकरण का अंश होता है: $$\text{Accuracy}=\frac{\text{correct classifications}}{\text{all classifications}}$$ यह सामान्यतः प्रतिशत के रूप में व्यक्त किया जाता है। उदाहरण के लिए, यदि कोई क्लासिफायर दस भविष्यवाणियां करता है और उनमें से नौ सही है, तो सटीकता 90% होती है।

सटीकता को शीर्ष-5 सटीकता से अलग करने के लिए शीर्ष-1 सटीकता भी कहा जाता है, जो दृढ़ तंत्रिका नेटवर्क मूल्यांकन में सामान्य होता है। शीर्ष -5 सटीकता का मूल्यांकन करने के लिए, क्लासिफायर को प्रत्येक वर्ग के लिए सापेक्ष संभावनाएँ प्रदान करनी चाहिए। जब इन्हें क्रमबद्ध किया जाता है, तो एक वर्गीकरण को सही माना जाता है यदि सही वर्गीकरण नेटवर्क द्वारा की गई शीर्ष 5 भविष्यवाणियों में कहीं भी आ जाता है। इमेजनेट चुनौती द्वारा शीर्ष-5 सटीकता को लोकप्रिय बनाया गया था। यह सामान्यतः शीर्ष -1 सटीकता से अधिक होती है, क्योंकि दूसरे से पांचवें स्थान तक कोई भी सही भविष्यवाणी शीर्ष -1 स्कोर में सुधार नहीं करती है, लेकिन शीर्ष -5 स्कोर में सुधार करती है।

साइकोमेट्रिक्स और साइकोफिज़िक्स में
साइकोमेट्रिक्स और साइकोफिज़िक्स में, सटीकता शब्द का प्रयोग वैधता और निरंतर त्रुटि के साथ किया जाता है। परिशुद्धता विश्वसनीयता और परिवर्तनशील त्रुटि का पर्याय होता है। माप उपकरण या मनोवैज्ञानिक परीक्षण की वैधता प्रयोग या व्यवहार के साथ सहसंबंध के माध्यम से स्थापित की जाती है। विभिन्न प्रकार की सांख्यिकीय तकनीकों के साथ विश्वसनीयता स्थापित की जाती है, मौलिक रूप से क्रोनबैक के अल्फा जैसे आंतरिक स्थिरता परीक्षण के माध्यम से यह सुनिश्चित करने के लिए कि संबंधित प्रश्नों के सेट से संबंधित प्रतिक्रियाएं होती है, और फिर संदर्भ और लक्षित आबादी के बीच उन संबंधित प्रश्नों की तुलना करती है।

तर्क अनुकरण में
तर्क अनुकरण में, सटीक मॉडल के मूल्यांकन में एक सामान्य गलती एक इलेक्ट्रॉनिक सर्किट सिमुलेशन मॉडल की तुलना ट्रांजिस्टर सर्किट सिमुलेशन मॉडल से करता है। यह सटीकता में अंतर की तुलना होती है। सटीकता को विस्तार के संबंध में मापा जाता है और वास्तविकता के संबंध में भी मापा जाता है।

सूचना प्रणाली में
सूचना पुनर्प्राप्ति प्रणाली, जैसे कि डेटाबेस और वेब सर्च इंजन, का मूल्यांकन कई अलग-अलग मेट्रिक्स द्वारा किया जाता है, जिनमें से कुछ भ्रम मैट्रिक्स से प्राप्त होते है, जो परिणामों को सही सकारात्मक (दस्तावेज़ों को सही ढंग से पुनर्प्राप्त), सच्चे नकारात्मक (दस्तावेज़ों को सही ढंग से पुनर्प्राप्त नहीं किया गया) में विभाजित करते है। झूठे सकारात्मक (दस्तावेज़ गलत तरीके से पुनर्प्राप्त), और झूठे नकारात्मक (दस्तावेज़ गलत तरीके से पुनर्प्राप्त नहीं किए गए)। सामान्यतः उपयोग किए जाने वाले मेट्रिक्स में सटीकता और रिकॉल की धारणाएं सम्मलित होती है। इस संदर्भ में, सटीकता को पुनः प्राप्त दस्तावेजों के अंश के रूप में परिभाषित किया गया है जो मानव द्वारा चुने गए जमीनी सच्चाई प्रासंगिक परिणामों के एक सेट का उपयोग करके क्वेरी के लिए प्रासंगिक होते है (सच्चे सकारात्मक को सही + गलत सकारात्मक से विभाजित किया गया है)। रिकॉल को प्रासंगिक दस्तावेजों की कुल संख्या की तुलना में पुनर्प्राप्त किए गए प्रासंगिक दस्तावेजों के अंश के रूप में परिभाषित किया गया है (वास्तविक सकारात्मक सकारात्मक सकारात्मक + गलत नकारात्मक द्वारा विभाजित)। सामान्यतः, सटीकता की मीट्रिक का उपयोग किया जाता है, इसे दस्तावेजों की कुल संख्या से विभाजित सही वर्गीकरणों (वास्तविक सकारात्मक और वास्तविक नकारात्मक) की कुल संख्या के रूप में परिभाषित किया जाता है।

इनमें से कोई भी मेट्रिक्स परिणामों की रैंकिंग को ध्यान में नहीं रखता है। वेब खोज इंजनों के लिए रैंकिंग बहुत महत्वपूर्ण होती है क्योंकि पाठक संभवतः ही कभी परिणामों के पहले पृष्ठ से आगे जाते है, और वेब पर बहुत सारे दस्तावेज़ मैन्युअल रूप से उन सभी को वर्गीकृत करने के लिए है कि क्या उन्हें किसी खोज से सम्मलित किया जाना चाहिए या बाहर रखा जाना चाहिए। परिणामों की एक विशेष संख्या में कटऑफ जोड़ने से रैंकिंग को कुछ हद तक ध्यान में रखा जाता है। उदाहरण के लिए, k पर माप सटीकता, केवल शीर्ष दस (k=10) खोज परिणामों को देखते हुए परिशुद्धता का माप होता है। अधिक परिष्कृत मेट्रिक्स, जैसे कि रियायती संचयी लाभ, प्रत्येक व्यक्तिगत रैंकिंग को ध्यान में रखते है, और सामान्यतः इसका उपयोग तब किया जाता है जब यह महत्वपूर्ण होता है।

संज्ञानात्मक प्रणालियों में
संज्ञानात्मक प्रणालियों में, जैविक या कृत्रिम संस्थाओं द्वारा निष्पादित एक संज्ञानात्मक प्रक्रिया के परिणामों को चिह्नित करने और मापने के लिए सटीकता का उपयोग किया जाता है जहां एक संज्ञानात्मक प्रक्रिया डेटा, सूचना, ज्ञान या ज्ञान का एक उच्च-मूल्यवान रूप में परिवर्तन करती है। (DIKW पिरामिड) कभी-कभी, एक संज्ञानात्मक प्रक्रिया सटीक रूप से इच्छित या वांछित आउटपुट उत्पन्न करती है लेकिन कभी-कभी इच्छित या वांछित से बहुत दूर आउटपुट उत्पन्न करती है। इसके अतिरिक्त, एक संज्ञानात्मक प्रक्रिया की पुनरावृत्ति हमेशा एक ही परिणाम नहीं देती है। संज्ञानात्मक सटीकता (सीA) इच्छित या वांछित आउटपुट का उत्पादन करने के लिए एक संज्ञानात्मक प्रक्रिया की प्रवृत्ति होती है। संज्ञानात्मक परिशुद्धता (सीP) केवल अभीष्ट या वांछित परिणाम उत्पन्न करने के लिए एक संज्ञानात्मक प्रक्रिया की प्रवृत्ति होती है।  मानव/कोग पहनावा में संवर्धित अनुभूति को मापने के लिए, जहां एक या अधिक मनुष्य एक या एक से अधिक संज्ञानात्मक प्रणालियों (कोग) के साथ मिलकर काम करते है, संज्ञानात्मक सटीकता में वृद्धि होती है और संज्ञानात्मक वृद्धि की डिग्री को मापने में संज्ञानात्मक सटीकता सहायता करती है।

यह भी देखें

 * सांख्यिकी और मशीन लर्निंग में बाईस-वैरिएंस ट्रेडऑफ़
 * स्वीकृत और प्रायोगिक मूल्य
 * आधार सामग्री की गुणवत्ता
 * इंजीनियरिंग सहिष्णुता
 * सटीकता (बहुविकल्पी)
 * प्रायोगिक अनिश्चितता विश्लेषण
 * एफ-स्कोर
 * बाइनरी क्लासिफायर का मूल्यांकन # सिंगल मेट्रिक्स
 * सूचना गुणवत्ता
 * माप अनिश्चितता
 * प्रेसिजन (सांख्यिकी)
 * संभावना
 * यादृच्छिक और व्यवस्थित त्रुटियाँ
 * संवेदनशीलता और विशिष्टता
 * महत्वपूर्ण लोग
 * आंकड़ों की महत्ता

बाहरी संबंध

 * BIPM - Guides in metrology, Guide to the Expression of Uncertainty in Measurement (GUM) and International Vocabulary of Metrology (VIM)
 * "Beyond NIST Traceability: What really creates accuracy", Controlled Environments magazine
 * Precision and Accuracy with Three Psychophysical Methods
 * Appendix D.1: Terminology, Guidelines for Evaluating and Expressing the Uncertainty of NIST Measurement Results
 * Accuracy and Precision
 * Accuracy vs Precision — a brief video by Matt Parker
 * What's the difference between accuracy and precision? by Matt Anticole at TED-Ed