यथार्थता एवं परिशुद्धता

सटीकता और सटीकता अवलोकन संबंधी त्रुटि के दो उपाय हैं। सटीकता यह है कि दिए गए मापों का एक सेट (अवलोकन या रीडिंग) उनके सही मूल्य के कितना करीब है, जबकि परिशुद्धता मापन एक दूसरे के कितने करीब हैं।

दूसरे शब्दों में, परिशुद्धता यादृच्छिक त्रुटियों का वर्णन है, जो सांख्यिकीय परिवर्तनशीलता का एक उपाय है। सटीकता की दो परिभाषाएँ हैं: पहले, उपरोक्त सटीकता की अधिक सामान्य परिभाषा में, अवधारणा परिशुद्धता से स्वतंत्र है, इसलिए डेटा के एक विशेष सेट को सटीक, सटीक, दोनों या दोनों में से कोई भी नहीं कहा जा सकता है।
 * 1) अधिक सामान्यतः, यह केवल 'व्यवस्थित त्रुटियों' का वर्णन है, जो केंद्रीय प्रवृत्ति के दिए गए माप के सांख्यिकीय पूर्वाग्रह का एक उपाय है; कम सटीकता परिणाम और वास्तविक मान के बीच अंतर का कारण बनती है; मानकीकरण के लिए अंतर्राष्ट्रीय संगठन इसे 'सत्यता' कहते हैं।
 * 2) वैकल्पिक रूप से, आईएसओ परिभाषित करता है सटीकता दोनों प्रकार की अवलोकन संबंधी त्रुटि (यादृच्छिक और व्यवस्थित) के संयोजन का वर्णन करती है, इसलिए उच्च सटीकता के लिए उच्च सटीकता और उच्च सत्यता दोनों की आवश्यकता होती है।

सरल शब्दों में, एक ही मात्रा के बार-बार माप से एक सांख्यिकीय नमूना या डेटा बिंदुओं का सेट दिया जाता है, नमूना या सेट को सटीक कहा जा सकता है यदि उनका औसत मापी जाने वाली मात्रा के सही मूल्य के करीब है, जबकि सेट कर सकते हैं सटीक कहा जा सकता है यदि उनका मानक विचलन अपेक्षाकृत छोटा है।

सामान्य तकनीकी परिभाषा
विज्ञान और अभियांत्रिकी के क्षेत्र में, माप प्रणाली की सटीकता किसी मात्रा के माप की उस मात्रा के वास्तविक मान (गणित) की निकटता की डिग्री है। एक की सटीकता माप प्रणाली, पुनरुत्पादनीयता और दोहराव से संबंधित, वह डिग्री है जिस पर अपरिवर्तित परिस्थितियों में दोहराए गए माप समान परिणाम दिखाते हैं। यद्यपि बोलचाल के उपयोग में सटीकता और सटीकता दो शब्द समानार्थक हो सकते हैं, लेकिन वैज्ञानिक पद्धति के संदर्भ में जानबूझकर इसके विपरीत किया जाता है।

आँकड़ों का क्षेत्र, जहाँ माप की व्याख्या एक केंद्रीय भूमिका निभाती है, सटीकता और सटीकता के बजाय पूर्वाग्रह (सांख्यिकी) और परिवर्तनशीलता (सांख्यिकी) शब्दों का उपयोग करना पसंद करती है: पूर्वाग्रह अशुद्धि की मात्रा है और परिवर्तनशीलता अशुद्धि की मात्रा है।

एक माप प्रणाली सटीक हो सकती है लेकिन सटीक नहीं, सटीक लेकिन सटीक नहीं, न तो, या दोनों। उदाहरण के लिए, यदि किसी प्रयोग में एक व्यवस्थित त्रुटि होती है, तो नमूना आकार बढ़ाने से आमतौर पर सटीकता बढ़ जाती है लेकिन सटीकता में सुधार नहीं होता है। परिणाम त्रुटिपूर्ण प्रयोग से परिणामों की एक सुसंगत लेकिन गलत स्ट्रिंग होगी। व्यवस्थित त्रुटि को खत्म करने से सटीकता में सुधार होता है लेकिन सटीकता में बदलाव नहीं होता है।

एक माप प्रणाली को वैध माना जाता है यदि यह सटीक और सटीक दोनों है। संबंधित शब्दों में पूर्वाग्रह (गैर-यादृच्छिक या निर्देशित प्रभाव एक कारक या स्वतंत्र चर से असंबंधित कारकों के कारण) और त्रुटि (यादृच्छिक परिवर्तनशीलता) शामिल हैं।

शब्दावली को अप्रत्यक्ष मापों पर भी लागू किया जाता है - अर्थात, देखे गए डेटा से कम्प्यूटेशनल प्रक्रिया द्वारा प्राप्त मान।

सटीकता और सटीकता के अलावा, मापन में माप संकल्प भी हो सकता है, जो अंतर्निहित भौतिक मात्रा में सबसे छोटा परिवर्तन है जो माप में प्रतिक्रिया उत्पन्न करता है।

संख्यात्मक विश्लेषण में, सटीकता भी सही मूल्य की गणना की मंहगाई है; जबकि परिशुद्धता प्रतिनिधित्व का संकल्प है, आमतौर पर दशमलव या बाइनरी अंकों की संख्या द्वारा परिभाषित किया जाता है।

सैन्य शब्दों में, सटीकता मुख्य रूप से आग की सटीकता (जस्टसी डी टीआईआर) को संदर्भित करती है, लक्ष्य के केंद्र में और उसके आस-पास शॉट्स के समूह के निकटता द्वारा व्यक्त की गई आग की सटीकता।

परिमाणीकरण
औद्योगिक उपकरण में, सटीकता माप की सहनशीलता, या उपकरण का संचरण है और जब उपकरण सामान्य परिचालन स्थितियों में उपयोग किया जाता है तो त्रुटियों की सीमा को परिभाषित करता है। आदर्श रूप से एक माप उपकरण सटीक और सटीक दोनों है, माप के साथ सभी वास्तविक मूल्य के करीब और कसकर क्लस्टर किए गए हैं। माप प्रक्रिया की सटीकता और सटीकता आमतौर पर कुछ ट्रैसेबिलिटी संदर्भ तकनीकी मानक को बार-बार मापने के द्वारा स्थापित की जाती है। इस तरह के मानकों को एसआई (फ्रांसीसी से संक्षिप्त एसआई: सिस्टेम इंटरनेशनल डी'यूनिट्स) में परिभाषित किया गया है और संयुक्त राज्य अमेरिका में राष्ट्रीय मानकों और प्रौद्योगिकी संस्थान जैसे राष्ट्रीय मानक संगठनों द्वारा बनाए रखा गया है।

यह तब भी लागू होता है जब माप दोहराए जाते हैं और औसत होते हैं। उस मामले में, मानक त्रुटि (सांख्यिकी) शब्द ठीक से लागू होता है: औसत की सटीकता औसत माप की संख्या के वर्गमूल से विभाजित प्रक्रिया के ज्ञात मानक विचलन के बराबर होती है। इसके अलावा, केंद्रीय सीमा प्रमेय से पता चलता है कि औसत मापों की संभाव्यता वितरण व्यक्तिगत मापों की तुलना में सामान्य वितरण के करीब होगा।

सटीकता के संबंध में हम भेद कर सकते हैं:
 * माप के माध्य और संदर्भ मान के बीच का अंतर, अनुमानक का पूर्वाग्रह। अंशांकन के लिए पूर्वाग्रह की स्थापना और सुधार आवश्यक है।
 * उस और परिशुद्धता का संयुक्त प्रभाव।

विज्ञान और इंजीनियरिंग में एक सामान्य परिपाटी महत्वपूर्ण अंकों के माध्यम से सटीकता और/या सटीक रूप से व्यक्त करना है। जहां स्पष्ट रूप से नहीं कहा गया है, त्रुटि का मार्जिन अंतिम महत्वपूर्ण स्थान के मूल्य का आधा समझा जाता है। उदाहरण के लिए, 843.6 m, या 843.0 m, या 800.0 m की रिकॉर्डिंग में 0.05 m का मार्जिन होगा (अंतिम महत्वपूर्ण स्थान दसवां स्थान है), जबकि 843 m की रिकॉर्डिंग में 0.5 m की त्रुटि का मार्जिन होगा ( अंतिम महत्वपूर्ण अंक इकाइयां हैं)।

अनुगामी शून्य और कोई दशमलव बिंदु के साथ 8,000 मीटर की रीडिंग अस्पष्ट है; अनुगामी शून्य महत्वपूर्ण आंकड़े के रूप में आशयित हो भी सकते हैं और नहीं भी। इस अस्पष्टता से बचने के लिए, संख्या को वैज्ञानिक संकेतन में दर्शाया जा सकता है: 8.0 × 103 m इंगित करता है कि पहला शून्य महत्वपूर्ण है (इसलिए 50 m का मार्जिन) जबकि 8.000 × 103 m इंगित करता है कि सभी तीन शून्य महत्वपूर्ण हैं, जो 0.5 m का मार्जिन देता है। इसी तरह, बुनियादी माप इकाई के एक गुणक का उपयोग किया जा सकता है: 8.0 किमी 8.0 × 10 के बराबर है 3 मि. यह 0.05 किमी (50 मी) के मार्जिन को इंगित करता है। हालांकि, इस सम्मेलन पर निर्भरता से उन स्रोतों से डेटा स्वीकार करते समय गलत सटीक त्रुटियां हो सकती हैं जो इसका पालन नहीं करते हैं। उदाहरण के लिए, 153,753 जैसी संख्या की रिपोर्ट करने वाला स्रोत सटीकता +/- 5,000 के साथ ऐसा लगता है कि इसमें सटीकता +/- 0.5 है। अधिवेशन के तहत इसे 154,000 तक गोल किया गया होगा।

वैकल्पिक रूप से, एक वैज्ञानिक संदर्भ में, यदि अधिक सटीकता के साथ त्रुटि के मार्जिन को इंगित करना वांछित है, तो 7.54398(23) × 10 जैसे अंकन का उपयोग किया जा सकता है।-10 मी, मतलब 7.54375 और 7.54421 × 10 के बीच की सीमा -10 मी.

परिशुद्धता में शामिल हैं: इंजीनियरिंग में, सटीकता को अक्सर माप के तीन गुना मानक विचलन के रूप में लिया जाता है, जो उस सीमा का प्रतिनिधित्व करता है जिसमें 99.73% माप हो सकते हैं। उदाहरण के लिए, मानव शरीर को मापने वाला एक एर्गोनोमिस्ट आश्वस्त हो सकता है कि उनके निकाले गए माप का 99.73% ± 0.7 सेमी के भीतर आता है - अगर GRYPHON प्रसंस्करण प्रणाली का उपयोग कर रहा है - या ± 13 सेमी - अगर असंसाधित डेटा का उपयोग कर रहा है।
 * पुनरावृत्ति - एक ही उपकरण और ऑपरेटर का उपयोग करके स्थितियों को स्थिर रखने के लिए सभी प्रयास किए जाने और कम समय अवधि के दौरान दोहराए जाने पर होने वाली भिन्नता; और
 * पुनरुत्पादन - विभिन्न उपकरणों और ऑपरेटरों के बीच एक ही माप प्रक्रिया का उपयोग करके उत्पन्न होने वाली भिन्नता, और लंबी अवधि में।

1994 में आईएसओ 5725 श्रृंखला के मानकों के प्रकाशन के साथ इन शब्दों के अर्थ में बदलाव दिखाई दिया, जो 2008 के बीआईपीएम इंटरनेशनल वोकैबुलरी ऑफ मेट्रोलॉजी (वीआईएम), आइटम 2.13 और 2.14 के अंक में भी परिलक्षित होता है।

आईएसओ 5725-1 के अनुसार, सामान्य शब्द सटीकता का उपयोग माप के वास्तविक मूल्य के निकटता का वर्णन करने के लिए किया जाता है। जब शब्द समान माप के माप के सेट पर लागू होता है, तो इसमें यादृच्छिक त्रुटि का एक घटक और व्यवस्थित त्रुटि का एक घटक शामिल होता है। इस मामले में ट्रूनेस माप परिणामों के एक सेट के वास्तविक (ट्रू) मान के माध्य की निकटता है और सटीकता परिणामों के एक सेट के बीच समझौते की निकटता है।

ISO 5725-1 और VIM भी पूर्वाग्रह (सांख्यिकी) शब्द के उपयोग से बचते हैं, जो पहले BS 5497-1 में निर्दिष्ट था, क्योंकि चिकित्सा और कानून के रूप में विज्ञान और इंजीनियरिंग के क्षेत्र के बाहर इसके अलग-अलग अर्थ हैं।

बाइनरी वर्गीकरण में
सटीकता का उपयोग एक सांख्यिकीय माप के रूप में भी किया जाता है कि बाइनरी वर्गीकरण परीक्षण कितनी अच्छी तरह से किसी स्थिति को सही ढंग से पहचानता है या बाहर करता है। अर्थात्, जांच किए गए मामलों की कुल संख्या के बीच सटीकता सही भविष्यवाणियों (वास्तविक सकारात्मक और वास्तविक नकारात्मक दोनों) का अनुपात है। जैसे, यह पूर्व और परीक्षण के बाद की संभाव्यता के अनुमानों की तुलना करता है। शब्दार्थ द्वारा संदर्भ को स्पष्ट करने के लिए, इसे अक्सर रैंड सटीकता या रैंड इंडेक्स के रूप में संदर्भित किया जाता है।  यह परीक्षण का एक पैरामीटर है। बाइनरी सटीकता को मापने का सूत्र है: $$\text{Accuracy}=\frac{TP+TN}{TP+TN+FP+FN}$$ कहाँ पे $TP = True positive$; $FP = False positive$; $TN = True negative$; $FN = False negative$ ध्यान दें कि, इस संदर्भ में, ISO 5725-1 द्वारा परिभाषित सत्यता और परिशुद्धता की अवधारणाएं लागू नहीं होती हैं। एक कारण यह है कि मात्रा का एक "सही मूल्य" नहीं है, बल्कि हर मामले के लिए दो संभावित वास्तविक मूल्य हैं, जबकि सटीकता सभी मामलों में औसत है और इसलिए दोनों मूल्यों को ध्यान में रखती है। हालाँकि, इस संदर्भ में सटीक और याद शब्द का उपयोग सूचना पुनर्प्राप्ति के क्षेत्र से उत्पन्न एक अलग मीट्रिक के अर्थ के लिए किया जाता है (#सूचना प्रणाली में)।

मल्टीक्लास वर्गीकरण में
मल्टीक्लास वर्गीकरण में सटीकता की गणना करते समय, सटीकता केवल सही वर्गीकरण का अंश है: $$\text{Accuracy}=\frac{\text{correct classifications}}{\text{all classifications}}$$ यह आमतौर पर प्रतिशत के रूप में व्यक्त किया जाता है। उदाहरण के लिए, यदि कोई क्लासिफायर दस भविष्यवाणियां करता है और उनमें से नौ सही हैं, तो सटीकता 90% है।

सटीकता को शीर्ष-5 सटीकता से अलग करने के लिए शीर्ष-1 सटीकता भी कहा जाता है, जो दृढ़ तंत्रिका नेटवर्क मूल्यांकन में सामान्य है। शीर्ष -5 सटीकता का मूल्यांकन करने के लिए, क्लासिफायर को प्रत्येक वर्ग के लिए सापेक्ष संभावनाएँ प्रदान करनी चाहिए। जब इन्हें क्रमबद्ध किया जाता है, तो एक वर्गीकरण को सही माना जाता है यदि सही वर्गीकरण नेटवर्क द्वारा की गई शीर्ष 5 भविष्यवाणियों में कहीं भी आता है। इमेज नेट चुनौती द्वारा शीर्ष-5 सटीकता को लोकप्रिय बनाया गया था। यह आमतौर पर शीर्ष -1 सटीकता से अधिक है, क्योंकि दूसरे से पांचवें स्थान तक कोई भी सही भविष्यवाणी शीर्ष -1 स्कोर में सुधार नहीं करेगी, लेकिन शीर्ष -5 स्कोर में सुधार करेगी।

साइकोमेट्रिक्स और साइकोफिज़िक्स में
साइकोमेट्रिक्स और साइकोफिजिक्स में, सटीकता शब्द का उपयोग वैधता (सांख्यिकी) और निरंतर त्रुटि के साथ किया जाता है। सटीकता विश्वसनीयता (सांख्यिकी) और परिवर्तनशील त्रुटि का पर्याय है। माप उपकरण या मनोवैज्ञानिक परीक्षण की वैधता प्रयोग या व्यवहार के साथ सहसंबंध के माध्यम से स्थापित की जाती है। विश्वसनीयता विभिन्न प्रकार की सांख्यिकीय तकनीकों के साथ स्थापित की जाती है, शास्त्रीय रूप से क्रोनबैक के अल्फा जैसे आंतरिक स्थिरता परीक्षण के माध्यम से यह सुनिश्चित करने के लिए कि संबंधित प्रश्नों के सेट से संबंधित प्रतिक्रियाएं हैं, और फिर संदर्भ और लक्ष्य आबादी के बीच उन संबंधित प्रश्नों की तुलना करें।

तर्क सिमुलेशन में
तर्क अनुकरण में, सटीक मॉडल के मूल्यांकन में एक सामान्य गलती एक इलेक्ट्रॉनिक सर्किट सिमुलेशन की तुलना एक ट्रांजिस्टर ट्रांजिस्टर मॉडल से करना है। यह सटीकता में अंतर की तुलना है, सटीकता की नहीं। सटीकता को विस्तार के संबंध में मापा जाता है और सटीकता को वास्तविकता के संबंध में मापा जाता है।

सूचना प्रणाली में
सूचना पुनर्प्राप्ति प्रणाली, जैसे कि डेटाबेस और वेब सर्च इंजन, का मूल्यांकन मूल्यांकन उपायों (सूचना पुनर्प्राप्ति) द्वारा किया जाता है, जिनमें से कुछ भ्रम मैट्रिक्स से प्राप्त होते हैं, जो परिणामों को सही सकारात्मक (दस्तावेज़ों को सही ढंग से पुनर्प्राप्त), सच्चे नकारात्मक (दस्तावेज़ों को सही ढंग से नहीं) में विभाजित करते हैं। पुनर्प्राप्त), झूठे सकारात्मक (दस्तावेज़ गलत तरीके से पुनर्प्राप्त), और झूठे नकारात्मक (दस्तावेज़ गलत तरीके से पुनर्प्राप्त नहीं किए गए)। आमतौर पर उपयोग किए जाने वाले मेट्रिक्स में सटीकता और रिकॉल की धारणाएं शामिल हैं। इस संदर्भ में, सटीकता को पुनः प्राप्त दस्तावेजों के अंश के रूप में परिभाषित किया गया है जो मानव द्वारा चुने गए जमीनी सच्चाई प्रासंगिक परिणामों के एक सेट का उपयोग करके क्वेरी के लिए प्रासंगिक हैं (सच्चे सकारात्मक को सही + गलत सकारात्मक से विभाजित किया गया है)। रिकॉल को प्रासंगिक दस्तावेजों की कुल संख्या की तुलना में पुनर्प्राप्त किए गए प्रासंगिक दस्तावेजों के अंश के रूप में परिभाषित किया गया है (वास्तविक सकारात्मक सकारात्मक सकारात्मक + गलत नकारात्मक द्वारा विभाजित)। आमतौर पर, सटीकता की मीट्रिक का उपयोग किया जाता है, इसे दस्तावेजों की कुल संख्या से विभाजित सही वर्गीकरणों (वास्तविक सकारात्मक और वास्तविक नकारात्मक) की कुल संख्या के रूप में परिभाषित किया जाता है।

इनमें से कोई भी मेट्रिक्स परिणामों की रैंकिंग को ध्यान में नहीं रखता है। वेब खोज इंजनों के लिए रैंकिंग बहुत महत्वपूर्ण है क्योंकि पाठक शायद ही कभी परिणामों के पहले पृष्ठ से आगे जाते हैं, और वेब पर बहुत सारे दस्तावेज़ मैन्युअल रूप से उन सभी को वर्गीकृत करने के लिए हैं कि क्या उन्हें किसी खोज से शामिल किया जाना चाहिए या बाहर रखा जाना चाहिए। परिणामों की एक विशेष संख्या में कटऑफ जोड़ने से रैंकिंग को कुछ हद तक ध्यान में रखा जाता है। उदाहरण के लिए, k पर माप सटीकता, केवल शीर्ष दस (k=10) खोज परिणामों को देखते हुए परिशुद्धता का माप है। अधिक परिष्कृत मेट्रिक्स, जैसे कि रियायती संचयी लाभ, प्रत्येक व्यक्तिगत रैंकिंग को ध्यान में रखते हैं, और आमतौर पर इसका अधिक उपयोग किया जाता है जहां यह महत्वपूर्ण है।

संज्ञानात्मक प्रणालियों में
संज्ञानात्मक प्रणालियों में, जैविक या कृत्रिम संस्थाओं द्वारा निष्पादित एक संज्ञानात्मक प्रक्रिया के परिणामों को चिह्नित करने और मापने के लिए सटीकता और सटीकता का उपयोग किया जाता है, जहां एक संज्ञानात्मक प्रक्रिया डेटा, सूचना, ज्ञान या ज्ञान का एक उच्च-मूल्यवान रूप में परिवर्तन है। (DIKW पिरामिड) कभी-कभी, एक संज्ञानात्मक प्रक्रिया सटीक रूप से इच्छित या वांछित आउटपुट उत्पन्न करती है लेकिन कभी-कभी इच्छित या वांछित से बहुत दूर आउटपुट उत्पन्न करती है। इसके अलावा, एक संज्ञानात्मक प्रक्रिया की पुनरावृत्ति हमेशा एक ही परिणाम नहीं देती है। संज्ञानात्मक सटीकता (सीA) इच्छित या वांछित आउटपुट उत्पन्न करने के लिए एक संज्ञानात्मक प्रक्रिया की प्रवृत्ति है। संज्ञानात्मक सटीकता (सीP) केवल इच्छित या वांछित परिणाम उत्पन्न करने के लिए एक संज्ञानात्मक प्रक्रिया की प्रवृत्ति है।  मानव/कोग पहनावा में संवर्धित अनुभूति को मापने के लिए, जहां एक या अधिक मनुष्य एक या एक से अधिक संज्ञानात्मक प्रणालियों (कोग) के साथ मिलकर काम करते हैं, संज्ञानात्मक सटीकता में वृद्धि होती है और संज्ञानात्मक वृद्धि की डिग्री को मापने में संज्ञानात्मक सटीकता सहायता करती है।

यह भी देखें

 * सांख्यिकी और मशीन लर्निंग में बाईस-वैरिएंस ट्रेडऑफ़
 * स्वीकृत और प्रायोगिक मूल्य
 * आधार सामग्री की गुणवत्ता
 * इंजीनियरिंग सहिष्णुता
 * सटीकता (बहुविकल्पी)
 * प्रायोगिक अनिश्चितता विश्लेषण
 * एफ-स्कोर
 * बाइनरी क्लासिफायर का मूल्यांकन # सिंगल मेट्रिक्स
 * सूचना गुणवत्ता
 * माप अनिश्चितता
 * प्रेसिजन (सांख्यिकी)
 * संभावना
 * यादृच्छिक और व्यवस्थित त्रुटियाँ
 * संवेदनशीलता और विशिष्टता
 * महत्वपूर्ण लोग
 * आंकड़ों की महत्ता

बाहरी संबंध

 * BIPM - Guides in metrology, Guide to the Expression of Uncertainty in Measurement (GUM) and International Vocabulary of Metrology (VIM)
 * "Beyond NIST Traceability: What really creates accuracy", Controlled Environments magazine
 * Precision and Accuracy with Three Psychophysical Methods
 * Appendix D.1: Terminology, Guidelines for Evaluating and Expressing the Uncertainty of NIST Measurement Results
 * Accuracy and Precision
 * Accuracy vs Precision — a brief video by Matt Parker
 * What's the difference between accuracy and precision? by Matt Anticole at TED-Ed