डाटा (कंप्यूटर विज्ञान)

[[कंप्यूटर विज्ञान]] में, डाटा (एकवचन, बहुवचन, या सामूहिक संज्ञा के रूप में माना जाता है) एक या अधिक प्रतीकों का कोई क्रम है; विवरण डाटा का एकल प्रतीक है। डाटा को सूचना बनने के लिए व्याख्या की आवश्यकता होती है। अंकीय डाटा वह डाटा है जिसे समधर्मी संकेत प्रतिनिधित्व के स्थान पर युग्मक संख्या प्रणाली (1) और शून्य (0) का उपयोग करके दर्शाया जाता है। आधुनिक (1960 के बाद) कंप्यूटर प्रणाली में, सभी डाटा अंकीय हैं।

डाटा तीन अवस्थाओं में उपस्थित होते हैं: स्थिर डाटा, पारगमन में डाटा और उपयोग में डाटा है। एक कंप्यूटर के भीतर डाटा, अधिकतर स्तिथियों में,समानांतर डेटा के रूप में चलता है। कंप्यूटर से या उसके पास जाने वाला डेटा, अधिकतर स्तिथियों में, क्रमिक डेटा के रूप में चलता है। एक समरूप युक्‍ति से प्राप्त डेटा, जैसे तापमान संवेदक, को रेखीय-से-अंकीय परिवर्तक का उपयोग करके अंकीय में परिवर्तित किया जा सकता है। मात्रा, वर्ण, या प्रतीकों का प्रतिनिधित्व करने वाला डाटा, जिस पर कंप्यूटर द्वारा संचालन किया जाता है, आधार सामग्री भंडारण और अभिलेखबद्ध (कंप्यूटर विज्ञान) चुंबकीय पट्टी पर डाटा भंडारण, दृक् भंडारण, विद्युत् या यांत्रिक अभिलेखन मीडिया, और अंकीय इलेक्ट्रिकल के रूप में डाटा संचार या दृक् संकेत है। डाटा परिधीय के माध्यम से कंप्यूटर से अंदर और बाहर जाता है।

भौतिक स्मृति तत्वों में एक एड्रेस और डाटा संग्रहण का एक बाइट/शब्द सम्मिलित होता है। अंकीय डाटा को प्रायः संबंधात्मक आंकड़ाकोष में संग्रहीत किया जाता है, जैसे तालिका (आंकड़ाकोष) या SQL आंकड़ाकोष, और सामान्यतः सार कुंजी / मान जोड़े के रूप में प्रदर्शित किया जा सकता है। डाटा को कई अलग-अलग प्रकार की डाटा संरचनाओं में व्यवस्थित किया जा सकता है, जिसमें सरणियाँ, डाटा प्रकार)]] सम्मिलित हैं। डाटा संरचनाएँ चल बिन्दु आधार, श्रृंखला (कंप्यूटर विज्ञान) और यहां तक ​​​​कि अन्य पुनरावर्ती डाटा प्रकार सहित कई अलग-अलग डाटा प्रकारों के डाटा को संग्रहीत कर सकती हैं।

विशेषताएं
मेटाडाटा आंकड़ों को सूचना में अनुवाद करने में मदद करता है। मेटाडाटा डाटा के बारे में डाटा है। मेटाडाटा निहित, निर्दिष्ट या दिया जा सकता है।

भौतिक घटनाओं या प्रक्रियाओं से संबंधित डाटा में एक अस्थायी घटक होगा। यह अस्थायी घटक निहित हो सकता है। यह ऐसी स्तिथि है जब तापमान प्रचालेखित्र जैसे उपकरण को तापमान संवेदक से डाटा प्राप्त होते हैं। जब तापमान प्राप्त होता है तो यह माना जाता है कि डाटा का अब का अस्थायी संदर्भ है। इसलिए उपकरण तारीख, समय और तापमान को एक साथ अभिलेखबद्ध कर लेता है। जब डाटा प्रचालेखित्र तापमान का संचार करता है, तो उसे प्रत्येक तापमान पठन के लिए मेटाडाटा के रूप में दिनांक और समय की विवरणी भी करनी चाहिए।

मौलिक रूप से, कंप्यूटर डाटा के रूप में दिए गए निर्देशों के अनुक्रम का पालन करते हैं। किसी दिए गए कार्य (या कार्यों) को करने के लिए निर्देशों के एक सम्मुच्चय को कंप्यूटर क्रमादेश कहा जाता है। क्रमादेश एक कंप्यूटर या अन्य यन्त्र के संचालन को नियंत्रित करने के लिए कूटित निर्देशों के रूप में डाटा होते हैं। नाममात्र की स्तिथि में, कंप्यूटर द्वारा निष्पादन (कंप्यूटिंग) के रूप में क्रमादेश में यन्त्र कूट सम्मिलित होगा। कंप्यूटर डाटा भंडारण के तत्व क्रमादेश द्वारा युक्तियोजित किए गए, लेकिन वास्तव में केंद्रीय प्रक्रिया इकाई (सीपीयू) द्वारा निष्पादित नहीं किए गए, डाटा भी हैं। सबसे आवश्यक रूप से, एकल डाटा एक विशिष्ट स्थान पर संग्रहीत मान (कंप्यूटर विज्ञान) है। इसलिए, कंप्यूटर क्रमादेश के लिए उनके क्रमादेशिकी डाटा में युक्तियोजित करके, अन्य कंप्यूटर क्रमादेश पर काम करना संभव है।

किसी संचिका में डाटा बाइट को संग्रहीत करने के लिए, उन्हें संचिका स्वरूप में क्रमबद्ध करना होगा। सामान्यतः, क्रमादेश विशेष संचिका प्रकारों में संग्रहीत होते हैं, जो अन्य डाटा के लिए उपयोग किए जाने वाले से भिन्न होते हैं। निष्पादन योग्य में कार्यक्रम होते हैं; अन्य सभी संचिकाएँ भी डाटा संचिकाएँ हैं। हालाँकि, निष्पादन योग्य संचिकाओं में क्रमादेश द्वारा उपयोग किया जाने वाला डाटा भी हो सकता है जो क्रमादेश में बनाया गया है। विशेष रूप से, कुछ निष्पादन योग्य संचिकाओं में एक डाटा खंड होता है, जिसमें मुख्य रूप से चर के लिए स्थिरांक और प्रारंभिक मान होते हैं, जिनमें से दोनों को आंकड़ा माना जा सकता है।

क्रमादेश और डाटा के बीच की रेखा धुंधली हो सकती है। उदाहरण के लिए एक दुभाषिया (कंप्यूटिंग), क्रमादेश है। एक दुभाषिया के लिए निविष्ट डाटा अपने आप में एक क्रमादेश है, केवल मूल यन्त्र कूट में व्यक्त नहीं किया गया है। कई स्तिथियों में, व्याख्या किया गया क्रमादेश मानव-पठनीय पाठ्य संचिका होगा, जिसे पाठ संपादक क्रमादेश के साथ जोड़-तोड़ किया जाता है। मेटाप्रोग्रामिंग में इसी तरह क्रमादेश सम्मिलित होते हैं जो डाटा के रूप में अन्य प्रोग्रामों में युक्तियोजित करते हैं। संकलनकर्ता, संयोजक (कंप्यूटिंग), दोषमार्जक, सॉफ्टवेयर आधुनिकीकरण, एंटीवायरस सॉफ्टवेयर जैसे क्रमादेश और ऐसे अन्य प्रोग्रामों को उनके डाटा के रूप में उपयोग करते हैं।

उदाहरण के लिए, एक उपयोगकर्ता (कंप्यूटिंग) पहले प्रचालन प्रणाली को एक संचिका से एक शब्द संसाधक क्रमादेश उद्‍भारण करने का निर्देश दे सकता है, और फिर किसी अन्य संचिका में संग्रहीत दस्तावेज़ संचिका स्वरूप को खोलने और संपादित करने के लिए चल रहे क्रमादेश का उपयोग कर सकता है। इस उदाहरण में, प्रपत्र को आंकड़ा माना जाएगा। यदि शब्द प्रक्रमक में वर्तनी परीक्षक भी होता है, तो वर्तनी परीक्षक के लिए शब्दकोष (शब्द सूची) को भी आंकड़ा माना जाएगा। वर्तनी परीक्षक द्वारा सुधारों का सुझाव देने के लिए उपयोग किए जाने वाले कलन विधि या तो यन्त्र कूट डाटा या कुछ व्याख्यात्मक क्रमादेशन भाषा में पाठ होंगे।

एक वैकल्पिक उपयोग में, युग्मक संचिकाएँ (जो मानव-पठनीय माध्यम नहीं हैं को कभी-कभी मानव-पठनीय पाठ संचिका से अलग डाटा कहा जाता है। 2007 में अंकीय डाटा की कुल राशि 281 बिलियन गीगाबाइट (281 विविध-बाइट यूनिट) होने का अनुमान लगाया गया था।

डाटा कुंजियाँ और मूल्य, संरचनाएँ और दृढ़ता
डाटा में कुंजियाँ मूल्यों के लिए संदर्भ प्रदान करती हैं। डाटा की संरचना के बावजूद, हमेशा एक प्रमुख घटक उपस्थित होता है। डाटा मूल्यों को अर्थ देने के लिए डाटा और डाटा-संरचनाओं में कुंजियाँ आवश्यक हैं। एक कुंजी के बिना जो सीधे या परोक्ष रूप से मूल्य से जुड़ा हुआ है, या संरचना में मूल्यों का संग्रह है, मूल्य अर्थहीन हो जाते हैं और डाटा नहीं रह जाते हैं। कहने का तात्पर्य यह है कि इसे आंकड़ा माना जाने के लिए एक मूल्य घटक से जुड़ा एक प्रमुख घटक होना चाहिए।

निम्नलिखित उदाहरणों के अनुसार कंप्यूटर में डाटा को कई तरीकों से दर्शाया जा सकता है:

रैम

 * रैंडम अभिगम स्मृति (रैम) में वह डाटा होते हैं जिस तक सीपीयू की सीधी पहुंच होती है। एक सीपीयू केवल अपने संसाधक पंजिका या स्मृति के भीतर डाटा में युक्तियोजित कर सकता है। यह डाटा भंडारण के विपरीत है, जहां सीपीयू को भंडारण उपकरण (चर्किका, टेप...) और स्मृति के बीच डाटा स्थानान्तरण को निर्देशित करना चाहिए। RAM रैखिक सन्निहित स्थानों की एक सरणी है जिसे एक प्रोसेसर पढ़ने या लिखने के संचालन के लिए एक एड्रेस प्रदान करके पढ़ या लिख ​​सकता है। प्रोसेसर किसी भी समय किसी भी क्रम में स्मृति में किसी भी स्थान पर काम कर सकता है। रैम में डाटा का सबसे छोटा तत्व युग्मक अंश होता है। RAM तक पहुँचने की क्षमताएँ और सीमाएँ प्रोसेसर विशिष्ट हैं। सामान्यतः कंप्यूटर डाटा भंडारण को एड्रेस 0 (हेक्साडेसिमल 0) से प्रारम्भ होने वाले स्मृति एड्रेस पंजी की एक सरणी के रूप में व्यवस्थित किया जाता है। कंप्यूटर शिल्प विद्या के आधार पर प्रत्येक स्थान सामान्यतः 8 या 32 बिट संग्रह कर सकता है।

कुंजी

 * डाटा कुंजियों को स्मृति में प्रत्यक्ष हार्डवेयर एड्रेस नहीं होना चाहिए। डाटा संरचना बनाने के लिए अप्रत्यक्ष, अमूर्त और तार्किक कुंजियों के कूट मूल्यों के सहयोग से संग्रहीत किए जा सकते हैं। डाटा संरचनाओं ने संरचना के प्रारम्भ से प्रतिसंतुलन (कंप्यूटर विज्ञान) (या श्रृंखला या पथ) को पूर्व निर्धारित किया है, जिसमें डाटा मान संग्रहीत हैं। इसलिए, डाटा कुंजी में संरचना की कुंजी और संरचना में प्रतिसंतुलन (या श्रृंखला या पथ) सम्मिलित हैं। जब इस तरह की संरचना को दोहराया जाता है, तो डाटा मानों की विविधताओं और डाटा कुंजियों को एक ही दोहराई जाने वाली संरचना के भीतर संग्रहीत किया जाता है, परिणाम को एक तालिका (सूचना) के समान माना जा सकता है, जिसमें दोहराई जाने वाली संरचना के प्रत्येक तत्व को एक पंक्ति और संरचना के प्रत्येक दोहराव को तालिका की एक पंक्ति के रूप में माना जाता है। डाटा के ऐसे संगठन में, डाटा कुंजी सामान्यतः पंक्ति के एक (या कई में मानों का संयोजन) में एक मान होता है।

संगठित आवर्ती डाटा संरचनाएं

 * डाटा संरचनाओं को दोहराने की तालिका (सूचना) दृश्य कई संभावनाओं में से एक है। दोहराई जाने वाली डाटा संरचनाओं को पदानुक्रम में व्यवस्थित किया जा सकता है, जैसे कि माता-पिता-बाल संबंधों के एक झरने में पर्णसंधि एक-दूसरे से जुड़े होते हैं। मान और संभावित रूप से अधिक जटिल डाटा-संरचनाएं पर्णसंधि से जुड़ी हुई हैं। इस प्रकार निःस्पंद पदानुक्रम निःस्पंद से जुड़े डाटा संरचनाओं को संबोधित करने की कुंजी प्रदान करता है। इस प्रतिनिधित्व को प्रतिलोमित तरू (डाटा संरचना) के रूप में माना जा सकता है। उदा. आधुनिक कंप्यूटर प्रचालन प्रणाली संचिका प्रणाली एक सामान्य उदाहरण हैं; और एक्सएमएल दूसरा उदाहरण है।

क्रमबद्ध या आदेशित डाटा

 * डाटा जब समाकलन होता है तो उसमें कुछ अन्तर्निहित विशेषताएँ होती हैं। कुंजी के उपवर्ग के सभी मान एक साथ दिखाई देते हैं। एक ही कुंजी, या प्रमुख परिवर्तनों के एक उपसमुच्चय के साथ डाटा के समूहों के माध्यम से अनुक्रमिक रूप से पारित होने पर, इसे डाटा प्रसंस्करण वृत्त में विभाजन या नियंत्रण विभाजन के रूप में संदर्भित किया जाता है। यह विशेष रूप से कुंजी के उपवर्ग पर डाटा मानों के एकत्रीकरण की सुविधा प्रदान करता है।

परिधीय भंडारण

 * स्फुर स्मृति जैसी थोक अहासी स्मृति के आगमन तक, परिधीय युक्ति को डाटा लिखकर पारंपरिक रूप से लगातार डाटा भंडारण प्राप्त किया गया था। ये उपकरण सामान्यतः चुंबकीय मीडिया पर एक स्थान की तलाश करते हैं और फिर पूर्व निर्धारित आकार के खंड (डाटा संग्रहण) को पढ़ते या लिखते हैं। इस स्तिथि में, मीडिया पर खोज स्थान डाटा कुंजी है और खंड डाटा मान हैं। डाटा संचिकाओं के लिए चक्रिका चालक पर प्रारंभिक उपयोग किए गए अप्रशिक्षित चर्किका डाटा संचिका-प्रणाली या चर्किका प्रचालन प्रणाली आरक्षित विखंडन (कंप्यूटिंग) खण्ड हैं। उन प्रणालियों में, संचिकाओं को भरा जा सकता था, इससे पहले कि उन्हें सभी डाटा लिखे गए थे, डाटा स्थान समाप्त हो गए। इस प्रकार प्रत्येक संचिका के लिए पर्याप्त खाली स्थान सुनिश्चित करने के लिए बहुत अधिक अप्रयुक्त डाटा स्थान अनुत्पादक रूप से आरक्षित किया गया था। बाद में संचिका-प्रणाली ने विभाजन प्रकार प्रस्तुत किया। उन्होंने विभाजन के लिए चर्किका डाटा स्थान के खण्ड आरक्षित किए और आवंटित खण्डों का अधिक आर्थिक रूप से उपयोग किया, गतिशील रूप से विभाजन के खण्ड को एक संचिका में आवश्यकतानुसार निर्दिष्ट करके किया गया। इसे प्राप्त करने के लिए, संचिका प्रणाली को सूची या संचिका आवंटन तालिका में डाटा संचिकाओं द्वारा कौन से खण्ड का उपयोग या अप्रयुक्त किया गया था, इसका पद चिन्ह रखना था। हालांकि इसने चर्किका डाटा स्थान का बेहतर उपयोग किया, इसके परिणामस्वरूप चर्किका भर में संचिकाओं का विखंडन हुआ, और डाटा पढ़ने के लिए अतिरिक्त खोज समय के कारण सहवर्ती प्रदर्शन उपरिव्यय हो गया। आधुनिक संचिका प्रणाली संचिका अभिगम समय को अनुकूलित करने के लिए खंडित संचिकाओं को गतिशील रूप से पुनर्गठित करते हैं। संचिका प्रणाली में आगे के विकास के परिणामस्वरूप चक्रिका चालक का आभासीकरण हुआ, जहां एक तार्किक अंतर्नोद को कई भौतिक अंतर्नोद से विभाजन के रूप में परिभाषित किया जा सकता है।

अनुक्रमित डाटा

 * एक बहुत बड़े सम्मुच्चय से डाटा के एक छोटे से उपवर्ग को पुनः प्राप्त करने का अर्थ हो सकता है कि क्रमिक रूप से डाटा के माध्यम से अक्षम रूप से खोज करना है। आंकड़ाकोष तालिका संचिकाओं, तालिकाओं और डाटा सम्मुच्चयों में डाटा संरचनाओं से कुंजियों और स्थान के संचय स्थल को अनुकरण करने का एक तरीका है, फिर मूल डाटा के एक उपवर्ग को पुनः प्राप्त करने में लगने वाले समय को कम करने के लिए तरु (डाटा संरचना) का उपयोग करके उन्हें व्यवस्थित करें। ऐसा करने के लिए, पुनर्प्राप्त किए जाने वाले डाटा के उपवर्ग की कुंजी को पुनर्प्राप्ति प्रारम्भ होने से पहले ज्ञात होना चाहिए। सबसे लोकप्रिय तालिकाबी-वृक्ष और डायनेमिक हैश फंकशन की इंडेक्सिंग मेथड हैं। डाटा दर्ज करने और पुनर्प्राप्त करने के लिए सूचकांकन उपरिव्यय है। अनुक्रमणिका को व्यवस्थित करने के अन्य तरीके हैं, उदा. द्विभाजी अन्वेषण कलन विधि का उपयोग करना है।

अमूर्तता और संकेत
यह तात्कालिकता के बाद ही होता है कि एक निर्दिष्ट वर्ग की वस्तु उपस्थित होती है। किसी वस्तु का संदर्भ साफ होने के बाद वस्तु का अस्तित्व भी समाप्त हो जाता है। स्मृति स्थान जहां वस्तु के डाटा संग्रहीत किये गए थे अपशिष्ट संग्रह (कंप्यूटर विज्ञान) है और पुन: उपयोग के लिए उपलब्ध अप्रयुक्त स्मृति के रूप में पुनः वर्गीकृत किया गया है।
 * वस्तु-उन्मुख क्रमादेशन डाटा और सॉफ्टवेयर को समझने के लिए दो बुनियादी अवधारणाओं का उपयोग करती है:
 * 1) वर्ग (कंप्यूटर क्रमादेशन) की वर्गीकरणात्मक क्रम संरचना, जो एक पदानुक्रमित डाटा संरचना का एक उदाहरण है; और
 * 2) कार्य अवधि पर, कक्षा पुस्तकालय से तत्काल वस्तुओं की स्मृति संघनन में डाटा-संरचनाओं के संदर्भों का निर्माण है।

आंकड़ाकोष डाटा

 * आंकड़ाकोष के आगमन ने लगातार डाटा भंडारण के लिए एक और अमूर्त परत प्रस्तुत की है। आंकड़ाकोष मेटाडाटा का उपयोग करते हैं, और उपभोगता-परिवेषक प्रतिरूप प्रणाली के बीच एक SQL विज्ञप्ति, संगणक संजाल पर संचार करते हैं, डाटा को सहेजते समय आंकड़ाकोष लेनदेन पूर्णता सुनिश्चित करने के लिए दो-चरण प्रतिबद्ध विज्ञप्ति उत्काष्ठन प्रणाली का उपयोग करते हैं।

समानांतर वितरित उत्काष्ठन प्रसंस्करण

 * आधुनिक मापनीय और उच्च-प्रदर्शन डाटा दृढ़ता प्रौद्योगिकियां, जैसे अपाचे हडूप, उच्च बैंड विस्तार संजाल पर कई वाणिज्या कंप्यूटरों में बड़े मापक्रम पर समानांतर वितरित डाटा प्रसंस्करण पर निर्भर करती हैं। ऐसी प्रणालियों में, डाटा कई कंप्यूटरों में वितरित किया जाता है और इसलिए प्रणाली में किसी विशेष कंप्यूटर को डाटा की कुंजी में प्रत्यक्ष या अप्रत्यक्ष रूप से दर्शाया जाना चाहिए। यह डाटा के दो समान सम्मुच्चय के बीच अंतर को सक्षम करता है, प्रत्येक को एक ही समय में एक अलग कंप्यूटर पर संसाधित किया जा रहा है।

यह भी देखें

 * प्रचुर आंकड़े
 * आंकड़े शब्दकोश
 * प्रतिरूपण की दिनांक
 * आकड़ों का प्रवाह
 * आंकड़े सम्मुच्चय
 * आंकड़ाकोष तालिका
 * स्थिति (कंप्यूटर विज्ञान)
 * टपल