फ़्लैट-फ़ाइल डेटाबेस

From Vigyanwiki
Revision as of 21:00, 5 August 2023 by alpha>Artiverma
फ़्लैट फ़ाइल मॉडल का उदाहरण[1]

फ़्लैट-फ़ाइल डेटाबेस फ़ाइल में संग्रहीत डेटाबेस है जिसे फ़्लैट फ़ाइल कहा जाता है। रिकॉर्ड यूनिफार्म फॉर्मेट का पालन करते हैं, और रिकॉर्ड के मध्य संबंधों को इंडेक्सिंग करने या पहचानने के लिए कोई संरचना नहीं होती है। फ़ाइल सरल है, फ़्लैट फ़ाइल प्लेन टेक्स्ट फ़ाइल (जैसे सीएसवी, टीएक्सटी या टीएसवी) या बाइनरी फ़ाइल हो सकती है। डेटाबेस में डेटा से संबंधों का अनुमान लगाया जा सकता है, किंतु डेटाबेस फॉर्मेट स्वयं उन रिलेशनशिप को स्पष्ट नहीं करता है।

इस शब्द का तात्पर्य सामान्यतः छोटा डेटाबेस है, किंतु अधिक बड़े डेटाबेस भी फ्लैट हो सकते हैं।

अवलोकन

प्लेन टेक्स्ट फ़ाइलों में सामान्यतः प्रति लाइन रिकॉर्ड (कंप्यूटर विज्ञान) होता है।[2] डेटा को चित्रित करने के लिए भिन्न-भिन्न परंपराएँ हैं। अल्पविराम से भिन्न किए गए मान और डिलिमिटर से भिन्न किए गए मान फ़ाइलों में, फ़ील्ड (कंप्यूटर विज्ञान) को अल्पविराम से भिन्न किए गए मान या टैब से भिन्न किए गए मान वर्णों जैसे डिलिमिटर द्वारा भिन्न किया जा सकता है। अन्य स्थितियों में, प्रत्येक फ़ील्ड की निश्चित लंबाई हो सकती है; संक्षिप्त मानों को स्पेस वर्णों के साथ जोड़ा जा सकता है। डिलिमिटर कोलिजन से बचने के लिए अतिरिक्त फोर्मटिंग की आवश्यकता हो सकती है।

डिलीमीटर का उपयोग करने पर प्रत्येक संसाधित होने पर ज्ञात करने में कुछ कम्प्यूटेशनल ओवरहेड व्यय होता है (फिक्स्ड-विड्थ फ़ॉर्मेटिंग के विपरीत), जिसका कंप्यूटर प्रदर्शन पर प्रभाव पड़ सकता है। चूँकि कैरेक्टर डिलीमीटर (विशेष रूप से अल्पविराम) का उपयोग भी डेटा कम्प्रेशन का क्रूड रूप है जो डेटा वॉल्यूम को कम करके समग्र प्रदर्शन में सहायता कर सकता है- विशेष रूप से डेटा ट्रांसमिशन उद्देश्यों के लिए वर्ण डिलिमिटर का उपयोग जिसमें लंबाई घटक (स्ट्रिंग घोषणात्मक) सम्मिलित है, तुलनात्मक रूप से दुर्लभ है, किंतु प्रत्येक क्षेत्र की सीमा को ज्ञात करने के लिए जुड़े ओवरहेड को अधिक सीमा तक कम कर देता है।

फ़्लैट फ़ाइलों के उदाहरणों में यूनिक्स जैसे ऑपरेटिंग सिस्टम पर /etc/passwd और /etc/group सम्मिलित हैं। फ़्लैट फ़ाइल का अन्य उदाहरण नेम, एड्रेस और फ़ोन नंबर फ़ील्ड वाली नेम-और-एड्रेस लिस्ट है।

पेपर की शीट पर हैण्ड से लिखे गए नेम, एड्रेस और फोन नंबरों की लिस्ट फ्लैट-फ़ाइल डेटाबेस है। यह किसी टाइपराइटर या वर्ड प्रोसेसर से भी किया जा सकता है। फ्लैट-फ़ाइल डेटाबेस को प्रारम्भ करने के लिए स्प्रेडशीट या टेक्स्ट एडिटर प्रोग्राम का उपयोग किया जा सकता है, जिसे पश्चात में उत्तम सर्च क्षमताओं के लिए प्रिंटेड या ऑनलाइन उपयोग किया जा सकता है।

इतिहास

संयुक्त राज्य अमेरिका की जनगणना ब्यूरो के लिए हरमन होलेरिथ का काम पहली बार 1890 की संयुक्त राज्य अमेरिका की जनगणना में किया गया था, जिसमें पेपर कार्ड में छेद के माध्यम से सारणीबद्ध डेटा सम्मिलित था,[3] इसे कभी-कभी पहला कम्प्यूटरीकृत फ़्लैट-फ़ाइल डेटाबेस माना जाता है, क्योंकि इसमें अन्य कार्डों को अनुक्रमित करने वाला कोई कार्ड सम्मिलित नहीं होता है, या अन्यथा व्यक्तिगत कार्डों को -दूसरे से संबंधित नहीं किया जाता है, उनकी समूह सदस्यता को छोड़कर।

1980 के दशक में, कॉन्फ़िगर करने योग्य फ्लैट-फ़ाइल डेटाबेस कंप्यूटर अनुप्रयोग आईबीएम पीसी और एप्पल मैकिंटोश पर लोकप्रिय थे। ये प्रोग्राम व्यक्तियों के लिए अपने स्वयं के डेटाबेस को डिज़ाइन करना और उपयोग करना आसान बनाने के लिए डिज़ाइन किए गए थे, और लोकप्रियता में लगभग वर्ड प्रोसेसर और स्प्रेडशीट के बराबर थे। फ़्लैट-फ़ाइल डेटाबेस सॉफ़्टवेयर के उदाहरणों में फ़ाइल निर्माता के शुरुआती संस्करण और शेयरवेयर पीसी फ़ाइल और लोकप्रिय dBase सम्मिलित हैं।

फ़्लैट-फ़ाइल डेटाबेस सामान्य और सर्वव्यापी हैं क्योंकि उन्हें लिखना और संपादित करना आसान है, और सरल तरीके से असंख्य उद्देश्यों के लिए उपयुक्त हैं।

आधुनिक कार्यान्वयन

NoSQL डेटा के रैखिक भंडार, JSON स्वरूपित डेटा, आदिम स्प्रेडशीट (शायद अल्पविराम से भिन्न या टैब-सीमांकित), और टेक्स्ट फ़ाइलें सभी को फ्लैट-फ़ाइल डेटाबेस के रूप में देखा जा सकता है, क्योंकि उनमें ीकृत अनुक्रमित, डेटा तत्वों के मध्य अंतर्निहित संदर्भ, या जटिल डेटा प्रकारों का अभाव है। पुस्तकों या नियुक्तियों और पता पुस्तिका के संग्रह को प्रबंधित करने के लिए कार्यक्रम अनिवार्य रूप से ल-उद्देश्य वाले फ्लैट-फ़ाइल डेटाबेस का उपयोग कर सकते हैं, इंडेक्स या पॉइंटिंग सिस्टम से रहित फ्लैट फ़ाइलों से जानकारी संग्रहीत और पुनर्प्राप्त कर सकते हैं।

जबकि कोई उपयोगकर्ता सामग्री की तालिका को टेक्स्ट फ़ाइल में लिख सकता है, टेक्स्ट फ़ाइल प्रारूप में सामग्री की तालिका की अवधारणा सम्मिलित नहीं होती है। जबकि कोई उपयोगकर्ता जॉन की संपर्क जानकारी के लिए नोट्स अनुभाग में कैथी के साथ मित्र लिख सकता है, यह डेटाबेस की अंतर्निहित सुविधा के बजाय उपयोगकर्ता द्वारा व्याख्या की जाती है। जब डेटाबेस प्रणाली रिकॉर्ड्स के मध्य संबंधों को पहचानना और संहिताबद्ध करना शुरू करती है, तो यह फ्लैट होने से दूर होने लगती है, और जब इसमें प्रकारों और पदानुक्रमित संबंधों का वर्णन करने के लिए विस्तृत प्रणाली होती है, तो यह अब इतनी संरचित हो जाती है कि इसे फ्लैट नहीं माना जा सकता है।

उदाहरण आंकड़ेबेस

निम्नलिखित उदाहरण फ़्लैट-फ़ाइल डेटाबेस के विशिष्ट तत्वों को दिखाता है। डेटा व्यवस्था में तालिका (सूचना) में व्यवस्थित स्तंभों और पंक्तियों की श्रृंखला होती है। यह विशिष्ट उदाहरण केवल तालिका का उपयोग करता है।

कॉलम में सम्मिलित हैं: नाम ( व्यक्ति का नाम, दूसरा कॉलम); टीम (व्यक्ति द्वारा समर्थित एथलेटिक टीम का नाम, तीसरा कॉलम); और संख्यात्मक अद्वितीय आईडी, (अभिलेखों को विशिष्ट रूप से पहचानने के लिए उपयोग किया जाता है, पहला कॉलम)।

यहां वर्णित डेटा का उदाहरण टेक्स्ट्य प्रस्तुतिकरण दिया गया है:

आईडी नाम टीम
1 एमी ब्लूज़
2 बॉब रेड्स
3 चक ब्लूज़
4 रिचर्ड ब्लूज़
5 एथेल रेड्स
6 फ्रेड ब्लूज़
7 गिल्ली ब्लूज़
8 हैंक रेड्स
9 हैंक ब्लूज़

इस प्रकार का डेटा प्रतिनिधित्व फ़्लैट-फ़ाइल डेटाबेस के लिए अधिक मानक है, चूँकि कुछ अतिरिक्त विचार हैं जो टेक्स्ट से आसानी से स्पष्ट नहीं होते हैं:

  • 'डेटा प्रकार:' डेटाबेस तालिका में प्रत्येक कॉलम, जैसा कि ऊपर दिया गया है, सामान्यतः विशिष्ट डेटा प्रकार तक ही सीमित होता है। ऐसे प्रतिबंध सामान्यतः सम्मेलन द्वारा स्थापित किए जाते हैं, किंतु औपचारिक रूप से तब तक संकेत नहीं दिए जाते जब तक कि डेटा को संबंध का डेटाबेस सिस्टम में स्थानांतरित नहीं किया जाता है।
  • 'पृथक कॉलम:' उपरोक्त उदाहरण में, भिन्न-भिन्न कॉलम को व्हाइटस्पेस (कंप्यूटर विज्ञान) वर्णों का उपयोग करके भिन्न किया गया है। इसे इंडेंटेशन या निश्चित-चौड़ाई डेटा फ़ॉर्मेटिंग भी कहा जाता है। अन्य आम परंपरा या अधिक डिलिमिटर वर्णों का उपयोग करके स्तंभों को भिन्न करना है, जैसे अल्पविराम से भिन्न किए गए_मान|टैब या अल्पविराम।
  • 'संबंधपरक बीजगणित:' उपरोक्त तालिका में प्रत्येक पंक्ति या रिकॉर्ड संबंधपरक बीजगणित के तहत टुपल की मानक परिभाषा को पूरा करता है (उपरोक्त उदाहरण 3-टुपल्स की श्रृंखला को दर्शाता है)। इसके अतिरिक्त, पहली पंक्ति Tuple#Names को निर्दिष्ट करती है जो प्रत्येक पंक्ति के मानों से जुड़े होते हैं।
  • 'डेटाबेस प्रबंधन प्रणाली:' चूंकि टेक्स्ट फ़ाइल के साथ संभव औपचारिक संचालन सामान्यतः वांछित से अधिक सीमित होते हैं, उपरोक्त उदाहरण में टेक्स्ट सामान्यतः डेटाबेस प्रबंधन प्रणाली में स्थानांतरित होने से पहले डेटा की मध्यस्थ स्थिति का प्रतिनिधित्व करेगा।

यह भी देखें

  • passwd|/etc/passwd, सामान्यतः उपयोग की जाने वाली फ़्लैट फ़ाइल, जिसका उपयोग यूनिक्स में उपयोगकर्ताओं का विवरण देने के लिए किया जाता है
  • अल्पविराम से भिन्न किए गए मान (मानक अल्पविराम से भिन्न किए गए मान)
  • बर्कले डीबी (विशिष्ट फ्लैट-फ़ाइल डेटाबेस)
  • Awk (शास्त्रीय फ़्लैट-फ़ाइल प्रोसेसर)
  • Recfiles (सादा टेक्स्ट डेटाबेस फ़ाइल स्वरूप)

संदर्भ

  1. Data Integration Glossary Archived March 20, 2009, at the Wayback Machine, U.S. Department of Transportation, August 2001.
  2. Fowler, Glenn (1994), "cql: Flat-file database query language", WTEC'94: Proceedings of the USENIX Winter 1994 Technical Conference on USENIX Winter 1994 Technical Conference
  3. Blodgett, John H.; Schultz, Claire K. (1969). "Herman hollerith: data processing pioneer". American Documentation (in English). 20 (3): 221–226. doi:10.1002/asi.4630200307. ISSN 1936-6108.