शेपफ़ाइल

शेपफाइल प्रारूप भौगोलिक सूचना प्रणाली (जीआईएस) सॉफ्टवेयर के लिए एक भूस्थानिक सदिश डेटा प्रारूप है। इसे एएसआरआई द्वारा और अन्य भौगोलिक सूचना प्रणाली के बीच डेटा इंटरऑपरेबिलिटी के लिए एक खुले मानक के रूप में विकसित और विनियमित किया जाता है। शेपफ़ाइल प्रारूप स्थानिक रूप से सदिश ग्राफिक्स सुविधाओं का वर्णन कर सकता है, जो बिंदु (ज्यामिति), पॉलीलाइन और बहुभुजों का उदाहरण के लिए पानी के कुएं नदियों और झीलों का प्रतिनिधित्व करते हैं और इस प्रकार प्रत्येक आइटम में एट्रिब्यूट (कंप्यूटिंग) इसका वर्णन करने वाले गुण का वर्णन करती है, जैसे नाम या तापमान इत्यादि।

अवलोकन
शेपफ़ाइल प्रारूप भौगोलिक स्थिति तथा उससे संबंधित एट्रिब्यूट सूचना के संग्रहीत करने के लिए एक डिजिटल सदिश भंडारण प्रारूप है। इस प्रारूप में भू-स्थानिक टोपोलॉजी जानकारी संग्रहीत करने की क्षमता का अभाव होता है। शेपफ़ाइल प्रारूप को 1990 के दशक के प्रारंभ में आर्कव्यू जी एस संस्करण 2 के साथ प्रस्तुत किया गया  है और  विभिन्न प्रकार के सॉफ़्टवेयर के साथ शेपफ़ाइल प्रारूप का उपयोग करके भौगोलिक डेटासेट को पढ़ना और लिखना अब संभव हो गया है।

शेपफ़ाइल प्रारूप ज्यामिति को बिंदुओं रेखाओं और बहुभुजों जैसी प्राचीन ज्यामितीय आकृतियों के रूप में संग्रहीत करता है। ये आकृतियाँ प्रत्येक आकृति से जुड़ी डेटा एट्रिब्यूट के साथ भौगोलिक डेटा का प्रतिनिधित्व करती है। शेपफाइल शब्द बहुत सामान्य होते है, लेकिन प्रारूप में एक ही निर्देशिका (कंप्यूटिंग) में संग्रहीत सामान्य फ़ाइल नाम प्रीफिक्स वाली फ़ाइलों का संग्रह होता है और इस प्रकार तीन अनिवार्य फाइलों में फ़ाइल नाम एक्सटेंशन .shp, .shx, और  .के रूप में होते है। वास्तविक शेपफ़ाइल विशेष रूप.shp फ़ाइल से संबंधित होती है, लेकिन वितरण के लिए अकेला अधूरा है क्योंकि अन्य सहायक फ़ाइलों की आवश्यकता होती है। यद्यपि आधुनिक सॉफ्टवेयर अनुप्रयोग लंबे नाम वाली फाइलों को स्वीकार करते हैं और इस प्रकार लीगेसी GIS सॉफ़्टवेयर के रूप में उम्मीद कर सकते हैं कि फ़ाइल नाम प्रीफिक्स को DOS 8.3 फ़ाइल नाम कन्वेंशन के अनुरूप आठ वर्णों तक सीमित किया जाता हैं।


 * अनिवार्य फ़ाइलें:
 * .shp - आकार प्रारूप; फ़ीचर ज्यामिति और कंटेंट -प्रकार x-gis/x-शेपफ़ाइल के रूप में होते है।
 * .shx- आकार सूचकांक प्रारूप; फ़ीचर ज्यामिति का स्थितिगत सूचकांक जो आगे और पीछे की ओर शीघ्रता से खोज करने की अनुमति देता है और कंटेंट -प्रकार x-gis/x शेपफ़ाइल के रूप में होते है।
 * .dbf - एट्रिब्यूट प्रारूप; प्रत्येक आकृति के लिए कॉलुम्नार विशेषताएँ, dBase IV प्रारूप में कंटेंट प्रकार अनुप्रयोग /ऑक्टेट-स्ट्रीम या टेक्स्ट/प्लैन के रूप में होते है।


 * अन्य फ़ाइलें :
 * .prj - प्रक्षेपण विवरण, निर्देशांक संदर्भ प्रणालियों के प्रसिद्ध टेक्स्ट प्रतिनिधित्व का उपयोग करते हुए कंटेंट -प्रकार टेक्स्ट /प्लैन या अनुप्रयोग /टेक्स्ट के रूप में होते है।
 * .sbn और .sbx - सुविधाओं का एक स्थानिक सूचकांक कंटेंट -प्रकार: x-gis/x-शेपफ़ाइल के रूप में होते है।
 * .fbn और .fbx - सुविधाओं का एक स्थानिक सूचकांक जो केवल पढ़ने के लिए है कंटेंट -प्रकार: x-gis/x-शेपफ़ाइल के रूप में उपयोग होते है।
 * .ain और .aih - तालिका में सक्रिय क्षेत्र का एक एट्रिब्यूट सूचकांक कंटेंट -प्रकार: x-gis/x-शेपफ़ाइल के रूप में उपयोग होते है।
 * .ixs - पढ़ने-लिखने वाले डेटासेट के लिए एक जियोकोडिंग इंडेक्स कंटेंट -प्रकार: x-gis/x-शेपफ़ाइल के रूप में उपयोग होते है।
 * .mxs - पढ़ने-लिखने वाले डेटासेट के लिए एक जियोकोडिंग इंडेक्स ओडीबी प्रारूप कंटेंट -प्रकार: x-gis/x-शेपफ़ाइल के रूप में उपयोग होते है।
 * .atx - के लिए एक एट्रिब्यूट सूचकांक .dbf फ़ाइल के रूप में  ArcGIS 8 और बाद के संस्करण कंटेंट प्रकार: x-gis/x-शेपफ़ाइल के रूप में उपयोग होते है।
 * .shp.xml - XML ​​प्रारूप में भू-स्थानिक मेटाडेटा, जैसे ISO 19115 या अन्य XML स्कीमा कंटेंट -प्रकार: अनुप्रयोग /fgdc+xml के रूप में उपयोग होते है।
 * .cpg - कोड पेज को निर्दिष्ट करने के लिए उपयोग किया जाता है और इस प्रकार .dbf) उपयोग किए जाने वाले अक्षरों को सांकेतिक अक्षरों में बदलना  की पहचान के लिए कंटेंट -प्रकार  टेक्स्ट/प्लैन या  x-gis/x-शेपफ़ाइल के रूप में उपयोग होते है।
 * .qix - मानचित्र सर्वर  और GDAL/OGR सॉफ़्टवेयर द्वारा उपयोग किया जाने वाला एक वैकल्पिक क्वाडट्री स्थानिक सूचकांक {कंटेंट -प्रकार: x-gis/x-शेपफ़ाइल के रूप में उपयोग होते है।

और इस प्रकार प्रत्येक में .shp, .shx, और .dbf फ़ाइलें में आकृतियाँ अनुक्रम में एक दूसरे से मेल खाती हैं, अर्थात पहला रिकॉर्ड .shp फ़ाइल पहले रिकॉर्ड से मेल खाती है .shx और .dbf फ़ाइलें, इत्यादि रूप में होती है। जबकि .shp और .shx फ़ाइलों में भिन्न -भिन्न एंडियननेस वाले विभिन्न क्षेत्र होते हैं, इसलिए फ़ाइल स्वरूपों के कार्यान्वयनकर्ता को प्रत्येक क्षेत्र की एंडियननेस का सम्मान करने और उसके साथ उचित व्यवहार करने के लिए बहुत सावधान रहना चाहिए।

शेपफाइल शेप प्रारूप(.shp)
मुख्य फ़ाइल (.shp) में ज्यामिति डेटा के रूप में सम्मलित होते है। किसी दिए गए फीचर की ज्यामिति को सदिश निर्देशांक के एक सेट के रूप में संग्रहीत किया जाता है। बाइनरी फ़ाइल में निश्चित-लंबाई वाला हेडर (कंप्यूटिंग) होता है जिसके बाद एक या अधिक चर-लंबाई के रिकॉर्ड होते है। प्रत्येक चर-लंबाई रिकॉर्ड में एक रिकॉर्ड हेडर घटक और एक रिकॉर्ड कंटेंट घटक के रूप में सम्मलित होता है और इस प्रकार फ़ाइल स्वरूप का विस्तृत विवरण ESRI शेपफ़ाइल प्रोद्योगिकीय विवरण में दिया गया है। इस प्रारूप को ऑटोकैड आकार फ़ॉन्ट स्रोत प्रारूप के साथ भ्रमित नहीं किया जाता है जो इसे.shpके रूप में साझा करता है।

निर्देशांक डेटा का 2डी अक्ष क्रम (XY) या ईस्टिंग नॉर्थिंग क्रम का उपयोग करके कार्टेशियन निर्देशांक पद्धति के रूप में जाना जाता है। यह अक्ष क्रम भौगोलिक निर्देशांक प्रणालियों के लिए कम्पेटिबिलिटी है, जहां क्रम समान रूप से देशांतर अक्षांश के रूप में है और ऊंचाई और माप के लिए ज्यामिति क्रमशः 3- या 4-आयामी Z और M निर्देशांक का समर्थन करती है। एक Z-आयाम त्रि-आयामी क्षेत्र में प्रत्येक निर्देशांक की ऊंचाई को संग्रहीत करता है, जिसका उपयोग विश्लेषण के लिए या 3डी कंप्यूटर ग्राफिक्स का उपयोग करके ज्यामिति के विज़ुअलाइज़ेशन के लिए किया जा सकता है और इस प्रकार उपयोगकर्ता-परिभाषित M आयाम का उपयोग कई कार्यों में से एक के लिए किया जा सकता है, जैसे कि रैखिक संदर्भ माप या 4D-आयामी क्षेत्र में किसी सुविधा के सापेक्ष समय को संग्रहीत करता है।

मुख्य फ़ाइल हेडर की लंबाई 100 बाइट्स तय की गई है और इसमें 17 क्षेत्र हैं; जबकि नौ 4-बाइट 32-बिट हस्ताक्षरित पूर्णांक या int32 पूर्णांक क्षेत्र और उसके बाद आठ 8-बाइट दोहरी सुनिश्चितता  हस्ताक्षरित फ़्लोटिंग पॉइंट क्षेत्र  होते है,

फ़ाइल में किसी भी संख्या में चर-लंबाई रिकॉर्ड सम्मलित होते हैं। प्रत्येक रिकॉर्ड के पहले 8 बाइट्स का रिकॉर्ड हेडर लगा होता है:

रिकॉर्ड हेडर के बाद वास्तविक रिकॉर्ड है:

चर-लंबाई रिकॉर्ड कंटेंट आकार प्रकार पर निर्भर करती है, जो या तो फ़ाइल हेडर में दिए गए आकार प्रकार या शून्य के रूप में होनी चाहिए। निम्नलिखित संभावित आकार प्रकार हैं,

शेपफाइल आकार सूचकांक प्रारूप (.shx)
सूचकांक में फ़ीचर ज्यामिति का स्थितीय सूचकांक और समान 100-बाइट हेडर के रूप में सम्मलित है और इस प्रकार.shp फ़ाइल जिसके किसी भी संख्या में 8-बाइट निश्चित-लंबाई वाले रिकॉर्ड होते हैं, जिसमें निम्नलिखित दो क्षेत्र सम्मलित होते हैं:

इस सूचकांक का उपयोग करके पहले आकार सूचकांक में पीछे की ओर खोज करना संभव होता है, क्योंकि यह निश्चित-लंबाई रिकॉर्ड का उपयोग करता है फिर रिकॉर्ड ऑफसेट को पढ़ना और उस ऑफसेट का उपयोग करके खोज करना संभव होता है और इस प्रकार की सही स्थिति .shp फ़ाइल के रूप में होती है। एक ही विधि का उपयोग करके यादृच्छिक ढंग से रिकॉर्ड की संख्या को आगे बढ़ाना संभव होता है।

अकेले दिए गए .shp फ़ाइल संपूर्ण इंडेक्स फ़ाइल को उत्पन्न करना संभव है, चूंकि शेपफाइल में अधिकांशतः एक इंडेक्स होना चाहिए, ऐसा करना एक भ्रष्ट फ़ाइल की मरम्मत के रूप में गिना जाता है।

शेपफाइल एट्रिब्यूट प्रारूप (.dbf)
यह फ़ाइल प्रत्येक आकृति के लिए एट्रिब्यूट को संग्रहीत करती है; यह dBase IV प्रारूप का उपयोग करता है। इस प्रकार प्रारूप सार्वजनिक ज्ञान के रूप में है और इसे कई dBase क्लोनों में प्रयुक्त किया जाता है जिन्हें xBase के नाम से जाना जाता है। उदाहरण के लिए ओपन-सोर्स शेपफाइल सी लाइब्रेरी अपने प्रारूप को xBase के रूप में होती है और  भले ही यह प्लैन dBase IV के रूप में प्रयुक्त किया जाता है। एट्रिब्यूट  के नाम और मान मानकीकृत नहीं हैं और आकृति फ़ाइल के स्रोत के आधार पर भिन्न  होती है।

शेपफ़ाइल स्थानिक सूचकांक प्रारूप (.sbn)
यह एक बाइनरी स्थानिक सूचकांक फ़ाइल है, जिसका उपयोग केवल Esri सॉफ़्टवेयर द्वारा किया जाता है। प्रारूप Esri द्वारा प्रलेखित नहीं है। हालाँकि इसे ओपन सोर्स समुदाय द्वारा रिवर्स-इंजीनियरिंग और दस्तावेजीकरण किया गया है। 100-बाइट हेडर इसके समान है .shp. यह वर्तमान में अन्य विक्रेताओं द्वारा कार्यान्वित नहीं किया गया है। {{code|.sbn}bn}} फ़ाइल पूरी तरह से आवश्यक नहीं है, क्योंकि .shp फ़ाइल में स्थानिक डेटा को सफलतापूर्वक पार्स करने के लिए आवश्यक सभी जानकारी सम्मलित है।

टोपोलॉजी और शेपफाइल प्रारूप
शेपफ़ाइल प्रारूप में टोपोलॉजी जानकारी संग्रहीत करने की क्षमता नहीं है। ईएसआरआई आर्कइन्फो कवरेज डेटा#जीआईएस प्रारूप और व्यक्तिगत/फ़ाइल/उद्यम जियोडेटाबेस में फीचर टोपोलॉजी को संग्रहीत करने की क्षमता है।

स्थानिक प्रतिनिधित्व
पॉलीलाइन या बहुभुज के किनारे बिंदुओं से बने होते हैं। बिंदुओं का अंतर स्पष्ट रूप से उस पैमाने को निर्धारित करता है जिस पर सुविधा दृष्टिगत रूप से उपयोगी है। उस पैमाने से अधिक होने पर प्रतिनिधित्व अनियमित हो जाता है। बड़े पैमाने पर चिकनी आकृतियाँ प्राप्त करने के लिए अतिरिक्त बिंदुओं की आवश्यकता होगी। चिकनी वक्रों द्वारा बेहतर प्रतिनिधित्व वाली सुविधाओं के लिए, बहुभुज प्रतिनिधित्व के लिए, उदाहरण के लिए, स्प्लाइन (गणित) की तुलना में बहुत अधिक डेटा भंडारण की आवश्यकता होती है, जो सुचारू रूप से भिन्न -भिन्न आकृतियों को कुशलतापूर्वक कैप्चर कर सकता है। कोई भी शेपफ़ाइल प्रारूप प्रकार स्प्लिंस का समर्थन नहीं करता है।

डेटा भंडारण
दोनों का आकार .shp और .dbf घटक फ़ाइलें 2 जीबी (या 231बाइट्स) - लगभग 70 मिलियन पॉइंट फ़ीचर। अन्य ज्यामिति प्रकारों के लिए फीचर की अधिकतम संख्या उपयोग किए गए शीर्षों की संख्या के आधार पर भिन्न होती है।

के लिए एट्रिब्यूट डेटाबेस प्रारूप .dbf घटक फ़ाइल पुराने dBase मानक पर आधारित है। इस डेटाबेस प्रारूप में स्वाभाविक रूप से कई सीमाएँ हैं: *जबकि वर्तमान dBase मानक, और GDAL|GDAL/OGR (शेपफाइल प्रारूप डेटासेट को पढ़ने और लिखने के लिए मुख्य ओपन सोर्स सॉफ़्टवेयर लाइब्रेरी) Null (SQL) मानों का समर्थन करते हैं, ESRI सॉफ़्टवेयर इन मानों को शून्य के रूप में प्रस्तुत करता है - मात्रात्मक विश्लेषण के लिए एक बहुत ही गंभीर मुद्दा डेटा, क्योंकि यदि शून्य मात्राओं को शून्य के रूप में दर्शाया जाता है तो यह प्रतिनिधित्व और आंकड़ों को विकृत कर सकता है
 * यूनिकोड क्षेत्र नाम या क्षेत्र संग्रहण के लिए ख़राब समर्थन
 * क्षेत्र नामों की अधिकतम लंबाई 10 अक्षर है
 * क्षेत्र की अधिकतम संख्या 255 है
 * समर्थित क्षेत्र प्रकार हैं: फ़्लोटिंग पॉइंट (13 वर्ण संग्रहण), पूर्णांक (4 या 9 वर्ण संग्रहण), दिनांक (कोई समय संग्रहण नहीं; 8 वर्ण संग्रहण), और टेक्स्ट (अधिकतम 254 वर्ण संग्रहण)
 * फ्लोटिंग पॉइंट नंबरों में राउंडिंग त्रुटियां हो सकती हैं क्योंकि उन्हें टेक्स्ट के रूप में संग्रहीत किया जाता है

मिश्रण आकार प्रकार
क्योंकि आकृति प्रकार प्रत्येक ज्यामिति रिकॉर्ड से पहले होता है, एक आकृति फ़ाइल प्रोद्योगिकीय रूप से विभिन्न आकार प्रकारों के मिश्रण को संग्रहीत करने में सक्षम होती है। हालाँकि, विनिर्देश में कहा गया है, एक शेपफाइल में सभी गैर-शून्य आकृतियों को एक ही आकार प्रकार का होना आवश्यक है। इसलिए, आकार प्रकारों को मिश्रित करने की यह क्षमता फ़ाइल के शीर्षलेख में घोषित एकल आकार प्रकार के साथ शून्य आकृतियों को जोड़ने तक सीमित होनी चाहिए। एक शेपफाइल में पॉलीलाइन और पॉलीगॉन दोनों डेटा नहीं होने चाहिए, उदाहरण के लिए, एक कुएं (बिंदु), एक नदी (पॉलीलाइन), और एक झील (बहुभुज) का विवरण तीन भिन्न -भिन्न डेटासेट में संग्रहीत किया जाएगा।

यह भी देखें

 * भौगोलिक सूचना प्रणाली
 * भू-स्थानिक कंसोर्टियम खोलें
 * ओपन सोर्स जियोस्पेशियल फाउंडेशन (OSGeo)
 * भौगोलिक सूचना प्रणाली सॉफ्टवेयर की सूची
 * भौगोलिक सूचना प्रणाली सॉफ्टवेयर की तुलना

बाहरी संबंध

 * शेपफ़ाइल file extensions – Esri Webhelp docs for ArcGIS 10.0 (2010)
 * Esri – Understanding Topology and शेपफ़ाइल s
 * shapelib.maptools.org – Free c library for reading/writing शेपफ़ाइल s
 * Python शेपफ़ाइल Library – Open Source (MIT License) Python library for reading/writing शेपफ़ाइल s
 * शेपफ़ाइल Projection Finder - Detect unknown projection of a शेपफ़ाइल  automatically
 * Java शेपफ़ाइल and Dbase Libraries – Open Source (Apache License) Java libraries for reading/writing शेपफ़ाइल s and the associated dBase files (libraries are part of the AFC Library but could be used independently)