पीडीएफ417

पीडीएफ417 एक स्टैक्ड लीनियर बारकोड प्रारूप है जिसका उपयोग परिवहन, पहचान पत्र और इन्वेंट्री प्रबंधन जैसे विभिन्न अनुप्रयोगों में किया जाता है। पीडीएफ का मतलब पोर्टेबल डेटा फ़ाइल है। 417 दर्शाता है कि कोड में प्रत्येक पैटर्न में 17 इकाइयों (मॉड्यूल) लंबे पैटर्न में 4 बार और रिक्त स्थान होते हैं। पीडीएफ417 सिम्बोलॉजी का आविष्कार 1991 में प्रतीक प्रौद्योगिकी में डॉ. यिनजियुन पी. वांग द्वारा किया गया था। इसे ISO 15438 में परिभाषित किया गया है।

अनुप्रयोग
पीडीएफ417 का उपयोग वाणिज्यिक और सरकारी दोनों संगठनों द्वारा कई अनुप्रयोगों में किया जाता है। पीडीएफ417 उन प्रारूपों में से एक है (डेटा मैट्रिक्स के साथ) जिसका उपयोग संयुक्त राज्य डाक सेवा द्वारा स्वीकार किए गए डाक टिकट को मुद्रित करने के लिए किया जा सकता है। पीडीएफ417 का उपयोग एयरलाइन उद्योग के बार कोडेड बोर्डिंग पास (बार कोडेड बोर्डिंग पास) मानक द्वारा पेपर बोर्डिंग पास के लिए 2डी बार कोड प्रतीकवाद के रूप में भी किया जाता है। पीडीएफ417 होमलैंड सिक्योरिटी विभाग द्वारा रीयलआईडी अनुरूप चालक लाइसेंस  और राज्य द्वारा जारी पहचान पत्र के लिए मशीन पठनीय क्षेत्र प्रौद्योगिकी के रूप में चयनित मानक है। पीडीएफ417 बारकोड इज़राइल राज्य द्वारा जारी वीज़ा (यात्रा) और सीमा पार कार्डों पर भी शामिल हैं ([[:File:Israel_border_card.png|उदाहरण)।

विशेषताएँ
द्वि-आयामी बार कोड की विशिष्ट विशेषताओं के अलावा, PDF417 की क्षमताओं में शामिल हैं:

ISO/IEC दस्तावेज़ का परिचय बताता है: ::बार कोड उपकरण के निर्माताओं और बार कोड प्रौद्योगिकी के उपयोगकर्ताओं को सार्वजनिक रूप से उपलब्ध मानक सिम्बोलॉजी विशिष्टताओं की आवश्यकता होती है, जिनका वे उपकरण और एप्लिकेशन मानकों को विकसित करते समय उल्लेख कर सकते हैं। यह आईएसओ/आईईसी का इरादा और समझ है कि इस अंतर्राष्ट्रीय मानक में प्रस्तुत सहजीवन पूरी तरह से सार्वजनिक डोमेन में है और सभी उपयोगकर्ता प्रतिबंधों, लाइसेंस और शुल्क से मुक्त है।
 * लिंक करना। पीडीएफ417 प्रतीक अन्य प्रतीकों से लिंक हो सकते हैं जिन्हें अनुक्रम में स्कैन किया जाता है जिससे और भी अधिक डेटा संग्रहीत किया जा सकता है।
 * उपयोगकर्ता-निर्दिष्ट आयाम। उपयोगकर्ता यह तय कर सकता है कि सबसे संकीर्ण ऊर्ध्वाधर पट्टी (एक्स आयाम) कितनी चौड़ी है, और पंक्तियाँ कितनी लंबी हैं (वाई आयाम)।
 * सार्वजनिक डोमेन प्रारूप. कोई भी बिना किसी लाइसेंस के इस प्रारूप का उपयोग करके सिस्टम लागू कर सकता है।

प्रारूप


PDF417 बार कोड (जिसे प्रतीक भी कहा जाता है) में 3 से 90 पंक्तियाँ होती हैं, जिनमें से प्रत्येक एक छोटे रैखिक बार कोड की तरह होती है। प्रत्येक पंक्ति में है:
 * एक शांत क्षेत्र. यह बार कोड शुरू होने से पहले सफेद स्थान की अनिवार्य न्यूनतम मात्रा है।
 * एक प्रारंभ पैटर्न जो प्रारूप को PDF417 के रूप में पहचानता है।
 * एक पंक्ति बाईं ओर कोडवर्ड है जिसमें पंक्ति के बारे में जानकारी होती है (जैसे कि पंक्ति संख्या और त्रुटि सुधार स्तर)
 * 1-30 डेटा कोडवर्ड: कोडवर्ड बार और रिक्त स्थान का एक समूह है जो एक या अधिक संख्याओं, अक्षरों या अन्य प्रतीकों का प्रतिनिधित्व करता है।
 * पंक्ति के बारे में अधिक जानकारी के साथ एक पंक्ति सही कोडवर्ड।
 * एक स्टॉप पैटर्न.
 * एक और शांत क्षेत्र।

सभी पंक्तियों की चौड़ाई समान है; प्रत्येक पंक्ति में समान संख्या में कोडवर्ड हैं।

कोडवर्ड
पीडीएफ417 सूत्र  929 एन्कोडिंग का उपयोग करता है। प्रत्येक कोडवर्ड 0 से 928 तक की संख्या को दर्शाता है।

कोडवर्ड को डार्क (बार) और लाइट (स्पेस) क्षेत्रों के पैटर्न द्वारा दर्शाया जाता है। इनमें से प्रत्येक पैटर्न में चार बार और चार स्थान होते हैं (जहां नाम में 4 आता है)। कुल चौड़ाई सबसे संकीर्ण अनुमत ऊर्ध्वाधर पट्टी (एक्स आयाम) की चौड़ाई से 17 गुना है; नाम में 17 यहीं से आता है। प्रत्येक पैटर्न एक बार से शुरू होता है और एक स्थान के साथ समाप्त होता है।

पंक्ति की ऊँचाई न्यूनतम चौड़ाई से कम से कम 3 गुना होनी चाहिए: Y ≥ 3 X।

प्रत्येक कोडवर्ड को दर्शाने के लिए तीन अलग-अलग बार-स्पेस पैटर्न का उपयोग किया जाता है। इन पैटर्नों को तीन समूहों में व्यवस्थित किया जाता है जिन्हें क्लस्टर कहा जाता है। क्लस्टर को 0, 3 और 6 लेबल किया गया है। एक से अधिक क्लस्टर में कोई बार-स्पेस पैटर्न का उपयोग नहीं किया जाता है। प्रतीक की पंक्तियाँ तीन समूहों के माध्यम से चक्रित होती हैं, इसलिए पंक्ति 1 क्लस्टर 0 से पैटर्न का उपयोग करती है, पंक्ति 2 क्लस्टर 3 का उपयोग करती है, पंक्ति 3 क्लस्टर 6 का उपयोग करती है, और पंक्ति 4 फिर से क्लस्टर 0 का उपयोग करती है।

कौन सा क्लस्टर एक समीकरण द्वारा निर्धारित किया जा सकता है:
 * $$K = b_1 - b_2 + b_3 - b_4 + 9 \,\, \pmod 9$$

जहां K क्लस्टर संख्या है और biप्रतीक वर्ण (X इकाइयों में) में i-वें काली पट्टी की चौड़ाई देखें।

वैकल्पिक रूप से,
 * $$K = E_1 - E_2 + E_5 - E_6 + 9 \,\, \pmod 9$$

जहां ईii-वें किनारे से अगले-समान-किनारे की दूरी है। विषम सूचकांक एक बार के अग्रणी किनारे से अगले बार के अग्रणी किनारे तक होते हैं; यहां तक ​​कि सूचकांक भी अनुगामी किनारों के लिए हैं।

तीन समूहों का एक उद्देश्य यह निर्धारित करना है कि कोडवर्ड किस पंक्ति (मॉड 3) में है। क्लस्टर एकल स्कैन लाइन का उपयोग करके प्रतीक के हिस्सों को पढ़ने की अनुमति देते हैं जो क्षैतिज से तिरछा हो सकता है। {{rp|5.11.1}उदाहरण के लिए, स्कैन पंक्ति की शुरुआत में पंक्ति 6 ​​पर शुरू हो सकता है लेकिन पंक्ति 10 पर समाप्त हो सकता है। स्कैन की शुरुआत में, स्कैनर निरंतर प्रारंभ पैटर्न देखता है, और फिर यह क्लस्टर 6 में प्रतीकों को देखता है। जब तिरछा हो जाता है पंक्तियों 6 और 7 को स्कैन करें, फिर स्कैनर को शोर दिखाई देता है। जब स्कैन पंक्ति 7 पर होता है, तो स्कैनर क्लस्टर 0 में प्रतीकों को देखता है। नतीजतन, स्कैनर तिरछा दिशा जानता है। जब तक स्कैनर दाईं ओर पहुंचता है, यह पंक्ति 10 पर होता है, इसलिए यह क्लस्टर 0 पैटर्न देखता है। स्कैनर एक निरंतर स्टॉप पैटर्न भी देखेगा।

एन्कोडिंग
929 उपलब्ध कोड शब्दों में से 900 का उपयोग डेटा के लिए किया जाता है, और 29 का उपयोग विशेष कार्यों के लिए किया जाता है, जैसे प्रमुख मोड के बीच स्थानांतरण। तीन प्रमुख मोड अलग-अलग प्रकार के डेटा को अलग-अलग तरीकों से एनकोड करते हैं, और आवश्यकतानुसार एक ही बार कोड में मिलाया जा सकता है:
 * बाइट: 5 कोड शब्दों का प्रत्येक समूह 6 बाइट्स का प्रतिनिधित्व करता है। (क्योंकि 9005>2566.) अतिरिक्त बाइट्स को प्रति कोड शब्द में से एक एन्कोड किया जाता है।
 * संख्यात्मक: n अंक एन्कोड किए गए हैं $\floor{n/3}$+1 कोड शब्द, 15 कोड शब्दों में अधिकतम 44 अंक।
 * पाठ: प्रत्येक कोड शब्द दो आधार-30 अंकों का प्रतिनिधित्व करता है, जिनका उपयोग मुद्रण योग्य ASCII वर्णों (प्लस कैरिज रिटर्न, रेखा भरण और क्षैतिज टैब) का प्रतिनिधित्व करने के लिए चार सबमोड की एक प्रणाली द्वारा किया जाता है:
 * अपरकेस: ए-जेड, स्पेस (विराम चिह्न), लोअरकेस में बदलें, मिश्रित में बदलें, अगले अंक को विराम चिह्न के रूप में समझें
 * लोअरकेस: ए-जेड, एसपी, अगले अंक को अपरकेस के रूप में समझें, मिश्रित में बदलें, अगले अंक को विराम चिह्न के रूप में समझें
 * मिश्रित: 0-9, और, सीआर, एचटी, अल्पविराम, :, #, -, अवधि, $, /, +, %, *, =, ^, विराम चिह्न में बदलें, एसपी, लोअरकेस में बदलें, बदलें अपरकेस, अगले अंक को विराम चिह्न के रूप में समझें
 * विराम चिह्न: ;, <, >, @, [, \, ], _, `, ~, !, CR, HT, अल्पविराम, :, LF, -, अवधि, $, /,, |, *, , ?, {, }, ', अपरकेस में बदलें

त्रुटि सुधार
जब PDF417 प्रतीक बनाया जाता है, तो 2 से 512 तक त्रुटि का पता लगाने और सुधार कोडवर्ड जोड़े जाते हैं। पीडीएफ417 रीड-सोलोमन त्रुटि सुधार का उपयोग करता है। जब प्रतीक को स्कैन किया जाता है, तो किए जा सकने वाले सुधारों की अधिकतम संख्या जोड़े गए कोडवर्ड की संख्या के बराबर होती है, लेकिन मानक अनुशंसा करता है कि सही जानकारी की विश्वसनीयता सुनिश्चित करने के लिए दो कोडवर्ड को रोक कर रखा जाए।

अन्य सहजीवन के साथ तुलना
पीडीएफ417 एक स्टैक्ड बारकोड है जिसे प्रतीक पर एक साधारण रैखिक स्कैन के साथ पढ़ा जा सकता है। उन रैखिक स्कैनों को प्रारंभ और स्टॉप कोड शब्दों के साथ बाएं और दाएं कॉलम की आवश्यकता होती है। इसके अतिरिक्त, स्कैन को यह जानने की आवश्यकता है कि वह किस पंक्ति को स्कैन कर रहा है, इसलिए प्रतीक की प्रत्येक पंक्ति को अपनी पंक्ति संख्या को भी एन्कोड करना होगा। इसके अलावा, रीडर का लाइन स्कैन सिर्फ एक पंक्ति को स्कैन नहीं करेगा; यह आम तौर पर एक पंक्ति को स्कैन करना शुरू कर देगा, लेकिन फिर पड़ोसी तक पहुंच जाएगा और संभवतः लगातार पंक्तियों को पार करना जारी रखेगा। इन क्रॉसिंग के प्रभाव को कम करने के लिए, पीडीएफ417 मॉड्यूल लंबे और संकीर्ण हैं - ऊंचाई आमतौर पर चौड़ाई से तीन गुना है। साथ ही, प्रत्येक कोड शब्द को यह अवश्य इंगित करना चाहिए कि वह किस पंक्ति से संबंधित है ताकि क्रॉसओवर होने पर, उनका पता लगाया जा सके। कोड शब्द भी डेल्टा-डिकोडेबल होने के लिए डिज़ाइन किए गए हैं, इसलिए कुछ कोड शब्द अनावश्यक हैं। प्रत्येक पीडीएफ डेटा कोड शब्द लगभग 10 बिट जानकारी (लॉग) का प्रतिनिधित्व करता है2(900)≈9.8), लेकिन मुद्रित कोड शब्द (अक्षर) 17 मॉड्यूल चौड़ा है। 3 मॉड्यूल की ऊंचाई सहित, एक PDF417 कोड शब्द 10 बिट्स का प्रतिनिधित्व करने के लिए 51 वर्ग मॉड्यूल लेता है। वह क्षेत्र अन्य ओवरहेड जैसे प्रारंभ, स्टॉप, पंक्ति, प्रारूप और ईसीसी जानकारी की गणना नहीं करता है।

अन्य 2डी कोड, जैसे डेटा मैट्रिक्स  और  क्यू आर संहिता, को असंगठित रैखिक स्कैन के बजाय छवि सेंसर के साथ डिकोड किया जाता है। उन कोडों को अभी भी पहचान और संरेखण पैटर्न की आवश्यकता है, लेकिन उन्हें उतना प्रमुख होने की आवश्यकता नहीं है। एक 8 बिट कोड वर्ड में 8 वर्ग मॉड्यूल लगेंगे (पहचान, संरेखण, प्रारूप और ईसीसी जानकारी को नजरअंदाज करते हुए)।

व्यवहार में, एक PDF417 प्रतीक डेटामैट्रिक्स या QR कोड का लगभग चार गुना क्षेत्रफल लेता है।

बाहरी संबंध

 * PDF417 Description
 * Free font, Windows encoder and detailed explanation
 * PDF417 Barcode Generator
 * ZXing PDF417 online decoder
 * PDF417 online decoder