स्ट्रिंग ऑपरेशन

कंप्यूटर विज्ञान में, औपचारिक भाषा सिद्धांत के क्षेत्र में, विभिन्न प्रकार के रज्जु फलनो का लगातार उपयोग किया जाता है, हालाँकि, उपयोग किया गया संकेतन कंप्यूटर प्रोग्रामिंग के लिए उपयोग किए जाने वाले संकेतन से भिन्न है, और सैद्धांतिक क्षेत्र में आमतौर पर उपयोग किए जाने वाले कुछ फलन प्रोग्रामिंग करते समय शायद ही कभी उपयोग किए जाते हैं। यह आलेख इनमें से कुछ मूल शब्दों को परिभाषित करता है।

रज्जु और भाषाएँ
एक रज्जु वर्णों का एक सीमित अनुक्रम है। रिक्त रज्जु को $$\varepsilon$$ के द्वारा निरूपित किया जाता है। दो रज्जु $$s$$ और $$t$$ के संश्रृंखलन को $$s \cdot t$$ या $$s t$$ द्वारा दर्शाया जाता है। रिक्त रज्जु के साथ संश्रृंखलन करने से कोई अंतर नहीं पड़ता, $$s \cdot \varepsilon = s = \varepsilon \cdot s$$। रज्जु का संश्रृंखलन साहचर्य है, $$s \cdot (t \cdot u) = (s \cdot t) \cdot u$$।

उदाहरण के लिए, $$(\langle b \rangle \cdot \langle l \rangle) \cdot (\varepsilon \cdot \langle ah \rangle) = \langle bl \rangle \cdot \langle ah \rangle = \langle blah \rangle$$।

एक भाषा रज्जु का एक सीमित या अनंत समुच्चय है। सम्मिलन, सर्वनिष्ठ आदि जैसे सामान्य समुच्चय संक्रिया के अलावा, संश्रृंखलन को भाषाओं पर लागू किया जा सकता है, यदि $$S$$ और $$T$$ दोनों भाषाएँ हैं, तो वहाँ औपचारिक रूप से $$S \cdot T = \{ s \cdot t \mid s \in S \land t \in T \}$$ के लिय संश्रृंखलन $$S \cdot T$$ को $$S$$ से किसी भी रज्जु और $$T$$ से किसी भी रज्जु के संश्रृंखलन के समुच्चय के रूप में परिभाषित किया गया है । फिर, संश्रृंखलन बिंदु $$\cdot$$ को प्रायः संक्षिप्तता के लिए विलोपित कर दिया जाता है।

केवल रिक्त रज्जु वाली भाषा $$\{\varepsilon\}$$ को रिक्त भाषा $$\{\}$$ से प्रतिष्ठित करना है किसी भी भाषा को पहली भाषा के साथ श्रृंखलाबद्ध करने से कोई परिवर्तन नहीं होता है,$$S \cdot \{\varepsilon\} = S = \{\varepsilon\} \cdot S$$, बाद वाले के साथ संश्रृंखलन करने पर हमेशा रिक्त भाषा उत्पन्न होती है, $$S \cdot \{\} = \{\} = \{\} \cdot S$$। भाषाओं का संश्रृंखलन साहचर्य है,$$S \cdot (T \cdot U) = (S \cdot T) \cdot U$$।

उदाहरण के लिए, $$D = \{ \langle 0 \rangle, \langle 1 \rangle, \langle 2 \rangle, \langle 3 \rangle, \langle 4 \rangle, \langle 5 \rangle, \langle 6 \rangle, \langle 7 \rangle, \langle 8 \rangle, \langle 9 \rangle \}$$ को संक्षिप्त करने पर सभी तीन अंकों की दशमलव संख्याओं का समुच्चय $$D \cdot D \cdot D$$ के रूप में प्राप्त होता है। यादृच्छिक लंबाई की सभी दशमलव संख्याओं का समुच्चय एक अनंत भाषा के लिए एक उदाहरण है।

एक रज्जु की वर्णमाला
एक रज्जु की वर्णमाला उन सभी वर्णों का समूह है जो एक विशेष रज्जु में होते हैं। यदि s एक रज्जु है, तो इसकी वर्णमाला


 * $$\operatorname{Alph}(s)$$

द्वारा दर्शायी जाती है। किसी भाषा की वर्णमाला $$S$$ उन सभी वर्णों का समुच्चय है जो औपचारिक रूप से ,$$\operatorname{Alph}(S) = \bigcup_{s \in S} \operatorname{Alph}(s)$$, $$S$$ के किसी भी रज्जु में होते हैं।

उदाहरण के लिए, समुच्चय $$\{\langle a \rangle,\langle c \rangle,\langle o \rangle\}$$ रज्जु का वर्णमाला है $$\langle cacao \rangle$$, और #रज्जु_और_भाषाएँ $$D$$ #रज्जु_एंड_भाषाेज भाषा की वर्णमाला है $$D \cdot D \cdot D$$ साथ ही सभी दशमलव संख्याओं की भाषा भी।

रज्जु प्रतिस्थापन
मान लीजिए L एक भाषा (कंप्यूटर विज्ञान) है, और मान लीजिए कि Σ इसकी वर्णमाला है। एक 'रज्जु प्रतिस्थापन' या बस एक 'प्रतिस्थापन' एक मैपिंग एफ है जो Σ में वर्णों को भाषाओं में मैप करता है (संभवतः एक अलग वर्णमाला में)। इस प्रकार, उदाहरण के लिए, एक अक्षर a ∈ Σ दिया गया है, तो किसी के पास f(a)=L हैa जहां एलa ⊆ Δक्लीन स्टार|* कुछ भाषा है जिसकी वर्णमाला Δ है। इस मैपिंग को रज्जु तक बढ़ाया जा सकता है


 * f(ε)=ε

रिक्त रज्जु ε के लिए, और


 * f(sa)=f(s)f(a)

रज्जु s ∈ L और वर्ण a ∈ Σ के लिए। रज्जु प्रतिस्थापन को संपूर्ण भाषाओं तक बढ़ाया जा सकता है
 * $$f(L)=\bigcup_{s\in L} f(s)$$

नियमित भाषाएँ रज्जु प्रतिस्थापन के अंतर्गत बंद हैं। अर्थात्, यदि किसी नियमित भाषा की वर्णमाला में प्रत्येक वर्ण को किसी अन्य नियमित भाषा द्वारा प्रतिस्थापित किया जाता है, तो परिणाम अभी भी एक नियमित भाषा ही है। इसी प्रकार, संदर्भ-मुक्त भाषाएँ रज्जु प्रतिस्थापन के अंतर्गत बंद हो जाती हैं। एक सरल उदाहरण रूपांतरण एफ हैuc(.) को अपरकेस में, जिसे परिभाषित किया जा सकता है जैसे निम्नलिखित नुसार:

एफ के विस्तार के लिएuc रज्जु के लिए, हमारे पास उदा. एफ के विस्तार के लिएuc भाषाओं के लिए, हमारे पास उदा.
 * एफuc(‹सड़क›) = {‹S›} ⋅ {‹T›} ⋅ {‹R›} ⋅ {‹A›} ⋅ {‹SS›} ⋅ {‹E›} = {‹सड़क›},
 * एफuc(‹u2›) = {‹U›} ⋅ {ε} = {‹U›}, और
 * एफuc(‹जाओ!›) = {‹जी›} ⋅ {‹ओ›} ⋅ {} = {}.
 * एफuc({ ‹सड़क›, ‹u2›, ‹जाओ!› }) = { ‹सड़क› } ∪ { ‹U› } ∪ { } = { ‹सड़क›, ‹U› }.

रज्जु समरूपता
एक रज्जु होमोमोर्फिज्म (अक्सर औपचारिक भाषा सिद्धांत में औपचारिक भाषा सिद्धांत में होमोमोर्फिज्म#होमोमोर्फिज्म और ई-मुक्त होमोमोर्फिज्म के रूप में संदर्भित) एक रज्जु प्रतिस्थापन है जैसे कि प्रत्येक वर्ण को एक रज्जु द्वारा प्रतिस्थापित किया जाता है। वह है, $$f(a)=s$$, कहाँ $$s$$ प्रत्येक वर्ण के लिए एक रज्जु है $$a$$. रज्जु होमोमोर्फिज्म मुक्त मोनोइड मुफ़्त मोनॉयड आकारिकी हैं, जो रिक्त रज्जु और रज्जु संश्रृंखलन के बाइनरी संक्रिया को संरक्षित करते हैं। एक भाषा दी गई $$L$$, समुच्चय $$f(L)$$ की समरूपी छवि कहलाती है $$L$$. एक रज्जु की व्युत्क्रम समरूपी छवि $$s$$ परिभाषित किया जाता है

$$f^{-1}(s) = \{ w | f(w) = s \}$$ जबकि किसी भाषा की व्युत्क्रम समरूपी छवि $$L$$ परिभाषित किया जाता है

$$f^{-1}(L) = \{ s | f(s) \in L \}$$ सामान्य रूप में, $$f(f^{-1}(L)) \neq L$$, जबकि एक के पास है

$$f(f^{-1}(L)) \subseteq L$$ और

$$L \subseteq f^{-1}(f(L))$$ किसी भी भाषा के लिए $$L$$.

नियमित भाषाओं का वर्ग समरूपता और व्युत्क्रम समरूपता के अंतर्गत बंद है। इसी प्रकार, संदर्भ-मुक्त भाषाएँ समरूपता के अंतर्गत बंद हैं और व्युत्क्रम समरूपताएँ। एक रज्जु समरूपता को ε-मुक्त (या ई-मुक्त) कहा जाता है यदि $$f(a) \neq \varepsilon$$ वर्णमाला में सभी के लिए $$\Sigma$$. सरल एकल-अक्षर प्रतिस्थापन सिफर (ε-मुक्त) रज्जु समरूपता के उदाहरण हैं।

एक उदाहरण रज्जु समरूपता जीuc #स्ट्रिंग_प्रतिस्थापन प्रतिस्थापन के समान परिभाषित करके भी प्राप्त किया जा सकता है: जीuc(‹ए›) = ‹ए›, ..., जीuc(‹0›) = ε, लेकिन g देनाuc विराम चिन्हों पर अपरिभाषित रहें। व्युत्क्रम समरूपी छवियों के उदाहरण हैं बाद वाली भाषा के लिए, जीuc(जीuc−1({ ‹A›, ‹bb› })) = guc({ ‹a› }) = { ‹A› } ≠ { ‹A›, ‹bb› }. समरूपता जीuc यह ε-मुक्त नहीं है, क्योंकि यह उदाहरण के लिए मैप करता है। ‹0› से ε.
 * जीuc−1({ ‹SSS› }) = { ‹sss›, ‹sß›, ‹ßs› }, चूँकि guc(‹sss›) = जीuc(‹sß›) = जीuc(‹ßs›) = ‹SSS›, और
 * जीuc−1({ ‹A›, ‹bb› }) = { ‹a› }, चूँकि guc(‹a›) = ‹A›, जबकि ‹bb› तक g द्वारा नहीं पहुंचा जा सकताuc.

एक बहुत ही सरल रज्जु होमोमोर्फिज्म उदाहरण जो प्रत्येक वर्ण को केवल एक वर्ण में मैप करता है वह EBCDIC-एन्कोडेड रज्जु को ASCII में परिवर्तित करना है।

रज्जु प्रक्षेपण
यदि s एक रज्जु है, और $$\Sigma$$ एक वर्णमाला है, एस का रज्जु प्रक्षेपण वह रज्जु है जो उन सभी वर्णों को हटाकर परिणामित होता है जो इसमें नहीं हैं $$\Sigma$$. ऐसा लिखा है $$\pi_\Sigma(s)\,$$. इसे औपचारिक रूप से दाहिनी ओर से वर्णों को हटाकर परिभाषित किया गया है:


 * $$\pi_\Sigma(s) = \begin{cases}

\varepsilon & \mbox{if } s=\varepsilon \mbox{ the empty string} \\ \pi_\Sigma(t) & \mbox{if } s=ta \mbox{ and } a \notin \Sigma \\ \pi_\Sigma(t)a & \mbox{if } s=ta \mbox{ and } a \in \Sigma \end{cases}$$ यहाँ $$\varepsilon$$ रिक्त रज्जु को दर्शाता है. एक रज्जु का प्रक्षेपण मूलतः संबंधपरक बीजगणित में प्रक्षेपण के समान है।

किसी भाषा के प्रक्षेपण के लिए रज्जु प्रक्षेपण को बढ़ावा दिया जा सकता है। एक औपचारिक भाषा एल दी गई है, इसका प्रक्षेपण द्वारा दिया गया है


 * $$\pi_\Sigma (L)=\{\pi_\Sigma(s)\ \vert\ s\in L \}$$

दायां और बायां भागफल
एक रज्जु s से a वर्ण का दायां भागफल, दाहिनी ओर से रज्जु s में वर्ण a का कटाव है। इसे इस प्रकार दर्शाया गया है $$s/a$$. यदि रज्जु में दाहिनी ओर a नहीं है, तो परिणाम रिक्त रज्जु है। इस प्रकार:


 * $$(sa)/ b = \begin{cases}

s & \mbox{if } a=b \\ \varepsilon & \mbox{if } a \ne b \end{cases}$$ रिक्त रज्जु का भागफल लिया जा सकता है:
 * $$\varepsilon / a = \varepsilon$$

इसी प्रकार, एक उपसमुच्चय दिया गया है $$S\subset M$$ एक मोनॉयड का $$M$$, कोई भागफल उपसमुच्चय को इस प्रकार परिभाषित कर सकता है
 * $$S/a=\{s\in M\ \vert\ sa\in S\}$$

बाएँ भागफल को समान रूप से परिभाषित किया जा सकता है, जिसमें संचालन एक रज्जु के बाईं ओर होता है।

हॉपक्रॉफ्ट और उल्मैन (1979) भागफल एल को परिभाषित करते हैं1/एल2 भाषाओं में से एल1 और मैं2 उसी वर्णमाला के ऊपर L1/L2 = $\{ s | ∃t∈L_{2}. st∈L_{1} \}$. यह उपरोक्त परिभाषा का सामान्यीकरण नहीं है, क्योंकि, एक रज्जु एस और अलग-अलग वर्णों ए, बी के लिए, हॉपक्रॉफ्ट और उलमैन की परिभाषा का तात्पर्य है $\{sa\}$ / $\{b\}$ उपज $\{\}$, इसके बजाय $\{ ε \}$.

एक सिंगलटन भाषा L का बायाँ भागफल (जब हॉपक्रॉफ्ट और उलमैन 1979 के समान परिभाषित किया गया)1 और एक मनमानी भाषा एल2 ब्रज़ोज़ोस्की व्युत्पन्न के रूप में जाना जाता है; यदि एल2 इसे नियमित अभिव्यक्ति  द्वारा दर्शाया जाता है, इसलिए बायां भागफल भी हो सकता है।

वाक्यात्मक संबंध
किसी उपसमुच्चय का सही भागफल $$S\subset M$$ एक मोनॉयड का $$M$$ एक तुल्यता संबंध को परिभाषित करता है, जिसे एस का सही वाक्यात्मक संबंध कहा जाता है। यह द्वारा दिया गया है


 * $$\sim_S \;\,=\, \{(s,t)\in M\times M\ \vert\ S/s = S/t \}$$

संबंध स्पष्ट रूप से परिमित सूचकांक का है (समतुल्य वर्गों की एक सीमित संख्या है) यदि और केवल यदि पारिवारिक सही भागफल परिमित है; वह है, यदि


 * $$\{S/m\ \vert\ m\in M\}$$

परिमित है. इस मामले में कि एम कुछ वर्णमाला पर शब्दों का मोनोइड है, एस तब एक नियमित भाषा है, यानी, एक ऐसी भाषा जिसे एक सीमित राज्य ऑटोमेटन द्वारा पहचाना जा सकता है। वाक्यात्मक मोनॉयड पर लेख में इस पर अधिक विस्तार से चर्चा की गई है।

सही रद्दीकरण
एक रज्जु एस से ए अक्षर का सही रद्दीकरण दाईं ओर से शुरू होने वाली रज्जु एस में अक्षर ए की पहली घटना को हटाना है। इसे इस प्रकार दर्शाया गया है $$s\div a$$ और इसे पुनरावर्ती रूप से परिभाषित किया गया है


 * $$(sa)\div b = \begin{cases}

s & \mbox{if } a=b \\ (s\div b)a & \mbox{if } a \ne b \end{cases}$$ रिक्त रज्जु हमेशा रद्द करने योग्य होती है:


 * $$\varepsilon \div a = \varepsilon$$

स्पष्ट रूप से, सही रद्दीकरण और प्रक्षेपण क्रमविनिमेय संपत्ति:


 * $$\pi_\Sigma(s)\div a = \pi_\Sigma(s \div a )$$

उपसर्ग
एक रज्जु के उपसर्ग किसी दी गई भाषा के संबंध में, एक रज्जु के सभी उपसर्गों (कंप्यूटर विज्ञान) का समुच्चय है:


 * $$\operatorname{Pref}_L(s) = \{t\ \vert\ s=tu \mbox { for } t,u\in \operatorname{Alph}(L)^*\}$$

कहाँ $$s\in L$$.

किसी भाषा का उपसर्ग समापन है


 * $$\operatorname{Pref} (L) = \bigcup_{s\in L} \operatorname{Pref}_L(s) = \left\{ t\ \vert\ s=tu; s\in L; t,u\in \operatorname{Alph}(L)^* \right\}$$

उदाहरण:

$$L=\left\{abc\right\}\mbox{ then } \operatorname{Pref}(L)=\left\{\varepsilon, a, ab, abc\right\}$$ किसी भाषा को उपसर्ग बंद यदि कहा जाता है $$\operatorname{Pref} (L) = L$$.

उपसर्ग बंद करने वाला ऑपरेटर निष्क्रिय है:


 * $$\operatorname{Pref} (\operatorname{Pref} (L)) =\operatorname{Pref} (L)$$

उपसर्ग संबंध एक द्विआधारी संबंध है $$\sqsubseteq$$ ऐसा है कि $$s\sqsubseteq t $$ अगर और केवल अगर $$s \in \operatorname{Pref}_L(t)$$. यह संबंध उपसर्ग क्रम का एक विशेष उदाहरण है।

यह भी देखें

 * प्रोग्रामिंग भाषाओं की तुलना (रज्जु फलनो)
 * लेवी की लेम्मा
 * रज्जु (कंप्यूटर विज्ञान)#औपचारिक सिद्धांत|रज्जु (कंप्यूटर विज्ञान) - रज्जु पर अधिक बुनियादी संचालन की परिभाषा और कार्यान्वयन

संदर्भ

 * (See chapter 3.)