वक्र अनुकूलन



वक्र फिटिंग एक  वक्र, या फ़ंक्शन (गणित) के निर्माण की प्रक्रिया है, जो डेटा बिंदुओं की एक श्रृंखला के लिए सबसे उपयुक्त है, संभवतः बाधाओं के अधीन।  वक्र फिटिंग में या तो  प्रक्षेप  शामिल हो सकता है,  जहां डेटा के लिए एक सटीक फिट की आवश्यकता है, या चौरसाई करना है,  जिसमें एक सुचारू कार्य का निर्माण किया जाता है जो लगभग डेटा को फिट करता है। एक संबंधित विषय  प्रतिगमन विश्लेषण  है,  जो सांख्यिकीय अनुमान के प्रश्नों पर अधिक ध्यान केंद्रित करता है जैसे कि वक्र में कितनी अनिश्चितता मौजूद है जो यादृच्छिक त्रुटियों के साथ देखे गए डेटा के लिए उपयुक्त है। फिटेड कर्व्स का उपयोग डेटा विज़ुअलाइज़ेशन के लिए सहायता के रूप में किया जा सकता है,  किसी फ़ंक्शन के मूल्यों का अनुमान लगाने के लिए जहां कोई डेटा उपलब्ध नहीं है, और दो या दो से अधिक चरों के बीच संबंधों को संक्षेप में प्रस्तुत करना।  एक्सट्रपलेशन  प्रेक्षित डेटा की सीमा (सांख्यिकी) से परे एक फिट वक्र के उपयोग को संदर्भित करता है, और एक  अनिश्चितता  के अधीन है चूंकि यह वक्र के निर्माण के लिए उपयोग की जाने वाली विधि को उतना ही प्रतिबिंबित कर सकता है जितना कि यह देखे गए डेटा को दर्शाता है।

डेटा के रैखिक-बीजगणितीय विश्लेषण के लिए, फिटिंग का अर्थ आमतौर पर उस वक्र को खोजने की कोशिश करना होता है जो वक्र से एक बिंदु के ऊर्ध्वाधर (y-अक्ष) विस्थापन को कम करता है (जैसे, साधारण न्यूनतम वर्ग)। हालांकि, ग्राफिकल और छवि अनुप्रयोगों के लिए, ज्यामितीय फिटिंग सर्वोत्तम दृश्य फिट प्रदान करना चाहता है; जिसका आमतौर पर मतलब होता है वक्र के लिए ओर्थोगोनल दूरी  को कम करने की कोशिश करना (जैसे, कुल कम से कम वर्ग), या अन्यथा वक्र से एक बिंदु के विस्थापन के दोनों अक्षों को शामिल करना। ज्यामितीय फिट लोकप्रिय नहीं हैं क्योंकि उन्हें आम तौर पर गैर-रैखिक और/या पुनरावृत्ति गणना की आवश्यकता होती है, हालांकि उनके पास अधिक सौंदर्य और ज्यामितीय रूप से सटीक परिणाम का लाभ होता है।

डेटा बिंदुओं के लिए कार्यों की बीजगणितीय फिटिंग
सबसे आम तौर पर, कोई फॉर्म के फ़ंक्शन को फिट करता है $y=f(x)$.

डेटा बिंदुओं के लिए फिटिंग लाइनें और बहुपद कार्य
पहली डिग्री बहुपद  समीकरण


 * $$y = ax + b\;$$

ढलान वाली एक रेखा है a. एक रेखा किन्हीं दो बिंदुओं को जोड़ेगी, इसलिए प्रथम डिग्री बहुपद समीकरण अलग-अलग x निर्देशांक वाले किन्हीं दो बिंदुओं के माध्यम से सटीक रूप से फिट होता है।

यदि समीकरण के क्रम को दूसरी डिग्री बहुपद तक बढ़ा दिया जाता है, तो निम्नलिखित परिणाम प्राप्त होते हैं:


 * $$y = ax^2 + bx + c\;.$$

यह बिल्कुल एक साधारण वक्र को तीन बिंदुओं पर फिट करेगा।

यदि समीकरण के क्रम को एक तिहाई डिग्री बहुपद तक बढ़ा दिया जाता है, तो निम्नलिखित प्राप्त होता है:


 * $$y = ax^3 + bx^2 + cx + d\;.$$

यह बिल्कुल चार बिंदुओं पर फिट होगा।

एक अधिक सामान्य कथन यह कहना होगा कि यह बिल्कुल चार बाधाओं के अनुरूप होगा। प्रत्येक बाधा एक बिंदु, कोण  या  वक्रता  हो सकती है (जो एक दोलन वृत्त की त्रिज्या का व्युत्क्रम है)। कोण और वक्रता बाधाओं को अक्सर एक वक्र के सिरों पर जोड़ा जाता है, और ऐसे मामलों में अंत की स्थिति कहलाती है। एक ही रेखा (गणित) के भीतर निहित बहुपद वक्रों के बीच एक सहज संक्रमण सुनिश्चित करने के लिए समान अंत स्थितियों का अक्सर उपयोग किया जाता है। वक्रता दर में परिवर्तन जैसे उच्च-क्रम की बाधाओं को भी जोड़ा जा सकता है। यह, उदाहरण के लिए, एक कार पर लागू बलों के परिवर्तन की दर को समझने के लिए राजमार्ग  तिपतिया घास इंटरचेंज  डिज़ाइन में उपयोगी होगा (जर्क (भौतिकी) देखें), क्योंकि यह क्लोवरलीफ का अनुसरण करता है, और तदनुसार उचित गति सीमा निर्धारित करने के लिए।

पहली डिग्री बहुपद समीकरण भी एक बिंदु और एक कोण के लिए एक सटीक फिट हो सकता है जबकि तीसरी डिग्री बहुपद समीकरण भी दो बिंदुओं, एक कोण बाधा और वक्रता बाधा के लिए सटीक फिट हो सकता है। इनके लिए और उच्च क्रम वाले बहुपद समीकरणों के लिए बाधाओं के कई अन्य संयोजन संभव हैं।

यदि n + 1 से अधिक बाधाएं हैं (n बहुपद की डिग्री होने के नाते), तो बहुपद वक्र अभी भी उन बाधाओं के माध्यम से चलाया जा सकता है। सभी बाधाओं के लिए एक सटीक फिट निश्चित नहीं है (लेकिन हो सकता है, उदाहरण के लिए, पहली डिग्री बहुपद के मामले में तीन कोलिनियर बिंदुओं को बिल्कुल फिट करना)। सामान्य तौर पर, हालांकि, प्रत्येक सन्निकटन का मूल्यांकन करने के लिए कुछ विधि की आवश्यकता होती है। कम से कम वर्ग विधि विचलन की तुलना करने का एक तरीका है।

बहुपद समीकरण की डिग्री को बढ़ाना और सटीक मिलान प्राप्त करना संभव होने पर अनुमानित फिट होने के कई कारण दिए गए हैं।


 * भले ही एक सटीक मिलान मौजूद हो, यह जरूरी नहीं है कि इसे आसानी से खोजा जा सके। उपयोग किए गए एल्गोरिदम के आधार पर एक अलग मामला हो सकता है, जहां सटीक फिट की गणना नहीं की जा सकती है, या समाधान खोजने में बहुत अधिक कंप्यूटर समय लग सकता है। इस स्थिति के लिए एक अनुमानित समाधान की आवश्यकता हो सकती है।
 * एक नमूने में संदिग्ध डेटा बिंदुओं का औसत निकालने का प्रभाव, उन्हें ठीक से फिट करने के लिए वक्र को विकृत करने के बजाय, वांछनीय हो सकता है।
 * रनगे की घटना: उच्च क्रम बहुपद अत्यधिक दोलनशील हो सकते हैं। यदि एक वक्र दो बिंदुओं ए और बी से होकर गुजरता है, तो यह अपेक्षा की जाएगी कि वक्र ए और बी के मध्य बिंदु के पास भी कुछ हद तक चलेगा। यह उच्च-क्रम वाले बहुपद वक्रों के साथ नहीं हो सकता है; उनके पास ऐसे मान भी हो सकते हैं जो सकारात्मक या नकारात्मक परिमाण (गणित)  में बहुत बड़े हों। निम्न-क्रम वाले बहुपदों के साथ, वक्र के मध्य बिंदु के पास गिरने की अधिक संभावना है (यह पहली डिग्री बहुपद पर मध्य बिंदु के माध्यम से चलने की गारंटी भी है)।
 * निम्न कोटि के बहुपद चिकने होते हैं और उच्च कोटि के बहुपद वक्र ढेलेदार होते हैं। इसे और अधिक सटीक रूप से परिभाषित करने के लिए, बहुपद वक्र में संभव अधिकतम विभक्ति बिंदु n-2 है, जहां n बहुपद समीकरण का क्रम है। एक विभक्ति बिंदु वक्र पर एक स्थान है जहां यह एक सकारात्मक त्रिज्या से नकारात्मक पर स्विच करता है। हम यह भी कह सकते हैं कि यहीं पर यह जल धारण करने से बहते जल में परिवर्तित हो जाता है। ध्यान दें कि यह केवल संभव है कि उच्च कोटि के बहुपद ढेलेदार हों; वे चिकने भी हो सकते हैं, लेकिन निम्न क्रम के बहुपद वक्रों के विपरीत इसकी कोई गारंटी नहीं है। एक पंद्रहवीं डिग्री बहुपद में, अधिक से अधिक, तेरह विभक्ति बिंदु हो सकते हैं, लेकिन ग्यारह, या नौ या कोई भी विषम संख्या एक से कम हो सकती है। (सम संख्या वाले बहुपद में n - 2 से शून्य तक कोई भी सम संख्या विभक्ति अंक हो सकते हैं।)

एक सटीक फिट के लिए आवश्यकता से अधिक होने वाले बहुपद वक्र की डिग्री उच्च कोटि के बहुपदों के लिए पहले सूचीबद्ध सभी कारणों के लिए अवांछनीय है, लेकिन यह भी आगे बढ़ता हैo एक ऐसा मामला जहां अनंत संख्या में समाधान हैं। उदाहरण के लिए, सामान्य दो के बजाय केवल एक बिंदु से विवश एक प्रथम डिग्री बहुपद (एक रेखा), अनंत संख्या में समाधान देगा। यह इस समस्या को सामने लाता है कि कैसे तुलना करें और केवल एक समाधान चुनें, जो सॉफ्टवेयर और मनुष्यों के लिए भी एक समस्या हो सकती है। इस कारण से, सभी बाधाओं पर सटीक मिलान के लिए जितना संभव हो उतना कम डिग्री चुनना सबसे अच्छा है, और शायद इससे भी कम डिग्री, यदि एक अनुमानित फिट स्वीकार्य है।



अन्य कार्यों को डेटा बिंदुओं पर फ़िट करना
कुछ मामलों में अन्य प्रकार के वक्र, जैसे त्रिकोणमितीय फलन  (जैसे साइन और कोसाइन) का भी उपयोग किया जा सकता है।

स्पेक्ट्रोस्कोपी में, डेटा को सामान्य वितरण,  कॉची वितरण ,  वोइगट फंक्शन  और संबंधित कार्यों के साथ फिट किया जा सकता है।

जीव विज्ञान, पारिस्थितिकी, जनसांख्यिकी, महामारी विज्ञान, और कई अन्य विषयों में, जनसंख्या वृद्धि, संक्रामक रोग का प्रसार, आदि को  रसद समारोह  का उपयोग करके फिट किया जा सकता है।

कृषि में इनवर्टेड लॉजिस्टिक  सिग्मॉइड फ़ंक्शन  (एस-वक्र) का उपयोग फसल की उपज और वृद्धि कारकों के बीच संबंध का वर्णन करने के लिए किया जाता है। नीली आकृति कृषि भूमि में मापे गए डेटा के सिग्मॉइड रिग्रेशन द्वारा बनाई गई थी। यह देखा जा सकता है कि शुरू में, यानी कम मिट्टी की लवणता पर, मिट्टी की लवणता बढ़ने पर फसल की उपज धीरे-धीरे कम हो जाती है, जबकि उसके बाद कमी तेजी से बढ़ती है।

डेटा बिंदुओं के लिए विमान वक्र की ज्यामितीय फिटिंग
यदि फॉर्म का एक फ़ंक्शन $$y=f(x)$$ अभिधारणा नहीं की जा सकती है, फिर भी कोई समतल वक्र  फिट करने का प्रयास कर सकता है।

कुछ मामलों में अन्य प्रकार के वक्र, जैसे कि शंकु खंड  (गोलाकार, अण्डाकार, परवलयिक, और अतिशयोक्तिपूर्ण चाप) या त्रिकोणमितीय कार्य (जैसे साइन और कोसाइन) का भी उपयोग किया जा सकता है। उदाहरण के लिए, गुरुत्वाकर्षण के प्रभाव में वस्तुओं के प्रक्षेपवक्र एक परवलयिक पथ का अनुसरण करते हैं, जब वायु प्रतिरोध को नजरअंदाज कर दिया जाता है। इसलिए, एक परवलयिक वक्र के लिए प्रक्षेपवक्र डेटा बिंदुओं का मिलान करना समझ में आता है। ज्वार साइनसॉइडल पैटर्न का पालन करते हैं, इसलिए ज्वारीय डेटा बिंदुओं को एक साइन लहर से मिलान किया जाना चाहिए, या विभिन्न अवधियों की दो साइन तरंगों का योग, यदि चंद्रमा और सूर्य दोनों के प्रभावों पर विचार किया जाता है।

एक पैरामीट्रिक वक्र  के लिए, इसके प्रत्येक निर्देशांक को चाप लंबाई के एक अलग कार्य के रूप में फिट करना प्रभावी होता है; यह मानते हुए कि डेटा बिंदुओं का आदेश दिया जा सकता है,  तार दूरी  का उपयोग किया जा सकता है।

ज्यामितीय फिट द्वारा एक वृत्त को फ़िट करना
सहकारी 2डी डेटा बिंदुओं के एक सेट के लिए सर्कल का सबसे अच्छा दृश्य फिट खोजने की कोशिश करने की समस्या का सामना करता है। विधि सामान्य रूप से गैर-रैखिक समस्या को एक रैखिक समस्या में बदल देती है जिसे पुनरावृत्त संख्यात्मक विधियों का उपयोग किए बिना हल किया जा सकता है, और इसलिए पिछली तकनीकों की तुलना में बहुत तेज़ है।

ज्यामितीय फिट द्वारा एक दीर्घवृत्त को फ़िट करना
उपरोक्त तकनीक सामान्य दीर्घवृत्त तक विस्तारित है एक गैर-रैखिक कदम जोड़कर, जिसके परिणामस्वरूप एक ऐसी विधि है जो तेज़ है, फिर भी मनमाना अभिविन्यास और विस्थापन के नेत्रहीन मनभावन दीर्घवृत्त पाता है।

फिटिंग सतह
ध्यान दें कि जबकि यह चर्चा 2D वक्रों के संदर्भ में थी, इस तर्क का अधिकांश भाग 3D सतहों तक भी फैला हुआ है, जिनमें से प्रत्येक पैच को दो पैरामीट्रिक दिशाओं में वक्रों के जाल द्वारा परिभाषित किया जाता है, जिसे आमतौर पर u और v कहा जाता है। एक सतह से बना हो सकता है प्रत्येक दिशा में एक या अधिक सतह पैच।

सॉफ्टवेयर
सांख्यिकीय पैकेजों की कई सूची जैसे R (प्रोग्रामिंग भाषा) और संख्यात्मक-विश्लेषण सॉफ़्टवेयर की सूची जैसे कि gnuplot,  जीएनयू वैज्ञानिक पुस्तकालय ,  MLAB , मेपल (सॉफ़्टवेयर),  MATLAB , TK सॉल्वर 6.0,  साइलैब ,  मेथेमेटिका , GNU ऑक्टेव, और  SciPy  विभिन्न परिदृश्यों में कर्व फिटिंग करने के लिए कमांड शामिल करें। वक्र फिटिंग करने के लिए विशेष रूप से लिखे गए कार्यक्रम भी हैं; उन्हें सांख्यिकीय सॉफ़्टवेयर की सूची और संख्यात्मक-विश्लेषण सॉफ़्टवेयर की सूची में पाया जा सकता है|संख्यात्मक-विश्लेषण कार्यक्रमों के साथ-साथ:श्रेणी:प्रतिगमन और वक्र फिटिंग सॉफ़्टवेयर।

यह भी देखें

 * कम से कम वर्ग समायोजन
 * वक्र-फिटिंग संघनन
 * अनुमान सिद्धांत
 * फंक्शन सन्निकटन
 * स्वस्थ रहने के फायदे
 * आनुवंशिक प्रोग्रामिंग
 * लेवेनबर्ग-मार्क्वार्ड एल्गोरिथम
 * लाइन फिटिंग
 * मल्टी एक्सप्रेशन प्रोग्रामिंग
 * अरेखीय प्रतिगमन
 * ओवरफिटिंग
 * प्लेन कर्व
 * संभाव्यता वितरण फिटिंग
 * साइनसॉइडल मॉडल
 * चौरसाई
 * तख़्ता (गणित) ( तख़्ता प्रक्षेप, चौरसाई तख़्ता )
 * समय श्रृंखला
 * कुल न्यूनतम वर्ग
 * रैखिक प्रवृत्ति अनुमान

अग्रिम पठन

 * N. Chernov (2010), Circular and linear regression: Fitting circles and lines by least squares, Chapman & Hall/CRC, Monographs on Statistics and Applied Probability, Volume 117 (256 pp.).