वक्र अनुकूलन

वक्र फिटिंग एक  वक्र, या गणितीय फ़ंक्शन के निर्माण की प्रक्रिया है, जो डेटा बिंदुओं की एक श्रृंखला के लिए सबसे उपयुक्त है, संभवतः बाधाओं के अधीन है।  वक्र फिटिंग में या तो  प्रक्षेप  शामिल हो सकता है,  जहां डेटा के लिए एक सटीक फिट की आवश्यकता होती है, या चौरसाई,  जिसमें एक "चिकनी" फ़ंक्शन का निर्माण किया जाता है जो डेटा को लगभग फिट करता है। एक संबंधित विषयप्रतिगमन विश्लेषण है,  जो सांख्यिकीय अनुमान के प्रश्नों पर अधिक ध्यान केंद्रित करता है जैसे कि वक्र में कितनी अनिश्चितता मौजूद है जो यादृच्छिक त्रुटियों के साथ देखे गए डेटा के लिए उपयुक्त है। फिटेड कर्व्स का उपयोग डेटा विज़ुअलाइज़ेशन के लिए सहायता के रूप में किया जा सकता है,  एक फ़ंक्शन के मूल्यों का अनुमान लगाने के लिए जहां कोई डेटा उपलब्ध नहीं है, और दो या अधिक चर के बीच संबंधों को संक्षेप में प्रस्तुत करने के लिए।  एक्सट्रपलेशन प्रेक्षित डेटा की सीमा से परे एक फिट वक्र के उपयोग को संदर्भित करता है, [ और अनिश्चितता की एक डिग्री के अधीन है क्योंकि यह वक्र के निर्माण के लिए उपयोग की जाने वाली विधि को उतना ही प्रतिबिंबित कर सकता है जितना कि यह देखे गए डेटा को दर्शाता है।

डेटा के रैखिक-बीजगणितीय विश्लेषण के लिए, "फिटिंग" का अर्थ आमतौर पर उस वक्र को खोजने का प्रयास करना होता है जो वक्र से एक बिंदु के ऊर्ध्वाधर (y-अक्ष) विस्थापन को कम करता है (उदाहरण के लिए, सामान्य न्यूनतम वर्ग)। हालांकि, ग्राफिकल और छवि अनुप्रयोगों के लिए, ज्यामितीय फिटिंग सर्वोत्तम दृश्य फिट प्रदान करना चाहता है; जिसका आमतौर पर मतलब होता है वक्र के लिएओर्थोगोनल दूरीको कम करने की कोशिश करना (जैसे, कुल कम से कम वर्ग), या अन्यथा वक्र से एक बिंदु के विस्थापन के दोनों अक्षों को शामिल करना। ज्यामितीय फिट लोकप्रिय नहीं हैं क्योंकि उन्हें आमतौर पर गैर-रैखिक और/या पुनरावृत्त गणना की आवश्यकता होती है, हालांकि उनके पास अधिक सौंदर्य और ज्यामितीय रूप से सटीक परिणाम का लाभ होता है।

डेटा बिंदुओं के लिए कार्यों की बीजगणितीय फिटिंग
सबसे आम तौर पर, कोई फॉर्म के फ़ंक्शन को फिट करता है $y=f(x)$.

डेटा बिंदुओं के लिए फिटिंग लाइनें और बहुपद कार्य
पहली डिग्री बहुपद  समीकरण


 * $$y = ax + b\;$$

ढलान वाली एक रेखा है a. एक रेखा किन्हीं दो बिंदुओं को जोड़ेगी, इसलिए प्रथम डिग्री बहुपद समीकरण अलग-अलग x निर्देशांक वाले किन्हीं दो बिंदुओं के माध्यम से सटीक रूप से फिट होता है।

यदि समीकरण के क्रम को दूसरी डिग्री बहुपद तक बढ़ा दिया जाता है, तो निम्नलिखित परिणाम प्राप्त होते हैं:


 * $$y = ax^2 + bx + c\;.$$

यह बिल्कुल एक साधारण वक्र को तीन बिंदुओं पर फिट करेगा।

यदि समीकरण के क्रम को एक तिहाई डिग्री बहुपद तक बढ़ा दिया जाता है, तो निम्नलिखित प्राप्त होता है:


 * $$y = ax^3 + bx^2 + cx + d\;.$$

यह बिल्कुल चार बिंदुओं पर फिट होगा।

एक अधिक सामान्य कथन यह कहना होगा कि यह बिल्कुल चार बाधाओं के अनुरूप होगा। प्रत्येक बाधा एक बिंदु,कोण या वक्रताहो सकती है (जो एक दोलन वृत्त की त्रिज्या का व्युत्क्रम है)। कोण और वक्रता बाधाओं को अक्सर एक वक्र के सिरों पर जोड़ा जाता है, और ऐसे मामलों में अंत की स्थिति कहलाती है। एक ही तख़्ता में निहित बहुपद वक्रों के बीच एक सहज संक्रमण सुनिश्चित करने के लिए समान अंत स्थितियों का अक्सर उपयोग किया जाता है। उच्च-क्रम की बाधाएं, जैसे "वक्रता की दर में परिवर्तन", को भी जोड़ा जा सकता है। यह, उदाहरण के लिए, एक कार पर लागू बलों के परिवर्तन की दर को समझने के लिए राजमार्गतिपतिया घास इंटरचेंजडिजाइन में उपयोगी होगा (झटका देखें), क्योंकि यह तिपतिया घास का अनुसरण करता है, और तदनुसार उचित गति सीमा निर्धारित करने के लिए।

पहली डिग्री बहुपद समीकरण भी एक बिंदु और एक कोण के लिए एक सटीक फिट हो सकता है जबकि तीसरी डिग्री बहुपद समीकरण भी दो बिंदुओं, एक कोण बाधा और वक्रता बाधा के लिए सटीक फिट हो सकता है। इनके लिए और उच्च क्रम वाले बहुपद समीकरणों के लिए बाधाओं के कई अन्य संयोजन संभव हैं।

यदि n + 1 से अधिक बाधाएं हैं (n बहुपद की डिग्री होने के नाते), तो बहुपद वक्र अभी भी उन बाधाओं के माध्यम से चलाया जा सकता है। सभी बाधाओं के लिए एक सटीक फिट निश्चित नहीं है (लेकिन हो सकता है, उदाहरण के लिए, पहली डिग्री बहुपद के मामले में तीन कोलिनियर बिंदुओं को बिल्कुल फिट करना)। सामान्य तौर पर, हालांकि, प्रत्येक सन्निकटन का मूल्यांकन करने के लिए कुछ विधि की आवश्यकता होती है। कम से कम वर्ग विधि विचलन की तुलना करने का एक तरीका है।

बहुपद समीकरण की डिग्री को बढ़ाना और सटीक मिलान प्राप्त करना संभव होने पर अनुमानित फिट होने के कई कारण दिए गए हैं।


 * यहां तक ​​​​कि अगर एक सटीक मिलान मौजूद है, तो यह जरूरी नहीं है कि इसे आसानी से खोजा जा सके। उपयोग किए गए एल्गोरिदम के आधार पर एक अलग मामला हो सकता है, जहां सटीक फिट की गणना नहीं की जा सकती है, या समाधान खोजने में बहुत अधिक कंप्यूटर समय लग सकता है। इस स्थिति के लिए एक अनुमानित समाधान की आवश्यकता हो सकती है।
 * एक नमूने में संदिग्ध डेटा बिंदुओं के औसत का प्रभाव, उन्हें ठीक से फिट करने के लिए वक्र को विकृत करने के बजाय, वांछनीय हो सकता है।
 * रंज की घटना: उच्च क्रम बहुपद अत्यधिक दोलनशील हो सकते हैं। यदि एक वक्र दो बिंदुओं A और B से होकर गुजरता है, तो यह अपेक्षा की जाएगी कि वक्र A और B के मध्य बिंदु के पास भी कुछ हद तक चलेगा। यह उच्च-क्रम वाले बहुपद वक्रों के साथ नहीं हो सकता है; उनके पास ऐसे मान भी हो सकते हैं जो सकारात्मक या नकारात्मकपरिमाण (गणित)में बहुत बड़े हों। निम्न-क्रम वाले बहुपदों के साथ, वक्र के मध्य बिंदु के पास गिरने की अधिक संभावना है (यह पहली डिग्री बहुपद पर मध्य बिंदु के माध्यम से चलने की गारंटी भी है)।
 * निम्न-क्रम वाले बहुपद चिकने होते हैं और उच्च-क्रम वाले बहुपद वक्र "ढेलेदार" होते हैं। इसे और अधिक सटीक रूप से परिभाषित करने के लिए, बहुपद वक्र में संभव अधिकतम विभक्ति बिंदु n-2 है, जहां n बहुपद समीकरण का क्रम है। एक विभक्ति बिंदु वक्र पर एक स्थान है जहां यह एक सकारात्मक त्रिज्या से नकारात्मक पर स्विच करता है। हम यह भी कह सकते हैं कि यह वह जगह है जहां यह "होल्डिंग वॉटर" से "बहाते पानी" में बदल जाता है। ध्यान दें कि यह केवल "संभव" है कि उच्च क्रम वाले बहुपद ढेलेदार होंगे; वे चिकने भी हो सकते हैं, लेकिन निम्न क्रम के बहुपद वक्रों के विपरीत इसकी कोई गारंटी नहीं है। एक पंद्रहवीं डिग्री बहुपद में, अधिक से अधिक, तेरह विभक्ति बिंदु हो सकते हैं, लेकिन ग्यारह, या नौ या कोई भी विषम संख्या एक से कम हो सकती है। (सम संख्या वाले बहुपद में n - 2 से नीचे शून्य तक किसी भी सम संख्या में विभक्ति बिंदु हो सकते हैं।)

सटीक फिट के लिए आवश्यकता से अधिक होने वाले बहुपद वक्र की डिग्री उच्च क्रम बहुपदों के लिए पहले सूचीबद्ध सभी कारणों के लिए अवांछनीय है, लेकिन एक ऐसे मामले की ओर भी ले जाती है जहां अनंत संख्या में समाधान होते हैं। उदाहरण के लिए, सामान्य दो के बजाय केवल एक बिंदु से विवश एक प्रथम डिग्री बहुपद (एक रेखा), अनंत संख्या में समाधान देगा। यह इस समस्या को सामने लाता है कि कैसे तुलना करें और केवल एक समाधान चुनें, जो सॉफ्टवेयर और मनुष्यों के लिए भी एक समस्या हो सकती है। इस कारण से, सभी बाधाओं पर सटीक मिलान के लिए जितना संभव हो उतना कम डिग्री चुनना सबसे अच्छा है, और शायद इससे भी कम डिग्री, यदि एक अनुमानित फिट स्वीकार्य है।



अन्य कार्यों को डेटा बिंदुओं पर फ़िट करना
कुछ मामलों में अन्य प्रकार के वक्र, जैसे त्रिकोणमितीय फलन  (जैसे साइन और कोसाइन) का भी उपयोग किया जा सकता है।

स्पेक्ट्रोस्कोपी में, डेटा को गाऊसी, लोरेंत्ज़ियन ,  वोइग्ट और संबंधित कार्यों के साथ फिट किया जा सकता है।

जीव विज्ञान, पारिस्थितिकी, जनसांख्यिकी, महामारी विज्ञान, और कई अन्य विषयों में, जनसंख्या की वृद्धि, संक्रामक रोग का प्रसार, आदि को रसद समारोह  का उपयोग करके फिट किया जा सकता है।

कृषि में इनवर्टेड लॉजिस्टिक  सिग्मॉइड फ़ंक्शन  (एस-वक्र) का उपयोग फसल की उपज और वृद्धि कारकों के बीच संबंध का वर्णन करने के लिए किया जाता है। नीली आकृति कृषि भूमि में मापे गए डेटा के सिग्मॉइड रिग्रेशन द्वारा बनाई गई थी। यह देखा जा सकता है कि शुरू में, यानी कम मिट्टी की लवणता पर, मिट्टी की लवणता बढ़ने पर फसल की उपज धीरे-धीरे कम हो जाती है, जबकि उसके बाद कमी तेजी से बढ़ती है।

डेटा बिंदुओं के लिए विमान वक्र की ज्यामितीय फिटिंग
यदि फॉर्म का एक फ़ंक्शन $$y=f(x)$$ अभिधारणा नहीं की जा सकती है, फिर भी कोई समतल वक्र  फिट करने का प्रयास कर सकता है।

कुछ मामलों में अन्य प्रकार के वक्र, जैसे कि शंकु खंड  (गोलाकार, अण्डाकार, परवलयिक, और अतिशयोक्तिपूर्ण चाप) या त्रिकोणमितीय कार्य (जैसे साइन और कोसाइन) का भी उपयोग किया जा सकता है। उदाहरण के लिए, गुरुत्वाकर्षण के प्रभाव में वस्तुओं के प्रक्षेपवक्र एक परवलयिक पथ का अनुसरण करते हैं, जब वायु प्रतिरोध को नजरअंदाज कर दिया जाता है। इसलिए, एक परवलयिक वक्र के लिए प्रक्षेपवक्र डेटा बिंदुओं का मिलान करना समझ में आता है। ज्वार साइनसॉइडल पैटर्न का पालन करते हैं, इसलिए ज्वारीय डेटा बिंदुओं को एक साइन लहर से मिलान किया जाना चाहिए, या विभिन्न अवधियों की दो साइन तरंगों का योग, यदि चंद्रमा और सूर्य दोनों के प्रभावों पर विचार किया जाता है।

एक पैरामीट्रिक वक्र  के लिए, इसके प्रत्येक निर्देशांक को चाप लंबाई के एक अलग कार्य के रूप में फिट करना प्रभावी होता है; यह मानते हुए कि डेटा बिंदुओं का आदेश दिया जा सकता है,  तार दूरी  का उपयोग किया जा सकता है।

ज्यामितीय फिट द्वारा एक वृत्त को फ़िट करना
सहकारी 2डी डेटा बिंदुओं के एक सेट के लिए सर्कल का सबसे अच्छा दृश्य फिट खोजने की कोशिश करने की समस्या का सामना करता है। विधि सामान्य रूप से गैर-रैखिक समस्या को एक रैखिक समस्या में बदल देती है जिसे पुनरावृत्त संख्यात्मक विधियों का उपयोग किए बिना हल किया जा सकता है, और इसलिए पिछली तकनीकों की तुलना में बहुत तेज़ है।

ज्यामितीय फिट द्वारा एक दीर्घवृत्त को फ़िट करना
उपरोक्त तकनीक सामान्य दीर्घवृत्त तक विस्तारित है एक गैर-रैखिक कदम जोड़कर, जिसके परिणामस्वरूप एक ऐसी विधि है जो तेज़ है, फिर भी मनमाना अभिविन्यास और विस्थापन के नेत्रहीन मनभावन दीर्घवृत्त पाता है।

फिटिंग सतह
ध्यान दें कि जबकि यह चर्चा 2D वक्रों के संदर्भ में थी, इस तर्क का अधिकांश भाग 3D सतहों तक भी फैला हुआ है, जिनमें से प्रत्येक पैच को दो पैरामीट्रिक दिशाओं में वक्रों के जाल द्वारा परिभाषित किया जाता है, जिसे आमतौर पर u और v कहा जाता है। एक सतह से बना हो सकता है प्रत्येक दिशा में एक या अधिक सतह पैच।

सॉफ्टवेयर
सांख्यिकीय पैकेजों की कई सूची जैसे R (प्रोग्रामिंग भाषा) और संख्यात्मक-विश्लेषण सॉफ़्टवेयर की सूची जैसे कि gnuplot,  जीएनयू वैज्ञानिक पुस्तकालय ,  MLAB , मेपल (सॉफ़्टवेयर),  MATLAB , TK सॉल्वर 6.0,  साइलैब ,  मेथेमेटिका , GNU ऑक्टेव, और  SciPy  विभिन्न परिदृश्यों में कर्व फिटिंग करने के लिए कमांड शामिल करें। वक्र फिटिंग करने के लिए विशेष रूप से लिखे गए कार्यक्रम भी हैं; उन्हें सांख्यिकीय सॉफ़्टवेयर की सूची और संख्यात्मक-विश्लेषण सॉफ़्टवेयर की सूची में पाया जा सकता है|संख्यात्मक-विश्लेषण कार्यक्रमों के साथ-साथ:श्रेणी:प्रतिगमन और वक्र फिटिंग सॉफ़्टवेयर।

यह भी देखें

 * कम से कम वर्ग समायोजन
 * वक्र-फिटिंग संघनन
 * अनुमान सिद्धांत
 * फंक्शन सन्निकटन
 * स्वस्थ रहने के फायदे
 * आनुवंशिक प्रोग्रामिंग
 * लेवेनबर्ग-मार्क्वार्ड एल्गोरिथम
 * लाइन फिटिंग
 * मल्टी एक्सप्रेशन प्रोग्रामिंग
 * अरेखीय प्रतिगमन
 * ओवरफिटिंग
 * प्लेन कर्व
 * संभाव्यता वितरण फिटिंग
 * साइनसॉइडल मॉडल
 * चौरसाई
 * तख़्ता (गणित) ( तख़्ता प्रक्षेप, चौरसाई तख़्ता )
 * समय श्रृंखला
 * कुल न्यूनतम वर्ग
 * रैखिक प्रवृत्ति अनुमान

अग्रिम पठन

 * N. Chernov (2010), Circular and linear regression: Fitting circles and lines by least squares, Chapman & Hall/CRC, Monographs on Statistics and Applied Probability, Volume 117 (256 pp.).