बहुभिन्नरूपी अनुकूली प्रतिगमन तख़्ता

आंकड़ों में, बहुभिन्नरूपी अनुकूली प्रतिगमन स्प्लिन (मार्स) 1991 में जेरोम एच. फ्रीडमैन द्वारा प्रस्तुत प्रतिगमन विश्लेषण का रूप है। यह अपैरामीट्रिक प्रतिगमन तकनीक है और इसे रैखिक मॉडल के विस्तार के रूप में देखा जा सकता है जो स्वचालित रूप से चर के मध्य अरैखिकता और इंटरैक्शन को मॉडल करता है।

मार्स सैलफोर्ड प्रणाली द्वारा ट्रेडमार्क और लाइसेंसीकृत है। ट्रेडमार्क उल्लंघनों से बचने के लिए, मार्स के कई विवृत-सोर्स कार्यान्वयनों को भूमि कहा जाता है।

आधार
यह खंड कुछ उदाहरणों का उपयोग करके मंगल ग्रह का परिचय देता है। हम डेटा के सेट से प्रारंभ करते हैं: इनपुट चर x का मैट्रिक्स, और देखी गई प्रतिक्रियाओं y का वेक्टर, x में प्रत्येक पंक्ति के लिए प्रतिक्रिया के साथ है। उदाहरण के लिए, डेटा हो सकता है:

यहां केवल आश्रित और स्वतंत्र चर है, इसलिए x मैट्रिक्स केवल कॉलम है। इन मापों को देखते हुए, हम मॉडल बनाना चाहेंगे जो किसी दिए गए x के लिए अपेक्षित y की भविष्यवाणी करता है।

उपरोक्त डेटा के लिए रैखिक मॉडल है:



\widehat{y} = -37 + 5.1 x $$ हैट $$\widehat{y}$$ दर्शाता है कि $$\widehat{y}$$ डेटा से अनुमान लगाया गया है। दाईं ओर का चित्र इस फलन का प्लॉट दिखाता है: पूर्वानुमान बताने वाली पंक्ति $$\widehat{y}$$ के प्रति x, y के मूल मान को लाल बिंदुओं के रूप में दिखाया गया है।

x के शीर्ष पर डेटा प्रदर्शित करता है कि y और x के मध्य संबंध अरैखिक हो सकता है (x के निम्न और उच्च मूल्यों पर प्रतिगमन रेखा के सापेक्ष लाल बिंदुओं को देखें)। इस प्रकार अरैखिकताओं को ध्यान में रखते हुए स्वचालित रूप से मॉडल बनाने के लिए मार्स की ओर संकेत करते हैं। मार्स सॉफ़्टवेयर दिए गए x और y से निम्नानुसार मॉडल बनाता है:



\begin{align} \widehat{y} = &\ 25 \\ & {} + 6.1 \max(0, x - 13) \\ & {} - 3.1 \max(0, 13 - x) \end{align} $$

दाईं ओर का चित्र इस फलन का प्लॉट दिखाता है: पूर्वानुमानित $$\widehat{y}$$ के प्रति x, y के मूल मानों को एक बार फिर लाल बिंदुओं के रूप में दिखाया गया है। पूर्वानुमानित प्रतिक्रिया अब मूल y मानों के लिए उत्तम अनुकूल है।

अरैखिकता को ध्यान में रखने के लिए मार्स ने स्वचालित रूप से अनुमानित y में घुमाव उत्पन्न किया है। किंक का निर्माण हिंज कार्यों द्वारा होता है। हिंज फलन से प्रारंभ होने वाले भाव $$\max$$ (जहाँ $$\max(a,b)$$ है $$a$$ यदि $$a > b$$, अन्य $$b$$) हिंज फलन का नीचे अधिक विस्तार से वर्णन किया गया है।

इस सरल उदाहरण में, हम प्लॉट से सरलता से देख सकते हैं कि y का x के साथ अरैखिक संबंध है (और संभवतः अनुमान लगा सकते हैं कि y, x के वर्ग के साथ परिवर्तित होता रहता है)। चूँकि, सामान्यतः कई आश्रित और स्वतंत्र चर होंगे, y और इन चर के मध्य संबंध अस्पष्ट होगा और प्लॉटिंग द्वारा सरलता से दिखाई नहीं देगा। हम उस अरैखिक संबंध का परिक्षण करने के लिए मार्स का उपयोग कर सकते हैं।

अनेक चरों के साथ मार्स अभिव्यक्ति का उदाहरण है:



\begin{align} \mathrm{ozone} = &\ 5.2 \\ & {} + 0.93 \max(0, \mathrm{temp} - 58) \\ & {} - 0.64 \max(0, \mathrm{temp} - 68) \\ & {} - 0.046 \max(0, 234 - \mathrm{ibt})  \\ & {} - 0.016 \max(0, \mathrm{wind} - 7) \max(0, 200 - \mathrm{vis}) \end{align} $$ यह अभिव्यक्ति वायु प्रदूषण (ओजोन स्तर) को तापमान और कुछ अन्य चर के आधार पर दर्शाती है। ध्यान दें कि सूत्र में अंतिम पद (अंतिम पंक्ति पर) के मध्य परस्पर क्रिया $$\mathrm{wind} $$ और $$\mathrm{vis}$$ सम्मिलित है।

उत्तम प्लॉट पर दिए गए आंकड़े की भविष्यवाणी की गई है $$\mathrm{ozone}$$ जैसा $$\mathrm{wind}$$ और $$\mathrm{vis}$$ भिन्न-भिन्न होते हैं, अन्य चर उनके मध्य मानों पर निश्चित होते हैं। यह आंकड़ा दर्शाता है कि वायु ओजोन स्तर को तब तक प्रभावित नहीं करती जब तक दृश्यता कम न हो। हम देखते हैं कि मार्स कार्यों के संयोजन से अधिक प्रतिगमन सतहों का निर्माण कर सकता है।

उपरोक्त अभिव्यक्ति प्राप्त करने के लिए, मार्स मॉडल निर्माण प्रक्रिया स्वचालित रूप से चयन करती है कि कौन से चर का उपयोग करना है (कुछ चर महत्वपूर्ण हैं, अन्य नहीं), कार्यों में किंक की स्थिति, और कार्यों को कैसे संयोजित किया जाता है।

मंगल ग्रह मॉडल
मार्स फॉर्म के मॉडल बनाता है:


 * $$\widehat{f}(x) = \sum_{i=1}^k c_i B_i(x). $$

मॉडल आधार कार्यों का भारित योग $$B_i(x)$$ है प्रत्येक $$c_i$$ स्थिर गुणांक है, उदाहरण के लिए, उपरोक्त ओजोन के सूत्र में प्रत्येक पंक्ति उसके गुणांक से गुणा किया गया आधार कार्य है।

प्रत्येक आधार कार्य $$B_i(x)$$ निम्नलिखित तीन रूपों में से प्राप्त करता है:

1) अचर 1 ऐसा पद है, अंतःखंड उपरोक्त ओजोन सूत्र में, अवरोधन पद 5.2 है।

2) कार्य फलन का ऐसा रूप होता है  $$ \max(0, x - \text{constant}) $$ या  $$ \max(0, \text{constant} - x) $$ मार्स हिंज फलन के लिए स्वचालित रूप से उन चरों के चर और मानों का चयन करता है। ऐसे आधार कार्यों के उदाहरण ओजोन सूत्र की मध्य तीन पंक्तियों में देखे जा सकते हैं।

3) दो या दो से अधिक फलनो का उत्पाद ये आधार फलन दो या दो से अधिक चरों के मध्य अंतःक्रिया को मॉडल कर सकते हैं। उदाहरण ओजोन सूत्र की अंतिम पंक्ति है।

कार्य के फलन


मार्स मॉडल का प्रमुख भाग रूप धारण करने वाले हिंज फलन हैं:
 * $$\max(0,x-c)$$

या
 * $$\max(0,c-x)$$

जहाँ $$c$$ स्थिरांक है, जिसे कनॉट कहा जाता है। दाईं ओर का चित्र 3.1 पर गाँठ के साथ कार्य के फलन की प्रतिबिंबित जोड़ी को दर्शाता है।

हिंज फलन इसकी सीमा के भाग के लिए शून्य है, इसलिए इसका उपयोग डेटा को असंयुक्त क्षेत्रों में विभाजित करने के लिए किया जा सकता है, जिनमें से प्रत्येक को स्वतंत्र रूप से व्यवहार किया जा सकता है। इस प्रकार, उदाहरण के लिए अभिव्यक्ति में कार्य की प्रतिबिंबित जोड़ी कार्य करती है:

6.1 \max(0, x - 13) - 3.1 \max(0, 13 - x) $$ पूर्व अनुभाग में सरल मार्स मॉडल के लिए दिखाया गया भाग रैखिक ग्राफ़ बनाता है।

कोई यह मान सकता है कि हिंज फलन के भाग से रैखिक फलन बनाए जा सकते हैं, किंतु नॉन-लीनियर फलन बनाने के लिए हिंज फलन के साथ गुणा किया जा सकता है।

हिंज फलन को रैंप फलन, आइस हॉकी स्टिक, या रेक्टिफायर (तंत्रिका नेटवर्क) फलन भी कहा जाता है। परिवर्तन में अधिकतम इस आलेख में उपयोग किए गए $$\max$$ नोटेशन में, हिंज फलन को प्रायः $$[\pm(x_i - c)]_+$$ से दर्शाया जाता है जहाँ $$[\cdot]_+$$ का तात्पर्य सकारात्मक भाग है।

मॉडल निर्माण प्रक्रिया
मार्स दो चरणों में मॉडल बनाता है: आगे और पीछे का मार्ग। यह दो-चरणीय दृष्टिकोण वही है जो पुनरावर्ती विभाजन वृक्षों द्वारा उपयोग किया जाता है।

फॉरवर्ड पास
मार्स मॉडल से प्रारंभ होता है जिसमें केवल इंटरसेप्ट टर्म होता है (जो प्रतिक्रिया मूल्यों का माध्य है)।

मार्स फिर मॉडल में जोड़े में आधार फलन को बार-बार जोड़ता है। प्रत्येक चरण में यह आधार फलनों की जोड़ी का शोध करता है जो वर्गों के योग में अवशिष्ट त्रुटि में अधिकतम कमी देता है (यह ग्रेडी एल्गोरिदम है)। जोड़ी में दो आधार फलन समान हैं, अतिरिक्त इसके कि प्रत्येक फलन के लिए मिरर किए गए हिंज फलन का भिन्न पक्ष उपयोग किया जाता है। प्रत्येक नए आधार फलन में मॉडल में पूर्व से ही शब्द सम्मिलित होता है (जो संभवतः इंटरसेप्ट शब्द हो सकता है) नए हिंज फलन द्वारा गुणा किया जाता है। हिंज फलन को चर और कनॉट द्वारा परिभाषित किया जाता है, इसलिए नया आधार फलन जोड़ने के लिए, मार्स को निम्नलिखित के सभी संयोजनों का परिक्षण करना होगा:

1) उपस्थित शब्द (इस संदर्भ में मूल शब्द कहे जाते हैं)।

2) सभी चर (नए आधार फलन का चयन करने के लिए)।

3) प्रत्येक चर के सभी मान (नए कार्य फलन के लिए कनॉट)।

प्रत्येक पद के गुणांक की गणना करने के लिए मार्स पदों पर रेखीय प्रतिगमन प्रारम्भ करता है।

शब्दों को जोड़ने की यह प्रक्रिया तब तक प्रारम्भ रहती है जब तक कि शेष त्रुटि में परिवर्तन प्रारम्भ रखने के लिए अधिक छोटा न हो या जब तक शब्दों की अधिकतम संख्या न हो जाए। मॉडल निर्माण प्रारंभ होने से पूर्व उपयोगकर्ता द्वारा नियम की अधिकतम संख्या निर्दिष्ट की जाती है।

प्रत्येक चरण पर परिक्षण पाशविक बल परिक्षण विधि द्वारा किया जाता है, किंतु मार्स का प्रमुख विषय यह है कि हिंज कार्यों की प्रकृति के कारण तीव्रता से न्यूनतम-वर्ग अद्यतन तकनीक का उपयोग करके परिक्षण अपेक्षाकृत तीव्रता से किया जा सकता है। वास्तव में, परिक्षण क्रूर बल नहीं है. परिक्षण को अनुमान के साथ तीव्रता से किया जा सकता है जो प्रत्येक चरण पर विचार करने के लिए मूल शब्दों की संख्या को कम कर देता है (फास्ट मार्स)।

बैकवर्ड पास
फॉरवर्ड पास आमतौर पर  ओवरफ़िट  मॉडल बनाता है। ( ओवरफिट मॉडल मॉडल बनाने के लिए उपयोग किए गए डेटा के लिए अच्छी तरह से फिट होता है किंतु नए डेटा के लिए अच्छी तरह से सामान्यीकृत नहीं होगा।) उत्तम सामान्यीकरण क्षमता के साथ  मॉडल बनाने के लिए, बैकवर्ड पास मॉडल को काटता है। यह - करके शब्दों को हटाता है, प्रत्येक चरण में सबसे कम प्रभावी शब्द को हटाता है जब तक कि उसे सबसे अच्छा सबमॉडल नहीं मिल जाता। मॉडल उपसमुच्चय की तुलना नीचे वर्णित सामान्यीकृत क्रॉस सत्यापन (जीसीवी) मानदंड का उपयोग करके की जाती है।

फॉरवर्ड पास की तुलना में बैकवर्ड पास का फायदा है: किसी भी चरण पर यह हटाने के लिए कोई भी शब्द चुन सकता है, जबकि प्रत्येक चरण पर फॉरवर्ड पास केवल शब्दों की अगली जोड़ी देख सकता है।

फॉरवर्ड पास जोड़े में शब्द जोड़ता है, किंतु बैकवर्ड पास आम तौर पर जोड़े के तरफ को हटा देता है और इसलिए अंतिम मॉडल में शब्द प्रायः जोड़े में नहीं देखे जाते हैं। के समीकरण में  युग्मित काज देखा जा सकता है $$\widehat{y}$$ उपरोक्त पहले मंगल उदाहरण में; ओजोन उदाहरण में कोई पूर्ण युग्म नहीं रखा गया है।

सामान्यीकृत क्रॉस सत्यापन
सबसे अच्छा सबसेट चुनने के लिए मॉडल सबसेट के प्रदर्शन की तुलना करने के लिए बैकवर्ड पास सामान्यीकृत क्रॉस वैलिडेशन (जीसीवी) का उपयोग करता है: जीसीवी के निचले मान उत्तम होते हैं। जीसीवी नियमितीकरण (मशीन लर्निंग) का रूप है: यह मॉडल जटिलता के मुकाबले फिट की अच्छाई का व्यापार करता है।

(हम यह अनुमान लगाना चाहते हैं कि कोई मॉडल नए डेटा पर कितना अच्छा प्रदर्शन करता है, प्रशिक्षण डेटा पर नहीं। ऐसा नया डेटा आमतौर पर मॉडल निर्माण के समय उपलब्ध नहीं होता है, इसलिए इसके बजाय हम नए डेटा पर प्रदर्शन क्या होगा इसका अनुमान लगाने के लिए जीसीवी का उपयोग करते हैं। प्रशिक्षण डेटा पर वर्गों का कच्चा अवशिष्ट योग | वर्गों का अवशिष्ट योग (RSS) मॉडल की तुलना करने के लिए अपर्याप्त है, क्योंकि मार्स शब्द हटा दिए जाने पर RSS हमेशा बढ़ता है। दूसरे शब्दों में, यदि RSS का उपयोग मॉडलों की तुलना करने के लिए किया जाता था, तो बैकवर्ड पास हमेशा सबसे बड़े मॉडल को चुनेगा - किंतु सबसे बड़े मॉडल में आमतौर पर सबसे अच्छा सामान्यीकरण प्रदर्शन नहीं होता है।)

जीसीवी का सूत्र है


 * जीसीवी = आरएसएस / (एन · (1 - (पैरामीटर की प्रभावी संख्या) / एन)2)

जहां RSS प्रशिक्षण डेटा पर मापा गया वर्गों का अवशिष्ट योग है और N अवलोकनों की संख्या ('x' मैट्रिक्स में पंक्तियों की संख्या) है।

EffectiveNumberOfParameters को परिभाषित किया गया है मंगल ग्रह संदर्भ के रूप में


 * (मापदंडों की प्रभावी संख्या) = (मंगल के पदों की संख्या) + (दंड) · ((मंगल के पदों की संख्या) − 1 ) / 2

जहां 'जुर्माना' लगभग 2 या 3 है (एमएआरएस सॉफ्टवेयर उपयोगकर्ता को जुर्माना पूर्व निर्धारित करने की अनुमति देता है)।

ध्यान दें कि


 * (मंगल पदों की संख्या − 1 ) / 2

हिंज-फलन गांठों की संख्या है, इसलिए सूत्र गांठों को जोड़ने पर जुर्माना लगाता है। इस प्रकार जीसीवी फॉर्मूला मॉडल के लचीलेपन को ध्यान में रखते हुए प्रशिक्षण आरएसएस को समायोजित (यानी बढ़ाता है) करता है। हम लचीलेपन को दंडित करते हैं क्योंकि जो मॉडल अधिक लचीले हैं वे डेटा की व्यवस्थित संरचना के बजाय डेटा में शोर के विशिष्ट अहसास को मॉडल करेंगे।

सामान्यीकृत क्रॉस-सत्यापन को यह नाम दिया गया है क्योंकि यह त्रुटि का अनुमान लगाने के लिए सूत्र का उपयोग करता है जिसे लीव-वन-आउट सत्यापन द्वारा निर्धारित किया जाएगा। यह सिर्फ  अनुमान है किंतु व्यवहार में अच्छा काम करता है। जीसीवी को क्रेवेन और ग्रेस वाहबा द्वारा पेश किया गया था और फ्रीडमैन द्वारा मार्स के लिए विस्तारित किया गया था।

बाधाएँ
बाधा का पहले ही उल्लेख किया जा चुका है: उपयोगकर्ता फॉरवर्ड पास में शब्दों की अधिकतम संख्या निर्दिष्ट कर सकता है।

फॉरवर्ड पास पर और बाधा लगाई जा सकती है बातचीत की अधिकतम स्वीकार्य डिग्री निर्दिष्ट करके। आम तौर पर केवल या दो डिग्री की बातचीत की अनुमति होती है, किंतु उच्च डिग्री का उपयोग तब किया जा सकता है जब डेटा इसकी गारंटी देता है। पहले मार्स उदाहरण में अंतःक्रिया की अधिकतम डिग्री उपरोक्त है (भूमिात् कोई इंटरैक्शन या कोई योगात्मक मॉडल नहीं); ओजोन उदाहरण में यह दो है।

फॉरवर्ड पास पर अन्य बाधाएँ संभव हैं। उदाहरण के लिए, उपयोगकर्ता निर्दिष्ट कर सकता है कि इंटरैक्शन की अनुमति है केवल कुछ इनपुट वेरिएबल के लिए। ज्ञान के कारण ऐसी बाधाएँ समझ में आ सकती हैं उस प्रक्रिया का जिसने डेटा उत्पन्न किया।

पक्ष और विपक्ष
कोई भी प्रतिगमन मॉडलिंग तकनीक सभी स्थितियों के लिए सर्वोत्तम नहीं है। नीचे दिए गए दिशानिर्देशों का उद्देश्य मंगल ग्रह के फायदे और नुकसान का विचार देना है। किंतु दिशानिर्देशों के अपवाद होंगे। मंगल की तुलना पुनरावर्ती विभाजन से करना उपयोगी है और यह नीचे किया गया है। (पुनरावर्ती विभाजन को सामान्यतः प्रतिगमन वृक्ष भी कहा जाता है, निर्णय वृक्ष, या पूर्वानुमानित विश्लेषण#वर्गीकरण और प्रतिगमन वृक्ष; विवरण के लिए निर्णय वृक्ष सीखना  लेख देखें)।


 * मार्स मॉडल रैखिक प्रतिगमन मॉडल की तुलना में अधिक लचीले होते हैं।
 * मार्स मॉडल समझने और व्याख्या करने में सरल हैं। उपरोक्त ओजोन सांद्रता के समीकरण की तुलना, मान लीजिए, प्रशिक्षित कृत्रिम तंत्रिका नेटवर्क या यादृच्छिक जंगल के अंदरूनी हिस्सों से करें।
 * मार्स निरंतर और श्रेणीबद्ध डेटा दोनों को संभाल सकता है। मार्स संख्यात्मक डेटा के लिए पुनरावर्ती विभाजन से उत्तम होता है क्योंकि पुनरावर्ती विभाजन द्वारा उपयोग किए जाने वाले टुकड़े-टुकड़े निरंतर विभाजन की तुलना में संख्यात्मक चर के लिए टिका अधिक उपयुक्त होती है।
 * मार्स मॉडल के निर्माण के लिए प्रायः अधिक कम या कोई डेटा तैयारी की आवश्यकता नहीं होती है। हिंज फलन स्वचालित रूप से इनपुट डेटा को विभाजित करता है, इसलिए आउटलेर्स का प्रभाव निहित होता है। इस संबंध में मार्स पुनरावर्ती विभाजन के समान है जो डेटा को असंयुक्त क्षेत्रों में भी विभाजित करता है, हालांकि भिन्न विधि का उपयोग करता है। (फिर भी, अधिकांश सांख्यिकीय मॉडलिंग तकनीकों की तरह, मार्स मॉडल को प्रशिक्षित करने से पहले ज्ञात आउटलेर्स को हटाने पर विचार किया जाना चाहिए।)
 * मार्स (पुनरावर्ती विभाजन की तरह) स्वचालित फ़ीचर चयन करता है (जिसका भूमि है कि यह मॉडल में महत्वपूर्ण चर सम्मिलित करता है और महत्वहीन को बाहर कर देता है)। चूँकि, चयन में कुछ मनमानी हो सकती है, खासकर जब सहसंबद्ध भविष्यवक्ता हों, और यह व्याख्या को प्रभावित कर सकता है *मार्स मॉडल में पूर्वाग्रह-विचरण का अच्छा समझौता होता है। मॉडल अरैखिकता और परिवर्तनीय इंटरैक्शन को मॉडल करने के लिए पर्याप्त लचीले हैं (इस प्रकार मार्स मॉडल में अधिक कम पूर्वाग्रह है), फिर भी मार्स आधार कार्यों का बाधित रूप अधिक अधिक लचीलेपन को रोकता है (इस प्रकार मार्स मॉडल में अधिक कम भिन्नता होती है)।
 * मार्स अधिक बड़े डेटासेट को संभालने के लिए उपयुक्त है। 100 भविष्यवक्ताओं और 10 के साथ इनपुट मैट्रिक्स से मार्स मॉडल बनाना  नियमित मामला है5अवलोकन. ऐसा मॉडल 1 गीगाहर्ट्ज मशीन पर लगभग  मिनट में बनाया जा सकता है, यह मानते हुए कि मार्स शब्दों की परस्पर क्रिया की अधिकतम डिग्री  तक सीमित है (यानी केवल योगात्मक शब्द)। समान 1 गीगाहर्ट्ज़ मशीन पर समान डेटा वाले डिग्री दो मॉडल को अधिक समय लगता है - लगभग 12 मिनट। ध्यान रखें कि यह समय अत्यधिक डेटा पर निर्भर है। पुनरावर्ती विभाजन मार्स की तुलना में अधिक तेज़ है।
 * मार्स मॉडल के साथ, किसी भी गैर-पैरामीट्रिक प्रतिगमन की तरह, पैरामीटर आत्मविश्वास अंतराल और मॉडल पर अन्य जांचों की गणना सीधे नहीं की जा सकती (रैखिक प्रतिगमन मॉडल के विपरीत)। क्रॉस-वैलिडेशन (सांख्यिकी)|इसके बजाय मॉडल को मान्य करने के लिए क्रॉस-वैलिडेशन और संबंधित तकनीकों का उपयोग किया जाना चाहिए।
 * मार्स मॉडल बूस्टिंग (मेटा-एल्गोरिदम) पेड़ों के समान अच्छे फिट नहीं देते हैं, किंतु इन्हें अधिक तेज़ी से बनाया जा सकता है और ये अधिक व्याख्या योग्य हैं। ( 'व्याख्यात्मक' मॉडल ऐसे रूप में है जो यह स्पष्ट करता है कि प्रत्येक भविष्यवक्ता का प्रभाव क्या है।)
 * का>,, और   कार्यान्वयन भविष्यवक्ताओं में लापता मूल्यों की अनुमति नहीं देता है, किंतु प्रतिगमन पेड़ों (जैसे) के मुफ्त कार्यान्वयन की अनुमति देता है   और  ) सरोगेट स्प्लिट्स नामक तकनीक का उपयोग करके लापता मानों की अनुमति दें।
 * मार्स मॉडल शीघ्रता से भविष्यवाणियां कर सकते हैं। भविष्यवाणी फलन को बस मार्स मॉडल सूत्र का मूल्यांकन करना है। इसकी तुलना  समर्थन वेक्टर यंत्र  के साथ भविष्यवाणी करने से करें, जहां प्रत्येक वेरिएबल को प्रत्येक सपोर्ट वेक्टर के संबंधित तत्व से गुणा करना होता है। यदि कई चर और कई समर्थन वैक्टर हैं तो यह  धीमी प्रक्रिया हो सकती है।
 * परिणामस्वरूप फिट किया गया फलन सुचारू नहीं है (टिका के साथ भिन्न-भिन्न नहीं)।

विस्तार और संबंधित अवधारणाएँ

 * सामान्यीकृत रैखिक मॉडल (जीएलएम) को मार्स मॉडल के निर्माण के बाद लिंक फलन प्रारम्भ करके मार्स मॉडल में सम्मिलित किया जा सकता है। इस प्रकार, उदाहरण के लिए, मार्स मॉडल संभावनाओं की भविष्यवाणी करने के लिए  संभार तन्त्र परावर्तन  को सम्मिलित कर सकते हैं।
 * अरेखीय प्रतिगमन|नॉन-लीनियर रिग्रेशन का उपयोग तब किया जाता है जब फलन का अंतर्निहित रूप ज्ञात होता है और रिग्रेशन का उपयोग केवल उस फलन के मापदंडों का अनुमान लगाने के लिए किया जाता है। दूसरी ओर, मंगल स्वयं कार्यों का अनुमान लगाता है, यद्यपि कार्यों की प्रकृति पर गंभीर बाधाएं होती हैं। (ये बाधाएँ आवश्यक हैं क्योंकि डेटा से मॉडल की परिक्षण करना  विपरीत समस्या है जो मॉडल पर बाधाओं के बिना अच्छी तरह से प्रस्तुत समस्या नहीं है।)
 * पुनरावर्ती विभाजन (आमतौर पर कार्ट कहा जाता है)। मार्स को पुनरावर्ती विभाजन के सामान्यीकरण के रूप में देखा जा सकता है जो मॉडल को संख्यात्मक (यानी गैर-श्रेणीबद्ध) डेटा को उत्तम ढंग से संभालने की अनुमति देता है।
 * सामान्यीकृत योगात्मक मॉडल। उपयोगकर्ता के नजरिए से GAM, मार्स के समान हैं, किंतु (ए) मार्स आधार कार्यों के बजाय सुचारू स्थानीय प्रतिगमन या बहुपद स्पलाइन (गणित) में फिट होते हैं, और (बी) स्वचालित रूप से परिवर्तनीय इंटरैक्शन को मॉडल नहीं करते हैं। GAMs द्वारा आंतरिक रूप से उपयोग की जाने वाली फिटिंग विधि मार्स से अधिक भिन्न है। ऐसे मॉडलों के लिए जिन्हें परिवर्तनीय इंटरैक्शन की स्वचालित परिक्षण की आवश्यकता नहीं होती है, GAMs प्रायः मार्स के साथ अनुकूल प्रतिस्पर्धा करते हैं।
 * टीएसएमएआरएस। टाइम सीरीज़ मार्स वह शब्द है जिसका उपयोग तब किया जाता है जब मार्स मॉडल को टाइम सीरीज़ संदर्भ में प्रारम्भ किया जाता है। आमतौर पर इस सेट अप में भविष्यवक्ता विलंबित समय श्रृंखला मान होते हैं जिसके परिणामस्वरूप ऑटोरेग्रेसिव स्पलाइन मॉडल होते हैं। मूविंग एवरेज स्पलाइन मॉडल को सम्मिलित करने के लिए इन मॉडलों और ्सटेंशनों को टीएसएमएआरएस का उपयोग करके यूनीवेरिएट टाइम सीरीज़ मॉडलिंग और पूर्वानुमान में वर्णित किया गया है: टीएसएमएआरएस का उपयोग करके थ्रेशोल्ड टाइम सीरीज़ ऑटोरेग्रेसिव, मौसमी और मूविंग औसत मॉडल का अध्ययन।
 * बायेसियन मंगल (बीएमएआरएस)  ही मॉडल फॉर्म का उपयोग करता है, किंतु बायेसियन दृष्टिकोण का उपयोग करके मॉडल बनाता है। यह विभिन्न इष्टतम मार्स मॉडल पर पहुंच सकता है क्योंकि मॉडल निर्माण का दृष्टिकोण भिन्न है। Bमार्स का परिणाम आम तौर पर मार्स मॉडल के पिछले नमूनों का  समूह होता है, जो संभाव्य भविष्यवाणी की अनुमति देता है।

यह भी देखें

 * रेखीय प्रतिगमन
 * स्थानीय प्रतिगमन
 * तर्कसंगत कार्य मॉडलिंग
 * खंडित प्रतिगमन
 * तख़्ता प्रक्षेप
 * तख़्ता प्रतिगमन

अग्रिम पठन

 * Hastie T., Tibshirani R., and Friedman J.H. (2009) The Elements of Statistical Learning, 2nd edition. Springer, ISBN 978-0-387-84857-0 (has a section on मार्स)
 * Faraway J. (2005) Extending the Linear Model with R, CRC, ISBN 978-1-58488-424-8 (has an example using मार्स with R)
 * Heping Zhang and Burton H. Singer (2010) Recursive Partitioning and Applications, 2nd edition. Springer, ISBN 978-1-4419-6823-4 (has a chapter on मार्स and discusses some tweaks to the algorithm)
 * Denison D.G.T., Holmes C.C., Mallick B.K., and Smith A.F.M. (2004) Bayesian Methods for Nonlinear Classification and Regression, Wiley, ISBN 978-0-471-49036-4
 * Berk R.A. (2008) Statistical learning from a regression perspective, Springer, ISBN 978-0-387-77500-5

बाहरी संबंध
Several free and commercial software packages are available for fitting मार्स-type models.


 * Free software:
 * R packages:
 * function in the  package
 * function in the  package
 * function in the  package.  Not Friedman's मार्स.
 * function in the  package for Bayesian मार्स.
 * Matlab code:
 * ARESLab: Adaptive Regression Splines toolbox for Matlab
 * Code from the book Bayesian Methods for Nonlinear Classification and Regression for Bayesian मार्स.
 * Python
 * भूमि – Multivariate adaptive regression splines
 * py-भूमि
 * pyBASS for Bayesian मार्स.


 * Commercial software:
 * मार्स from Salford Systems. Based on Friedman's implementation.
 * STATISTICA Data Miner from StatSoft
 * ADAPTIVEREG from SAS.