लॉग विश्लेषण

कंप्यूटर लॉग प्रबंधन और इंटेलिजेंस में, लॉग विश्लेषण (या सिस्टम और नेटवर्क लॉग विश्लेषण) एक कला और विज्ञान है जो कंप्यूटर जनित रिकॉर्ड (जिसे लॉग या अंकेक्षण  ट्रेल रिकॉर्ड भी कहा जाता है) को समझने की कोशिश करता है। ऐसे रिकॉर्ड बनाने की प्रक्रिया को डेटा प्रविष्ट कराना कहा जाता है।

लोग लॉग विश्लेषण क्यों करते हैं इसके विशिष्ट कारण हैं:
 * लेखापरीक्षा नीतियों का अनुपालन
 * ऑडिट या विनियमन का अनुपालन
 * सिस्टम समस्या निवारण
 * फोरेंसिक (जांच के दौरान या एक सम्मन के जवाब में)
 * सुरक्षा घटना प्रतिक्रिया
 * ऑनलाइन उपयोगकर्ता व्यवहार को समझना

लॉग नेटवर्क उपकरणों, ऑपरेटिंग सिस्टम, एप्लिकेशन और सभी प्रकार के बुद्धिमान या प्रोग्राम करने योग्य उपकरणों द्वारा उत्सर्जित होते हैं। समय क्रम में संदेशों की एक धारा में अक्सर एक लॉग शामिल होता है। लॉग फ़ाइलों को निर्देशित किया जा सकता है और डिस्क पर संग्रहीत किया जा सकता है या लॉग कलेक्टर को नेटवर्क स्ट्रीम के रूप में निर्देशित किया जा सकता है।

लॉग संदेशों को आमतौर पर इसके स्रोत (जैसे, एप्लिकेशन) की आंतरिक स्थिति के संबंध में व्याख्या की जानी चाहिए और सुरक्षा-प्रासंगिक या संचालन-प्रासंगिक घटनाओं (जैसे, उपयोगकर्ता लॉगिन या सिस्टम त्रुटि) की घोषणा करनी चाहिए।

लॉग अक्सर सॉफ्टवेयर डेवलपर्स द्वारा किसी एप्लिकेशन के संचालन के डिबगिंग में सहायता के लिए या यह समझने के लिए बनाए जाते हैं कि उपयोगकर्ता सिस्टम के साथ कैसे इंटरैक्ट कर रहे हैं, जैसे कि सर्च इंजन। लॉग संदेशों के भीतर डेटा का सिंटैक्स और शब्दार्थ आमतौर पर एप्लिकेशन या विक्रेता-विशिष्ट होते हैं। शब्दावली भी भिन्न हो सकती है; उदाहरण के लिए, किसी एप्लिकेशन के लिए उपयोगकर्ता के प्रमाणीकरण को लॉग इन, लॉगऑन, उपयोगकर्ता कनेक्शन या प्रमाणीकरण घटना के रूप में वर्णित किया जा सकता है। इसलिए, लॉग विश्लेषण को विभिन्न लॉग स्रोतों से संदेशों की उपयोगी तुलना करने के लिए एप्लिकेशन, विक्रेता, सिस्टम या कॉन्फ़िगरेशन के संदर्भ में संदेशों की व्याख्या करनी चाहिए।

लॉग संदेश प्रारूप या सामग्री हमेशा पूरी तरह से प्रलेखित नहीं हो सकती है। लॉग एनालिस्ट का एक कार्य सिस्टम को संदेशों की पूरी श्रृंखला को उत्सर्जित करने के लिए प्रेरित करना है ताकि संपूर्ण डोमेन को समझा जा सके जिससे संदेशों की व्याख्या की जानी चाहिए।

एक लॉग विश्लेषक अलग-अलग लॉग स्रोतों से अलग-अलग शब्दावली को एक समान, सामान्यीकृत शब्दावली में मैप कर सकता है ताकि एक विषम वातावरण से रिपोर्ट और आंकड़े प्राप्त किए जा सकें। उदाहरण के लिए, विंडोज, यूनिक्स, नेटवर्क फायरवॉल और डेटाबेस से लॉग संदेशों को ऑडिटर के लिए सामान्यीकृत रिपोर्ट में एकत्रित किया जा सकता है। अलग-अलग प्रणालियां अलग-अलग शब्दावली के साथ अलग-अलग संदेश प्राथमिकताओं को संकेत दे सकती हैं, जैसे त्रुटि और चेतावनी बनाम त्रुटि, चेतावनी और महत्वपूर्ण।

इसलिए, सॉफ़्टवेयर की रिवर्स इंजीनियरिंग के लिए पाठ पुनर्प्राप्ति से निरंतरता पर लॉग विश्लेषण अभ्यास मौजूद हैं।

कार्य और प्रौद्योगिकियां
पैटर्न पहचान आने वाले संदेशों का चयन करने और विभिन्न तरीकों को फ़िल्टर करने या संभालने के लिए पैटर्न बुक के साथ तुलना करने का एक कार्य है।

सामान्यीकरण संदेश भागों को एक ही प्रारूप (जैसे सामान्य दिनांक प्रारूप या सामान्यीकृत आईपी पता) में परिवर्तित करने का कार्य है।

वर्गीकरण और टैगिंग संदेशों को विभिन्न वर्गों में क्रमित करना या उन्हें बाद में उपयोग के लिए अलग-अलग कीवर्ड के साथ टैग करना है (जैसे फ़िल्टरिंग या प्रदर्शन)।

सहसंबंध विश्लेषण विभिन्न प्रणालियों से संदेश एकत्र करने और एक ही घटना से संबंधित सभी संदेशों को खोजने की एक तकनीक है (उदाहरण के लिए, विभिन्न प्रणालियों पर दुर्भावनापूर्ण गतिविधि द्वारा उत्पन्न संदेश: नेटवर्क डिवाइस, फायरवॉल, सर्वर आदि)। यह आमतौर पर अलर्टिंग सिस्टम से जुड़ा होता है।

आर्टिफिशियल इग्नोरेंस एक प्रकार की यंत्र अधिगम  है जो लॉग प्रविष्टियों को हटाने की एक प्रक्रिया है जो कि अरुचिकर होने के लिए जानी जाती है। कृत्रिम अज्ञान एक कार्य प्रणाली में विसंगतियों का पता लगाने की एक विधि है। लॉग विश्लेषण में, इसका मतलब नियमित, सामान्य लॉग संदेशों को पहचानना और अनदेखा करना है जो सिस्टम के सामान्य संचालन से उत्पन्न होते हैं, और इसलिए बहुत दिलचस्प नहीं होते हैं। हालांकि, नए संदेश जो लॉग में पहले नहीं दिखाई दिए हैं, महत्वपूर्ण घटनाओं को संकेत दे सकते हैं, और इसलिए इसकी जांच की जानी चाहिए। विसंगतियों के अलावा, एल्गोरिथ्म उन सामान्य घटनाओं की पहचान करेगा जो घटित नहीं हुई थीं। उदाहरण के लिए, एक सिस्टम अपडेट जो हर हफ्ते चलता है, चलाने में विफल रहा है।

लॉग एनालिसिस की तुलना अक्सर अन्य एनालिटिक्स टूल जैसे आवेदन प्रदर्शन प्रबंधन (APM) और एरर मॉनिटरिंग से की जाती है। जबकि उनकी अधिकांश कार्यक्षमता स्पष्ट ओवरलैप है, अंतर प्रक्रिया में निहित है। एपीएम का प्रदर्शन पर जोर है और इसका उत्पादन में सबसे अधिक उपयोग किया जाता है। त्रुटि निगरानी डेवलपर्स बनाम संचालन द्वारा संचालित होती है, और अपवाद हैंडलिंग ब्लॉक में कोड में एकीकृत होती है।

यह भी देखें

 * लेखापरीक्षा
 * डेटा लॉकर
 * लॉग मॉनिटर
 * सर्वर लॉग
 * सिस्टम मॉनिटर
 * वेब लॉग विश्लेषण सॉफ्टवेयर
 * वेब विश्लेषिकी सॉफ्टवेयर की सूची