हेल्लो दोस्तों! आज हम इस आर्टिकल में (Regression in Machine Learning in Hindi – रिग्रेशन क्या है?) के बारें में पढेंगे. इसे बहुत ही आसान भाषा में लिखा गया है. इसे आप पूरा पढ़िए, यह आपको आसानी से समझ में आ जायेगा. तो चलिए शुरू करते हैं:-
टॉपिक
Regression in Hindi – रिग्रेशन क्या है?
मशीन लर्निंग में, Regression एक तकनीक है जिसका इस्तेमाल independent variable और dependent variable के बीच की रिलेशनशिप को खोजने के लिए किया जाता है।
दूसरे शब्दों में कहें तो, “रिग्रेशन supervised learning की एक तकनीक है जो यह बताती है कि dependent variable की वैल्यू independent variable के अनुसार किस प्रकार बदलती है।”
Dependent variable वह डेटा होता है जिसके बारे में हमे पता होता है और Independent variable वह होता है जिसके बारे में हमे नहीं पता होता।
Regression का इस्तेमाल भविष्यवाणी करने, मौसम का पूर्वानुमान लगाने, और casual-effect रिलेशनशिप को निर्धारित करने के लिए किया जाता है।
रिग्रेशन का उपयोग विभिन प्रकार के कार्यो में किया जाता है जैसे:- स्टॉक की कीमतों का अनुमान लगाने में, कंपनी का वास्तविक लाभ निकालने के लिए, और डेटा की भविस्यवाणी करने के लिए।
इसका उपयोग ज्यादातर finance और investing से संबंधित क्षेत्रों में किया जाता है। इस विधि का उपयोग करके शेयर मार्किट , कर्मचारी की सैलरी और घर या किसी कंपनी की भविष्यवाणी की जा सकती है।
यह मार्किट के trend का पता लगाने में सक्षम है जिसके कारण लोगो को यह पता चल जाता है की मार्किट में इस समय किस चीज़ का ट्रेंड चल रहा है।
यह तकनीक तेज गति (speed) से वाहन चलाने से होने वाले सड़क हादसों की भविष्यवाणी कर सकती है।
इसे भी पढ़े –
Types of Regression in Hindi – रिग्रेशन के प्रकार
रिग्रेशन के बहुत सारे प्रकार होते है जिनके बारे में हम नीचे पढ़ने वाले है –
- Linear Regression
- Logistic Regression
- Polynomial Regression
- Support Vector Regression
- Decision Tree Regression
- Random Forest Regression
- Ridge Regression
- Lasso Regression
1- Linear Regression (लीनियर रिग्रेशन)
लीनियर रिग्रेशन की एक विधि है जिसका उपयोग predictive analysis के लिए किया जाता है। Predictive analysis में चीज़ो की भविष्यवाणी करने के लिए वर्तमान (present) और इतिहास (history) के तथ्यों को analyze किया जाता है उसके बाद भविष्यवाणी की जाती है।
इस विधि का उपयोग मशीन लर्निंग की समस्याओ को हल करने के लिए किया जाता है। यह एक सरल algorithm है जो रिग्रेशन पर काम करता है और continuous variables के बीच संबंध (relationship) को दिखाता है।
लीनियर रिग्रेशन का उपयोग विभिन्न प्रकार के कार्यो में किया जाता है जैसे :- ट्रेंड का अनुमान लगाने के लिए, बिक्री अनुमानों (sales estimates) को analyze करने, और real estate की भविष्यवाणी करने के लिए।
2- Logistic Regression (लॉजिस्टिक रिग्रेशन)
लॉजिस्टिक रिग्रेशन एक प्रकार का algorithm है जिसका उपयोग classification समस्याओ को सुलझाने के लिए किया जाता है। यह एल्गोरिथ्म probability (संभावना) के कॉसेप्ट पर काम करता है।
लीनियर रिग्रेशन की तुलना में यह महंगा होता है क्योकि यह sigmoid function और logistic function का उपयोग करता है जो काफी महंगे होते है और जटील (complex) भी होते है।
इसके तीन प्रकार होते है पहला Binary, दूसरा Multi और तीसरा Ordinal regression.
3- Polynomial Regression (पॉलिनोमियल रिग्रेशन)
यह एक प्रकार रिग्रेशन है जो मल्टीप्ल लीनियर रिग्रेशन के समान होता है और यह लीनियर मॉडल का उपयोग करता है।
Polynomial regression एक ऐसा रिग्रेशन जो independent variable और dependent variable के बीच के संबंध (relationship) को nth degree polynomial के रूप में प्रस्तुत करता है।
4- Support Vector Regression (सपोर्ट वेक्टर रिग्रेशन)
सपोर्ट वेक्टर रिग्रेशन एक लर्निंग एल्गोरिथ्म है जिसका उपयोग regression के साथ साथ classification की समस्याओ को हल करने के लिए किया जाता है।
यह एक मशीन है जो continuous variables के लिए काम करती है।
सपोर्ट वेक्टर रिग्रेशन में कुछ कीवर्ड का उपयोग किया जाता है जीने निचे समझाया गया है :-
- Kernel
यह एक प्रकार फंक्शन है जिसका इस्तेमाल lower dimensional डेटा को higher dimensional डेटा में map करने के लिए किया जाता है।
- Hyperplane
यह एक प्रकार की रेखा (line) है जो continuous variables की भविष्यवाणी करने में मदद करती है।
- Boundary line
यह एक ऐसी लाइन है जो डेटा बिन्दुओ (datapoints) के लिए margin बनाती है।
- Support vectors
सपोर्ट वेक्टर वह वेक्टर होते है जो hyperplane और opposite class के नजदीक होते है।
5- Decision Tree Regression (डिसीजन ट्री रिग्रेशन)
Decision tree एक algorithm है जिसका उपयोग classification और regression दोनों की समस्याओ को हल करने के लिए किया जाता है।
यह categorical और numerical दोनों प्रकार के डेटा की समस्याओ को हल करने में सक्षम होता है।
Decision tree एक फ्लो-चार्ट की तरह का स्ट्रक्चर होता है; जिस प्रकार tree में पत्तियाँ, जड़ तथा शाखाएँ होती है उसी प्रकार इसमें leaf नोड तथा branches होती है।
Decision tree में सबसे ऊपर की नोड को root नोड कहते है इसमें प्रत्येक leaf नोड एक class को प्रदर्शित करती है।
6- Random Forest Regression (रैंडम फॉरेस्ट रिग्रेशन)
यह supervised learning की एक शक्तिशाली एल्गोरिथम है जो बहुत सारें decision trees को आपस में मिलाती है और फिर इन सभी decision trees के औसत के आधार पर आउटपुट की भविष्यवाणी करती है।
रैंडम फॉरेस्ट रिग्रेशन Bootstrap Aggression तकनीक का इस्तेमाल करता है।
7- Ridge Regression (रिज रिग्रेशन)
रिज रिग्रेशन लीनियर रिग्रेशन का सबसे मजबूत प्रकार है जिसका उपयोग लम्बे समय तक भविष्यवाणी करने के लिए किया जाता है।
यह एक प्रकार की तकनीक भी है जो model की जटीलता (complexity) को कम करती है। इसे L2 regularization के नाम से भी जाना जाता है।
8- Lasso Regression (लासो रिग्रेशन)
यह एक ऐसी तकनीक हैं जो मॉडल की जटीलता (complexity) को कम करने में मदद करती है। लासो रिग्रेशन रिज रिग्रेशन के समान होता है जो समस्याओ को हल करने में सक्ष्म होता है। इसे L1 regularization के नाम से भी जाना जाता है।
Application of Regression in Hindi – रिग्रेशन के अनुप्रयोग
इसका इस्तेमाल निम्नलिखित जगहों पर किया जाता है –
1- Forecasting
रिग्रेशन का उपयोग भविष्य के खतरों और भविष्य के ट्रेंड का पता लगाने के लिए किया जाता है।
2- Weather Forecasting
इसका उपयोग मौसम की भविष्यवाणी करने के लिए किया जाता है।
3- Share Market
यह तकनीक शेयर बजार की भविष्यवाणी करने में मदद करती है।
4- Corporate Returns
इसका उपयोग बड़ी कंपनियों के द्वारा returns का पता लगाने के लिए किया जाता है कि उन्हें इस अगले साल कितने का मुनाफा या नुकसान होगा।
5- Identifying Problems
इसका उपयोग समस्याओ का पता लगाने के लिए किया जाता है।
6- Make Decision
कई ऐसी कंपनिया है जो रिग्रेशन का उपयोग करके फैसले लेती है।
Advantages of Regression in Hindi – रिग्रेशन के फायदे
1- रिग्रेशन समस्याओं को हल करने में मदद करता है।
2- यह आने वाले खतरों के बारे में लोगो को जानकारी देता है ताकि वह अपने आपको सुरक्षित रख सके।
3- यह डेटा को समझने में मदद करता है।
4- रिग्रेशन को समझना काफी आसान होता है।
Disadvantages of Regression in Hindi – रिग्रेशन के नुकसान
1- यदि डेटा में कोई त्रुटि (error) है तो सटीक भविष्यवाणी करना मुश्किल है।
2- इसकी प्रक्रिया को समझना मुश्किल होता है।
3- रिग्रेशन में जैसे जैसे चरो (variable) की संख्या बढ़ती है यह कम विश्वशनीय (reliable) होता जाता है।
Exam में पूछे जाने वाले प्रश्न
Regression एक तकनीक है जिसका इस्तेमाल independent variable और dependent variable के बीच की रिलेशनशिप को खोजने के लिए किया जाता है।
इसका उपयोग मौसम की भविष्यवाणी करने के लिए किया जाता है।
Reference:– https://www.javatpoint.com/regression-analysis-in-machine-learning
निवेदन:- अगर आपके लिए (Regression in Machine Learning in Hindi – रिग्रेशन क्या है?) का यह पोस्ट उपयोगी रहा हो तो इसे अपने दोस्तों के साथ अवश्य share कीजिये. और आपके जो भी questions हो उन्हें नीचे comment करके बताइए. धन्यवाद.
Mainly आप को मशीन लर्निंग का हर एक टॉपिक देना चाहिए आप ने अधूरा टॉपिक दिया है सर आप से विनती है कि पूरा टॉपिक मशीन लर्निंग का डाले वेबसाइट पर
really useful to all researchers, and all type of marketing field persons.