hello दोस्तों, आज मैं आपको data mining के टॉपिक rule based classifiers in hindi के बारें में बताऊंगा. तो चलिए start करते है:-
Rule based classifiers in hindi
IF-THEN Rules
rule-based classifier जो है वह IF-THEN rules के एक set का प्रयोग classification के लिए करता है. हम एक rule को निम्नलिखित रूप में प्रस्तुत कर सकते है:-
IF condition THEN conclusion
हम यहाँ एक rule R1 मान लेते है,
R1 : IF age = youth AND student = yes
THEN buy_laptop = yes
याद रखने वाली बातें:-
- rule के IF वाले part को rule antecedent या precondition कहते है.
- rule के THEN वाले part को rule consequent कहते है.
- antecedent part के एक या एक से ज्यादा attribute tests होते है.
- consequent part में class prediction सम्मिलित रहता है.
नोट:- हम R1 को निम्नलिखित तरीके से भी लिख सकते है:-
R1 : ((age = youth) ^ (student = yes)) (buys laptop = yes)
यदि ऊपर दी गयी condition सत्य होती है तो तब antecedent, satisfy हो जाता है.
Rule extraction
यहाँ हम सीखेंगे कि एक decision tree से IF-THEN rules को extract करके rule-based classifier कैसे बनाया जाता है.
Rule extraction using sequential covering algorithm
sequential covering algorithm का प्रयोग करके training data से IF-THEN rules को extract किया जा सकता है. हमें इसमें पहले decision tree को generate करने की आवश्यकता नही पड़ती.
इस algorithm का नाम sequential covering इसलिए पड़ा क्योंकि इस algorithm में, दिए गये class का प्रत्येक rule उस class के बहुत सारें tuples को cover करता है. और इन rules को sequentially (एक के बाद एक) learn किया जाता है.
इस algorithm का प्रयोग classification rules के sets की mining करने के लिए सबसे ज्यादा किया जाता है.
कुछ बहुत जयादा प्रयोग की जाने वाली sequential covering algorithms – AQ, CN2, तथा RIPPER है.
इसकी सामान्य strategy होती है कि इसमें एक एक समय में केवल एक rule को ही learn किया जाता है. और जो tuple, rule के द्वारा cover किया गया होता है उसे remove कर दिया जाता है और यह प्रक्रिया सभी tuples के लिए चलती है.
नीचे एक sequential covering algorithm दी गयी है जहाँ rules को एक समय में एक class के लिए learn किया जाता है. इसमें जब हम class C के लिए rule को learn करते है तो हम चाहते है कि class C के सभी training tuples, cover हो जाएँ. और अन्य class का कोई भी tuple cover ना हो. इस तरीके से हम जिन भी rules को learn करेंगे वो high accuracy के होंगे.
algorithm :-
Algorithm: Sequential Covering Input: D, a data set class-labeled tuples, Att_vals, the set of all attributes and their possible values. Output: A Set of IF-THEN rules. Method: Rule_set={ }; // initial set of rules learned is empty for each class c do repeat Rule = Learn_One_Rule(D, Att_valls, c); remove tuples covered by Rule form D; until termination condition; Rule_set=Rule_set+Rule; // add a new rule to rule-set end for return Rule_Set;
निवेदन:- अगर आपको यह article अच्छा लगा हो तो इसे अपने दोस्तों के साथ अवश्य share कीजिये. तथा अपने questions को कमेंट करके पूछिए. धन्यवाद.