கணித முறை அறிதலின் அற்புதமான உலகத்தை ஆராயுங்கள், அடிப்படை கருத்துக்கள் முதல் மேம்பட்ட நுட்பங்கள் மற்றும் நிஜ உலக பயன்பாடுகள் வரை. தரவு பகுப்பாய்வு, கணிப்பு மற்றும் தன்னியக்கமாக்கல் பற்றிய நுண்ணறிவுகளைத் திறக்கவும்.
கணித முறை அறிதலை உருவாக்குதல்: ஒரு விரிவான வழிகாட்டி
பங்குச் சந்தைப் போக்குகளைக் கணிப்பது முதல் நோய்களைக் கண்டறிவது மற்றும் உற்பத்தி செயல்முறைகளை மேம்படுத்துவது வரை, கணித முறை அறிதல் பல்வேறு துறைகளில் பயன்படுத்தப்படும் ஒரு சக்திவாய்ந்த கருவியாகும். இந்த விரிவான வழிகாட்டி, கணித முறை அறிதலின் அடிப்படைக் கருத்துக்கள், நுட்பங்கள் மற்றும் பயன்பாடுகளை ஆராய்ந்து, தொடக்கநிலையாளர்கள் மற்றும் அனுபவம் வாய்ந்த பயிற்சியாளர்களுக்கு ஒரு அடித்தளத்தை வழங்குகிறது.
கணித முறை அறிதல் என்றால் என்ன?
அதன் மையத்தில், கணித முறை அறிதல் என்பது தரவுகளுக்குள் உள்ள ஒழுங்குமுறைகளை அடையாளம் கண்டு வகைப்படுத்துவதை உள்ளடக்கியது. இந்த ஒழுங்குமுறைகள் வரிசைகள், வடிவங்கள், விநியோகங்கள் அல்லது மாறிகளுக்கு இடையிலான உறவுகளாக வெளிப்படலாம். இந்த முறைகளைத் தானாகக் கண்டறிந்து வகைப்படுத்தக்கூடிய வழிமுறைகள் மற்றும் மாதிரிகளை உருவாக்குவதே இதன் குறிக்கோள், இது கணிப்புகளைச் செய்யவும், நுண்ணறிவுகளைப் பெறவும், முடிவெடுக்கும் செயல்முறைகளைத் தன்னியக்கமாக்கவும் உதவுகிறது.
தரவுப் புள்ளிகளை வெறுமனே மனப்பாடம் செய்வதைப் போலல்லாமல், முறை அறிதல் என்பது காணப்படாத தரவுகளுக்குப் பொதுவான அடிப்படை கட்டமைப்புகளைப் பிரித்தெடுக்க முற்படுகிறது. மாறிவரும் சூழல்களுக்கு ஏற்ப மாற்றியமைக்கக்கூடிய வலுவான மற்றும் நம்பகமான அமைப்புகளை உருவாக்குவதற்கு இது முக்கியமானது.
அடிப்படை கருத்துக்கள்
கணித முறை அறிதலில் தேர்ச்சி பெற பின்வரும் அடிப்படைக் கருத்துக்களைப் புரிந்துகொள்வது அவசியம்:
- தரவு பிரதிநிதித்துவம்: தரவின் பொருத்தமான பிரதிநிதித்துவத்தைத் தேர்ந்தெடுப்பது முதல் மற்றும் பெரும்பாலும் மிக முக்கியமான படியாகும். நாம் அடையாளம் காண விரும்பும் முறைகளின் அத்தியாவசிய பண்புகளைப் பிடிக்கும் தொடர்புடைய கூறுகளைத் தேர்ந்தெடுப்பது இதில் அடங்கும். எடுத்துக்காட்டாக, பட அங்கீகாரத்தில், விளிம்புகள், மூலைகள் மற்றும் இழைமங்கள் போன்ற கூறுகள் இருக்கலாம்.
- கூறு பிரித்தெடுத்தல்: இந்த செயல்முறை மூலத் தரவை மிகவும் தகவலறிந்த மற்றும் பகுப்பாய்வு செய்ய எளிதான கூறுகளின் தொகுப்பாக மாற்றுகிறது. ஃபோரியர் மாற்றங்கள், வேவ்லெட்டுகள் மற்றும் புள்ளிவிவர தருணங்கள் போன்ற நுட்பங்கள் பொதுவாக கூறு பிரித்தெடுப்பதற்குப் பயன்படுத்தப்படுகின்றன.
- வகைப்பாடு: வகைப்பாடு வழிமுறைகள் தரவுப் புள்ளிகளை அவற்றின் கூறுகளின் அடிப்படையில் முன்னரே வரையறுக்கப்பட்ட வகைகளுக்கு ஒதுக்குகின்றன. எடுத்துக்காட்டுகளில் ஆதரவு திசையன் இயந்திரங்கள் (SVMs), முடிவு மரங்கள் மற்றும் நரம்பியல் நெட்வொர்க்குகள் ஆகியவை அடங்கும்.
- கொத்தாக்கம்: கொத்தாக்க வழிமுறைகள் தரவுப் புள்ளிகளை அவற்றின் ஒற்றுமையின் அடிப்படையில் கொத்துகளாகக் குழுவாக்குகின்றன. வகைப்பாட்டைப் போலல்லாமல், கொத்தாக்கத்திற்கு முன்னரே வரையறுக்கப்பட்ட வகைகள் தேவையில்லை. K-means கொத்தாக்கம் மற்றும் படிநிலை கொத்தாக்கம் ஆகியவை பிரபலமான நுட்பங்கள்.
- பின்னடைவு: பின்னடைவு வழிமுறைகள் உள்ளீட்டு மாறிகள் மற்றும் தொடர்ச்சியான வெளியீட்டு மாறிக்கு இடையிலான உறவை மாதிரியாக்குகின்றன. நேரியல் பின்னடைவு, பல்லுறுப்புக்கோவை பின்னடைவு மற்றும் ஆதரவு திசையன் பின்னடைவு ஆகியவை பொதுவாகப் பயன்படுத்தப்படுகின்றன.
- மாதிரி மதிப்பீடு: ஒரு முறை அறிதல் மாதிரியின் செயல்திறனை மதிப்பீடு செய்வது அதன் துல்லியம் மற்றும் நம்பகத்தன்மையை உறுதி செய்வதற்கு முக்கியமானது. துல்லியம், நுட்பம், நினைவு மற்றும் F1-மதிப்பெண் போன்ற அளவீடுகள் பொதுவாக மாதிரி செயல்திறனை மதிப்பிடுவதற்குப் பயன்படுத்தப்படுகின்றன.
கணித முறை அறிதலில் முக்கிய நுட்பங்கள்
கணித முறை அறிதலில் பல நுட்பங்கள் பொதுவாகப் பயன்படுத்தப்படுகின்றன. இங்கே சில மிக முக்கியமானவை:
1. புள்ளிவிவர முறைகள்
புள்ளிவிவர முறைகள் தரவை பகுப்பாய்வு செய்வதற்கும் முறைகளைக் கண்டறிவதற்கும் ஒரு சக்திவாய்ந்த கட்டமைப்பை வழங்குகின்றன. சில முக்கிய புள்ளிவிவர நுட்பங்கள் பின்வருமாறு:
- பயேசியன் பகுப்பாய்வு: பயேசியன் முறைகள் நிச்சயமற்ற தன்மையை மாதிரியாக்கவும், புதிய தரவுகளின் அடிப்படையில் நம்பிக்கைகளைப் புதுப்பிக்கவும் நிகழ்தகவைப் பயன்படுத்துகின்றன. அவை குறிப்பாக சத்தமில்லாத அல்லது முழுமையற்ற தரவுகளைக் கையாள்வதில் பயனுள்ளதாக இருக்கும். எடுத்துக்காட்டு: ஸ்பேம் செய்திகளில் சில வார்த்தைகள் தோன்றுவதற்கான நிகழ்தகவின் அடிப்படையில் மின்னஞ்சல்களை வகைப்படுத்த ஸ்பேம் வடிகட்டுதல் பெரும்பாலும் பயேசியன் நுட்பங்களைப் பயன்படுத்துகிறது.
- மறைக்கப்பட்ட மார்கோவ் மாதிரிகள் (HMMs): HMMகள் வரிசைமுறைத் தரவை மாதிரியாக்கப் பயன்படுத்தப்படுகின்றன, அங்கு அடிப்படை நிலை மறைக்கப்பட்டுள்ளது. அவை பொதுவாக பேச்சு அங்கீகாரம், உயிர் தகவலியல் மற்றும் நிதி மாதிரியாக்கத்தில் பயன்படுத்தப்படுகின்றன. எடுத்துக்காட்டு: பேச்சு அங்கீகரிப்பு அமைப்புகள் பேசும் வார்த்தைகளில் உள்ள ஃபோனீம்களின் வரிசையை மாதிரியாக்க HMMகளைப் பயன்படுத்துகின்றன.
- முதன்மை கூறு பகுப்பாய்வு (PCA): PCA என்பது ஒரு பரிமாணக் குறைப்பு நுட்பமாகும், இது தரவின் முதன்மைக் கூறுகளை அடையாளம் காட்டுகிறது, இது அதிகபட்ச மாறுபாட்டைப் பிடிக்கிறது. இது பெரும்பாலும் தரவின் சிக்கலைக் குறைக்கவும், முறை அறிதல் வழிமுறைகளின் செயல்திறனை மேம்படுத்தவும் பயன்படுகிறது. எடுத்துக்காட்டு: பட செயலாக்கத்தில், ஒரு படத்தைக் குறிக்கத் தேவையான கூறுகளின் எண்ணிக்கையைக் குறைக்க PCA ஐப் பயன்படுத்தலாம், இது பகுப்பாய்வு செய்வதை எளிதாக்குகிறது.
2. இயந்திர கற்றல் நெறிமுறைகள்
இயந்திர கற்றல் நெறிமுறைகள் வெளிப்படையான நிரலாக்கம் இல்லாமல் தரவிலிருந்து கற்றுக்கொள்ள வடிவமைக்கப்பட்டுள்ளன. அவை குறிப்பாக சிக்கலான முறை அறிதல் பணிகளுக்கு ஏற்றவை.
- ஆதரவு திசையன் இயந்திரங்கள் (SVMs): SVMகள் சக்திவாய்ந்த வகைப்பாடு வழிமுறைகளாகும், அவை தரவுப் புள்ளிகளை வெவ்வேறு வகைகளாகப் பிரிக்கும் உகந்த அதிபரப்பைத் தேடுகின்றன. அவை உயர்-பரிமாண இடைவெளிகளில் பயனுள்ளவை மற்றும் கர்னல் செயல்பாடுகளைப் பயன்படுத்தி நேரியல் அல்லாத தரவுகளைக் கையாள முடியும். எடுத்துக்காட்டு: படங்களில் உள்ள பொருட்களை அடையாளம் காண பட வகைப்படுத்தல் பணிகளில் SVMகள் பயன்படுத்தப்படுகின்றன.
- முடிவு மரங்கள்: முடிவு மரங்கள் என்பது ஒரு வகைப்பாடு அல்லது கணிப்பிற்கு வழிவகுக்கும் தொடர்ச்சியான முடிவுகளைக் குறிக்கும் மரம் போன்ற கட்டமைப்புகள். அவை விளக்குவதற்கு எளிதானவை மற்றும் வகை மற்றும் எண் தரவு இரண்டையும் கையாள முடியும். எடுத்துக்காட்டு: மக்கள்தொகை மற்றும் கொள்முதல் வரலாறு போன்ற பல்வேறு காரணிகளின் அடிப்படையில் வாடிக்கையாளர் வெளியேற்றத்தைக் கணிக்க முடிவு மரங்களைப் பயன்படுத்தலாம்.
- நரம்பியல் நெட்வொர்க்குகள்: நரம்பியல் நெட்வொர்க்குகள் மனித மூளையின் கட்டமைப்பால் ஈர்க்கப்பட்டு, தகவல்களைச் செயலாக்கும் ஒன்றோடொன்று இணைக்கப்பட்ட முனைகளைக் (நியூரான்கள்) கொண்டுள்ளன. அவை சிக்கலான முறைகளைக் கற்றுக் கொள்ளும் திறன் கொண்டவை மற்றும் பட அங்கீகாரம், இயற்கை மொழி செயலாக்கம் மற்றும் நேரத் தொடர் பகுப்பாய்வு ஆகியவற்றில் பரவலாகப் பயன்படுத்தப்படுகின்றன. எடுத்துக்காட்டு: ஆழமான கற்றல் மாதிரிகள், ஒரு வகை நரம்பியல் நெட்வொர்க், பொருட்களை அடையாளம் காணவும் சாலைகளில் செல்லவும் தானியங்கி கார்களில் பயன்படுத்தப்படுகின்றன.
- K-அருகாமை அயலவர்கள் (KNN): KNN என்பது ஒரு எளிய ஆனால் பயனுள்ள வகைப்பாடு வழிமுறையாகும், இது ஒரு தரவுப் புள்ளியை அதன் k அருகாமை அயலவர்களிடையே மிகவும் பொதுவான வகைக்கு ஒதுக்குகிறது. இது செயல்படுத்துவது எளிதானது மற்றும் வகைப்பாடு மற்றும் பின்னடைவுப் பணிகளுக்குப் பயன்படுத்தப்படலாம். எடுத்துக்காட்டு: ஒத்த வாடிக்கையாளர்கள் வாங்கிய தயாரிப்புகளின் அடிப்படையில் வாடிக்கையாளர்களுக்கு தயாரிப்புகளைப் பரிந்துரைக்க KNN ஐப் பயன்படுத்தலாம்.
3. சிக்னல் செயலாக்க நுட்பங்கள்
சிக்னல் செயலாக்க நுட்பங்கள் ஆடியோ, படங்கள் மற்றும் நேரத் தொடர் தரவு போன்ற சிக்னல்களில் இருந்து தகவல்களைப் பகுப்பாய்வு செய்து பிரித்தெடுக்கப் பயன்படுகின்றன.
- ஃபோரியர் மாற்றங்கள்: ஃபோரியர் மாற்றங்கள் ஒரு சிக்னலை அதன் கூறு அதிர்வெண்களாகப் பிரிக்கின்றன, இது நேர களத்தில் உடனடியாகத் தெரியாத முறைகளைக் கண்டறிய அனுமதிக்கிறது. எடுத்துக்காட்டு: இசையின் அதிர்வெண் உள்ளடக்கத்தை பகுப்பாய்வு செய்வதற்கும் வெவ்வேறு கருவிகளை அடையாளம் காண்பதற்கும் ஆடியோ செயலாக்கத்தில் ஃபோரியர் மாற்றங்கள் பயன்படுத்தப்படுகின்றன.
- வேவ்லெட்டுகள்: வேவ்லெட்டுகள் என்பவை ஃபோரியர் மாற்றங்களைப் போலவே, ஆனால் சிறந்த நேரத் தெளிவுத்திறனுடன், சிக்னல்களை வெவ்வேறு அதிர்வெண் கூறுகளாகப் பிரிக்கப் பயன்படும் கணித செயல்பாடுகள் ஆகும். அதிர்வெண் உள்ளடக்கம் காலப்போக்கில் மாறும் நிலையற்ற சிக்னல்களை பகுப்பாய்வு செய்வதற்கு அவை குறிப்பாக பயனுள்ளதாக இருக்கும். எடுத்துக்காட்டு: படங்களை வெவ்வேறு அதிர்வெண் கூறுகளாகப் பிரிப்பதன் மூலம் திறமையாகக் குறிக்க பட சுருக்கத்தில் வேவ்லெட்டுகள் பயன்படுத்தப்படுகின்றன.
- வடிகட்டுதல்: வடிகட்டுதல் நுட்பங்கள் சிக்னல்களில் இருந்து தேவையற்ற சத்தம் அல்லது கலைப்பொருட்களை அகற்றப் பயன்படுகின்றன. பொதுவான வகை வடிப்பான்களில் லோ-பாஸ் வடிப்பான்கள், ஹை-பாஸ் வடிப்பான்கள் மற்றும் பேண்ட்-பாஸ் வடிப்பான்கள் அடங்கும். எடுத்துக்காட்டு: பதிவுகளிலிருந்து பின்னணி இரைச்சலை அகற்ற ஆடியோ செயலாக்கத்தில் வடிப்பான்கள் பயன்படுத்தப்படுகின்றன.
4. நேரத் தொடர் பகுப்பாய்வு
நேரத் தொடர் பகுப்பாய்வு என்பது பங்கு விலைகள், வானிலை முறைகள் மற்றும் சென்சார் அளவீடுகள் போன்ற காலப்போக்கில் சேகரிக்கப்பட்ட தரவுகளை பகுப்பாய்வு செய்வதில் கவனம் செலுத்துகிறது.
- தன்னியக்கப் பின்னடைவு மாதிரிகள் (AR): AR மாதிரிகள் கடந்த கால மதிப்புகளின் அடிப்படையில் எதிர்கால மதிப்புகளைக் கணிக்கின்றன. அவை பொதுவாக முன்கணிப்பு மற்றும் முரண்பாடு கண்டறிதலுக்குப் பயன்படுத்தப்படுகின்றன. எடுத்துக்காட்டு: வரலாற்று விலை தரவுகளின் அடிப்படையில் பங்கு விலைகளைக் கணிக்க AR மாதிரிகள் பயன்படுத்தப்படுகின்றன.
- நகரும் சராசரிகள்: நகரும் சராசரிகள் நேரத் தொடர் தரவுகளில் உள்ள ஏற்ற இறக்கங்களை மென்மையாக்குகின்றன, இது போக்குகளை அடையாளம் காண்பதை எளிதாக்குகிறது. எடுத்துக்காட்டு: தினசரி பங்கு விலைகளை மென்மையாக்கவும் நீண்ட காலப் போக்குகளை அடையாளம் காணவும் நகரும் சராசரிகள் பயன்படுத்தப்படுகின்றன.
- தொடர் நரம்பியல் நெட்வொர்க்குகள் (RNNs): RNNகள் என்பது வரிசைமுறைத் தரவைக் கையாள பிரத்யேகமாக வடிவமைக்கப்பட்ட ஒரு வகை நரம்பியல் நெட்வொர்க் ஆகும். அவை கடந்த கால உள்ளீடுகள் பற்றிய தகவல்களைத் தக்கவைத்துக் கொள்ள அனுமதிக்கும் நினைவக செல்களைக் கொண்டுள்ளன, அவை நேரத் தொடர் பகுப்பாய்வுக்கு மிகவும் பொருத்தமானவையாக அமைகின்றன. எடுத்துக்காட்டு: ஒரு வாக்கியத்தில் உள்ள சொற்களின் வரிசையை மாதிரியாக்க இயற்கை மொழி செயலாக்கத்தில் RNNகள் பயன்படுத்தப்படுகின்றன.
- நீண்ட குறுகிய கால நினைவகம் (LSTM): LSTM நெட்வொர்க்குகள் என்பது ஒரு வகை RNN ஆகும், இது நீண்ட வரிசைகளில் RNNகளைப் பயிற்றுவிக்கும்போது ஏற்படக்கூடிய மறைந்துபோகும் சாய்வு சிக்கலைக் கடக்க வடிவமைக்கப்பட்டுள்ளது. LSTMகள் நீண்ட காலத்திற்கு தகவல்களை சேமிக்கக்கூடிய நினைவக செல்களைக் கொண்டுள்ளன, அவை நேரத் தொடர் தரவுகளில் நீண்ட கால சார்புகளை மாதிரியாக்க மிகவும் பொருத்தமானவையாக அமைகின்றன. எடுத்துக்காட்டு: ஒரு மொழியிலிருந்து மற்றொரு மொழிக்கு வாக்கியங்களை மொழிபெயர்க்க இயந்திர மொழிபெயர்ப்பில் LSTMகள் பயன்படுத்தப்படுகின்றன.
கணித முறை அறிதலின் நிஜ உலகப் பயன்பாடுகள்
கணித முறை அறிதல் பரந்த அளவிலான தொழில்கள் மற்றும் துறைகளில் பயன்படுத்தப்படுகிறது. இங்கே சில எடுத்துக்காட்டுகள்:
- நிதி: பங்குச் சந்தைப் போக்குகளைக் கணித்தல், மோசடியான பரிவர்த்தனைகளைக் கண்டறிதல் மற்றும் கடன் அபாயத்தை மதிப்பிடுதல். எடுத்துக்காட்டு: வழக்கத்திற்கு மாறான செலவு முறைகளைக் கண்டறிந்து மோசடியான கிரெடிட் கார்டு பரிவர்த்தனைகளைக் கண்டறிய வங்கிகள் முறை அறிதல் வழிமுறைகளைப் பயன்படுத்துகின்றன.
- சுகாதாரம்: நோய்களைக் கண்டறிதல், நோயாளி விளைவுகளைக் கணித்தல் மற்றும் சிகிச்சைத் திட்டங்களைத் தனிப்பயனாக்குதல். எடுத்துக்காட்டு: மருத்துவப் படங்களை பகுப்பாய்வு செய்து கட்டிகளைக் கண்டறிய மருத்துவர்கள் முறை அறிதல் வழிமுறைகளைப் பயன்படுத்துகின்றனர்.
- உற்பத்தி: உற்பத்தி செயல்முறைகளை மேம்படுத்துதல், குறைபாடுகளைக் கண்டறிதல் மற்றும் உபகரணங்களின் தோல்விகளைக் கணித்தல். எடுத்துக்காட்டு: உபகரணங்களின் செயல்திறனைக் கண்காணிக்கவும், பராமரிப்பு தேவைப்படும்போது கணிக்கவும் தொழிற்சாலைகள் முறை அறிதல் வழிமுறைகளைப் பயன்படுத்துகின்றன.
- போக்குவரத்து: போக்குவரத்து ஓட்டத்தை மேம்படுத்துதல், பயண நேரங்களைக் கணித்தல் மற்றும் பாதுகாப்பை மேம்படுத்துதல். எடுத்துக்காட்டு: போக்குவரத்து மேலாண்மை அமைப்புகள் போக்குவரத்து முறைகளைப் பகுப்பாய்வு செய்யவும், போக்குவரத்து விளக்குகளின் நேரத்தை மேம்படுத்தவும் முறை அறிதல் வழிமுறைகளைப் பயன்படுத்துகின்றன.
- சில்லறை வர்த்தகம்: பரிந்துரைகளைத் தனிப்பயனாக்குதல், வாடிக்கையாளர் நடத்தையைக் கணித்தல் மற்றும் சரக்கு நிர்வாகத்தை மேம்படுத்துதல். எடுத்துக்காட்டு: மின்-வணிக வலைத்தளங்கள் வாடிக்கையாளர்களின் உலாவல் வரலாறு மற்றும் கொள்முதல் நடத்தையின் அடிப்படையில் தயாரிப்புகளைப் பரிந்துரைக்க முறை அறிதல் வழிமுறைகளைப் பயன்படுத்துகின்றன.
- சைபர் பாதுகாப்பு: தீம்பொருளைக் கண்டறிதல், நெட்வொர்க் ஊடுருவல்களை அடையாளம் காணுதல் மற்றும் தரவு மீறல்களைத் தடுத்தல். எடுத்துக்காட்டு: பாதுகாப்பு நிறுவனங்கள் நெட்வொர்க் போக்குவரத்தை பகுப்பாய்வு செய்து தீங்கிழைக்கும் செயல்பாடுகளைக் கண்டறிய முறை அறிதல் வழிமுறைகளைப் பயன்படுத்துகின்றன.
- சுற்றுச்சூழல் அறிவியல்: காலநிலை மாற்றத்தை மாதிரியாக்குதல், இயற்கை பேரழிவுகளைக் கணித்தல் மற்றும் மாசு அளவைக் கண்காணித்தல். எடுத்துக்காட்டு: விஞ்ஞானிகள் காலநிலை தரவுகளை பகுப்பாய்வு செய்து எதிர்கால காலநிலை போக்குகளைக் கணிக்க முறை அறிதல் வழிமுறைகளைப் பயன்படுத்துகின்றனர்.
குறியீட்டுடன் எடுத்துக்காட்டுகள் (பைதான்)
பைதான் மற்றும் ஸ்கைக்கிட்-லெர்ன் போன்ற பொதுவான நூலகங்களைப் பயன்படுத்தி அடிப்படை முறை அறிதல் நுட்பங்களை நிரூபிக்க சில எளிய எடுத்துக்காட்டுகள் கீழே உள்ளன. இவை எளிமைப்படுத்தப்பட்ட எடுத்துக்காட்டுகள் என்பதையும், நிஜ உலகப் பயன்பாடுகளுக்கு மேலும் செம்மைப்படுத்தல் தேவைப்படலாம் என்பதையும் நினைவில் கொள்க.
1. ஆதரவு திசையன் இயந்திரம் (SVM) உடன் வகைப்பாடு
இந்த எடுத்துக்காட்டு SVM ஐப் பயன்படுத்தி தரவை எவ்வாறு வகைப்படுத்துவது என்பதைக் காட்டுகிறது.
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score
# ஐரிஸ் தரவுத்தொகுப்பை ஏற்றவும்
iris = datasets.load_iris()
X = iris.data
y = iris.target
# தரவை பயிற்சி மற்றும் சோதனை தொகுப்புகளாக பிரிக்கவும்
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# ஒரு SVM வகைப்படுத்தியை உருவாக்கவும்
svm = SVC(kernel='linear')
# வகைப்படுத்தியைப் பயிற்றுவிக்கவும்
svm.fit(X_train, y_train)
# சோதனை தொகுப்பில் கணிப்புகளைச் செய்யவும்
y_pred = svm.predict(X_test)
# வகைப்படுத்தியின் துல்லியத்தைக் கணக்கிடவும்
accuracy = accuracy_score(y_test, y_pred)
print(f"துல்லியம்: {accuracy}")
2. K-Means உடன் கொத்தாக்கம்
இந்த எடுத்துக்காட்டு K-Means ஐப் பயன்படுத்தி தரவை எவ்வாறு கொத்தாக்குவது என்பதைக் காட்டுகிறது.
from sklearn.cluster import KMeans
from sklearn.datasets import make_blobs
import matplotlib.pyplot as plt
# மாதிரி தரவை உருவாக்கவும்
X, y = make_blobs(n_samples=300, centers=4, cluster_std=0.60, random_state=0)
# ஒரு K-Means கொத்தாக்க மாதிரியை உருவாக்கவும்
kmeans = KMeans(n_clusters=4, init='k-means++', max_iter=300, n_init=10, random_state=0)
# மாதிரியை தரவுகளுக்குப் பொருத்தவும்
kmeans.fit(X)
# கொத்து லேபிள்களைப் பெறவும்
y_kmeans = kmeans.predict(X)
# கொத்துகளை வரைபடமாக்கவும்
plt.scatter(X[:, 0], X[:, 1], c=y_kmeans, s=50, cmap='viridis')
centers = kmeans.cluster_centers_
plt.scatter(centers[:, 0], centers[:, 1], c='red', s=200, alpha=0.75)
plt.title('K-Means கொத்தாக்கம்')
plt.show()
3. தன்னியக்கப் பின்னடைவு (AR) மாதிரியுடன் நேரத் தொடர் முன்கணிப்பு
இந்த எடுத்துக்காட்டு AR மாதிரியைப் பயன்படுத்தி நேரத் தொடர் தரவை எவ்வாறு முன்கணிப்பது என்பதைக் காட்டுகிறது.
import numpy as np
import pandas as pd
from statsmodels.tsa.ar_model import AutoReg
from sklearn.metrics import mean_squared_error
import matplotlib.pyplot as plt
# மாதிரி நேரத் தொடர் தரவை உருவாக்கவும்
np.random.seed(42)
data = np.random.randn(100)
data = pd.Series(data)
# தரவை பயிற்சி மற்றும் சோதனை தொகுப்புகளாக பிரிக்கவும்
train_data = data[:80]
test_data = data[80:]
# ஒரு AR மாதிரியை உருவாக்கவும்
model = AutoReg(train_data, lags=5)
# மாதிரியைப் பொருத்தவும்
model_fit = model.fit()
# சோதனை தொகுப்பில் கணிப்புகளைச் செய்யவும்
y_pred = model_fit.predict(start=len(train_data), end=len(data)-1)
# சராசரி வர்க்கப் பிழையைக் கணக்கிடவும்
mse = mean_squared_error(test_data, y_pred)
print(f"சராசரி வர்க்கப் பிழை: {mse}")
# முடிவுகளை வரைபடமாக்கவும்
plt.plot(test_data, label='உண்மையானது')
plt.plot(y_pred, label='கணிக்கப்பட்டது')
plt.legend()
plt.title('AR மாதிரியுடன் நேரத் தொடர் முன்கணிப்பு')
plt.show()
நெறிமுறைக் கருத்தில் கொள்ள வேண்டியவைகள்
எந்தவொரு சக்திவாய்ந்த தொழில்நுட்பத்தைப் போலவே, கணித முறை அறிதலின் நெறிமுறைக் தாக்கங்களைக் கருத்தில் கொள்வது மிகவும் முக்கியம். தரவுகளில் உள்ள சார்பு, தற்போதுள்ள ஏற்றத்தாழ்வுகளை நிலைநிறுத்திப் பெருக்கும் சார்புடைய மாதிரிகளுக்கு வழிவகுக்கும். உதாரணமாக, преимущественно வெள்ளையர்களின் முகங்களில் பயிற்சி பெற்ற முக அங்கீகார அமைப்புகள் மற்ற இனத்தவர்களின் முகங்களில் மோசமாகச் செயல்படக்கூடும்.
வெளிப்படைத்தன்மை மற்றும் விளக்கத்தன்மை ஆகியவையும் முக்கியமான கருத்தாகும். ஒரு முறை அறிதல் மாதிரி அதன் முடிவுகளுக்கு எவ்வாறு வருகிறது என்பதைப் புரிந்துகொள்வது, நம்பிக்கையை வளர்ப்பதற்கும் பொறுப்புக்கூறலை உறுதி செய்வதற்கும் முக்கியமானது. சுகாதாரம் மற்றும் குற்றவியல் நீதி போன்ற உயர்-பங்கு பயன்பாடுகளில் இது குறிப்பாக முக்கியமானது.
எதிர்காலப் போக்குகள்
கணித முறை அறிதல் துறை தொடர்ந்து உருவாகி வருகிறது, புதிய நுட்பங்கள் மற்றும் பயன்பாடுகள் எல்லா நேரத்திலும் வெளிவருகின்றன. சில முக்கிய போக்குகள் பின்வருமாறு:
- ஆழமான கற்றல்: ஆழமான கற்றல் மாதிரிகள் பெருகிய முறையில் சக்திவாய்ந்தவையாகி வருகின்றன, மேலும் பெரிய தரவுத்தொகுப்புகளிலிருந்து சிக்கலான முறைகளைக் கற்றுக் கொள்ளும் திறன் கொண்டவை.
- விளக்கக்கூடிய AI (XAI): XAI நுட்பங்கள் இயந்திர கற்றல் மாதிரிகளை மிகவும் வெளிப்படையானதாகவும் புரிந்துகொள்ளக்கூடியதாகவும் மாற்றுவதை நோக்கமாகக் கொண்டுள்ளன, "கருப்புப் பெட்டி" சிக்கலைத் தீர்க்கின்றன.
- கூட்டமைப்பு கற்றல்: கூட்டமைப்பு கற்றல், தரவுகளைப் பகிராமலேயே பரவலாக்கப்பட்ட தரவுகளில் மாதிரிகளைப் பயிற்றுவிக்க அனுமதிக்கிறது, தனியுரிமையைப் பாதுகாக்கிறது மற்றும் நிறுவனங்களிடையே ஒத்துழைப்பை செயல்படுத்துகிறது.
- குவாண்டம் இயந்திர கற்றல்: குவாண்டம் கம்ப்யூட்டிங், பாரம்பரிய கணினிகளுக்கு தீர்க்க முடியாத சிக்கல்களைத் தீர்க்கக்கூடிய புதிய வழிமுறைகளின் வளர்ச்சியை செயல்படுத்துவதன் மூலம் இயந்திர கற்றலில் புரட்சியை ஏற்படுத்தும் திறனைக் கொண்டுள்ளது.
முடிவுரை
கணித முறை அறிதல் என்பது நமது வாழ்வின் பல அம்சங்களை மாற்றியமைக்கும் திறனைக் கொண்ட வேகமாக வளர்ந்து வரும் துறையாகும். அடிப்படைக் கருத்துக்கள், நுட்பங்கள் மற்றும் நெறிமுறைக் கருத்தில் கொள்ள வேண்டியவைகளைப் புரிந்துகொள்வதன் மூலம், சிக்கலான சிக்கல்களைத் தீர்க்கவும் சிறந்த எதிர்காலத்தை உருவாக்கவும் முறை அறிதலின் சக்தியைப் பயன்படுத்தலாம். இந்த வழிகாட்டி இந்த அற்புதமான பகுதியில் மேலும் ஆய்வு மற்றும் பரிசோதனைக்கு ஒரு உறுதியான அடித்தளத்தை வழங்குகிறது.
மேலும் வளங்கள்
- புத்தகங்கள்: கிறிஸ்டோபர் பிஷப்பின் "பேட்டர்ன் ரெகக்னிஷன் அண்ட் மெஷின் லேர்னிங்", ஹேஸ்டி, திப்ஷிரானி மற்றும் ஃப்ரீட்மேனின் "தி எலிமெண்ட்ஸ் ஆஃப் ஸ்டேடிஸ்டிகல் லேர்னிங்"
- ஆன்லைன் படிப்புகள்: கோர்செரா, எட்எக்ஸ், யுடாசிட்டி ஆகியவை இயந்திர கற்றல் மற்றும் முறை அறிதல் குறித்த படிப்புகளை வழங்குகின்றன.
- ஆராய்ச்சி ஆவணங்கள்: arXiv, IEEE Xplore மற்றும் பிற கல்வி தரவுத்தளங்களில் உள்ள வெளியீடுகளை ஆராயுங்கள்.
- திறந்த மூல நூலகங்கள்: ஸ்கைக்கிட்-லெர்ன், டென்சர்ஃப்ளோ, பைடார்ச் ஆகியவை முறை அறிதல் வழிமுறைகளைச் செயல்படுத்தப் பிரபலமான நூலகங்கள்.