பைத்தானில் புள்ளியியல் கருதுகோள் சோதனையில் தேர்ச்சி பெறுங்கள். தரவு அறிவியலுக்கான கருத்துக்கள், முறைகள் மற்றும் நடைமுறை பயன்பாடுகளை இந்த வழிகாட்டி உள்ளடக்கியது.
பைதான் தரவு அறிவியல்: புள்ளியியல் கருதுகோள் சோதனையின் விரிவான வழிகாட்டி
புள்ளியியல் கருதுகோள் சோதனை என்பது தரவு அறிவியலின் ஒரு முக்கிய அம்சமாகும், இது தரவின் அடிப்படையில் தகவலறிந்த முடிவுகளை எடுக்க உதவுகிறது. இது ஆதாரங்களை மதிப்பிடுவதற்கும், ஒரு மக்கள் தொகை பற்றிய கூற்று உண்மையா என்பதைத் தீர்மானிப்பதற்கும் ஒரு கட்டமைப்பை வழங்குகிறது. இந்த விரிவான வழிகாட்டி, பைத்தானைப் பயன்படுத்தி புள்ளியியல் கருதுகோள் சோதனையின் முக்கிய கருத்துக்கள், முறைகள் மற்றும் நடைமுறை பயன்பாடுகளை ஆராயும்.
புள்ளியியல் கருதுகோள் சோதனை என்றால் என்ன?
அதன் மையத்தில், கருதுகோள் சோதனை என்பது ஒரு மக்கள் தொகை பற்றிய கூற்றை மதிப்பிடுவதற்கு மாதிரி தரவைப் பயன்படுத்தும் ஒரு செயல்முறையாகும். இது இரண்டு போட்டியிடும் கருதுகோள்களை உருவாக்குகிறது: பூஜ்ஜிய கருதுகோள் (H0) மற்றும் மாற்று கருதுகோள் (H1).
- பூஜ்ஜிய கருதுகோள் (H0): இது சோதனை செய்யப்படும் அறிக்கை. இது பொதுவாக தற்போதைய நிலையையோ அல்லது விளைவின் பற்றாக்குறையையோ குறிக்கிறது. உதாரணமாக, "ஆண்கள் மற்றும் பெண்களின் சராசரி உயரம் ஒரே மாதிரியாக உள்ளது."
- மாற்று கருதுகோள் (H1): நாம் ஆதரிக்க ஆதாரங்களைக் கண்டறிய முயற்சிக்கும் அறிக்கை இது. இது பூஜ்ஜிய கருதுகோளுக்கு முரணாக உள்ளது. உதாரணமாக, "ஆண்கள் மற்றும் பெண்களின் சராசரி உயரம் வேறுபட்டது."
கருதுகோள் சோதனையின் நோக்கம், மாற்று கருதுகோளுக்கு ஆதரவாக பூஜ்ஜிய கருதுகோளை நிராகரிக்க போதுமான ஆதாரம் உள்ளதா என்பதைத் தீர்மானிப்பதாகும்.
கருதுகோள் சோதனையில் முக்கிய கருத்துக்கள்
கீழ்க்கண்ட கருத்துகளைப் புரிந்துகொள்வது கருதுகோள் சோதனைகளைச் செய்து விளக்குவதற்கு அவசியமாகும்:
P-மதிப்பு
p-மதிப்பு என்பது மாதிரி தரவிலிருந்து கணக்கிடப்பட்டதை விட, அல்லது அதற்கு மேற்பட்ட ஒரு சோதனை புள்ளிவிவரத்தை கவனிப்பதற்கான நிகழ்தகவு ஆகும், பூஜ்ஜிய கருதுகோள் உண்மை என்று கருதினால். ஒரு சிறிய p-மதிப்பு (வழக்கமாக முக்கியத்துவ நிலையை விடக் குறைவானது, ஆல்ஃபா) பூஜ்ஜிய கருதுகோளுக்கு எதிராக வலுவான ஆதாரங்களைக் குறிக்கிறது.
முக்கியத்துவ நிலை (ஆல்ஃபா)
முக்கியத்துவ நிலை (α) என்பது பூஜ்ஜிய கருதுகோளை நிராகரிக்க தேவையான ஆதாரங்களின் அளவை வரையறுக்கும் முன் தீர்மானிக்கப்பட்ட வரம்பாகும். ஆல்ஃபாவுக்கான பொதுவாகப் பயன்படுத்தப்படும் மதிப்புகள் 0.05 (5%) மற்றும் 0.01 (1%). p-மதிப்பு ஆல்ஃபாவிடமிருந்து குறைவாக இருந்தால், பூஜ்ஜிய கருதுகோளை நிராகரிக்கிறோம்.
வகை I மற்றும் வகை II பிழைகள்
கருதுகோள் சோதனையில், நாம் செய்யக்கூடிய இரண்டு வகையான பிழைகள் உள்ளன:
- வகை I பிழை (தவறான நேர்மறை): பூஜ்ஜிய கருதுகோள் உண்மையில் உண்மை இருக்கும்போது அதை நிராகரித்தல். வகை I பிழையைச் செய்வதற்கான நிகழ்தகவு ஆல்ஃபா (α) க்கு சமம்.
- வகை II பிழை (தவறான எதிர்மறை): பூஜ்ஜிய கருதுகோள் உண்மையில் தவறாக இருக்கும்போது அதை நிராகரிக்கத் தவறுதல். வகை II பிழையைச் செய்வதற்கான நிகழ்தகவு பீட்டா (β) ஆல் குறிக்கப்படுகிறது.
ஒரு சோதனையின் சக்தி
ஒரு சோதனையின் சக்தி என்பது பூஜ்ஜிய கருதுகோள் தவறாக இருக்கும்போது அதை சரியாக நிராகரிப்பதற்கான நிகழ்தகவு ஆகும் (1 - β). ஒரு உயர்-சக்தி சோதனை உண்மையான விளைவைக் கண்டறிய அதிக வாய்ப்புள்ளது.
சோதனை புள்ளிவிவரம்
ஒரு சோதனை புள்ளிவிவரம் என்பது மாதிரி தரவிலிருந்து கணக்கிடப்பட்ட ஒரு தனி எண் ஆகும், இது பூஜ்ஜிய கருதுகோளை நிராகரிக்க வேண்டுமா என்பதைத் தீர்மானிக்கப் பயன்படுகிறது. எடுத்துக்காட்டுகளில் t-புள்ளிவிவரம், z-புள்ளிவிவரம், F-புள்ளிவிவரம் மற்றும் கை-வர்க்க புள்ளிவிவரம் ஆகியவை அடங்கும். சோதனை புள்ளிவிவரத்தின் தேர்வு தரவின் வகை மற்றும் சோதனை செய்யப்படும் கருதுகோளைப் பொறுத்தது.
நம்பிக்கை இடைவெளிகள்
ஒரு நம்பிக்கை இடைவெளி என்பது ஒரு குறிப்பிட்ட நம்பிக்கை மட்டத்தில் (எ.கா., 95% நம்பிக்கை) உண்மையான மக்கள் தொகை அளவுரு விழக்கூடும் மதிப்புகளின் வரம்பை வழங்குகிறது. நம்பிக்கை இடைவெளிகள் கருதுகோள் சோதனைகளுடன் தொடர்புடையவை; பூஜ்ஜிய கருதுகோள் மதிப்பு நம்பிக்கை இடைவெளியில் விழுந்தால், நாம் பூஜ்ஜிய கருதுகோளை நிராகரிப்போம்.
பைத்தானில் பொதுவான கருதுகோள் சோதனைகள்
பைத்தானின் scipy.stats தொகுப்பு புள்ளியியல் கருதுகோள் சோதனைகளைச் செய்வதற்கான பரந்த அளவிலான செயல்பாடுகளை வழங்குகிறது. மிகவும் பொதுவாகப் பயன்படுத்தப்படும் சில சோதனைகள் இங்கே:
1. டி-சோதனைகள்
டி-சோதனைகள் ஒன்று அல்லது இரண்டு குழுக்களின் சராசரியை ஒப்பிடுவதற்குப் பயன்படுத்தப்படுகின்றன. டி-சோதனைகளில் மூன்று முக்கிய வகைகள் உள்ளன:
- ஒரு மாதிரி டி-சோதனை: ஒரு மாதிரி சராசரியை ஒரு அறியப்பட்ட மக்கள் தொகை சராசரியுடன் ஒப்பிடுவதற்குப் பயன்படுத்தப்படுகிறது.
- சுயாதீன மாதிரிகள் டி-சோதனை (இரண்டு-மாதிரி டி-சோதனை): இரண்டு சுயாதீன குழுக்களின் சராசரியை ஒப்பிடுவதற்குப் பயன்படுத்தப்படுகிறது. இந்த சோதனை இரண்டு குழுக்களின் மாறுபாடுகள் சமமாக இருப்பதாகக் கருதுகிறது (அல்லது அவை இல்லையென்றால் சரிசெய்யப்படலாம்).
- ஜோடி மாதிரிகள் டி-சோதனை: இரண்டு தொடர்புடைய குழுக்களின் சராசரியை ஒப்பிடுவதற்குப் பயன்படுத்தப்படுகிறது (எ.கா., ஒரே பாடங்களில் அளவீடுகளுக்கு முன் மற்றும் பின்).
எடுத்துக்காட்டு (ஒரு மாதிரி டி-சோதனை):
ஒரு குறிப்பிட்ட பள்ளியில் (ஜப்பான்) உள்ள மாணவர்களின் சராசரி தேர்வு மதிப்பெண் தேசிய சராசரியிலிருந்து (75) கணிசமாக வேறுபடுகிறதா என்பதைச் சோதிக்க விரும்புகிறோம் என்று வைத்துக்கொள்வோம். 30 மாணவர்களிடமிருந்து தேர்வு மதிப்பெண்களின் மாதிரியை நாங்கள் சேகரிக்கிறோம்.
```python import numpy as np from scipy import stats # மாதிரி தரவு (தேர்வு மதிப்பெண்கள்) scores = np.array([82, 78, 85, 90, 72, 76, 88, 80, 79, 83, 86, 74, 77, 81, 84, 89, 73, 75, 87, 91, 71, 70, 92, 68, 93, 95, 67, 69, 94, 96]) # மக்கள் தொகை சராசரி population_mean = 75 # ஒரு மாதிரி டி-சோதனை செய்யுங்கள் t_statistic, p_value = stats.ttest_1samp(scores, population_mean) print("டி-புள்ளிவிவரம்:", t_statistic) print("பி-மதிப்பு:", p_value) # பி-மதிப்பு ஆல்ஃபா விடக் குறைவாக உள்ளதா என சரிபார்க்கவும் (எ.கா., 0.05) alpha = 0.05 if p_value < alpha: print("பூஜ்ஜிய கருதுகோளை நிராகரிக்கவும்") else: print("பூஜ்ஜிய கருதுகோளை நிராகரிக்கத் தவறிவிட்டேன்") ```எடுத்துக்காட்டு (சுயாதீன மாதிரிகள் டி-சோதனை):
இரண்டு வெவ்வேறு நாடுகளில் (கனடா மற்றும் ஆஸ்திரேலியா) மென்பொருள் பொறியாளர்களின் சராசரி வருமானத்தை ஒப்பிட விரும்புகிறோம் என்று வைத்துக் கொள்வோம். ஒவ்வொரு நாட்டிலும் உள்ள மென்பொருள் பொறியியலாளர்களின் மாதிரிகளிலிருந்து வருமானத் தரவைச் சேகரிக்கிறோம்.
```python import numpy as np from scipy import stats # கனடாவில் உள்ள மென்பொருள் பொறியியலாளர்களுக்கான வருமான தரவு (ஆயிரம் டாலர்களில்) canada_income = np.array([80, 85, 90, 95, 100, 105, 110, 115, 120, 125]) # ஆஸ்திரேலியாவில் உள்ள மென்பொருள் பொறியியலாளர்களுக்கான வருமான தரவு (ஆயிரம் டாலர்களில்) australia_income = np.array([75, 80, 85, 90, 95, 100, 105, 110, 115, 120]) # சுயாதீன மாதிரிகள் டி-சோதனை செய்யுங்கள் t_statistic, p_value = stats.ttest_ind(canada_income, australia_income) print("டி-புள்ளிவிவரம்:", t_statistic) print("பி-மதிப்பு:", p_value) # பி-மதிப்பு ஆல்ஃபா விடக் குறைவாக உள்ளதா என சரிபார்க்கவும் (எ.கா., 0.05) alpha = 0.05 if p_value < alpha: print("பூஜ்ஜிய கருதுகோளை நிராகரிக்கவும்") else: print("பூஜ்ஜிய கருதுகோளை நிராகரிக்கத் தவறிவிட்டேன்") ```எடுத்துக்காட்டு (ஜோடி மாதிரிகள் டி-சோதனை):
ஜெர்மனியில் உள்ள ஒரு நிறுவனம் ஒரு புதிய பயிற்சி திட்டத்தை செயல்படுத்துகிறது மற்றும் அது ஊழியர்களின் செயல்திறனை மேம்படுத்துகிறதா என்று பார்க்க விரும்புகிறது என்று வைத்துக்கொள்வோம். அவர்கள் பயிற்சி திட்டத்திற்கு முன் மற்றும் பின் ஒரு குழு ஊழியர்களின் செயல்திறனை அளவிடுகிறார்கள்.
```python import numpy as np from scipy import stats # பயிற்சிக்கு முன் செயல்திறன் தரவு before_training = np.array([60, 65, 70, 75, 80, 85, 90, 95, 100, 105]) # பயிற்சிக்குப் பிறகு செயல்திறன் தரவு after_training = np.array([70, 75, 80, 85, 90, 95, 100, 105, 110, 115]) # ஜோடி மாதிரிகள் டி-சோதனை செய்யுங்கள் t_statistic, p_value = stats.ttest_rel(after_training, before_training) print("டி-புள்ளிவிவரம்:", t_statistic) print("பி-மதிப்பு:", p_value) # பி-மதிப்பு ஆல்ஃபா விடக் குறைவாக உள்ளதா என சரிபார்க்கவும் (எ.கா., 0.05) alpha = 0.05 if p_value < alpha: print("பூஜ்ஜிய கருதுகோளை நிராகரிக்கவும்") else: print("பூஜ்ஜிய கருதுகோளை நிராகரிக்கத் தவறிவிட்டேன்") ```2. இசட்-சோதனைகள்
மக்கள் தொகை தரநிலை விலக்கம் தெரிந்திருந்தால் அல்லது மாதிரி அளவு போதுமானதாக இருந்தால் (வழக்கமாக n > 30) ஒன்று அல்லது இரண்டு குழுக்களின் சராசரியை ஒப்பிடுவதற்கு z-சோதனைகள் பயன்படுத்தப்படுகின்றன. டி-சோதனைகளைப் போலவே, ஒரு மாதிரி மற்றும் இரண்டு மாதிரி z-சோதனைகள் உள்ளன.
எடுத்துக்காட்டு (ஒரு மாதிரி இசட்-சோதனை):
வியட்நாமில் லைட் பல்புகளை தயாரிக்கும் ஒரு தொழிற்சாலை, தங்கள் லைட் பல்புகளின் சராசரி ஆயுட்காலம் 1000 மணிநேரம் என்றும், 50 மணிநேரங்களின் அறியப்பட்ட தரநிலை விலக்கம் என்றும் கூறுகிறது. ஒரு நுகர்வோர் குழு 40 லைட் பல்புகளின் மாதிரியை சோதிக்கிறது.
```python import numpy as np from scipy import stats from statsmodels.stats.weightstats import ztest # மாதிரி தரவு (லைட் பல்புகளின் ஆயுட்காலம்) lifespan = np.array([980, 1020, 990, 1010, 970, 1030, 1000, 960, 1040, 950, 1050, 940, 1060, 930, 1070, 920, 1080, 910, 1090, 900, 1100, 995, 1005, 985, 1015, 975, 1025, 1005, 955, 1045, 945, 1055, 935, 1065, 925, 1075, 915, 1085, 895, 1095]) # மக்கள் தொகை சராசரி மற்றும் தரநிலை விலக்கம் population_mean = 1000 population_std = 50 # ஒரு மாதிரி இசட்-சோதனை செய்யுங்கள் z_statistic, p_value = ztest(lifespan, value=population_mean) print("இசட்-புள்ளிவிவரம்:", z_statistic) print("பி-மதிப்பு:", p_value) # பி-மதிப்பு ஆல்ஃபா விடக் குறைவாக உள்ளதா என சரிபார்க்கவும் (எ.கா., 0.05) alpha = 0.05 if p_value < alpha: print("பூஜ்ஜிய கருதுகோளை நிராகரிக்கவும்") else: print("பூஜ்ஜிய கருதுகோளை நிராகரிக்கத் தவறிவிட்டேன்") ```3. ANOVA (மாறுபாட்டின் பகுப்பாய்வு)
மூன்று அல்லது அதற்கு மேற்பட்ட குழுக்களின் சராசரியை ஒப்பிடுவதற்கு ANOVA பயன்படுத்தப்படுகிறது. குழு சராசரிகளுக்கு இடையே குறிப்பிடத்தக்க வேறுபாடு உள்ளதா என்பதை இது சோதிக்கிறது. ஒரு வழி ANOVA மற்றும் இரண்டு வழி ANOVA உள்ளிட்ட பல்வேறு வகையான ANOVA உள்ளன.
எடுத்துக்காட்டு (ஒரு வழி ANOVA):
பிரேசிலில் உள்ள ஒரு சந்தைப்படுத்தல் நிறுவனம், மூன்று வெவ்வேறு விளம்பர பிரச்சாரங்கள் விற்பனையில் குறிப்பிடத்தக்க தாக்கத்தை ஏற்படுத்துகின்றனவா என்பதைச் சோதிக்க விரும்புகிறது. அவர்கள் ஒவ்வொரு பிரச்சாரத்தாலும் உருவாக்கப்பட்ட விற்பனையை அளவிடுகிறார்கள்.
```python import numpy as np from scipy import stats # ஒவ்வொரு பிரச்சாரத்திற்கான விற்பனை தரவு campaign_A = np.array([100, 110, 120, 130, 140]) campaign_B = np.array([110, 120, 130, 140, 150]) campaign_C = np.array([120, 130, 140, 150, 160]) # ஒரு வழி ANOVA செய்யுங்கள் f_statistic, p_value = stats.f_oneway(campaign_A, campaign_B, campaign_C) print("எஃப்-புள்ளிவிவரம்:", f_statistic) print("பி-மதிப்பு:", p_value) # பி-மதிப்பு ஆல்ஃபா விடக் குறைவாக உள்ளதா என சரிபார்க்கவும் (எ.கா., 0.05) alpha = 0.05 if p_value < alpha: print("பூஜ்ஜிய கருதுகோளை நிராகரிக்கவும்") else: print("பூஜ்ஜிய கருதுகோளை நிராகரிக்கவும்") ```4. கை-வர்க்க சோதனை
கை-வர்க்க சோதனை வகை தரவை பகுப்பாய்வு செய்யப் பயன்படுகிறது. இது இரண்டு வகை மாறிகளுக்கு இடையே குறிப்பிடத்தக்க தொடர்பு உள்ளதா என்பதை சோதிக்கிறது.
எடுத்துக்காட்டு (கை-வர்க்க சோதனை):
தென்னாப்பிரிக்காவில் ஒரு கணக்கெடுப்பு மக்களிடம் அவர்களின் அரசியல் தொடர்பு (ஜனநாயக, குடியரசுக் கட்சி, சுயேச்சை) மற்றும் ஒரு குறிப்பிட்ட கொள்கையைப் பற்றிய அவர்களின் கருத்தை (ஆதரவு, எதிர்ப்பு, நடுநிலை) கேட்கிறது. அரசியல் தொடர்புக்கும் கொள்கையைப் பற்றிய கருத்துக்கும் ஏதாவது தொடர்பு இருக்கிறதா என்று பார்க்க விரும்புகிறோம்.
```python import numpy as np from scipy.stats import chi2_contingency # கவனித்த அதிர்வெண்கள் (தொடர்பு அட்டவணை) observed = np.array([[50, 30, 20], [20, 40, 40], [30, 30, 40]]) # கை-வர்க்க சோதனை செய்யுங்கள் chi2_statistic, p_value, dof, expected = chi2_contingency(observed) print("கை-வர்க்க புள்ளிவிவரம்:", chi2_statistic) print("பி-மதிப்பு:", p_value) print("சுதந்திரத்தின் அளவை:", dof) print("எதிர்பார்க்கப்பட்ட அதிர்வெண்கள்:", expected) # பி-மதிப்பு ஆல்ஃபா விடக் குறைவாக உள்ளதா என சரிபார்க்கவும் (எ.கா., 0.05) alpha = 0.05 if p_value < alpha: print("பூஜ்ஜிய கருதுகோளை நிராகரிக்கவும்") else: print("பூஜ்ஜிய கருதுகோளை நிராகரிக்கத் தவறிவிட்டேன்") ```நடைமுறைச் சிந்தனைகள்
1. கருதுகோள் சோதனைகளின் அனுமானங்கள்
பல கருதுகோள் சோதனைகள் முடிவுகள் செல்லுபடியாகும் வகையில் குறிப்பிட்ட அனுமானங்களைக் கொண்டுள்ளன. உதாரணமாக, t-சோதனைகள் மற்றும் ANOVA தரவு இயல்பாக விநியோகிக்கப்படுகிறது மற்றும் சமமான மாறுபாடுகளைக் கொண்டுள்ளது என்று கருதுகின்றன. சோதனைகளின் முடிவுகளை விளக்குவதற்கு முன் இந்த அனுமானங்களைச் சரிபார்க்க வேண்டியது அவசியம். இந்த அனுமானங்களை மீறுவது தவறான முடிவுகளுக்கு வழிவகுக்கும்.
2. மாதிரி அளவு மற்றும் சக்தி பகுப்பாய்வு
ஒரு கருதுகோள் சோதனையின் சக்தியில் மாதிரி அளவு முக்கிய பங்கு வகிக்கிறது. பொதுவாக ஒரு பெரிய மாதிரி அளவு சோதனையின் சக்தியை அதிகரிக்கிறது, இது உண்மையான விளைவைக் கண்டறியும் வாய்ப்பை அதிகரிக்கிறது. விரும்பிய சக்தி மட்டத்தை அடைய தேவையான குறைந்தபட்ச மாதிரி அளவை தீர்மானிக்க சக்தி பகுப்பாய்வு பயன்படுத்தப்படலாம்.
எடுத்துக்காட்டு (சக்தி பகுப்பாய்வு):
டி-சோதனையைத் திட்டமிட்டுள்ளோம் என்றும் 5% முக்கியத்துவ மட்டத்தில் 80% சக்தியை அடைய தேவையான மாதிரி அளவை தீர்மானிக்க விரும்புகிறோம் என்றும் வைத்துக்கொள்வோம். நாம் விளைவு அளவை (சராசரிக்கு இடையேயான வேறுபாடு நாம் கண்டறிய விரும்புகிறோம்) மற்றும் தரநிலை விலக்கத்தை மதிப்பிட வேண்டும்.
```python from statsmodels.stats.power import TTestIndPower # அளவுருக்கள் effect_size = 0.5 # கோஹனின் டி alpha = 0.05 power = 0.8 # சக்தி பகுப்பாய்வு செய்யுங்கள் analysis = TTestIndPower() sample_size = analysis.solve_power(effect_size=effect_size, power=power, alpha=alpha, ratio=1) print("குழு ஒன்றுக்கு தேவையான மாதிரி அளவு:", sample_size) ```3. பல சோதனை
பல கருதுகோள் சோதனைகளைச் செய்யும்போது, வகை I பிழை (தவறான நேர்மறை) செய்வதற்கான நிகழ்தகவு அதிகரிக்கிறது. இந்த சிக்கலைத் தீர்க்க, பொன்ஃபெரோனி திருத்தம் அல்லது பெஞ்சமின்-ஹோச்பெர்க் செயல்முறை போன்ற p-மதிப்புகளை சரிசெய்வதற்கான முறைகளைப் பயன்படுத்துவது முக்கியம்.
4. சூழலில் முடிவுகளை விளக்குதல்
கருதுகோள் சோதனைகளின் முடிவுகளை ஆராய்ச்சி கேள்வி மற்றும் பகுப்பாய்வு செய்யப்படும் தரவின் சூழலில் விளக்குவது முக்கியம். ஒரு புள்ளிவிவர ரீதியாக குறிப்பிடத்தக்க முடிவு நடைமுறை முக்கியத்துவத்தை கட்டாயமாக குறிக்காது. விளைவின் அளவையும் அதன் நிஜ-உலக தாக்கங்களையும் கருத்தில் கொள்ளுங்கள்.
மேம்பட்ட தலைப்புகள்
1. பேய்சியன் கருதுகோள் சோதனை
பேய்சியன் கருதுகோள் சோதனை பாரம்பரிய (அடிக்கடி) கருதுகோள் சோதனைக்கு ஒரு மாற்று அணுகுமுறையை வழங்குகிறது. இது பேய்ஸ் காரணியைக் கணக்கிடுவதை உள்ளடக்கியது, இது மற்றொன்றுக்கு ஒரு கருதுகோளுக்கான ஆதாரங்களை அளவிடுகிறது.
2. பாராமெட்ரிக் அல்லாத சோதனைகள்
பாராமெட்ரிக் சோதனைகளின் அனுமானங்கள் (எ.கா., இயல்பு) பூர்த்தி செய்யப்படாதபோது பாராமெட்ரிக் அல்லாத சோதனைகள் பயன்படுத்தப்படுகின்றன. எடுத்துக்காட்டுகளில் மேன்-விட்னி யூ சோதனை, வில்காக்ஸன் கையொப்பமிட்ட-வரிசை சோதனை மற்றும் கிருஸ்கல்-வாலிஸ் சோதனை ஆகியவை அடங்கும்.
3. மறுசீரமைப்பு முறைகள் (பூட்ஸ்டிராப்பிங் மற்றும் பெருக்கல் சோதனைகள்)
பூட்ஸ்டிராப்பிங் மற்றும் பெருக்கல் சோதனைகள் போன்ற மறுசீரமைப்பு முறைகள், அடிப்படை மக்கள் தொகை விநியோகம் பற்றிய வலுவான அனுமானங்களை எடுக்காமல் சோதனை புள்ளிவிவரத்தின் மாதிரி விநியோகத்தை மதிப்பிடுவதற்கான ஒரு வழியை வழங்குகின்றன.
முடிவுரை
புள்ளியியல் கருதுகோள் சோதனை அறிவியல், வணிகம் மற்றும் பொறியியல் உள்ளிட்ட பல்வேறு துறைகளில் தரவு சார்ந்த முடிவுகளை எடுப்பதற்கான ஒரு சக்திவாய்ந்த கருவியாகும். முக்கிய கருத்துக்கள், முறைகள் மற்றும் நடைமுறைச் சிந்தனைகளைப் புரிந்துகொள்வதன் மூலம், தரவு விஞ்ஞானிகள் தரவிலிருந்து நுண்ணறிவுகளைப் பெறவும், அர்த்தமுள்ள முடிவுகளை எடுக்கவும் கருதுகோள் சோதனையைப் பயன்படுத்தலாம். பைத்தானின் scipy.stats தொகுப்பு பரந்த அளவிலான கருதுகோள் சோதனைகளைச் செய்வதற்கான விரிவான செயல்பாடுகளை வழங்குகிறது. ஒவ்வொரு சோதனையின் அனுமானங்களையும், மாதிரி அளவையும், பல சோதனைகளுக்கான சாத்தியக்கூறையும் கவனமாக நினைவில் கொள்ளுங்கள், மேலும் ஆராய்ச்சி கேள்வியின் சூழலில் முடிவுகளை விளக்குங்கள். இந்த வழிகாட்டி, உண்மையான உலக சிக்கல்களுக்கு இந்த சக்திவாய்ந்த முறைகளைப் பயன்படுத்தத் தொடங்க உங்களுக்கு ஒரு உறுதியான அடித்தளத்தை வழங்குகிறது. உங்கள் புரிதலை ஆழப்படுத்தவும், உங்கள் தரவு அறிவியல் திறன்களை மேம்படுத்தவும் வெவ்வேறு சோதனைகள் மற்றும் நுட்பங்களை தொடர்ந்து ஆராயுங்கள்.
மேலும் கற்றல்:
- புள்ளியியல் மற்றும் தரவு அறிவியலில் ஆன்லைன் படிப்புகள் (எ.கா., கூர்சேரா, எட்எக்ஸ், டேட்டாகாம்ப்)
- புள்ளியியல் பாடப்புத்தகங்கள்
- பைத்தானின்
scipy.statsதொகுப்புக்கான ஆவணங்கள் - குறிப்பிட்ட கருதுகோள் சோதனை நுட்பங்களைப் பற்றிய ஆராய்ச்சி கட்டுரைகள் மற்றும் கட்டுரைகள்