Хипотеза тестирање

Једноставан и кратак водич за тестирање хипотеза помоћу Питхона

Слика са: хттп://ввв.адванцеинноватионгроуп.цом/блог/медиан-басед-хипотхесис-тест

У овом блогу даћу кратак туториал испитивања хипотезе користећи статистичке методе у Питхон-у. Тестирање хипотеза део је научне методе коју смо сви добро познавали, нешто што смо вероватно научили у нашим раним образовним годинама. Међутим, у статистици се многи експерименти раде на узорку популације.

„Утврђивање онога што узорак скупа опажања говори о предложеном објашњењу, уопште нас захтева да закључимо, или како то статистичари називају, Разлог са несигурношћу. Образложење са несигурношћу је срж статистичког закључивања и обично се врши методом која се назива Испитивање значаја нулте хипотезе. " -Овећи.

Као пример за овај блог, користићу сет европских података о фудбалу који се налази на Кагглеу и спровешћу тестирање хипотеза. Овај скуп података можете пронаћи овде.

Корак 1

Упути се

Први корак је посматрање појава. У овом случају биће: Да ли постоји утицај одбрамбене агресије на просечно дозвољене циљеве?

Корак 2

Испитајте истраживање

Добар начин размишљања за рад је паметнији, а не тежи. Добро је видети да ли већ постоје истраживања која се тичу вашег запажања. Ако је тако, можда ће вам помоћи у одговору на наше питање. Свесност већ постојећих истраживања или експеримената помоћи ће нам да боље структуирамо експеримент, или ћемо можда чак и одговорити на наше питање и да прво не морамо да спроводимо експеримент.

3. корак

Формирајте нулту хипотезу и алтернативну хипотезу

Алтернативна хипотеза је наше образовано претпостављање, а нулта хипотеза је управо супротна. Ако алтернативна хипотеза наводи да постоји значајан однос између две променљиве, нулта хипотеза наводи да нема значајног односа.

Наша Нулл Хипотхесис ће бити: Не постоји статистичка разлика у циљевима који су дозвољени код тимова са одбрамбеном агресијом већом или једнаком 65 у односу на тимове испод 65.

Алтернативна хипотеза: Постоји статистичка разлика у циљевима који су дозвољени код тимова са одбрамбеном агресијом већом или једнаком 65 у односу на тимове испод 65 година.

4. корак

Утврдите да ли је наша хипотеза тест с једним репом или двострани тест.

Тест са једним репом

"Ако користите ниво значајности од 0,05, једнокраки тест омогућава свим алфа да тестирају статистичку значајност у једном правцу који вас занима." Пример једноструког теста би био „Фудбалски тимови са степеном агресије нижим од 65 омогућавају статистички значајно више голова него тимови са оценом нижим од 65.“

Дворедни тест

„Ако користите ниво значајности од 0,05, двоструки тест омогућава половини алфа да тестира статистичку значајност у једном правцу, а половину алфа за тестирање статистичког значаја у другом смеру. То значи да се у сваком репу дистрибуције ваше тестне статистике налази 0,025. "

Помоћу двостраног теста тестирате статистичку значај у оба смера. У нашем случају тестирамо статистичку значај у оба смера.

Корак 5

Подесите ниво значајности прага (алфа)

(алфа вредност): гранични праг код којег смо у реду са одбацивањем нулте хипотезе. Алфа вредност може бити било која вредност коју поставимо између 0 и 1. Међутим, најчешћа алфа вредност у науци је 0,05. Алфа постављена на 0,05 значи да смо у реду са одбацивањем нулте хипотезе иако постоји 5% или мање шансе да резултати настану због случајности.

П-вредност: Израчуната вероватноћа да се ови подаци насумично појаве.

Ако израчунамо п-вредност и она достигне 0,03, то можемо протумачити речима: "Постоји 3% шансе да резултати које видим заправо настају насумичношћу или чистом срећом".

Слика са Леарн.цо

Наш циљ је израчунати п-вредност и упоредити је са нашом алфа. Што је нижа алфа тежи је тест.

Корак 6

Извршите узорковање

Овде имамо наш скуп података који се зове фудбал. За наш тест, потребна су нам само два ступца у нашем скупу података: теам_деф_аггр_ратинг и таргет_алловед. Филтрираћемо га у та два ступца и затим ћемо створити два подскупа за тимове са одбрамбеном агресијом већом или једнаком 65 и тимовима са одбрамбеном агресијом испод 65.

Само да се прикажемо за тест хипотезе:

Утицај одбрамбене агресије на просечно дозвољене циљеве. Нулта хипотеза: Не постоји статистичка разлика у циљевима који су дозвољени код тимова са одбрамбеном агресијом већом или једнаком 65 у односу на тимове испод 65. Алтернативна хипотеза: Постоји статистичка разлика у циљевима дозвољена код тимова са већом оценом одбрамбене агресије. већи од или једнак 65 према тимовима испод 65. Двоструки тест Алпха: 0,05

Сада имамо две листе узорака на којима можемо да вршимо статистичке тестове. Пре тог корака направићу две дистрибуције да бих добио визуелни приказ.

Корак 7

Извршите Т-тест са два узорка

Т-тест са два узорка користи се за утврђивање да ли су два популацијска средства једнака. За то ћемо користити Питхон модул који се зове статсмоделс. Нећу улазити у превише детаља о статистичким моделима, али документацију можете видети овде.

Корак 8

Оцените и закључите

Подсјетимо да је алфа коју смо поставили била = 0,05. Као што видимо из резултата наших тестова, п-вредност је мања од наше алфа. Ми можемо одбацити нашу ништавну хипотезу и са 95% поузданости прихватити нашу алтернативну хипотезу.

Хвала вам за читање! За детаљније тестирање хипотеза, можете погледати овај групни пројекат на ГитХуб-у у коме сам учествовао на тестирању хипотеза.

Ресурси:

Пећнице, Маттхев. „Статистика и„ Научна метода “преузето са ИоурСтатсГуру. хттпс://ввв.иоурстатсгуру.цом/сецретс/сциметход-статс/?в=4442е4аф0916

Увод у САС. УЦЛА: Статистичка консултантска група. са хттпс://статс.идре.уцла.еду/отхер/мулт-пкг/фак/генерал/фак-вхат-аре-тхе-дифференцес-бетвеен-оне-таилед-анд-тво-таилед-тестс/ (приступљено маја 16, 2019).

Приручник за инжењерску статистику. хттпс://ввв.итл.нист.гов/див898/хандбоок/еда/сецтион3/еда353.хтм