Örneklem Dağılımının Belirlenmesi

Bir önceki yazım olan “Hipotez Testi Nedir?” isimli yazımı okumadan lütfen bu yazıma geçmeyiniz!

Bir önceki yazımızın sonunda örneklem dağılımının belirlenmesi şeklinde bir madde yazmıştık. Peki nedir bu örneklem dağılımı?  Örneklemin ne olduğunu öğrenmiştik ama dağılım kelimesi hakkında bilgi vermemiştik. O zaman soruyu baştan bir daha soruyum. Nedir bu dağılım?

Basit bir örnek ile başlayalım o zaman. Elinize bir kalem ve kağıt aldınız, 100 kişilik bir sınıfa girdiniz ve herkesin boylarını tek tek ölçüp, kağıdınıza not aldınız.  Kağıdınızın üzerindeki değerler aşağıdaki gibidir;

136144148141145149142146151
137144148141145149142146151
138144148141145149142146151
138144148141145149143146151
139144148141145150143146152
139145148141146150143147152
140145148142146150143147153
140145149142146150143147153
140145149142146150143147154
140145149142146150143147155
143147144147144147144147144
148        

Boyları not aldıktan sonra, bu boyları kişi sayısına göre ayırdınız. Buna ise “frekans” denir.

BoyFrekans
1361
1371
1382
1392
1404
1416
1427
1438
1449
14510
14610
1479
1488
1497
1506
1514
1522
1532
1541
1551

Şimdi bu veriler ile bir grafik oluşturdunuz;

Peki bu grafik sizlere tanıdık geldi mi? Hani şu çan şekline benzeyen? Aslında bu grafik bizlere bir sınıftaki kişilerin boylarının dağılımını gösteren bir şekilden ibarettir. Bu en bilinen olduğu için bu örneği vermek istedim. Bu dağılımın adı “Normal Dağılımdır”!

Peki bu ne anlama gelmektedir? İstatistik bilimine katkı sağlayan Gauss gibi bazı kişiler, doğadaki verilerin belirli bir şekilde dağıldığını tespit etmiş. Bazı verilerin kendisine özgü hareketleri olduğu ve bu hareketlerinde bir kuralı olduğunu bulduklarında, dağılımların bu dağılıma konu olan veriler ile bu verileri oluşturan olguların gerçekleşme olasılıkları hakkında fikir sahibi olabileceğimizi göstermişlerdir. Bunlarla ilgili bazı örnekler vermek gerekirse;

Hastanede doğan bebeklerin doğum aralıkları, kişilerin boyları, üretim bandından geçen tek tip ürünlerin ağırlıkları gibi bazı yapılar “Normal Dağılım” gösterir.

Hilesiz bir zar atıldığında ortaya çıkacak olasılıklar “Uniform Dağılım” gösterir.

Madeni paranın havaya atılması sonucu yazı veya tura gelmesi “Bernoulli Dağılım” gösterir.

Bir bölgede 3 ay içerisinde meydana gelen 4.0 şiddetindeki depremlerin sayısı veya bir telefon santraline 1 saat içerisinde gelen çağrı sayısı “Poisson Dağılım” gösterir.

Bu dağılımlar kendi başlarına özel olarak varsayımları ile birlikte incelenmelidir. Bu konu ise istatistik dersinin konusudur. Yine tekrar ediyorum, burada anlatılanları ilk defa duyuyorsanız, lütfen istatistik dersi alınız.

Aşağıda genel anlamda kullanılan dağılımlar ve dağılımların histogram üzerindeki gösterimleri verilmiştir.

1-Eğer popülasyon ortalaması hakkında hipotez testi yapıyorsak, popülasyon varyansını bildiğimiz varsayımında veya popülasyon varyansını bilmesek bile n ≥ 30 varsayımı altında normal dağılım yani Z testinden yararlanacağız. Popülasyon varyansını bilmediğimiz durumda ise n < 30 varsayımı altında ise t testi uygulayacağız.

2-Eğer popülasyon varyansı hakkında hipotez testi yapıyorsak Х2 (Ki-Kare) testinden yararlanacağız.

3-Eğer popülasyon varyansının oranı için hipotez testi yapıyorsak F testinden yararlanacağız.

Bunlardan bazılarını kısa bir tabloda göstermek istersek;

Tek örneklem ve tek anakütle parametresi için hipotez sınamaları

İki-örneklem ve iki anakütle parametresi farkı için hipotez sınamaları

Şimdi bunlarla ilgili bir örnek verip biraz daha anlaşılmasını sağlayalım;

Örnek

Bilye üreten bir işletmede bilyelerin ağırlıklarının ortalaması 5 gr, standart sapması 0,1 gr olan bir normal dağılıma uymaktadır. İşletmede belli bir değişiklik yapılmış ve bu değişikliğin bilye ağırlıklarını arttırdığı düşünülmektedir. Bu amaçla üretimden 16 rassal örnek alınmış ve bu örneğin ortalaması 5,038 gr bulunmuştur. Bu verilere dayanılarak 0.05 önem seviyesinde populasyon ortalamasının 5 gr dan artıp artmadığını test ediniz?

İlk önce soruda verilen parametreleri yazalım;

Ortalama (µ)= 5 gr

Standart Sapma (σ)=0,1 gr

Örnek sayısı (n)= 16

Örnek ortalaması (x bar) = 5,038 gr

Önem Seviyesi (α)= 0,05

Parametreleri yazdıysak şimdi ortaya atılan iddiadan hipotezleri oluşturalım. H0 hipotezi her zaman yokluk hipotezi olduğu için;

H0 = µ0=5

H1 = µ0>5

Verilerin hepsini hazırladıysak, şimdi test istatistiğimizi seçelim. Öncelikle oluşturulan hipotez tek kuyruk testi olduğu için önem seviyesini olduğu gibi alacağız. Eğer çift kuyruklu bir hipotez olsaydı α/2 değerini kullanacaktık. Elimizde varyans değeri bilindiği içinse Z Testini uygulayacağız.

Zhesap = (5,038-5) / (0,1/4) =1,52 test istatistiği sonucuna ulaştık. Şimdi ise bu değeri Z tablo değeri dediğimiz değer ile karşılaştıracağız. Eğer Z tablo değerini nasıl okuyacağınızı bilmiyorsanız, yine istatistik kitaplarını karşılaştırabilirsiniz.

Z0,05 = 1,64 ise;

Zhesap < Z0,05 sonucuna ulaştığımız için H0 reddedilemez şeklinde yorumluyoruz. Yani %95 güven aralığında popülasyon ortalamasının 5 gr dan arttığı sonucunu kabul edemeyiz.

Hatırlatmak istediğim bu konu, tamamen istatistik temeli aldığınız varsayımı ile yazılmıştır. Burada anlatılanlar hakkında hiçbir fikriniz yoksa, istatistik temel eğitimini almanız gerekmektedir. Eğer buradaki mantığın temeline sahipseniz, ekonometri eğitiminde çok fazla zorlanmayacaksınızdır.

Bir sonraki derste görüşmek dileği ile…  

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir