AP Statistics Chi-Square Test Açıklamalı Anlatım (2026 İçin Adım Adım Rehber)
AP Statistics çalışırken bazı konular ilk bakışta göz korkutabilir. Chi-Square testi bu konulardan biri gibi görünebilir, ama aslında arkasında son derece basit bir fikir yatar: “Gördüklerimiz, beklediklerimizle ne kadar uyuşuyor?”
Bu yazıda Chi-Square testini formül ezberleyerek değil, mantığını anlayarak öğreneceksin. Kategorik veri (renk, tercih, evet/hayır gibi sınıflara ayrılan veri), gözlenen değer (tabloda gerçekten gördüğün sayılar), beklenen değer (model doğruysa bekleyeceğin sayılar) ve p-değeri (gözlenen farkın şansla açıklanma olasılığı) gibi temel kavramları sade dille açıklayacağız.
College Board’ın resmi AP Statistics kurs açıklamasında Chi-Square testleri, 2026 sınavı için de çekirdek başlıklar arasında yer almaya devam ediyor. Ayrıntıları AP Statistics – AP Students sayfasında görebilirsin.
Bu konuyu iyi kavradığında, AP sınavındaki free-response sorularında büyük avantaj sağlarsın. Özellikle tablo, kategori ve hipotez testleri içeren sorularda, rahat ve sistemli bir çözüm yolun olur.
Chi-Square Test Nedir ve AP Statistics İçin Neden Önemlidir?
Chi-Square testi, çok teknik görünen adıyla birlikte aslında basit bir soru sorar: “Gözlenen sayılar ile beklenen sayılar arasında fark var mı ve bu fark sıradan şans dalgalanmasından daha mı büyük?”
Kategorik verilerle çalışırken, her bir kategori için kaç gözlem olduğunu sayarız. Örneğin:
- Hangi dondurma tadı seçildi?
- Hangi içecek tercih edildi?
- Öğrenciler “katılıyorum / katılmıyorum” mı dedi?
Bu tür veriler sınıflara ayrılmıştır, bu yüzden “kategorik” adını alır. Chi-Square testleri, işte bu kategorik verilerle çalışırken kullanılır. Sayısal verilerde (boy, kilo, süre) ise genelde t-testi veya z-testi kullanılır.
AP Statistics müfredatında Chi-Square, College Board tarafından uzun süredir korunmuş çekirdek bir konu. Resmi kurs tanımında, üç ana Chi-Square testi açıkça listelenir: goodness-of-fit, homogeneity, independence. Bu üç testin temel fikri aynıdır, sadece senaryoları değişir. Bir kez mantığı kavradığında, aralarındaki farkı ayırt etmek çok daha kolay olur.
Gözlenen ve beklenen sayıları karşılaştırma fikri
Günlük hayattan küçük bir örnek düşün. Bir sınıfta 60 öğrenci var. Herkes en sevdiği dondurma tadını söylüyor: çikolata, vanilya, çilek. Saydın ve sonuç:
- Çikolata: 30
- Vanilya: 20
- Çilek: 10
Bunlar gözlenen değerlerdir, yani gerçekten gördüğün sayılar.
Şimdi varsayalım ki “her tadın eşit derecede sevildiği” bir model kabul ediyorsun. Bu durumda 60 öğrenciyi 3 tada eşit bölersen, her tadı 20 kişi seçmeliydi. Bunlar da beklenen değerlerdir.
Gerçekte 30, 20, 10 gördün; model ise 20, 20, 20 bekliyordu. Arada farklar var. Fakat bu farklar normal mi, yoksa model “eşit seviliyor” varsayımını reddetmek gerekir mi?
Chi-Square istatistiği, her kategori için:
- farkı hesaplar (Gözlenen − Beklenen),
- karesini alır,
- beklenen değere böler,
ve tüm kategoriler için toplar. Ortaya tek bir sayı çıkar. Bu sayı büyükse, “Gözlenen ile beklenen çok uzak, bu sadece şans gibi durmuyor” demeye başlarız.
Kategorik verilerle çalışma: Ne zaman Chi-Square, ne zaman değil?
Kategorik veriler:
- Cevaplar sınıflara ayrılmıştır.
- Örnekler: renk, marka, evet/hayır, sınıf seviyesi, tercih edilen platform.
Sayısal veriler:
- Cevaplar sayı çizgisinde yer alır.
- Örnekler: boy, kilo, yaş, süre, puan.
Chi-Square testi sadece kategorik veriler için uygundur. Eğer soru, “ortalama skor farklı mı?” diye soruyorsa, bu genelde sayısal veri ve t-testi gibi yöntemler gerektirir. Eğer soru bir tablo içinde kategori sayıları veriyorsa, “Acaba burada Chi-Square olabilir mi?” diye düşünmek yerinde olur.
AP sorusunda bir kontenjans tablosu (satırlar ve sütunlar halinde kategoriler) görürsen, çoğu zaman Chi-Square Homogeneity veya Independence testlerinden biri işin içindedir. Tek satırlı frekans tablosu varsa, akla goodness-of-fit gelir. Bir sonraki bölümde bu üç test türünü net biçimde ayıracağız.
AP Statistics’te Üç Temel Chi-Square Testi: Kısa ve Net Özet
AP Statistics’te üç ana Chi-Square testi vardır:
- Goodness-of-Fit
- Homogeneity
- Independence
Hepsi aynı genel formülü kullanır, fakat soru kökü ve veri yapısı farklıdır.
Aşağıdaki tablo, farkları hızlıca görmene yardım eder:
| Test türü | Örneklem yapısı | Değişken sayısı | Tipik tablo tipi |
|---|---|---|---|
| Goodness-of-Fit | Tek grup | 1 | Tek boyutlu frekans |
| Homogeneity | Birden çok grup | 1 | Satır = grup, sütun = kategori |
| Independence | Tek örneklem içinden iki değişken | 2 | Satır = değişken 1, sütun = değişken 2 |
Goodness-of-Fit testi: Tek grup, tek kategorik değişken
Goodness-of-Fit, tek bir örneklemin, verilen bir teorik dağılıma uyup uymadığını test eder. Amaç, “gerçek dağılım, modelde iddia edilen dağılımla uyumlu mu?” sorusunu yanıtlamaktır.
Tipik senaryolar:
- Bir zarın adil olup olmadığı.
- Şeker paketindeki renk oranlarının üretici iddiasıyla uyumu.
- Seçmenlerin parti tercihlerinin geçmiş seçim oranlarına uyup uymaması.
Bu tür sorularda tablo genelde kategori isimleri ve her kategori için gözlenen sayıları içerir. Beklenen sayılar ise ya verilen oranlara göre, ya da “hepsi eşit” varsayımına göre hesaplanır.
Hipotezler sezgisel olarak:
- H₀: Dağılım, verilen modelle uyumlu.
- Hᴬ: Dağılım, verilen modelle uyumlu değil.
AP sınavında goodness-of-fit soruları çoğunlukla tek satırlı frekans tablosu ve yanında teorik oranlar ile verilir.
Homogeneity testi: Farklı grupları karşılaştırma
Homogeneity testi, birden fazla grubun aynı dağılıma sahip olup olmadığını inceler. Burada odak, “gruplar birbirine benziyor mu?” sorusudur.
Örnek senaryolar:
- Farklı okullardaki öğrencilerin içecek tercihleri aynı mı?
- Üç farklı şehirdeki seçmenlerin parti tercih dağılımları benzer mi?
- Farklı yaş gruplarının alışveriş platformu tercihleri aynı mı?
Veriler genelde bir kontenjans tablosu içinde verilir:
- Satırlar: gruplar (Okul A, Okul B, Okul C vb.)
- Sütunlar: kategoriler (Kola, Meyve suyu, Su vb.)
Hipotezler sezgisel olarak:
- H₀: Tüm gruplar aynı dağılıma sahip.
- Hᴬ: En az bir grup farklı bir dağılıma sahip.
Independence testinden temel fark, veri toplama biçimidir. Homogeneity testinde genelde her grup için ayrı örneklem alınır. Independence testinde ise tek örneklem içinden, iki değişkene göre sınıflama yapılır.
Independence testi: İki kategorik değişken ilişkili mi?
Independence testi, tek bir popülasyonda iki kategorik değişkenin birbirinden bağımsız olup olmadığını inceler.
Örnekler:
- Aynı lisedeki öğrencilerde cinsiyet ile spor kulübüne katılım ilişkili mi?
- Bir markette, müşteri yaşı ile tercih edilen ürün tipi arasında ilişki var mı?
- Aynı anket içindeki “sigara kullanımı” ve “egzersiz sıklığı” değişkenleri bağımsız mı?
Yine kontenjans tablosu kullanılır. Ancak bu kez:
- Tek örneklem vardır.
- Her gözlem, iki değişkenin kesişimindeki bir hücreye düşer.
Hipotezler:
- H₀: Değişkenler bağımsız.
- Hᴬ: Değişkenler bağımsız değil (aralarında ilişki var).
Soru kökünde “tek örneklemden toplanan veriler, daha sonra X ve Y’ye göre sınıflandı” gibi ifadeler görürsen, çoğu zaman independence testinden söz edilir.
Chi-Square Testi Nasıl Yapılır? Adım Adım 2026 AP Statistics Yol Haritası
Chi-Square testlerinin hepsi, AP Statistics’te aynı iskeleti takip eder. Bu iskelet, free-response sorularındaki ünlü dört adımlı yapıyla uyumludur:
- State (İfade et)
- Plan (Planla)
- Do (Yap)
- Conclude (Sonuçlandır)
Matematiksel formül genel olarak:
χ² = Σ ( (Gözlenen − Beklenen)² / Beklenen )
Şimdi bu süreci, altı pratik adımda inceleyelim.
Adım 1: Varsayımlar ve koşullar kontrolü
Her Chi-Square testinde, önce bazı koşulları kontrol etmen gerekir:
- Rastgelelik: Veriler rastgele örneklemden veya uygun tasarlanmış bir deneyden gelmeli.
- Bağımsızlık: Gözlemler birbirinden bağımsız olmalı. Genelde “10× kuralı” kullanılır, popülasyon büyüklüğü örneklemden en az 10 kat büyük olmalı.
- Beklenen hücre sayıları: Tablodaki her beklenen hücre değeri en az 5 olmalı.
Beklenen hücre sayısının küçük olması, Chi-Square dağılımının iyi çalışmamasına yol açar. Yani testin ürettiği p-değeri gerçeği iyi yansıtmayabilir.
AP sınavında bu koşulları açıkça yazmak puan kazandırır. Özellikle free-response yanıtlarında, “Random, Independent, Large enough (E ≥ 5)” gibi unsurları cümle içinde belirtmek önemlidir.
Adım 2: Hipotezleri yazma (H₀ ve Hᴬ)
Sonra, test türüne göre H₀ ve Hᴬ yazılır. AP rubriği, hipotezlerin popülasyon düzeyinde ve sözel olarak net yazılmasını ister. Sembollere boğulmaya gerek yoktur.
Örnek ifadeler:
- Goodness-of-Fit:
- H₀: Öğrencilerin dondurma tadı tercih dağılımı, her tadın eşit seçildiği dağılımla aynıdır.
- Hᴬ: Dağılım, her tadın eşit seçildiği dağılımla aynı değildir.
- Homogeneity:
- H₀: Üç okulun içecek tercih dağılımları aynıdır.
- Hᴬ: En az bir okulun içecek tercih dağılımı farklıdır.
- Independence:
- H₀: Bu lisedeki öğrenciler için cinsiyet ile spor kulübüne katılım bağımsızdır.
- Hᴬ: Bu lisedeki öğrenciler için cinsiyet ile spor kulübüne katılım bağımsız değildir.
Kısa ama net cümleler her zaman daha iyi görünür.
Adım 3: Beklenen değerleri hesaplama ve tabloyu doldurma
Goodness-of-Fit için:
- Toplam gözlem sayısını al.
- Verilen oranlarla çarp, her kategori için beklenen sayıları elde et.
- Eğer “tümü eşit” diyorsa, toplamı kategori sayısına böl.
Homogeneity ve Independence için her hücredeki beklenen değer:
Beklenen = (Satır toplamı × Sütun toplamı) / Genel toplam
Bu formülün mantığı basittir. Eğer dağılımlar arasında fark yoksa, her hücreye hem satır payına, hem sütun payına göre “adil” bir pay düşer.
Küçük bir örnek:
- Genel toplam 100 öğrenci.
- Satır toplamı (Okul A) 40.
- Sütun toplamı (Kola) 25.
O zaman Okul A & Kola hücresinin beklenen değeri:
(40 × 25) / 100 = 10
Bu işlemi tüm hücreler için yapar, tabloyu beklenen sayılarla doldurursun.
Adım 4: Chi-Square istatistiğini ve serbestlik derecesini bulma
Chi-Square istatistiği için her hücrede şu hesabı yaparsın:
- Gözlenen − Beklenen
- Sonucu kare al.
- Beklenen değere böl.
Sonra tüm hücrelerin sonuçlarını toplarsın. Elde ettiğin toplam, χ² istatistiğidir. Bu değer ne kadar büyükse, gözlenen ile beklenen arasındaki farkın sıradışı olduğu düşünülür.
Serbestlik derecesi (degrees of freedom, df) ise:
- Goodness-of-Fit: df = (kategori sayısı − 1)
- Homogeneity ve Independence: df = (satır sayısı − 1) × (sütun sayısı − 1)
Serbestlik derecesi, Chi-Square dağılımının şeklini belirler. P-değeri hesabında mutlaka kullanılır.
Adım 5: P-değerini bulma ve sınavda hesap makinesi kullanımı
AP Statistics sınavında grafik hesap makinelerini kullanabilirsin. TI veya benzeri cihazlarda Chi-Square test fonksiyonları mevcuttur. Menü detaylarını ezberlemek yerine, genel mantığı bilmek daha yararlı olur:
- Gözlenen tabloyu gir.
- Beklenenleri makine hesaplat ya da gerektiğinde sen gir.
- χ² ve df değerlerini kullanarak makine p-değerini üretir.
P-değeri, “H₀ doğruysa, bu kadar veya daha uç bir χ² değeri görme olasılığı” olarak yorumlanır.
Sade bir yorum için:
- P-değeri küçükse (genelde p < 0,05), farkların sadece şansla açıklanması zordur. H₀ reddedilir.
- P-değeri büyükse, gördüğün farkların şansla açıklanması mümkündür. H₀ reddedilmez.
P-değerini yorumlarken, mutlaka soru bağlamına geri dönmen gerekir. Bu, College Board’ın 2024 AP Statistics scoring guidelines belgesi içinde rubrikte açıkça vurgulanır.
Adım 6: Sonucu bağlam içinde yorumlama
Son adımda, matematiksel sonucu sözel ve bağlamsal bir cümleye çevirirsin. İyi bir sonuç cümlesi üç parçadan oluşur:
- P-değerini veya kararını belirt.
- H₀’ı reddedip reddetmediğini açık söyle.
- Popülasyon hakkında net bir yorum yap.
Örnekler:
- “p-değeri 0,02 olduğu için, α = 0,05 düzeyinde H₀’ı reddediyoruz. Veriler, öğrencilerin dondurma tat tercih dağılımının tüm tatların eşit olduğu bir dağımla uyumlu olmadığını gösterir.”
- “p-değeri 0,28 olduğu için, H₀’ı reddetmek için yeterli kanıt yoktur. Veriler, üç okulun içecek tercih dağılımlarının aynı olduğu iddiasıyla çelişmez.”
Son cümlede “istatistiksel anlamlılık” ile “pratik önem”in farklı şeyler olabileceğini kısaca hatırlatmak da yerinde olur. Örneğin, çok büyük örneklemlerde küçük farklar bile istatistiksel olarak anlamlı çıkabilir, ama gerçek hayatta büyük bir değişikliğe yol açmayabilir.
AP Statistics 2026 İçin Chi-Square Stratejileri: Sınav Sorularını Güvenle Çöz
2026 AP Statistics sınavında Chi-Square konusunun yapısı, güncel kurs açıklamasına göre değişmeden devam ediyor. Yani bugün öğrendiğin yöntemler, sınavda doğrudan işine yarayacak.
Soru tipleri genel olarak üç grupta toplanır:
- Çoktan seçmeli kavramsal sorular.
- Free-response tablo ve hipotez soruları.
- Yalnızca yorum yapmanı isteyen, hesap gerektirmeyen sorular.
Genel sınav stratejilerine alışmak istersen, daha geniş çerçevede hazırlanmak için IB Matematik Sınavı İpuçları ve Stratejileri yazısındaki çalışma yaklaşımlarından da yararlanabilirsin.
Sık sorulan soru tipleri ve AP rubriğinde beklenenler
Chi-Square ile ilgili sık görülen soru tipleri:
- Hangi Chi-Square testinin gerekli olduğunu seçme
- Soru kökünde “tek örneklem” ve “iki kategorik değişken” ifadeleri varsa, independence aklına gelsin.
- “Farklı grupların dağılımları” varsa, homogeneity daha olasıdır.
- Tek boyutlu frekans ve teorik oranlar varsa, goodness-of-fit beklenir.
- Beklenen değerler tablosunu tamamlama
- Her hücre için (satır toplamı × sütun toplamı) / genel toplam kuralını uygula.
- Hesaplama adımlarında çok yuvarlama yapma, genelde iki ondalık yeterlidir.
- Koşulları açıklama
- Random, Independent, Large enough (E ≥ 5) gibi anahtar kelimeleri, tam cümleler içinde kullan.
- Sadece kısaltma yazmak yerine, “Veriler rastgele seçilen bir örneklemden gelmektedir” gibi ifadeler kullan.
- P-değerini yorumlama
- “Bu p-değeri, H₀ doğruyken bu kadar veya daha uç bir sonuç görme olasılığıdır” şeklinde düşün.
- “%98 ihtimalle H₀ doğrudur” gibi yanlış yorumlardan uzak dur.
- Bağlam içinde sonuç yazma
- Cümlede mutlaka popülasyon ismini geçir. “Bu anket yapılan öğrenciler” veya “bu şehirdeki seçmenler” gibi.
Rubrik odaklı bakıldığında, net hipotezler, tam koşullar, doğru serbestlik derecesi ve bağlamsal sonuç cümleleri, ham hesaplardan daha çok puan kazandırır. College Board’ın yayımladığı bir Chi-Square free-response örneği, iyi yazılmış yanıtların nasıl göründüğünü incelemek için faydalıdır.
Yaygın hatalar: Beklenen değerler, koşullar ve yanlış yorumlar
Öğrencilerin sıklıkla yaptığı hatalar:
- Gözlenen yerine beklenen tabloya yazmak
Daha iyi ifade: Gözlenen tabloyu aynen bırak, beklenenleri ayrı bir tabloya veya aynı tabloya parantez içinde yaz. - Beklenen değerleri aşırı yuvarlamak
Örnek hata: 10,47’yi 10’a yuvarlamak.
Daha iyi: 10,47’yi 10,5 gibi tut veya iki ondalıkla yaz. - Koşulları hiç anmamak
Örnek hata: Sadece χ² ve p-değeri hesaplayıp geçmek.
Daha iyi: Önce koşulları tek tek yaz, ondan sonra hesaba geç. - P-değerini yanlış yorumlamak
Örnek hata: “p = 0,02 olduğu için H₀ %98 ihtimalle doğrudur.”
Daha iyi: “p = 0,02, H₀ doğruyken bu kadar uç bir sonuç görme olasılığının 0,02 olduğunu gösterir.” - Sonuçta sadece örnek hakkında konuşmak
Örnek hata: “Bu 120 öğrenci arasında fark vardır.”
Daha iyi: “Bu lisedeki tüm öğrenciler için içecek tercih dağılımlarının farklı olduğuna dair kanıt vardır.”
Bu küçük düzeltmeler, hem puanını yükseltir hem de yazdığın cevabın akademik kalitesini artırır.
Çalışma planı: Chi-Square testini kalıcı şekilde öğrenmek
Chi-Square testini gerçekten içselleştirmek için kısa ama net bir plan izleyebilirsin:
- Üç test türünü tek bir tabloda özetle
- Sütunlara “kaç örneklem, kaç değişken, tipik senaryo” gibi başlıklar ekle.
- Bu tabloyu çalışma masanda görünür bir yere koy.
- Her test türü için 2–3 örnek soru çöz
- Biri daha basit, biri orta, biri sınav ayarında olsun.
- Hesap adımlarını yazarak yap, özellikle hipotez ve sonuç cümlelerine dikkat et.
- Karışık soru setleriyle, test türünü hızlı seçme pratiği yap
- Soru kökünü okur okumaz, beş saniye içinde “goodness-of-fit / homogeneity / independence” seçmeyi hedefle.
- Konuyu başkasına anlat
- Arkadaşına veya ailen birine, “Chi-Square testi ne işe yarar?”ı 2 dakikada açıklamaya çalış.
- Anlatabiliyorsan, gerçekten öğrenmişsin demektir.
- Kısa tekrar kartları hazırla (flashcard)
- Kartların ön yüzüne: H₀, Hᴬ, serbestlik derecesi, beklenen değer, kontenjans tablosu, p-değeri gibi kavramları yaz.
- Arka yüzüne kısa tanımlar ve 1 örnek ekle.
Chi-Square testini gerçekten öğrendiğin an, soru köküne bakar bakmaz hangi testin gerektiğini birkaç saniye içinde söyleyebildiğin andır.
Sonuç
Bu yazıda, Chi-Square testinin ne olduğunu, AP Statistics bağlamında neden önemli olduğunu ve üç temel test türünü gördün: goodness-of-fit, homogeneity ve independence. Ardından, koşullardan hipotezlere, beklenen değer hesabından p-değeri yorumuna kadar tüm süreci adım adım ele aldık. Son bölümde ise 2026 AP Statistics sınavı için pratik stratejiler, yaygın hatalar ve uygulanabilir bir çalışma planı paylaşıldı.
Artık kategorik veri içeren sorular sana daha tanıdık gelmeli. Düzenli tekrar yaparsan, özellikle 2–3 günde bir kısa soru setleri çözersen, Chi-Square testleri kalıcı hale gelir. Bu konu, AP Statistics toplam puanında ek puan kazandıran alanlardan biridir, bu yüzden ayırdığın her dakika sınav performansına olumlu yansır.
Yeni konulara geçmeden önce, en az bir tam Chi-Square free-response sorusunu baştan sona çözmeyi dene. Koşulları yaz, hipotezleri formüle et, beklenenleri hesapla, χ² ve p-değerini bul, sonra da bağlam içinde net bir sonuç cümlesi yaz. Bu tek egzersiz, sınav gününde sana beklediğinden daha büyük bir özgüven sağlayacaktır.
Etiket:AP, AP Course, ap course istanbul, ap exams, ap prep