Bağımsız ve Bağımlı Değişken Arasında Bir İlişki Kurmaya Yarayan Tahmin Şekli: Regresyon
regresyon, sosyal bilimlerde çok yaygın olarak kullanılan bir istatistik analizidir
kısaca x'i kullanarak y'yi tahmin etmek olarak özetlenebilir. geçelim gelin canlar, geyikle istatistik öğrenelim.
mesela bi matematik öğretmeni sene başında derse başlamadan genel matematik düzeyini ölçen bir test yapıyor. matematik öğretmeninin adı selma. selma bu score'ları kullanarak, öğrencinin sene sonu notunu tahmin edicek (ki bu sene sonu da y, yani son ürün) bir denklem yazıyor. selma bunlarla aklını mı yemiş, neden insan gibi dersini anlatıp geçmiyor, o ayrı bi konu.
selma'nın bulduğu regresyonun en genel denklemi y'=bo + b1.x1
- y sene sonu notu,
- x sene başındaki genel mat testi notu,
- b0 intercept,
- b1 de bu ilk notu çarparak sene sonunu notunu bulmamızı sağlayan kat sayı, nami diğer coefficient ya da slope'tur.
selma bu denklemi farklı şeyleri gözlemlemek için de kullanabiliyor. mesela kız öğrenciler ve erkek öğrencilerin sene başı aldıkları nottan sene sonunda aldıkları notu tahmin etmek için kullanılan denklemleri birbirinden "anlamlı biçimde" farklı mı.
selma bunu niye yapıyor?
çünkü selma tahmine gönül vermiş, tahminin acı, manyağı bi bünye. burda motivasyonu “kızlar ilk notlarına göre erkeklere on basmış höh-hoöyyt” ya da “bana bakın sıdıkliler, erkeklerin ardından gene nal toplamışsınız, ilk nottan son nota zirnik gelişme yok andonlar” demek olabilir, o başka bir “selmanın motivasyonuyla tahmin manyaklığı ne kadar pozitif ya da negatıve korale” istatistik analiz başlığı.
gelelim anlamlı fark bir nedire. bu anlamlı biçimde farklılık terimine güzel britanyamızda significant difference deniyor, ki bu da sosyal bilimlerde kullanılan her türlü istatistik analizinin (bkz: analysis of varience, multivariate analysis of varience, t test, bivariate correlation, regression, chi square) can damarı, göz bebeği.
bu iki şey birbirinden "anlamlı olarak" farklı mı değil mi, tüm mesele bunun üzerine kurulu. o minik küçük fark anlamlıysa yerine göre yayın manyağı oluyor, yerine göre doçentliğinizi alamayıp okuldan $utlanıyorsunuz, öylesine mukaddes, ah sen yok musun ah sen, canımın içiciği denilesi yumurcak bi kavram. yerine göre ıt partikülü, kodgümün anlamlı çıkmayan farkı diye de adlandırıldığı görülebiliyor. fakat selma'nın böyle dertleri yok, devletten maaş her ay tıkır tıkır yatıyor.
selma "kız öğrencilerle erkek öğrenciler farklı mı?" motivasyonuyla şöyle bi denklem yazıyor
y'=bo+b1.x1+b2.x2
- burda b1 kız öğrencilerin denkleminin katsayısına,
- b2 de erkek öğrencilerin denkleminin katsayısına tekabül etmekte,
- ee haliyle x1 kız öğrenci ön test puanı,
- x2 de erkek öğrenci ön test puanına eşit.
neden yapıyor bunu selma?
çünkü mesela bi öğrencinin sene başından sene sonu notunu hesaplayacaksa, ve bu katsayı her öğrenci için 1.15 derse selma, bi süre sonra anlamlılık testinde görebiliyor ki, on test sonuçlarından son not significant difference deniyor, ki bu da sosyal bilimlerde kullanılan her türlü istatistik analizinin (bkz: analysis of varience, multivariate analysis of varience, t test, bivariate correlation, regression, chi square) can damarı, göz bebeği.
bu iki şey birbirinden "anlamlı olarak" farklı mı değil mi, tüm mesele bunun üzerine kurulu. o minik küçük fark anlamlıysa yerine göre yayın manyağı oluyor, yerine göre doçentliğinizi alamayıp okuldan $utlanıyorsunuz, öylesine mukaddes, ah sen yok musun ah sen, canımın içiciği denilesi yumurcak bi kavram. yerine göre ıt partikülü, kodgümün anlamlı çıkmayan farkı diye de adlandırıldığı görülebiliyor. fakat selma'nın böyle dertleri yok, devletten maaş her ay tıkır tıkır yatıyor.
selma "kız öğrencilerle erkek öğrenciler farklı mı?" motivasyonuyla şöyle bi denklem yazıyor
y'=bo+b1.x1+b2.x2
- burda b1 kız öğrencilerin denkleminin katsayısına,
- b2 de erkek öğrencilerin denkleminin katsayısına tekabül etmekte,
- ee haliyle x1 kız öğrenci ön test puanı,
- x2 de erkek öğrenci ön test puanına eşit.
neden yapıyor bunu selma?
çünkü mesela bi öğrencinin sene başından sene sonu notunu hesaplayacaksa, ve bu katsayı her öğrenci için 1.15 derse selma, bi süre sonra anlamlılık testinde görebiliyor ki, on test sonuçlarından son not tahmini anlamlı çıkmıyor. nami diğer bildiğiniz fos. siz deyin triska, ben diyeyim selma bi nevi bunca zaman bokuyla oynamış çok afedersiniz.
hah, bu noktada selma diyor ki "ulan bu işte bi puştluk var, sakin bu kızlarla erkeklerin son notunu tahmin edeceğim denklemini eksik yazmış olmayayım, yoksa bu iki grubun farklı katsayıları mı var?"
bu gazla oturuyor, denklemi y'=b0+b1.x1 ‘den y'=b0+b1.x1+b2.x2'ye dönüştürüyor.
deli filan ama, kafa zehir selma'da naaber? burda selma diyor ki “ne naaberi allahın salağı, hikayeyi yazan sensin”. biraz heyheyli biri.
hah, selma bu noktada istatistik guruları tarafından different slopes for different folks denilen kavramı keşfediyor aslında
elimizdeki örneklem içinde yazdığımız regresyon denklemini piç edip bize saçımızı başımızı yoldurucak bi puştluğa, bi kanayan yaraya parmak basıyor. meğer kızların sayısı 1.17, erkeklerinkiyse 1.12 imiş.
yani on testten 60 alan ortalama bi hanım kızımızın sene sonunda 70.2 ile geçeçeği tahmin edilirken, ortalama bi erkek öğrencimizin 67.2 ile geçeceğine tekabül ediyor. oysa kızlarla erkekleri iki ayrı grup olarak ayırmasa da, y'=bo+b1.x1’de takılı kalsa bu denklemin b’si 1.15 öldüğü üzre, on test notu 60 olan herhangi bi öğrenci için son notu 69 olarak hesaplayacaktı. artık rakamdan mı kıllanıp yola çıktı, o yine allah'la selma arasında.
selmanın yeteri kadar azılı bi manyak olduğu durumlarda, bu regresyon denklemi “don rengi de ilk nottan son not tahmini etkiler, b3.x3, mor ve ötesi dinleyip dinlememek de bence etkiler" diyerek b4,x4 şeklinde bk.xk’ya kadar uzanabilen çok bilinmeyenli bi denklem olmaya koşabiliyor.
doktora yapmanın nörotiklik üzerindeki etkisinde anneni de bilinmeyen olarak kullanmak istiyorum dediğinden beri, bi süredir konuşmuyoruz yalnız. geçen gün aradı, evladım neden sözlükle aklını kaçırdın, oturup tezini yazsana, nickinle bu kadar uyumlu olmak zorunda mısın diyicem ama o kelimeyi de götünden atmışsın be evladım dediğinden beri aramız daha iyi gibi. canım selma.
edit: dummy coded konusuna değinmeden kız erkek karşılaştırma tamamiyle selmanın fikridir. a lifetime of type ıı errors'a uyarı için teşekkürler.