Analitik Geometriden Regresyon Modeline

Her şeyi ölçmek gibi çılgın bir alışkanlığınız olduğunu düşünün. Bir tiyatro veya toplantıda insanlar kaç defa esner, kaç defa kıpırdarlar? Masabaşı çalışan birisinin ayık kalması için kafasına kaç dakikada bir su damlatılması lazım? Bir masada yemeğe ulaşmak için sofraya doğru ne kadar eğilmek gerekir? İdam mahkumlarını asmak için gerekli olan ipin kalınlığı ne kadar olmalıdır? Bir portre için ortalama kaç fırça darbesi vurmak gerekir? Uzun boylu ebeveynler uzun boylu, kısa boylu ebeveynler kısa boylu çocuklara mı sahip olur?

Uzun yıllar boyunca birçok çalışması büyük tartışmalara yol açan, insanların yaşamı boyunca parmak izlerinin değişmediğini belirten ilk antropolog. Charles Darwin’in kuzeni, Galton Kutusu’nun mucidi. İngiliz bilim insanı Sir Francis Galton, yukarıda yazdığım tüm çılgınlıkların sahibidir.

Sir Francis Galton Galton Kutusu

Değişken ve Veri Nedir? isimli yazımda, bağımlı ve bağımsız değişkenler hakkında bilgi vermiştim. Peki bu değişkenler regresyon için neden önemli?

Regresyon analizi, belirli varsayımlar altında bağımsız değişken veya değişkenlerin bağımlı değişkene nasıl bağlanacağı ile ilgili inceleme tekniğidir. Bu terimi ilk defa kullanan ise Sir Francis Galton’dur (Galton, 1886). Tabi ki daha öncesinde Adrien Marie Legendre ve Carl Friedrich Gauss gibi bilim insanları, daha sonra anlatacağım bir konu olan “En Küçük Kareler Prensibi” ile uyduların güneş etrafındaki yörüngelerini tespit etmek için çalışmalar yapmış ve Galton gibi bilim insanlarına yol gösterici olmuştur. O zaman bizler de adım adım bu işin içerisine girelim olur mu?

Ekonometri Nedir? başlıklı yazımda, matematiksel bir modeli Y= a + bX şeklinde tanımlamış ve daha sonra da ekonometrik bir model yapısına nasıl gittiğini kısaca anlatmıştım. Lise yıllarımıza dönmeye ne dersiniz? Dersimiz “Analitik Geometri”, konumuz “İki Noktası Bilinen Doğrunun Denklemi” olsun. Öncelikle işe boş bir koordinat sistemi ve bir doğru çizerek başlayalım.

İki noktası bilinen bir doğrunun denklemini bulabilmemiz için iki şart vardır. Bunlardan ilki “Doğrunun eğimi”, ikincisi ise “Doğru üzerinde iki noktanın oluşturduğu koordinatlar”. O zaman hemen devam edelim. 😊

Doğru üzerinde A noktasının koordinatları (X1 ,Y1), B noktasının ise (X2 , Y2) olsun.

Şimdi bu noktaları koordinat sistemine yerleştirelim ve noktalar arası mesafeyi matematiksel olarak yazalım.

Doğrunun denklemi için şartlardan birisini sağlamış olduk. Yani A ve B noktalarına teorik olarak bir koordinat yerleştirmiş olduk. Şimdi denklemi yazmak için ikinci şart olan eğimi bulalım. Yine lise yıllarımıza dönersek, bu sefer dersimiz “Geometri”, konumuz “Eğim”. Geometri dersinde eğim konusunu düşünürsek, bir dik üçgende Tan α değeri bize eğimi verecektir. Hatırladınız mı? Şimdi biraz daha eğlenceli olmaya başladı sanki. 😊 O zaman bir dik üçgen üzerinde inceleme yapalım. Yukarıda gösterdiğim doğru üzerindeki 2 noktanın oluşturduğu üçgenin büyük hali gibi düşünün bu üçgeni.

Yine lise yıllarına dönüp ufak bir hatırlatma yaparsak, Tan α değerinin “karşı/komşu” olduğunu hatırladık değil mi? Matematiksel bir formüle dökersek, A-C mesafe / C-B mesafe diyebiliriz.

O zaman ilk başta çizdiğimiz koordinat sisteminde eğimi nasıl bulacağız? Yine aynı mantık ile bir formül oluşturursak ve eğime “m” dersek;

Koordinat sistemi üzerinde Tan α açısının karşısı (Y2 – Y1), komşusu  (X2 – X1) olacağına göre

şeklinde formül yapısına çevirebiliriz. Aslında bu formül yapısında, X’i bir girdi değişkeni olarak düşünürsek, çıktı değişkeni olarak düşüneceğimiz Y değişkenini ne kadarlık bir birimde değiştireceğini söyleyen katsayıdır.

O zaman bu cümleye dikkat!!!

“Matematiksel olarak eğim, X koordinatındaki değişim durumunda, Y koordinatında ne kadarlık bir değişimin söz konusu olduğunu tespit etmeye yarayan bir yapıdır.”

Doğrunun denklemi için iki şartı da gerçekleştirdiğimize göre, doğrunun denklemini yazabiliriz artık değil mi?

Y2 – Y1 = m (X2 – X1) ise, denklemimiz;

Y = mX şeklinde olacaktır.

Şimdi Y= a + bX matematiksel modeli hatırlayalım. Y = mX ile arasında biraz benzerlik var gibi değil mi? O zaman “m” dediğimiz eğime “b” diyelim ki biraz daha benzesin. 😊

Y = bX

Peki eksik olan nedir?  “a” sabiti !!! “a” sabitini neden bulamadık? Aslında doğrunun denklemi içerisinde a sabitini bulduk ama doğrumuz koordinat sisteminde orijinden (sıfır noktası) geçtiği varsayımı altında sıfır değerini aldı ve denklem içerisinde yokmuş gibi karşımıza çıktı. Doğru yapısı her zaman sıfır noktasından geçemeyeceği için biz denklem içerisine bir “a” sabit parametresi ekleyeceğiz. Peki bunu neden yaptık? Ekonometrik bir modelde doğruyu orijinden geçirirsek, bağımsız değişkenler sıfır olduğu varsayımı altında bağımlı değişkenimiz de sıfır olacaktır. Peki bu neden mantıksız olur? Bir fabrika açtığınızı düşünün. Maliyetlerinizi bir kağıda yazdığınızda, bazı maliyet kalemlerinin sabit, bazılarının ise değişken olduğunu göreceksiniz. Örneğin, fabrika için ödeyeceğiniz kira bedeli sizin sabit maliyetiniz olurken, ödeyeceğiniz elektrik faturası çalışacak makinaların çalışma saatlerine bağlı kalacaktır. Y= bX bu modele göre yukardaki örneği uygularsak, hiç üretim yapmazsanız X dediğimiz elektrik maliyeti sıfır olacak ve eğim katsayısı “b” ne olursa olsun Y dediğimiz toplam maliyet sıfır çıkacaktır. Peki ödeyeceğimiz kira bedeli ne olacak? İşte bu basit örnekte sabit maliyetlerimizi de ekleyebilmek için “a” sabiti ekledik. Birçok ekonometrik modelde bu “a” sabitine ihtiyacımız olacaktır.

Sabit maliyetlere (Turuncu) dikkat ederseniz, üretim miktarı arttıkça (sağa doğru gittikçe) maliyetlerde bir değişiklik olmuyor. Ama değişken maliyetlere bakarsak (Siyah kesikli), üretim miktarı arttıkça maliyetler yukarı yönlü hareket etmektedir. İşte çizdiğimiz doğrunun orijinden geçmemesinin nedeni bu sabit maliyetlerdir. Umarım bu noktaya kadar kafamızda soru işareti kalmamıştır.

Şimdi matematiksel modeli bulduk. 😊

Y = a + bX  

“Bu cümleye dikkat” dediğim bir yer vardı. O zaman bu model için şöyle bir yorum yapabilir miyiz?

X bağımsız değişkeni sıfır olduğu varsayımı ile Y bağımlı değişkeni a sabitine eşittir. Yine aynı şekilde, X bağımsız değişken değerinin 1 birimlik artışı, Y bağımlı değişken değerini b (eğim katsayısı) kadar arttırır!!!

O zaman yine Ekonometri Nedir? isimli yazımda belirttiğim basit bir ekonometrik modeli tekrar yazalım.

Y= α + βX + ε   

İşte bu modelin ismi Basit Doğrusal Regresyon Modeli dir. Peki bu model ismini biraz daha tanıyalım. “Basit” kelimesi model içerisindeki bağımsız değişken sayısına göre verilir. Bizim bu modelimizde X bağımsız değişkeni bir tane olduğu için “Basit” kavramı ile söylenir. Peki gerçek hayatta bir olayı etkileyen tek bir tane mi olay var? Tabi ki hayır. O zaman bu “Basit” kavramını geliştirirsek ortaya Çoklu Doğrusal Regresyon Modeli çıkacaktır. Bu modelin özelliği ise birden fazla bağımsız değişkeni içerisinde barındırmasından kaynaklıdır.

Y= α + β1X1 + β2X2 + β3X3 +  …………….. + βkXk + ε

şeklinde tanımladığımız model k adet bağımsız değişkeni içerisinde barındırdığı için çoklu doğrusal regresyon modelidir.

Peki basit ve çoklu kavramını anladıysak, “Doğrusal” dediğimiz yapı nedir? Bunu bir örnek üzerinden göstermek istiyorum. Boş bir excel sayfası açıp aşağıdaki gibi 2 adet değişken ve verilerini giriniz.

Daha sonra Ekle-Grafikler-Dağılım grafiğini seçiniz ve karşınıza çıkan boş grafiğe sağ tıklayarak “veri seç” kısmına tıklayınız.

Karşınıza çıkan ekrandan sol tarafta bulunan “Gösterge Girdiler” kısmındaki ekle yazısına tıklayınız.

Daha sonra ise X değişkenlerinin ve Y değişkenlerinin bulunduğu alanları “Seri X değerleri” ve “Seri Y değerleri” kısımlarına başlık olmadan tanımlayınız ve tamam kısmına basınız.

Bu işlemleri sorunsuz bir şekilde yaptıysanız, karşınıza aşağıdaki gibi bir grafik çıkacaktır.

Bu grafik içerisindeki her nokta bizim X bağımsız değişkeni değerlerine karşılık Y bağımlı değişken değerlerini göstermektedir. Peki doğrusallık dediğimiz yapı bunun neresinde? Hemen devam edelim!

Grafiğin sağ üst tarafındaki artı işaretine bastıktan sonra, “Eğilim Çizgisi” kısmına girip “Diğer Seçenekler” diyelim.

Ekranımızın sağ tarafında aşağıdaki gibi bir ekran açılacaktır. Bu ekranda bazı eğilim çizgilerinin seçeneklerini göreceksiniz.

İlk olarak “Doğrusal” kısmını işaretlediğimizde, grafiğimiz aşağıdaki gibi olacaktır.

Gördüğünüz gibi verilerimizin üzerinden geçen doğrusal bir çizgi çizdik. Peki diğer seçenekleri de deneyelim mi? Mesela “üstel” seçelim. Grafik aşağıdaki gibi olacaktır.

Veya “logaritmik” seçelim.

Aslında benim ulaşmak istediğim yer, verilerimden oluşan “mavi noktalar” kısmına en yakın çizgi yapısını bulmak. Her “mavi nokta” ve doğru arası benim hata terimi dediğim ε değeridir. Doğrunun kendisi ise hata terimsiz modelin kendisidir.

Peki daha önce bu çizgilerin eğimini değiştiren bir parametre söylemiştik. Hangisiydi?

Y= α + βX + ε   

β parametresi değil mi? Şimdi o zaman şunu söylemek mümkün mü? Bir regresyon modelinin doğrusal olup olmaması eğim parametresine bağlıdır. O zaman “doğrusal” dediğimiz yapı, eğim parametresinin karakteridir. X veya Y değişkenlerinin değil!!!

Kaynak: İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi Ekonometri Ders Notu

Aşağıda bazı doğrusal ve doğrusal olmayan model örnekleri mevcuttur.

Bizim ilk konumuz “Basit Doğrusal Regresyon Modeli” olacaktır. İlerleyen kısımlarda ise “Doğrusal Olmayan Regresyon Modelleri” de işlenecektir. Bir sonraki ders “Basit Doğrusal Regresyon Modeli” için “En Küçük Kareler Metodu” olacaktır.

Bir sonraki derste görüşmek dileği ile…  

4 thoughts on “Analitik Geometriden Regresyon Modeline

  • 30 Kasım 2020 tarihinde, saat 12:14
    Permalink

    Eğimin bulunuşu ezber ile öğretilmişti. Sayenizde mantığını kavradım. Güzel bir yazı, emeğinize sağlık.

    Yanıtla
  • 30 Kasım 2020 tarihinde, saat 14:14
    Permalink

    Teorinin görsel öğelerle desteklendiği, uygulama ve kendin yap desteği ile zenginleştirilmiş, çok güzel bir yazı olmuş. Elinize sağlık.

    Yanıtla
  • 1 Aralık 2020 tarihinde, saat 13:56
    Permalink

    Yani nefret ettiğim ekonometriyi yavaş yavaş sevmeye başlıyorum galiba.Anlatım harika ,ustamızın ellerine sağlık 🙂 inşallah kısa zamanda devamı gelirde bizde bu güzel dersi öğreniriz.Sağlıcakla kalın. <3

    Yanıtla
  • 5 Aralık 2020 tarihinde, saat 01:53
    Permalink

    Çok açıklayıcı bir paylaşım olmuş. Anlatım sade ve akılda kalıcı. Umarım devamı gelir. Teşekkürler.

    Yanıtla

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir