Değişken ve Veri Nedir?

Y= α +βX + ε   

Y = Bağımlı değişken

α = Sabit parametre

β = Eğim parametresi

X = Bağımsız değişken

ε = Hata terimi

Bir önceki derste basit bir ekonometrik modelin nasıl bir yapıda olduğunu sizlere yazmıştım. Bugün ise bu yapının bazı temel bileşenleri hakkında bilgi vermek istiyorum. Dikkat ederseniz model içerisinde bir bağımlı, bir bağımsız değişken, iki parametre ve bir de hata terimi olduğunu söylemiştim. Tabi ki ilerleyen süreçlerde hem değişken hem de parametre sayıları artacak, hatta günümüzde popüler olan “yapay zeka” dediğimiz yapının, binlerce hatta milyonlarca farklı parametre ve farklı model ile çalıştığını öğreneceksiniz. Örneğin, günümüzün bilinen en popüler yapay zekası olan GTP-3 yapay zekası, yapımcısı olan OpenAl şirketinin açıklamasına göre 175 milyar parametreden oluşuyor. “Hocam siz de ne ara yapay zekaya geçtiniz?” demeyin. 😊 Aslında hepsinin temel ana mantığı, minimum hata ile gerçeğe en yakın modeli bulmak ve bu modeli uygulamak. Sadece parametre sayısı ve kurulacak model sayısı değişiyor. Ve tabi ki teknolojinin yarattığı hızı kullanarak bunları yapıyor. Neyse biz dönelim asıl konumuza. Değişkenler nedir?

Elinize bir kalem bir de kağıt alıp veri toplamaya başladığınızda, her elde ettiğiniz verinin diğerlerinden farklı özellik göstermesine değişken diyoruz. O kağıda evinizdeki günlük hava sıcaklığını yazarsanız, bir sıcaklık değişkeni elde edersiniz. Ama dikkat edin bir adet değişkeniniz var, değişen sadece farklı günlerdeki farklı sıcaklıklar. Sıcaklıkla birlikte serinlemek için açtığınız klimanın günlük kaç saat çalıştığını da o kağıda eklerseniz iki değişkeniniz olur. Hadi o kağıda bir tane daha değişken ekleyelim o zaman. Günlük kaç litre su tükettiğinizi de eklersek oldu size üç değişken. 😊  Bu yapıyı, elinizdeki teknolojik imkanların çok ileri olduğu varsayımı altında kaç değişken eklersiniz, siz düşünün?

O zaman değişkenleri biraz daha tanıyalım.

Elinize aldığınız o kağıda oluşturduğunuz değişkenler farklı yapılarda olabilir. Mesela bir yaş değişkeni oluşturdunuz ve o değişken için tutacağınız değerler 12-15-20 gibi sayısal değerler olur. Veya günlük kaç kalori yaktığınızı bir kağıda yazdınız. Yine yazacağınız değerler sayısal değer olur. İşte bu tarz sayısal değerlerin oluşturduğu değişkenlere “Nicel Değişken” denir. Peki her zaman sayısal değerlerin oluşturduğu değişkenler mi yaratacaksınız? Kişilerin cinsiyeti, medeni durumu, eğitim durumu, doğum yeri gibi bilgilerin üzerinde nasıl matematiksel işlem yapacaksınız? İşte bu tarz sayısal olmayan değerlerin oluşturduğu değişkenlere ise “Nitel Değişken” denir.

Peki, sadece değişkenlerin sınıflandırılması bu kadar mı? Daha yolun başındayız, devam edelim. 😊

Elinizdeki değişkenin nitel veya nicel olmasına bakmaksızın, farklı bir özelliğini daha görebilirsiniz. Elde ettiğiniz değerler sadece bir sınır içerisinde kalabilir. Ya da o sınır değerlerini delip geçebilir. Mesela nitel bir değişken olan işçiyi ele alalım. Ya sendikalı ya sendikasız değerini alır. Yine bir sınır içerisinde yer alan nicel bir değişken ele alalım. Ülkemizdeki plaka kodları sayısal değerlerden oluşuyor olsa bile 01-81 şeklinde bir sınırı vardır. İşte bu tarz değişkenlere “Kesikli Değişken” veya “Süreksiz Değişken” adı verilir. Bunun tam tersi olan değişkenler yok mu? Yani hiçbir sınır tanımayan. 😊 Mesela boylarımızın uzunluğu veya bir elektronik alete verilen garanti süresi. İlk örnekte verdiğimiz oda sıcaklığı gibi tamsayı veya ondalıklı değer alan değişkenlere “Sürekli Değişken” adı verilir. Başta kesikli ve sürekli değişkenler için “nitel veya nicel olmasına bakılmaksınız” şeklinde kurduğum cümleyi şimdi tekrar düşünürsek, nicel değişkenler hem kesikli hem sürekli olurken, nitel değişkenler sadece kesikli olur değil mi? 😊

O zaman gelelim başka bir değişken sınıfına.  Bazı değişkenler bazı değişkenleri etkiler ya da aynı mantıkta tam tersini düşünürsek, bazı değişkenler bazı değişkenlerden etkilenir. Çok mu karmaşık bir cümle oldu? Hadi biraz daha basit şekilde düşünelim. Sigara içerseniz, kanser olma riskiniz artar. Cümleyi tersine çevirelim hadi. Kanser olursanız sigara içme riskiniz artar. Oldu mu? Bence ilk cümle çok daha mantıklı değil mi? Yani kanser değişkeni, sigara içme değişkenine bağımlı. Başka bir örnek verelim. Araç sürerken ne kadar hız yaparsanız, kaza yapma olasılığınız o derece artar. Yani hız, kaza yapma durumuna etki ediyor, kaza durumu ise hız yapma durumundan etkileniyor değil mi? İşte bu durumda bizler, etkilenen değişkene “Bağımlı Değişken”, etkileyen değişkene ise “Bağımsız Değişken” ismini veriyoruz. Farklı kaynaklarda farklı isimler ile de geçebilir.

Yukarıdaki tabloyu ise farklı kaynaklardan görebileceğiniz farklı isimleri göstermek için yaptım. Hepsinin sizlere söylemek istediği, bağımlı-bağımsız değişken kavramıdır. Eğer değişken yapıları basit bir şekilde anlaşıldıysa artık “Veri Yapılarına” geçebiliriz.

Peki, veri nedir?

Teknik olarak tanımlamak gerekirse veriler birer bilgi parçacığıdır. Yazının başında elimize kalem kağıt alıp bazı bilgiler yazmıştık. Daha sonra bunları birer değişken altında toplamıştık. İşte o değişkenlerin içerisindeki her bir gözlem veya değer birer veridir. Veriler sadece ekonometri için değil bilimin tamamında çok önemli bir yere sahiptir.

İktisadi olarak veriler, ekonomik olayları ve aralarındaki ilişkileri sayısal olarak ifade edebilen bilgi kaynaklarıdır. Ama biz konumuz olan ekonometrik modellerde veri türlerine geri dönelim. Ekonometride veri türleri 3 ana başlıkta toplanır. Bunlar “Zaman Serisi Verisi”, “Yatay Kesit Verisi” ve “Panel Veri” şeklindedir. Bu veri türlerinin birbirinden farklı şekilde ayrılmasının ana nedeni ise her veri türünün analizi için farklı istatistiki süreçlere ihtiyaç duymalarıdır.

1- Zaman Serisi Verisi

Bir veya birden fazla değişkenin, belirli bir zaman dilimi içerisinde zamana bağlı olarak aldığı değerlere zaman serisi verisi diyoruz. Etrafımıza baktığımızda milyonlarca zaman serisi verisi görmek mümkünüdür. Basit örnekler vermek gerekirse, bir hisse senedinin saatlik-günlük-haftalık-aylık-yıllık gibi periyotlardaki kapanış fiyatları, borsa endeksinin belirli bir zaman aralığında getiri değerleri, makroekonomik verilerin çeyreklik bazda değerleri, yine belirli zaman periyotlarında ölçülen hava sıcaklıkları, belirli zaman aralığında kalbimizin aktivitesi (EKG cihazı ile veri toplanır), doğum oranları, hasta sayısı gibi veriler çevremizde en çok karşılaştığımız örneklerdir.

2- Yatay Kesit Verisi

Yatay kesit verileri zaman serisinden farklı olarak, belirli bir zaman aralığı yerine zamanın bir noktasındaki değerlerdir. Örneğin, endeks içerisindeki hisselerin 27.11.2020 tarihindeki kapanış fiyatı gibi. Ya da daha basit bir örnek vermek gerekirse, gelişmekte olan ülkelerin 2020 büyüme oranı gibi. Dikkat edilirse, yatay kesit verisinin zaman serisinden farkı bir zaman aralığı yerine zamanın bir noktası üzerinde durmasıdır.

3- Panel Veri (Karma Veri)

Yine çok önemli bir veri türü olan Panel veriler ise hem zaman serisi verilerini hem de yatay kesit verilerini içerisinde barındıran özel bir veri türüdür. Kafanız sakın karışmasın! Hemen basit bir şekilde örnekler verelim. Kendinize 1 adet ülke seçin ve bu ülkenin 2010-2020 büyüme oranlarını bir kağıda yazın. İşte bu bir Zaman Serisi Verisidir. Şimdi ülke sayısını 3 adet yapın ve bu ülkelerin sadece 2020 büyüme oranlarını bir kağıda yazın. İşte bu bir Yatay Kesit Verisidir. Eğer bu 3 adet ülkenin, 2010-2020 büyüme oranlarını yazarsanız, işte bu bir Panel Veri olur.

Kaynak: İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi Ekonometri Ders Notu

Bu 3 veri türünü kısaca toparlarsak;

Zaman serileri tek bir birimin çoklu zaman dönemlerini içerir.

Yatay Kesit serileri birden fazla birimin tek bir zaman noktasını içerir.

Panel serileri ise birden fazla birim ve her birim için birden fazla zaman noktası içerir.

Bir sonraki derste görüşmek dileği ile…  

5 thoughts on “Değişken ve Veri Nedir?

  • 28 Kasım 2020 tarihinde, saat 01:23
    Permalink

    Cok guzel anlatmışsın reis 👍kalemine sağlık.

    Yanıtla
  • 28 Kasım 2020 tarihinde, saat 13:14
    Permalink

    Anlatım için teşekkürler en kısa zamanda devamını bekliyoruz 🙂

    Yanıtla
  • 29 Kasım 2020 tarihinde, saat 08:39
    Permalink

    Ders tadında. Sonraki Yazı tüketim mi
    Emeğinize sağlık

    Yanıtla
  • Geri bildirim: Analitik Geometriden Regresyon Modeline – 3σ Eğitim

  • 7 Aralık 2020 tarihinde, saat 11:19
    Permalink

    Eğitim çalışmalarında anlaşılır bir dil önemlidir ve Türkçe ifade edilebilecek unsurları kullanmanızı çok yerinde buldum. “Nicel ve Nitel” kelimeleri için İngilizce “Quantitative and Qualitative” kelimelerinin “Kantitatif ve Kalitatif” benzeri o kadar kötü kullanımları var ki, anlam veremiyorum.

    Elinize sağlık.

    Yanıtla

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir