Olasılık — Odds — Log-Odds(Logit) — OR(odds-ratio)

SelmaTosun
3 min readApr 1, 2021

--

Bu okuma özellikle regresyon ile ilgilenen veya psikometride modern kuramları anlamaya çalışanlar için çok temel düzeydeki kavramları tanıtmak için hazırlandı.

İlköğretimden beri aşina olduğumuz en temel kavramlar aslında olay ve olasılık kavramlarıdır. Günlük güneşlik bir havada yağmur yağma olayını kimse beklemez ama bir ihtimal gerçekleşebileceğini biliriz. Meteoroloji bilimi bunun gibi sayısız hava durumu olaylarının olasılıklarını doğru tahmin etmeye çalışır. Buna göre;

Yağmur yağma olayı “A” iken

Yağmur yağma olasılığını P(A) olarak gösterirsek

Yağmur yağmama olasılığı = 1-P(A) olacaktır.

Buraya kadar çoğumuz için tanıdık bir durumun altını çizdik. Şimdi gelelim Odds kavramına;

Yağmur yağma olasılığının yağmama olasılığına oranı ise Odds (A) olarak tanımlanır ve

Odds (A) = P(A) /1-P(A) ‘dır.

yani A olayının Odds değeri olayın olma olasılığı ile olmama olasılığının oranıdır.

Bundan sonra bir diğer kavram ise LOGİT, yani odds değerinin logaritması…

Bir A olayının logit değeri (Log-Odds ifadesi zamanla Logit olarak söylenmeye başlamıştır.) Odds değerinin doğal logaritmasına eşittir. Yani;

Logit (A) = ln(Odds (A) )= ln(P(A) /1-P(A)) olacaktır.

Peki bu dönüşümlere biz niye ihtiyaç duyarız; Birçok kullanım alanı var ancak psikometride biz istatistiksel değişkenlerin kesikli yapılarını sürekli hale getirmek veya sınırlı aralıklarını daha geniş şekilde ölçekleyebilmek için bu dönüşümleri yaparız.

  • Bilindiği gibi olasılık ifadeleri 0 ile 1 arasında değer alır ( 0<P(A)<1)
  • Odds değerleri ise 0 ile +∞ arasında olabilir ( 0<Odds (A)< +∞)
  • Logit değerleri ise -∞ ile +∞ arasında değişebilir ( -∞<Logit (A)< +∞)

Bahsetmemiz gereken bir diğer kavram ise Odds-ratio(OR) kavramı; bu da iki Odds değerinin birbirine oranını ifade eder.

Örnek ile açıklayacak olursak;

COVİD risk grubuna göre hasta sayıları

Yukardaki tabloda Covid-19 salgınında risk grubu olarak tanımlananların ve risk grubunda olmayan kişilerin 200 kişilik bir grupta hasta olma sayıları verilmiştir. Bu tabloyu kullanarak yukardaki kavramları örneklendirelim;

A olayı: bir kişinin hasta olma olayı olursa eğer;

P(A)= 50/200=%25=0.25 (risk durumuna bakılmaksızın hasta olma olasılığı)

Hasta olmama olasılığı==1-P(A)=1–0.25=0.75

Odss(A)= P(A)/1-P(A)=0.25/0.75=1/3

Lojit (A)=ln( P(A)/1-P(A))=ln(1/3)=-1.098

Öte yandan;

Covid-19 riski olanların hastalığa yakalanma olasılığı =4/6

*(Covid-19 riski olanların hastalığa yakalanmama olasılığı=2/6)

Covid-19 riski olanların hastalığa yakalanma odds’u =40/20=2

*(Covid-19 riski olanların hastalığa yakalanmama odds’u =1/2)

Covid-19 riski olanların hastalığa yakalanma Log-odds’u yani Lojit=ln2=0.693

*(Covid-19 riski olanların hastalığa yakalanmama Log-odds’u = -0.693)

Covid-19 riski olmayanların hastalığa yakalanma odds’u=10/130 =1/13

bu iki Odds’un oranı (yani Odds-Ratio)=2/1:13=26

Bu durum Covid riski taşıyanlar ile taşımayanların karşılaştırılabilmesi için kullanılır. Ve bu sonuca göre Covid riski taşıyanların hasta olma olasılığı risk taşımayanlara göre 26 kat daha fazladır.

Lojit değerlerinin yorumlanması esasında zordur, Ancak bir P(A) olasılığı 0.5 (P(A) =0.5) iken

Odds(P(A))=1'dir ve ln1=0 olduğundan

Logit (P(A))=0'dır

Buna göre Lojit fonksiyonu P=0.5 etrafında simetriktir. Yani olasılık 0.5'den küçük iken (odds 1'den küçük) Lojit negatif; olasılık 0.5'den büyük iken (odds 1'den büyük)Lojit pozitif değer alacaktır. Regresyonda Lojitin negatif yada pozitif olmasına bakarak olasılığın 0.5'den büyük mü küçük mü olduğuna karar verebiliriz. Bunun için aşağıdaki grafik yardımcı olacaktır:

Bilindiği üzere en eski istatistiksel işlemler olasılık hesapları ile başlamıştır. Günümüzde ileri olasılık temelli modellemeler sağlık eğitim ekonomi, kumar, iddia oyunları yada geleceğini tahmin etmek istediğimiz her durum için kullanılmakta…Burada açıklanan kavramlar bizim Regresyon temelli modellemeleri anlayabilmemize hizmet edecektir. Özellikle Psikometride Örtük Özellikler Kuramı (MTK) lojistik modellere dayanır ve geniş bir uygulama alanı vardır.

***Ayrıca logit değerlerinin regresyonda b-beta katsayısı olduğunu da bir yere not edelim.

--

--

SelmaTosun
SelmaTosun

No responses yet