Faktör Analizi Nedir? (AFA-DFA)

SelmaTosun
8 min readApr 22, 2021

--

Faktör Analizi başta sosyal bilimler olmak üzere, pek çok alanda ilişkili değişkenleri bir araya getirerek, az sayıda yeni ilişkisiz değişken bulmayı amaçlayan çok değişkenli bir analiz türüdür (Tatlıdil, 1992). Ölçme araçlarında ortak özelliğe sahip maddeleri bir araya getiren özellik/yapıya faktör deriz. Faktör doğrudan gözlenemeyen örtük bir değişkendir. İlk faktör belirleme çalışmaları Spearman’ın 1904 yılında zeka ölçümleri için yaptığı çalışmalara dayanır. Sosyal bilimler özü itibari ile genellikle örtük özellikler ile ilgilendiği için faktör analizleri geniş bir uygulama alanına sahiptir. Genellikle boyut indirgemeye ve veri özetlemeye yönelik yapılan faktör analizleri için varsayımları amaca göre değişebilecek 7 yöntem kullanılır Açımlayıcı Faktör Analizindeki (Exploratory Factor Analysis) bu yöntemler şemadaki gibidir.

Açımlayıcı Faktör Analizinde Yöntemler

Bu yöntemlerin hangi örneklem büyüklüklerinde ne düzeyde varyansı açıkladığı ile ilgili Karaman, Atar & Çobanoğlu Aktan’ın(2017) çalışması incelenebilir.

Faktör çıkartma tekniklerinin farkları temelde kullandığı ölçüt ile ilişkilidir. En sık kullanılan yöntemlerden “Temel bileşenler analizinin (TBA) amacı her bir bileşen için maksimum varyansı çıkarmaktır. Öte yandan temel eksenler analizinin (TEA) amacı ise faktörlerin birbirine dik olduğu yeni bir korelasyon matrisi üretmek ve gizil yapıyı ortaya çıkarmaktır (Tabachnick ve Fidell)”

Faktör analizi yaparken genel olarak kullandığımız yönteme bakmaksızın aşağıdaki adımları takip ederiz;

  1. Korelasyon matrisinin hesaplanması: Faktör analizinde, regresyon analizinin tersine, değişkenler arasında yüksek korelasyon ilişkisi aranır.
  2. Bartlett Testi (Bartlett Test of Sphericity): Korelasyon matrisinin, bütün köşegen (diyagonal) terimleri 1, köşegen dışındaki terimleri 0 olan birim matris olup olmadığını test etmek maksadıyla kullanılır. Söz konusu test, verilerin çoklu normal dağılımından gelmiş olmasını gerektirir
  3. Kaiser–Meyer-Olkin (KMO ) testi: Bu test, örneklem yeterliliğini ölçer ve örneklem büyüklüğüyle ilgilenir. Bunun için, gözlenen korelasyon katsayılarının büyüklüğü ile kısmi korelasyon katsayılarının büyüklüğünü karılaştırır. KMO, testinde bulunan değer 0,50'nin altında ise örneklem yetersizdir, kabul edilemez
  4. Faktör Sayısının Belirlenmesi: bunun için aşağıdaki yöntemler kullanılır. a) Özdeğere (Eigenvalues) Göre Belirleme: Çoğunlukla özdeğeri 1 veya 1'den büyük faktörler dikkate alınır. b) Serpilme Diyagramı (Scree test) ile Belirleme: Diyagram esasında özdeğerleri görselleştirir ve makale raporlarında da sıkça bu grafiğe yer verilir. Ani-keskin bir düşüşün olduğu noktanın üstündeki özdeğerlere sahip faktörler dikkate alınır.(tek bir noktadan sonra keskin düşüş tek faktöre işaret eder.)
  5. Faktör Döndürme- Rotasyonlu Faktör Matrisi: Faktör analizinde faktörlerin anlaşılır ve kolay açıklanabilir olması için değişkenlerin mümkün olduğunca tek faktöre yüklenmesi beklenir aksi durumda bunu sağlayabilecek yöntemlere yani Faktör Döndürmeye başvurulur. Dik (Varimax, Quartimax, Equamax) ve Eğik(Promax, Direct Oblimin)Faktör Döndürme yöntemleri SPSS’de mevcuttur. En sık kullanılan faktör döndürme tekniği Varimax’dır. Varimax birbiri ile ilişkisiz faktörler bulunmasını sağlar.
  6. Faktörlere İsim Verilmesi: Analizler çıkarılan faktörler için bir isim önermez, bu aşamadan sonra değişkenlerin özellikleri ve teorik yapı ile uyumlu isimlendirmeler yapılmalıdır.
  7. Raporlanması: Özellikle boyut indirgeme amacıyla yapılan faktör analizinde seçilen yöntem ve nedeni açıkça yazılmalı, yukardaki adımlar için yapılanlara yer verilmelidir. Son aşamada çıkartılan faktör modeline göre faktörlere ait özdeğerler, gözlenen değişkenlere ait faktör yükleri ve varsa artıklar- açıklanamayan varyanslar raporda yer almalıdır. Çıkan faktörler kuram ile desteklenmelidir.

Faktör analizinin uygulamasında ve raporlanmasında bazı kavram karmaşaları da mevcuttur; öncellikle temel düzeyde yaygın olarak kullanılan SPSS Statistics programında 7 farklı faktör çıkarma yöntemi bulunmakta, Ancak Doğrulayıcı Faktör Analizi (DFA) yapılmamaktadır. Burada bir diğer husus ise Açımlayıcı Faktör Analizi(AFA) ile Temel Bileşenler analizinin karıştırılması ve farklarına dikkat edilmemesidir.

Temel Bileşenle Analizi

Alanda Temel Bileşenler Analizini Faktör Analizleri içinde değerlendirmeyen pek çok görüş vardır. TBA’da bileşenler tarafıdan varyansın tamamı açıklanır dolayısı ile TBA denkleminde artık varyans yoktur. TBA değişkenlerin mükemmel güvenirlikle ölçüldüğünü varsayar. Dolayısı ile TBA’da gizli faktör yoktur, birtakım gözlenen değişkenlerin lineer kombinasyonu temel bileşenleri oluşturur. Bileşenler, birbirleriyle diklerdir ve Korelasyon/kovaryans matrisinden üretilirler.

Bir bileşen bütün ölçülen değişkenlerin doğrusal bir bileşimidir. AFA’da her bir ölçülen değişken faktörlerin ve hatanın doğrusal bir bileşimidir. Bu iki model arasındaki temel fark, ikisinin amaçlarının da farklı olmasıdır.“Eğer araştırmacının amacı gözlenen değişkenler arasındaki ilişkileri açıklayan gizil değişkenleri anlamaksa ortak faktör modeli; eğer amaç ölçülen değişken üzerindeki varyansı açıklamaksa temel bileşenler analizi kullanılması önerilmektedir” (Convary ve Hutcoff, 2003; Fabrigar vd., 1999; Velicer ve Jackson, 1990b).

TBA yöntemi ortak faktör analizinde yer alan “ortak varyans”, “hata varyansı” ve “özgün varyans” birbirinden ayrı ayrı olarak değil birlikte hesaplanır. Temel bileşenler analizinde ortaya çıkan bileşenler arasında yüksek derecede ilişki olması beklenmez, yani bu bileşenler birbirinden bağımsızdır. Açımlayıcı Faktör Analizlerinde ortak faktör modeli (common factor model) temeldir: Gözlenen her bir değişken faktör puanlarının ve bir hata puanının bir fonksiyonudur.

AFA modeli

AFA; gözlenen x’leri faktörlerin bir fonksiyonu olarak ifade ederken, TBA; bileşenleri x’lerin bir fonksiyonu olarak ifade eder. Dolayısı ile 6 gözlenen değişkenden oluşan 6 bileşenin(C ile gösterilir) matematiksel gösterimi aşağıdaki gibidir;

TBA denklemi

Yeni geliştirilen ölçme araçlarında araştırmacılar kuramsal yapının göstergelerinden değişkenler hakkında yeteri kadar fikir sahibi değilse veya değişkenler arası ilişki hakkında güçlü varsayımlar yok ise öncelikli olarak AFA yöntemleri tercih edilmelidir.

TBA ise bir grup ölçülen değişkenin fonksiyonu olan bileşik puanlar (composite scores) elde etmek istenirse kullanışlıdır.

Ancak yapılan çalışmalarda değişkenlerin sayısı fazlaysa ve değişkenlerin güvenirlikleri yüksekse Temel Bileşenler Analizi ve Açımlayıcı Faktör Analizi veri yapısı ve faktörlerin/bileşenlerin yorumlanması bakımından benzer sonuçları ürettiği görülmektedir. Snook ve Gorsuch (1989)’a göre bu yöntemler arasındaki farkı belirleyen iki temel durum: ortak varyansın ve değişkenlerin sayısıdır. Ortak varyans değerlerinin 1 olduğu durumlar için elde edilen sonuçlar büyük oranda birbirine benzerdir.

Dichotomous ölçekler: Çoğu psikometrik yapıların ölçekleri en az eşit aralık düzeyindedir. Dolayısı ile yukarda bahsettiğimiz faktör belirleme yöntemleri en az bu düzeydeki ölçeklerde kullanılır. Ancak burada yaygın olan bir diğer ölçek türü de çoktan seçmeli başarı testleridir. Ki bu testler dichomotous-ikili sonuç üretir. Dolayısı ile bu yapıdaki -yapay süreksiz ölçeklerde faktör yapısı incelenirken çoğunlukla Tetrakonik faktör analizi yapılır. Tetrakonik faktör analizi yapay iki süreksiz veri arasındaki korelasyon ilişkisini tetrakonik korelasyona dayanarak inceler ve buna dayalı faktör çıkarır. Ayrıca bakınız: Tekrakonik Faktör Analizi

Doğrulayıcı Faktör Analizi -DFA

Doğrulayıcı Faktör Analizi (Confirmatory Factor Analysis) esasında ileri düzey analiz tekniklerindedir ve Yapısal eşitlik Modelleri içinde incelenmesi daha doğrudur. Öncelikle söylenmesi gereken DFA için SPSS programı kullanılamaz, Mplus programı ve R-Studio paketleri bunun için daha uygundur.

İkinci söylememiz gereken konu ise DFA modelinin iyi anlaşılabilmesi için yine YEM grubu içinde olan Yol Analizlerinin iyi bilinmesi gerekir, zira DFA tanımlarında yol analizi içinde yer alan terimler kullanılır. Yine raporlamalarda yol şemalarına yer verilir.

DFA’ne başvurmadan önce araştırmacılar ölçülen değişkenlerin yapısı hakkında genel bir yargıya sahiptir. Tanımlı yapıyı ölçtüğü ve en iyi göstergeleri olduğu varsayılan ölçülen değişkenin altında kaç faktör olduğu ve hangi değişkenler ile faktörler arasında ilişki kurulacağı bilinir. Dolayısı ile bu bilinen varsayımın uygun bir model ile testini içerir Doğrulayıcı Faktör Analizleri.

DFA genel olarak;

  • Test araçlarının psikometrik özelliklerinin incelenmesinde (bunun neticesinde de puanlamanın nasıl yapılacağına karar verirken)
  • Test araçlarının yapı geçerliğini belirlemede 
  • Ölçme değişmezliğini değerlendirmede (iki ölçme sürecinde aynı yapının korunduğunun test edilmesinde)
  • Çoklu gruplara genellemede MIMIC (Multiple indicators multiple causes) kullanılır.

DFA yapılar ve göstergeler arasındaki ilişkileri tanımladığı için ölçme modelleri (measurement models) olarak da adlandırılır. DFA’da araştırmacıların kafasında bir grup gözlenen değişkenin (örneğin, ölçülen değişkenler) nasıl ilişkili olduğuna dair kurama dayalı bir önsel vardır. Faktörlerin göstergeleri hakkında yeterince bilgi yok ise DFA yapılmamalı daha uygun bir analiz olarak Açımlayıcı Faktör Analizi (AFA)düşünülmelidir.

DFA modelinin amacı bir grup ölçülen değişken arasındaki varsayılan ilişkilerin veri tarafından desteklenip desteklenmediğini değerlendirmektir.  Model mantığı, kullanılan kestirim yöntemleri ve model veri uyumunun değerlendirilmesi yol analizi modellerindekilerle aynıdır. Dolayısı ile bir DFA kabaca;

  • model kurulması
  • kestirim yönteminin belirlenmesi
  • model veri uyumunun değerlendirilmesi aşamalarından oluşur.

en yaygın kullanılan modeller Standart DFA Modelleri’dir (tek faktörlü ve iki faktörlü DFA).

Standart DFA Modelleri — Tek Faktörlü DFA Modeli

Aşağıdaki gibi şema edilen tek faktörlü ve 3 gözlenen değişkene sahip modelde; X göstergelerinin altında yatan tek gizil-örtük faktör(değişken) F’dir. (** DFA literatüründe bir gizil faktörü temsil etmek üzere F yerine ξ (ksi)de kullanılır.)

Tek faktörlü DFA en temel düzeyde 3 gözlenen değişkenin tek faktörü açıkladığını varsayan modeldir. Her bir gözlenen puan; gizil faktörün neden olduğu puan ve gizil faktörün neden olmadığı hata puanının birleşimidir. Şemada hata terimleri δ ile gösterilmiştir.

Tek faktör DFA Modeli

Modelde görüleceği gibi göstergeler arasındaki kovaryansı üretecek gizil faktörden başka kaynaklar yoktur. Faktör ve göstergeyi bağlayan yola faktör yükü (factor loading) adı verilir ve λ ile gösterilir. DFA kestirimlerinde genellikle göstergelerden birinin gizil faktördeki yükü 1 değerine sabitlenir.

Modelde F gizil değişken olduğu için sabit bir ölçeği yoktur dolayısı faktör yüklerinin ölçekleri de belirlenemez. Bu sorunun çözümü için iki yola başvurulur;

Faktör yüklerinin ölçeği sabitlenir ve gizil değişkenin ölçeği serbestçe kestirilir. 

Gizil değişkenin ölçeği sabitlenir ve faktör yüklerinin ölçekleri serbestçe kestirilir. (Örnekte birinci yaklaşım kullanılmış ve birinci faktör yükü 1,0’e sabitlenmiştir.)

Standart DFA Modelleri — İki Faktörlü DFA Modeli

Aşağıda şematize edilen 4 gözlenen değişkenin 2 örtük yapıyı-faktörü temsil ettiği modele 2 Faktörlü DFA modeli denir. Bu modelde faktörlerin birbiri ile ilişkisi vardır.(F1 ile F2 arasında korelasyon vardır.) DFA modellerinde kestirilecek parametre sayısının belirlenmesi de önemli bir işlemdir.

2 Faktörlü DFA’da parametre hesaplanması

Yukarıdaki tek ve iki faktörlü DFA modelleri standart DFA modelleri olarak adlandırılır. Standart DFA modelleri aşağıdaki özelliklere sahiptir: 

  • Göstergeler sürekli değişken yapısında ve tek bir faktöre aittir. Bu faktör ile ölçme hatasının bir fonksiyonudur. 
  • Ölçme hataları birbirlerinden ve faktörlerden bağımsızdır. (hatalar arasında korelasyon yoktur)
  • Birden fazla Gizil Faktör var ise aralarında korelasyon vardır.

Dolayısı ile bir DFA modeli kurarken bunlara dikkat edilmelidir. Standart DFA dışında Çapraz yüklü DFA modelleri de mevcuttur. Bu modellerde gözlenen değişkenler-göstergeler birden fazla faktöre yüklenmiş olabilir.

DFA Modelerinin bir yol analizi olduğu düşünülürse bazı sınırlılıkları olduğu unutulmamalıdır.

Yol Analizindeki Sınırlılıklar:

  • Her bir yapıyı temsil etmek üzere sadece tek bir gözlenen ölçüm (gösterge) kullanılır. 
  • Bir yol analizi modeli çoklu göstergeleri ele almaz. 
  • Gözlenen değişkenlerin (dışsal değişkenler için geçerli) hatasız ölçüldüğünü varsayar (örneğin, gözlenen değişkenlere ait ölçümlerin mükemmel derecede güvenilir olduğunu varsayar) ki çoğu durumda bu gerçekçi bir yaklaşım değildir. Bu sayıltının ihlalinde, parametre kestirimleri yanlı olacaktır. 

***Hem yapılar arasındaki ilişkileri hem de yapılara ilişkin göstergelerin ölçüm hatalarını ele alan model Tam Yapısal Model (Full Structural Model) olarak adlandırılır.

DFA Modellerinde Tanımlama Sorunları 

DFA modelinde gözlemlerin sayısı önemlidir. Gözlenen değişkenden yola çıkarak yol analizi modelindeki gibi hesaplan gözlem sayısı(v =gözlenen değişken sayısı): v(v+1)/2 olarak hesaplanır.

  • Modelin tanımlanabilmesi için gözlemlerin sayısı model parametrelerinin sayısına eşit veya daha büyük (sd ≥ 0) olmalıdır. 

Gizil değişkenlerin (faktörler ve ölçme hataları) ölçekleri bilinmediği için her gizil değişkene bir ölçek verilmelidir. DFA’da gizil değişken faktörleri ve ölçme hatalarını içerir.

  • Genellikle ölçme hataları yol katsayıları 1'e eşitlenerek ölçeklenir(ULI yöntemi).
  • Ancak gizil faktörler için iki yöntem de(UVI veya ULI) kullanılabilir; ya faktörün varyansı 1'e sabitlenir ya da bir göstergenin yol katsayısı 1'e eşitlenir.

(ULI -unit loading identification, gözlenen değişken ile gizil değişkeni bağlayan yol 1,0‘e sabitlenir)

(UVI-unit variance identification gizil değişkenin varyansı 1,0’e sabitlenir)

Toparlayacak olursak Doğrulayıcı Faktör Analizi için öncelikle doğrulayacağımız yani kuram ile gizil faktörü yeteri kadar temsil ettiğini düşündüğümüz göstergeler ve bunların açıkladığı gizil faktör sayısı hakkında varsayımımız olmalıdır. Göstergelerin hatasız ölçüldüğünü bilmemiz en azından düşünmemiz gerekli. Modeldeki gözlem sayısı tahmin edilen parametre sayısına eşit ya da daha fazla olmalı. Ayrıca gizil değişkenler için de bir ölçekleme yöntemi belirlemeliyiz(ULI veya UVI).Tek Faktörlü bir model için de en az 3 gözlenen değişkenimiz de var ise bundan sonraki iş kullanacağımız programı seçip( zira bu iş bence elle imkansız) uygun bir sözdizimi(syntax) yazarak modeli test etmek olacaktır. Sonra ortaya çıkan parametrelerin ve modelin uyumunu istatistiklere bakarak yorumlayacağız.

Model Uyum İndeksleri inşallah başka bir yazının konusu olacak…

Aynı Örnekleme Açımlayıcı ve Doğrulayıcı Faktör Analizi Uygulanabilir Mi? sorusu uygulamada çok karşıma geldi bence bu çalışmayı incelemelisiniz.

Önemli: Prof. Dr. Hakan Yavuz Atar’ın ders notlarından çokça faydalanılmıştır.

--

--