Güvenirlik ve Geçerlik Kavramlarını ayırt eden video için lütfen buraya tıklayınız…

Ölçme aracının ölçülmek istenen özelliğe karşı olan duyarlılık ve tesadüfi hatalardan arınıklık derecesidir. 0 ile +1 arasında değer alır. Ölçme sonuçlarındaki hata miktarı ne kadar az olursa ölçme sonuçları gerçeğe o kadar yakın olur ve aracın güvenirliği o kadar yüksek olur. Güvenirliği sadece tesadüfi hata etkiler. Öğretmen yapımı testlerin güvenirliğinin 0,70’ten yüksek olması istenir. Ancak farklı güvenirlik katsayıları olan testlerden güvenirliği 1’e yakın olan kullanılmalıdır. Güvenirlik; duyarlılık, tutarlılık ve objektiflik kavramlarıyla yakından ilgilidir.

Güvenirlik indeksi teorik bir kavramdır. Öğrencilerin aldıkları puanlarla gerçek puanları arasındaki korelasyonun karesi olarak tanımlanır.

Duyarlılık, ölçme aracındaki birimlerin büyüklüğü yani aracın hassasiyeti ile ilgilidir. Bir ölçme aracının birimi küçüldükçe duyarlılığı artar çünkü ölçme aracı daha fazla ayrıntıyı ölçebilecek duruma gelir. Örneğin milimetre, metreden daha duyarlıdır. 50 soruluk bir çoktan seçmeli test 10 soruluk bir yazılı yoklamaya göre daha duyarlıdır.

Tutarlılık, benzer koşullar altında aynı ölçme aracının birden fazla uygulanması sonucunda birbirine benzer sonuçlar vermesidir. Aynı nesneyi birden fazla defa ölçtüğümüzde benzer sonuçlar elde ediyorsak ölçme işlemi tutarlı, dolayısıyla güvenilirdir. Ancak bu farklı ölçmeler arasında ya hiç zaman olmamalıdır ya da kısa bir zaman aralığı olmalıdır.

Kararlılık, ölçme konusu olan özellik aynı ölçme aracıyla daha uzun zaman aralıklarında birkaç defa ölçüldüğünde aynı ya da yakın değerleri vermelidir.

Objektiflik, bir ölçme işlemi kim tarafından yapılırsa yapılsın aynı sonuca ulaşması demektir. Puanların ölçmeciden ölçmeciye değişmemesidir. Örneğin, aynı sınav cevaplarına farklı öğretmenler benzer puanları veriyorsa, bu ölçme objektiftir.

Geçerlik, güvenirliği de kapsayan bir özelliktir. Bu nedenle geçerli olan her aracın güvenilir olduğu söylenebilir. Ancak bir ölçme aracının güvenilir olması o aracın geçerli olduğu anlamına gelmez. Çünkü geçerliği etkileyen başka özellikler de vardır. Kısacası güvenirlik, geçerlik için ön koşuldur. Bu nedenle bir ölçme aracının güvenirliği, geçerliğini sınırlandırır. Geçerlik katsayısı, hiçbir zaman güvenirlik katsayısının karekök değerinden fazla olamaz. Formülü yaz.

Bir ölçme aracı için en önemli özellik geçerliktir. Daha sonra güvenirlik ve en sonunda da kullanışlılık gelir.

Güvenirlik Hesaplama Yöntemleri:

– Test – Tekrar Test Yöntemi: Bir test, belli bir zaman aralığıyla aynı öğrenci grubuna iki kez uygulanır. Daha sonra öğrencilerin her iki uygulamadan aldıkları puanlar arasındaki korelasyon (ilişki) katsayısı hesaplanır ve bu korelasyon katsayısı güvenirlik katsayısı olarak kabul edilir. Kararlılık güvenirliği hesaplanmaktadır. Korelasyon katsayısının yüksek olması her bir uygulamadan elde edilen ölçümlerin tutarlı ve uygulanan testin güvenilir olduğu anlamına gelir. Güvenirlik belirlerken elde edilen korelasyon katsayısının yüksek olduğunu söyleyebilmemiz için genel olarak 0,70’ten yüksek olması gerektiği kabul edilmektedir. Birinci uygulamadan sonra öğrencilerin soruları hatırlamaları, sorularla ilgili yeni öğrenmeler gerçekleştirmeleri gibi nedenlerle öğrencilerin iki uygulamadan aynı puanları almaları güç olabilir. Ayrıca, bir testin aynı öğrenciye iki kez uygulaması genel olarak zordur.

Paralel (Eşdeğer) Formlar Yöntemi: Bu yöntemde, birbirine paralel yani aynı davranışları ölçen, fakat farklı sorulardan oluşan iki test hazırlanır. Testlerdeki soru sayıları, testlerin kapsamı, soruların güçlük düzeyi, soru tipleri, ortalamaları, varyansları vb. aynı olmalıdır. Bu iki test öğrencilere uygulanır ve iki testten elde edilen puanlar arasındaki korelasyon katsayısı hesaplanır. Hesaplanan korelasyon katsayısı da güvenirlik katsayısı olarak kabul edilir. Bu katsayıya “eşdeğerlik katsayısı” denir. Tutarlılık güvenirliği hesaplanmaktadır. Korelasyon katsayısının yüksek olması, uygulanan iki testin birbirleriyle tutarlı, dolayısıyla da güvenilir olduğu anlamına gelir. Aynı özelliği ölçen bu iki farklı test birbirinden farklı zamanda uygulandığında daha etkili olur.

İki Yarı (Eşdeğer Yarılar) Yöntemi: İki yarı yönteminde öncelikle bir test geliştirilir. Bu test bir grup öğrenciye uygulanır ve uygulama sonuçları yani test maddeleri iki yarıya ayrılır. Öğrencilerin testin iki yarısından aldıkları puanlar arasında korelasyon hesabı yapılır. Bu katsayı, testin iç tutarlılık katsayısı olarak kullanılır. Çünkü bu yöntem bir testin kendi içinde tutarlılığına dayalıdır. Hesaplanan korelasyon katsayısının yüksek olması, iki yarıdan elde edilen puanların tutarlı olduğu ve testin güvenilir olduğu anlamına gelir. En kullanışlı güvenirlik hesaplama yöntemidir çünkü hem zahmetsizdir hem rahatlıkla uygulanabilir.

            İki yarıdan elde edilen korelasyon katsayısı iki yarıdan bir tanesinin güvenirliğini verir. Çünkü bu korelasyon katsayısı iç tutarlılık katsayısıdır ve güvenirlik katsayısına eşit değildir. Testin bütünü için güvenirlik katsayısının hesaplanması durumunda da şu formül kullanılır:

            rx : Testin bütününün güvenirliği

            r12 : İki yarı puanları arasındaki korelasyon (yarılardan birinin güvenirliği)     

            rx = (2.r12) / (1 + r12)

  • İç Tutarlılık Güvenirliği Yöntemi (Maddelerin Birbirlerine Uyumuna Bakılarak Yapılan Güvenirlik Kestirme Yöntemi): Bir testin, bir kez uygulanması ve testte yer alan maddelerin analiz edilmesine dayanır.
    • KR-20 ve KR-21: İç tutarlılık güvenirliğini hesaplamak için KR-20 ve KR-21 formülleri kullanılmaktadır. Testteki soruların birbiriyle uyumunu, tutarlılığını gösterir. Yalnızca doğru cevabı tek ve kesin olan testlerde uygulanabilir, cevaplayıcının yorumunun istendiği testlerde uygulanamaz. Testteki sorular 1 ve 0 olarak puanlanabiliyorsa KR-20 ve KR-21 kullanılabilir. Eğer test ve madde istatistikleri biliniyorsa KR-20; yalnızca test istatistikleri biliniyor madde istatistikleri hesaplanamıyorsa KR-21 kullanılır. Madde güçlük düzeyleri farklı olan testlerin güvenirliği için KR-20, madde güçlükleri bilinmeyenler için KR-21 kullanılır. Bu formüllerle elde edilen güvenirlik katsayısının yüksek olması test maddelerinin birbirleriyle tutarlı olduğu anlamına gelir. KR-21 ile hesaplanan güvenirlik katsayısı, KR-20 ile hesaplanan güvenirlik katsayısından her zaman küçüktür. Bu nedenle KR-21 güvenirliğin alt sınırıdır. Testin güvenirlik katsayısı, testin sonucunda alınan puanlar birbirine yakınsa, yani grup homojen ise KR-21, grup heterojen ise KR-20 yöntemi ile hesaplanmalıdır. 
    • Cronbach – Alpha Yöntemi: KR-20’nin 1 ve 0 şeklinde puanlanamayan testlerde sorular arası tutarlılığı bulmak için kullanılan özel bir halidir. Doğru cevabı kişiye göre değişen özelliklerin ölçümünde kullanılır. Duyuşsal özelliklerin (ilgi, tutum, kişilik vb.) ölçülmesinde kullanılan testlerde hesaplanabilir. İç tutarlılık güvenirliği hesaplanır.

            KR-20 ya da KR-21 ve Cronbach – Alpha katsayısı yüksek ise yapılabilecek yorumlar şunlardır:

  • Uygulanan test hatalardan arınıktır (güvenirlik katsayısı yüksektir) ve duyarlıdır.
  • Ölçülen değişken tek boyutludur (sorular birbirine benzer ve tutarlı sonuçlar vermiştir).
  • Testin uygulandığı grup heterojendir.
  • Testi oluşturan maddeler homojendir (testteki bütün sorular, testin bütünü ile aynı amaca yöneliktir).
  • Testin yapı geçerliği yüksektir (madde – madde ilişkisi ve madde – test ilişkisi yüksektir).
  • Testin ayırıcılığı yüksektir.
  • Puanlar tesadüfi hatalardan arınıktır.
  • Puanlayıcılar Güvenirliği: Birden çok puanlayıcının puanlama yapması durumunda, puanlayıcıların birbirleri ile tutarlı puanlama yapıp yapmadıklarını belirlemek için kullanılan tutarlılık anlamında bir güvenirlik türüdür. Birden çok puanlayıcının birbirinden bağımsız yaptığı puanlamaların ortalamasının alınması veya birden çok testten alınan puanların ortalamasının kullanılması güvenirliği artırmak içindir.

Güvenirlik Arttırma Yolları

  • Teste karışabilecek tesadüfi hatalar önlendikçe test sonuçları tutarlı yani güvenilir çıkar.
  • Bir sınavdaki soru sayısı belli bir noktaya kadar arttıkça o sınavdan elde edilen puanların güvenirliği de artar. Soru sayısını arttırmak güvenirliği arttırmanın en öncelikli yoludur çünkü birim küçülür ve duyarlılık artar.
  • Şans başarısı azaldıkça güvenirlik artar.
  • Bir sınavda kullanılan soruların öğrenciler tarafından açıkça anlaşılır olması ve sorunun yanıtının kesin olması sınavdan elde edilen puanların güvenirliğini arttırır.
  • Sınavın yapıldığı ortamın sınav için uygun hale getirilmesi (pis koku, kötü aydınlatma, kötü ısıtma, gürültü vb. giderilmesi) güvenirliği artırır.
  • Öğrencilerin sınava motive edilmeleri soruları dikkatle yanıtlamalarını sağlayacağından uygulanan sınavın güvenirliğini arttırır.
  • Sınav için, bütün bireylerin soruları okuyarak yanıtlayabilecekleri kadar sürenin verilmesi güvenirliği arttırır. Ancak fazla süre kopya nedeniyle güvenirliği düşürür.
  • Testte kullanılan yazı karakterleri ve yazı büyüklüğünün öğrencilerin düzeyine uygun olması güvenirliği artırır.
  • Sınavda yer alan soruların, sınava katılan öğrencilerin yaklaşık yarısı kadar yanıtlanabilir olması, ifadelerin yalın ve anlaşılır olması güvenirliği arttırır.
  • Testin öncelikle daha kolay sorularla başlaması öğrencilerin motivasyonunu arttıracağından güvenirlik artar.
  • Sınav sonuçlarının objektif olarak puanlanması hataların azalmasına dolayısıyla güvenirliğin artmasına neden olur.
  • Ölçmede duyarlılığı yüksek olan araçların kullanılması ve ölçme sonuçlarının duyarlı olarak kaydedilmesi güvenirliği arttırır. (5 üzerinden not vermek yerine 100 üzerinden not vermek)
  • Sınavın başına bir yönergenin eklenmesi güvenirliği arttırır.
  • Sınavın her aşamasında dikkatli davranılması güvenirliği arttırır. Dikkatle ilgili her türlü sorun güvenirliği düşürür.
  • Testin uygulandığı grubun heterojen olması testin güvenirliğini arttırır.
  • Testin uygulandığı öğrenci sayısını arttırmak, testin güvenirliğini arttırır.

Güvenirlik ve Geçerlik Kavramlarını ayırt eden video için lütfen buraya tıklayınız…