reCAPTCHA nedir?

reCAPTCHA nedir?

Luis von Ahn oturur biraz hesap yapar, hergün internette 60 milyon CAPTCHA’nın çözüldüğünü anlar. Her bir CAPTCHA ifadesinin çözülmesi ortalama 10 saniye sürmektedir. “10 saniyeden ne çıkar?” demez, 60 milyon ifadeyi çözmek için toplamda kaç saat harcandığına bakar.

reCAPTCHACAPTCHA kelimesini, internetle uğraşan hemen herkes duymuştur muhtemelen. Bilmeyenler için açıklayalım: Completely Automated Public Turing test to tell Computers and Humans Apart” ifadesinin kısaltması olan CAPTCHA, herhangi bir insan tarafından kolayca yapılabilecek, fakat bilgisayarlar tarafından yapılamayacak bir işlem hazırlayarak insanlarla bilgisayarları (genellikle spam botlarını) ayırmaya yarayan bir testtir.

Pek çok web sitesi, yorum bölümlerinin spam botların saldırısına maruz kalmaması amacıyla CAPTCHA’yı kullanır. Email siteleri gibi büyük çaplı sorguya maruz kalabilecek sitelerde (güvenlik yönü de dikkate alınarak) bir kaç denemeden sonra CAPTCHA sistemi devreye girer. Buna göre, bir kaç denemede yanlış kullanıcı adı veya şifre giren kullanıcı, sonraki denemelerinde bir resimdeki karışık harflerden oluşan ifadeyi de girmek zorunda kalır. Böylece bilgisayarlar tarafından otomatik sorguyla şifrelerin kırılmasının önüne geçilmesi amaçlanır.

CAPTCHA testleri, yukarıdaki örnekten başka tiplerde de karşımıza çıkabilirler: “Gökyüzünün rengi nedir?” gibi basit bilgi sorularından oluşan testler ve “1+3 kaçtır?” gibi basit 4 işlem soruları içeren testler ilk aklımıza gelenler. Liste uzatılabilir.

reCAPTCHAResimdeki karışık harfleri bir kutuya yazmamızı isteyen klasik CAPTCHA testi, oldukça can sıkıcıdır. Resimdeki harflerin bir kelime oluşturmaması sebebiyle, okunamayan bir harf, ifadenin yanlış girilmesine sebep olabilir. CAPTCHA hata verir, sil baştan harfleri sökmeye çalışırsınız. Hele bilgisayar programları tarafından okunabilmenin önüne geçmek için harflere değişik şekiller verildiğinde, iş iyice çığırından çıkar.

Bu “macera”, dil bilimciler veya arkeologlar için eğlenceli olabilir ama internet kullanıcılarının çoğu için gerçekten çekilmezdir.

Yeni CAPTCHA: reCAPTCHA

reCAPTCHAİnternet kullanıcılarının serzenişlerini, Carnegie Mellon’dan yardımcı profesör Luis von Ahn vaktinde duyar, kafasında şimşekler çakar. Oturur biraz hesap yapar, hergün internette 60 milyon CAPTCHA’nın çözüldüğünü anlar. Her bir CAPTCHA ifadesinin çözülmesi ortalama 10 saniye sürmektedir. “10 saniyeden ne çıkar?” demez, 60 milyon ifadeyi çözmek için toplamda kaç saat harcandığına bakar.

Sonuç çok büyüktür: Günde tam 150,000 saat.

Bir başka deyişle, internette hergün 150,000 saat, anlamsız ifadeleri boş kutulara yazarak heba edilmektedir.

Luis von Ahn düşünür taşınır, bu iş gücünü faydalı bir alana yönlendirmenin yollarını arar. Aklına kitapların bilgisayar ortamına aktarımı gelir.

Kütüphanelerde yazılı metinler bilgisayar ortamına aktarılırken bir problem ortaya çıkar: Kitap sayfalarındaki bozulmalar veya basım problemleri sebebiyle, bazı kelimeler okuyucu program tarafından doğru tanınamazlar. Doğru okunamayan kelimelerde programın uyarı vermesi elbette mümkündür, ancak bu şekilde kitapların aktarım süreleri ciddi anlamda uzar. Özellikle eski metinler bilgisayara aktarılırken, çalışanlar bunalır, hani “Elle yazsak daha iyiydi!” diyecek hale gelirler.

Kütüphane çalışanlarını bu sıkıntıdan kurtaracak fikir, işte Luis von Ahn’ın reCAPTCHA projesidir: Okunamayan kelimeler otomatik olarak internete aktarılacak, internette bir çok kullanıcı tarafından aynı yazılan ifadeler doğru kabul edilip metinlere aktarılacaktır.

Böylece hem kullanıcılar karışık harflerden oluşan anlamsız ifadelerden kurtulacaklar, hem de aktarım işi oldukça hızlanmış olacaktır.

Proje hemen hayata geçer ve oldukça beğenilir. Hatta CAPTCHA’nın üreticileri, reCAPTCHA’nın orijinal CAPTCHA sürümü olarak kabul edilmesini arzularlar.

Sistem nasıl işliyor?

Yukarıdaki açıklamada, muhtemelen bir nokta dikkatinizi çekti: ReCAPTCHA, okunamamış kelimeleri internet kullanıcılarına soruyor. Burada elbette akıllara bir soru takılıyor: Öyleyse sistem doğru cevap veren ile yanlış cevap vereni nasıl ayırabiliyor?

Bu sorunun cevabı, reCAPTCHA’nın her seferinde 2 kelime sormasında saklı. Bu kelimelerden biri, daha önce okunmuş kelimelerden seçilirken, diğeri daha önce okunamamış kelimelerden seçiliyor. Kontrol için, daha önce okunan kelime kullanılıyor. Diğeri için verilen cevap da metinlerin bilgisayarlara aktarımında işe yarıyor.

Konu ilginizi çektiyse, reCAPTCHA’nın resmi web sitesinden ayrıntılı bilgiye ulaşabilirsiniz. WordPress için de bir pluginleri bulunuyor.

İbrahim

Hekim. Yazar, beğenirse çevirir, kod yazarak eğlenir. 2002'den beri internette yazıyor.

Sevebilirsin...

1 Yanıt

  1. pembe gül dedi ki:

    anlamadım recaptcha ne diosa yapiom ama olmuyor hayır deyip çıkıyor