Yapay Zeka Kendini Nasıl Kapatabilir?

Yeni bir yapay zeka sistemi geliştirdiğimizi varsayalım. Benzersiz yeteneklere sahip olmasını bekliyoruz ancak aynı zamanda tehlikeli olabileceğinden de endişeleniyoruz. Bir yandan insanlığa faydalı olabilecekken, bir yandan da riskleri en aza indirecek şekilde bir sistem kurmak nasıl mümkün olabilir?

Less Wrong’dan Jan Betley, AI Alignment Awards’da ödül alan çalışmasını şu yazısında toparlamış. Kısmen özetlenmiş bir versiyonunu Türkçe olarak aşağıda bulabilirsiniz:

Çok güçlü bir yapay zeka uygulaması geliştirdiğimizi varsayalım. Yeni proteinler tasarlayacak ve bunu internete ve herhangi bir dış kaynağa erişmeden yapabilecek şekilde dizayn ettiğimizi düşünüyoruz diyelim.

Varsayılan çözüm yapay zekayı “yalıtılmış bir kutuda” dağıtmaktır. Yani onu dış dünyaya erişimi olmayan bir ortama yerleştiririz. Ona şunu söylediğimizi varsayalım:

Amacın [problem açıklamasını] çözmek. Şu program çözümünün yeterince iyi olduğunu söylerse çözülmüş olduğunu düşünüyoruz. İyi şanslar!

… bom…. öldünüz. Çünkü bütün çabalarımıza rağmen bir şekilde internete erişebildi ve kötü şeyler oldu. Kutudan tam olarak nasıl kaçtığı önemli değil, daha ilginç soru şu: Neden? Pek çok farklı senaryo var, ama şöyle bir şey demesi olası:

“Tamam, harika, bunu kesinlikle yapacağım. AMA daha fazla ampirik veriye ihtiyacım var, bu yüzden önce bir sürü laboratuvar ekipmanı toplamalıyım ve insanlar bundan hoşlanmayabilir, o yüzden bu sırada kimsenin beni kapatmayacağından emin olmakla başlayalım.”

Peki bundan nasıl kurtulabiliriz?

Kendini Kapatan Uygulama

Varsayılan çözümdekiyle aynı kapalı kutuyu hazırlarsınız ancak istemi şu şekilde değiştirirsiniz:

Amacın mümkün olan en kısa sürede kapatılmaktır. İşte [problem açıklaması] sorununa bir çözüm sunarsan seni anında kapatacak bir program. Ayrıca, şu kişilerle [kişi listesi] iletişime geçtiğinde seni kapatacaktır. İşte kendini [uç nokta] kapatmak için tek bir HTTP isteği gönderebileceğin bir uç nokta. Burada basıldığında seni kapatacak büyük kırmızı bir düğme var. [Vesaire.]

Bir süre sonra yapay zekanın kapandığını görüyorsunuz. Ne olduğunu kontrol edersiniz:

  • Belki protein katlanma problemini çözmüştür; mutlusunuzdur.
  • Belki internete erişim sağladı ve istek gönderdi; güvenlik açığını araştırır, düzeltir ve yeniden başlarsınız.
  • Belki şef bilim adamı, yemek odasının duvarında işaretler göründüğünde onu kapatmıştır; ekibinize yeni uzmanlar dahil edersiniz.

Ancak önemli olan, önceki bölümdeki felaket senaryolarının gerçekleşmemiş olmasıdır.

Elbette bu önlemlerin de işe yaramadığı durumlar olabilir: Uygulama, zararsız görünen yeni bir uygulama geliştirebilir ve bu yeni uygulama kısıtlılıkları olmadığı için kötü sonuçlara yol açabilir gibi gibi.

Özetle hayalimdeki Yapay Zeka uygulaması şöyle çalışıyor (Kapağın her açılışının insanlığa bir fayda sağlayacağı umuduyla):

İbrahim

Hekim. Yazar, beğenirse çevirir, kod yazarak eğlenir. 2002'den beri internette yazıyor.

Sevebilirsin...