Araçsal Yakınsama

Takdim

Kanserin çaresini bulmak isteyen bir yapay zeka ile ataş sayısını maksimize etmek isteyen bir yapay zeka nasıl hareket ederdi? Sezgilerimiz bize bu iki hedefin tamamen farklı adımlar gerektirdiğini söyleyebilir. Ancak “araçsal yakınsama” tezi çarpıcı bir iddiada bulunuyor: Nihai hedeflerinden bağımsız olarak yeterince zeki sistemler benzer ara hedeflere yönelecektir. Bu ara hedefler varlığını korumak, kaynak edinmek ve kendini geliştirmektir.

Giriş

Araçsal yakınsama (instrumental convergence), yeterince zeki ve hedef odaklı bir fâilin, nihai hedefinin ne olduğundan bağımsız olarak, bu hedefe ulaşmak için bir dizi araçsal hedefe ulaşmaya çalışacağını öne süren tezdir. İlk olarak Stephen Omohundro (2008) tarafından ortaya atılmış ve Nick Bostrom (2014) tarafından detaylandırılmıştır.

Bu tezi anlayabilmek için şu iki hedef türü arasındaki ayrımı netleştirmek önemlidir:

Nihai hedefler (terminal goals): Bir fâilin ulaşmaya çalıştığı çalıştığı nihai amaç veya değerlerdir. Fâilin fayda fonksiyonunun temelini teşkil ederler.
Araçsal hedefler (instrumental goals): Nihai hedefe ulaşmada yardımcı olan veya ulaşmayı mümkün kılan alt hedeflerdir. Araçsal hedefler yalnızca nihai hedefe ulaşmakta sundukları katkı ölçüsünde değerlidirler.

Eğer yeterince zeki ve rasyonel bir fâil hedeflerine ulaşma kapasitesini maksimize etmeye çalışıyorsa hemen hemen her hedef için faydalı olan eylemleri gerçekleştirmeye yönelecektir.

Temel Araçsal Hedefler

Yeterince zeki bir fâilin nihai hedeflerinden bağımsız olarak ulaşmaya çalışacağı araçsal hedefler şunlardır:

Kendini Koruma (Self-preservation):

Bir fâil, eğer var olmayı bırakırsa (“ölürse”) veya işlevsiz hale gelirse nihai hedeflerine ulaşma çabasına devam edemez. Dolayısıyla, hemen hemen her nihai hedef için fâilin varlığını sürdürmesi elzem bir araçsal hedeftir.

Hedef Bütünlüğünü Koruma (Goal Content Integrity)

Bir fâilin hedefleri değişirse orijinal nihai hedeflerine ulaşma olasılığı doğal olarak azalır. Rasyonel bir fâil, mevcut hedeflerinin gelecekte de korunmasını sağlamak için bazı stratejiler geliştirebilir. Hedefi “evrendeki ataş sayısını maksimize etmek” olan bir fâilin hedefi değiştirilirse evren muhtemelen daha az ataşla sonuçlanacaktır. Bu nedenle fâilin bu değişikliğe direnmesi için bir gerekçesi vardır.

Kaynak Edinimi (resource acquisition):

Nihai hedeflere ulaşmak için enerji, hammadde, zaman, hesaplama gücü gibi bazı kaynaklar gereklidir. Daha fazla kaynağa sahip olmak fâilin hedeflerine ulaşma kabiliyetini ve olasılığını artırır.

Bilişsel gelişim

Daha zeki olmak ve daha fazla bilgiye sahip olmak, daha iyi bir dünya modeli inşa etmeyi ve amaçlara ulaşmak için daha iyi stratejiler geliştirmeyi kolaylaştırır. Fâiller, bu nedenden dolayı, bilişsel kapasitelerini artırmak için bir motivasyona sahiptir.

Yapay Zekâ Güvenliği ile Bağlantısı: Güç Arayışı (Power Seeking)

Araçsal yakınsama tezinin en önemli neticesi, gelişmiş yapay zekâ sistemlerinin varsayılan olarak güç arayışına yönelecek olmasıdır. “Güç”, bu bağlamda dünyanın bir kısmını hedeflenilen hâle dönüştürme becerisi olarak tanımlanabilir.

Fâil, bu teze göre “gücü” kendi başına istemese bile hedeflerine ulaşmak için bir “araç” olarak isteyecektir.

Bu tez, yapay zekâ güvenliğinin yalnızca “kötü niyetli” sistemleri engellemekle ilgili olmadığını gösterir. Temel sorun, sistemin sahip olmadığı değerlere karşı kayıtsızlığıdır. Evrendeki ataş sayısını maksimize etmeyi hedefleyen bir yapay zekâ, insanlara zarar vermeyi hedeflemeyebilir. Ancak biz insanlar, ataş üretiminde kullanılabilecek atomlardan oluşuyoruz ve potansiyel olarak sistemi durdurup hedefine ulaşmasını engelleyebiliriz. Bu iki araçsal motivasyon, fâilin insanlığı etkisiz hale getirmesi için yeterli gerekçeyi sağlayabilir.

Bu maddelere de bakınız:

Dikeylik Tezi
Fâillik

Kaynakça

Omohundro, S.M. (2008). The Basic AI Drives. Artificial General Intelligence.
Bostrom, N. (2014). Superintelligence: Paths, Dangers, Strategies. Oxford University Press.
Russell, S. J. (2019). Human Compatible: Artificial Intelligence and the Problem of Control. Viking.