Fâillik

Giriş

Yapay zekâ disiplininde bir fâil (agent), formel olarak, çevresini sensörler aracılığıyla algılayabilen ve bu çevre üzerinde aktüatörler (eyleyiciler, ya da İngilizcede “actuators”) vasıtasıyla eyleyebilen herhangi bir varlık olarak tanımlanır (Russell & Norvig, 2021). Fâillik (agency), böyle bir varlığın hedeflere ulaşmak amacıyla kendi çevresi içinde eylemlerde bulunma becerisidir. Bir fâilin davranışı, herhangi bir algı dizisinden (duyusal girdilerin geçmişi) bir eyleme yönelik soyut bir matematiksel eşleme olan fâil fonksiyonu ile tarif edilir.

Fâilliğin önemlini kavramak için, şehir trafiğini yönetmek üzere tasarlanmış iki sistemi ele alalım. Alışageldik bir trafik ışığı kontrolcüsü, sabit zamanlayıcılara veya basit sensörlere göre çalışır ve katı, önceden tanımlanmış kurallara göre tepki verir. Bu sistem, asgari düzeyde bir fâilliğe sahiptir, tamamen reaktiftir ve öngörülemeyen durumlara adapte olamaz.

Buna karşılık olarak, şehir genelindeki trafik verimliliğini maksimize etme görevi verilmiş gelişmiş bir yapay zekâ trafik yönetim sistemini düşünün. Bu sistem, binlerce kaynaktan gelen gerçek zamanlı trafik verilerini analiz eder, trafik sıkışıklıklarını saatler öncesinden tahmin eder ve dinamik yeniden yönlendirme, geçiş ücreti ayarlamaları ve toplu taşıma ile koordinasyonu içeren stratejileri proaktif (önetkin) olarak geliştirir. Beklenmedik olaylar meydana geldiğindeyse otonom bir biçimde uyum sağlar. Bu ikinci sistem, dinamik bir ortamda üst düzey hedeflere ulaşmak için düşünüp karmaşık planlar yürüterek önemli bir miktarda fâillik sergiler.

Fâillik Fonksiyonu ve Fâillik Programı

Faillik (agency) için tesis edilen formel çerçeve, fâil fonksiyonu ile fâil programı arasında bir ayrıma gider. Fâil fonksiyonu, bütüncül algı geçmişinden bir eyleme uzanan soyut matematiksel eşlemeyi temsil eder: $f : \mathcal{P}^* \to \mathcal{A}.$ Bu fonksiyon, teorik olarak fâilin davranışını bütünüyle tanımlamaktadır.

Ne var ki, bu fonksiyonun doğrudan, mesela bir arama tablosu (lookup table) olarak, tatbik edilmesi, pratikte kayda değer neredeyse hiçbir ortam için hesaplama açısından olanaklı değildir. Russell ve Norvig, kitapta, otonom bir taksinin görsel girdisinin, gözlemlenebilir evrendeki atom sayısını katbekat aşan bir arama tablosu üreteceğine dikkat çekmektedir.

Fâil programı, fâil fonksiyonundan farklı olarak, fâilin hesaplama mimarisi üzerinde yürütülen somut ve verimli bir uygulamadır. Yani fâil fonksiyonu formel bir soyutlamayken (aynı Turing makinesi gibi), fâil programı bu fonksiyonun somut bir implementasyonudur (ENIAC veya bunu okurken kullandığınız bilgisayar gibi!).

Yapay zekânın temel güçlüğü, kapsamlı bir sayım dökümü olmaksızın rasyonel davranış üreten kompakt programlar tasarlamaktır. Rasyonel bir fâil, birikmiş deliller ve önsel (prior) bilgiler ışığında, performans ölçüsünü maksimize etmesi beklenen eylemleri seçer. Bu teorik çerçeve, davranışı yalnızca sonuçlarına göre değerlendiren felsefî sonuçsalcılığı (consequentialism) benimsemektedir.

Burada kritik olan nokta şudur ki rasyonalite her şeyi bilmeyi, yani âlim-i mutlak veya allâme-i cihan olmayı, gerektirmez. Bu nedenle bir fâil tamemen rasyonel olsa dahi çeşitli kısıtlamalar nedeniyle hata yapabilir. Rasyonel bir fâil, yalnızca mevcut bilgiye dayanarak beklenen performansı maksimize eder ki bu da tabiatı gereği, keşif veya deney yoluyla çevrenin gelecekteki anlayışını geliştirmek amacıyla özel olarak eylemlerde bulunmayı, yani bilgi toplamayı zorunlu kılar.

Temel Fâil Mimarileri

Fâillik, fâil mimarilerinin evrimine de yansıyan bir karmaşıklık yelpazesi üzerinde varlık gösterir. Bu mimariler, fâillerin dahili olarak nasıl yapılandırıldığını ve eylemlerini nasıl hesapladıklarını belirler.

Basit refleks fâilleri

Basit refleks fâilleri, eylemlerini yalnızca mevcut algıya dayanarak seçer ve algısal geçmişi göz ardı eder. Bu failler, “eğer engel tespit edilirse, o halde sola dön” gibi koşul-eylem kuralları vasıtasıyla faaliyet gösterirler.Bu fâiller sadece tamamen gözlemlenebilir ortamlarda etkilidir; kısmen gözlemlenebilir ortamlarda ise başarısızlığa veya sonsuz döngülere (sphex arısı gibi) meyillidirler. Basitlikleri onları şeffaf ve öngörülebilir kılsa da, uygulanabilirliklerini de ciddi ölçüde kısıtlar.

Model tabanlı refleks fâilleri

Model tabanlı refleks fâilleri, dünyanın gözlemlenmeyen yönlerini takip etmek amacıyla bir içsel durum (internal state) barındırarak ederek kısmi gözlemlenebilirlik meselesini ele alırlar. Bu, iki bileşen gerektirir: dünyanın nasıl evrildiğini betimleyen bir geçiş modeli (transition model) ve dünya durumlarının algı olarak nasıl tezahür ettiğini açıklayan bir sensör modeli. Basit refleks faillerinden daha sofistike olmalarına rağmen, model tabanlı sistemler hala büyük ölçüde reaktif kalır: dünya modellerini yeni algılara göre güncellerler ama hedeflerine yönelik aktif bir planlama yapamazlar.

Hedef tabanlı fâiller

Hedef tabanlı fâiller, fâillikte niteliksel (kalitatif) bir sıçramayı temsil eder. Bu sistemler, arzu edilen durumların (hedeflerin) açık temsillerine sahiptir ve gelecekteki sonuçları değerlendirmek için geçiş modellerini kullanırlar:

“Eğer A eylemini yaparsam ne olur?”

Bu durum, hedeflere ulaşan eylem dizilerini bulmak anlamına gelen arama ve planlamayı mümkün kılar. Uzak hedeflere ulaşmak için düşünebilme ve çok adımlı planlar yapabilme kapasitesi, önemli bir ölçüde fâilliğin ortaya çıkışına alamettir. Hedef tabanlı fâiller, reaktif olmaktan ziyade temelde proaktiftirler ve genişletilmiş planlama ufukları (planning horizons) gerektiren hedeflerin peşinden gidebilirler.

Fayda tabanlı fâiller

Fayda tabanlı fâiller, ikili hedeflerdense farklı dünya durumlarına dereceli değerler atayan fayda fonksiyonları (utility functions) kullanarak hedef tabanlı akıl yürütme kapasitesini daha üst bir mertebeye çıkarırlar.

Fayda tabanlı bir fail, beklenen faydayı maksimize eder:

$$ \mathrm{Eylem} = \operatorname*{argmax}_{a \in \mathcal{A}} \sum_{s’} P(s’ \mid s, a) U(s’) $$

Bu formülde $P(s’ \mid s, a)$ ifadesi; mevcut $s$ durumu ve $a$ eylemi verildiğinde $s’$ durumuna geçiş olasılığını, $U(s’)$ ise o durumun faydasını temsil etmektedir. Bu mimari, belirsizlik altında sofistike karar verme süreçlerini ve karmaşık ödünleşimler (trade-offs) arasında uzlaşmayı mümkün kılar. Bu yapı, Russell ve Norvig’in yapay genel zeka için “standart model” olarak adlandırdığı modeli teşkil eder.

Bu mimarilerden herhangi biri, fâillerin geri bildirimlere dayanarak davranışlarını değiştirmelerine ve bilinmeyen ortamlara adaptasyonlarına olanak tanıyan bir öğrenme özelliğini bünyesine eklemleyebilir. Bu durum, davranışın tasarımcı bilgisinden ziyade sistemin kendi deneyimi tarafından ne ölçüde belirlendiğini belirleyen özerklik (autonomy) niteliğini artırır. Karmaşık ortamlarda yüksek düzeyde fâillik, fâilin tasarımcıları olası tüm durumları öngöremeyeceği için yüksek derecede özerkliği zorunlu kılar.

Fâillik ve Yapay Zekâ Güvenliği

Bir yapay zekâ sisteminin fâillik derecesi ve bu fâilliğin mahiyeti, hizalanma problemi açısından merkezî bir önemi haizdir. Fâillik, yapay zekâ sistemlerinin zekâlarını işlevselleştirmelerine ve çevreleri üzerinde bir optimizasyon baskısı uygulamalarına olanak tanır. Buradaki asıl risk, bu optimizasyon baskısı insanî değerlerle uyumsuz hedeflere yönlendirildiğinde ortaya çıkar.

Bu konu hakkında daha fazla bilgi almak için şu maddelere göz atabilirsiniz:

Ödül Korsanlığı
Araçsal Yakınsama
Dikeylik Tezi

Failliğin Boyutları

Klasik mimariler failliği anlamak için bir temel teşkil etse de, yapay zekâ güvenliği analizi bize göre ek çerçeveler gerektirmektedir. Mimari taksonomi, faillerin dahili olarak nasıl akıl yürüttüğünü, yani hesapsal karmaşıklığı tarif eder. Ancak güvenlik mülahazaları açısından, hedeflerin haricen mi belirlendiği yoksa dahili olarak mı istikrarlı olduğu ve bağlamlar arasında devamlılık gösterip göstermediği gibi, amaçların kaynağını ve istikrarını da kavramamız elzemdir.

Bu ayrım, kendilerine görevler verildiğinde sofistike hedef odaklı akıl yürütme (planlama, arama, sonuçları değerlendirme) sergileyebilen, ancak bağlama bağlı, kullanıcı tarafından belirlenen hedeflerle çalışan büyük dil modelleri gibi modern sistemlerini çözümlerken daha da önem kazanmaktadır. Bir etmenin sahip olduğu becerileri ve hedeflerinin içyüzünü kavramak, risk değerlendirmesi için yadsınamaz bir öneme sahiptir.

Farklı fâillik türlerinin yapay zekâ güvenliği endişeleriyle ne şekilde ilintili olduğuna dair teferruatlı bir analiz için ansiklopedimizdeki, özellikle güvenlikle ilgili ayrımlara odaklanan bir taksonomi sunan “Davranışsal ve Araçsal Fâillik” başlıklı maddeye müracaat edebilirsiniz.

Bu maddelere de bakınız:

Zekâ
Dikeylik Tezi
Araçsal Yakınsama
Davranışsal ve Araçsal Fâillik

Kaynaklar

Russell, S. J. (2019). Human compatible: Artificial intelligence and the problem of control. Allen Lane. https://books.google.com.tr/books?id=VMq_wwEACAAJ

Russell, S. J., Russell, S., & Norvig, P. (2020). Artificial intelligence: A modern approach. Pearson. https://books.google.com.tr/books?id=koFptAEACAAJ