Yapay Zekanın Korkutucu Bir Boyuta Geçtiği Deep Learning (Derin Öğrenme) Nedir?

Derin öğrenme (deep learning) kısaca nedir? Tanımını yapmak zor gibi görünse de birkaç entry yardımıyla kolayca anlayabileceğiniz bir disiplin deep learning denilen şey.
Yapay Zekanın Korkutucu Bir Boyuta Geçtiği Deep Learning (Derin Öğrenme) Nedir?
iStock

Nedir, ne değildir?

deep learning, geleceğin vazgeçilmezi haline gelmiş bir teknoloji. temelde insan psikolojisi üzerinde dahi kullanılabilen, teoride çok amaçlı ve adından da anlaşılacağı gibi, temel bilgiler haricinde bilgilere sahip olmayan bir yazılımın, kendi kendine öğrenmesi algoritmalarının tamamına verilen isimdir.

youtube videolarında gördüğünüz her şeyi unutun, deep learning ile anketlere ihtiyaç duymadan seçim sonuçları, kitlelerin davranışları, tekerrür eden tarihin önemli kısımlarını yeniden öğrenebiliriz. sosyoloji gibi alanlar aktif bilim haline gelebilir. tüm dünya bu teknoloji çevresinde yepyeni bir kültür ve "prediction" hakimiyeti kazanabilir.

bildiğimiz normal neural network'lerdeki hidden layer sayısının artmasıyla network, deep hale gelir. ne kadar hidden layer o kadar deep neural network, başka bir deyişle deep learning. peki bu çok sayıda "hidden", ne sağlamaktadır?

elde edeceğin sonuca ait karar mekanizmalarını, doğrudan bizim belirlediğimiz özelliklere göre (feature) değil de , bunların çeşitli ağırlıklandırılmış kombinasyonlarına göre yeni özellikler meydana getirerek oluşturmaktadır. yapı, özellikleri nasıl kombinlersem daha iyi öğrenirim? sorusunu da kendisine devamlı sorar ve en iyi öğrenebileceği ara özellikleri de otomatikman bularak karara varır.

machine learning'ten farkı nedir?

deep learning ile machine learning arasında çok büyük bir fark yoktur. en önemli fark, sistemin yeni veri setlerini kendisinin değerlendirebilmesidir. bu yetiye sahip olduğu için de sistem büyük veri setleriyle öğrenebilmektedir. dinamik makine öğrenmesi dense belki daha uygun olurdu ama derin öğrenme çok daha havalı duruyor.

biraz daha detaylandıralım

toplumumuzun genel bir huyu olarak tanımların içini boşaltma konusunda yeni moda olan mühendislik alanlarından birisidir. özellikle bu alanda o kadar büyük bir karmaşa vardır ki genellikle yapay zekayla ilgili olarak makine öğrenmesi, derin öğrenme ve yapay sinir ağı kelimelerini hemen hemen aynı şeyler için kullanan büyük bir güruha sahip olduk.

işbu öğrenme çeşidi makine öğrenmesinin dallarından birisidir, yapay zekaya sanat diyecek olursak, makine öğrenimi resim, derin öğrenme ise farklı akımlardan etkilenmiş dönemsel resim teknikleri gibi algılayabilirsiniz. (bkz: klasizm) (bkz: ekspresyonizm)

peki bu derin neden? yahut ne kadar derin?

özellikle bu çalışma alanı şekillenmeye başlarken bilim adamları haliyle bu tekniğin niteliklerine göre tutarlı bir isim vermişler. diğer makine öğrenimi uygulamalarına (bkz: lojistik regresyon) bakacak olursak bu işlemleri kağıt üzerinde yahut hesaplayıcılarda yaparak girdileri ve çıktıları daha detaylı görebilirken, derin öğrenmede bu kısım daha belirsizdir. madem derin öğrenmeye bakıyoruz konunun daha derinine bakmakta fayda var.

derin öğrenme konusunun olmazsa olmazı diyebileceğimiz bir hususa göz atabiliriz: yapay sinir ağı. bunu çok kaba bir tabirle tahayyül etmek isterseniz beynimizdeki nöronları model alabilirsiniz.

yapay zeka tarifi:

en az bir yapay sinir ağı
programlama dili, (bkz: python) tavsiyemdir.
bilgisayar
makinemize bir şeyler öğretecek kadar veri. (göz kararı atabilirsiniz fakat elinizi korkak alıştırmayın)

tercihen veriyi yemeğe hazırlamak açısından temizleyebilirsiniz (şiddetle tavsiyedir).

verilerimiz servise hazır olana dek birçok prosesten geçecek, uzun uzun hepsini yazmıyorum. bu işin içine girecekseniz sosyal medyada yazılan birkaç satırlık tanımların size yetmeyeceğinden emin olabilirsiniz, o yüzden başlıklarını yazıp kaçıyorum.

(bkz: initializing parameters), (bkz: forward propagation), (bkz: loss function), (bkz: cost function), (bkz: backward propagation), (bkz: updating parameters), (bkz: prediction)

bir kısmın havada kaldığının farkındayım buraya kadar gözünüz korkmadıysa geri kalanlarla içine bakmaya devam edebiliriz.

işte bu işlemler yapılırken optimizasyonlar, parametre güncellemeleri, zincir türevler, hataya katılım oranları, eğilim ve ağırlık değerleri gibi birçok işlemi aslında izleyebiliyoruz, fakat bu yapay sinirlerdeki nöronların verinin hangi durumuna göre nasıl aktive olacağı biraz probabilistik bir sonuç oluyor. bu yüzden derin öğrenme konusunu insandaki sezgisellik olarak düşünebilirsiniz.

son olarak... bağlayacak olursak bu derin kavramı, giriş ve çıkış arasındaki gizli katmanlardan gelmektedir, sinir ağınızın gücü (ya da derinliği) diyebileceğimiz  bir parametre de bu katman sayısı desek yanlış yapmış olmayız.

deep learning'in, insan beyninin çalışma yapısına benzediği aşikâr

içgüdüsel bilgileri de açıklıyor aslında. mesela ördekler genetik olarak nesillerdir öğrenilmiş/train edilmiş verilere sahip olarak doğuyor ve doğar doğmaz yüzebiliyor. transfer learning dediğimiz olayın ta kendisi işte bu. hazır bir nöral ağla beraber doğuyoruz canlılar olarak, nam-ı diğer içgüdü. supervision takımının eğittiği alexnet'i alarak kendi problemlerimize nasıl adapte edebiliyorsak, canlılar da genetik olarak doğuştan gelen veriler üzerine yaşamını kuruyor. tabula rasa fikrinin antitezinden bahsediyoruz dolayısıyla.

final yorumu

nasıl canlılar tek hücreliden insanoğluna kadar doğal seleksiyonla elenerek geliştilerse, programların da aynı şekilde, kendini geliştirerek işe yaramayan kodu silip yarayanla devam etmesini sağlayan bir alan deep learning.

bugün otonom araçlar, ses tanıma, hatta iphone x'in yüz tanıması bile kullanıyor bunu. nasıl kutupta mutasyon sonucu beyaz olan ayılar, normal ayılardan daha çok yaşama şansına sahip olduğundan oradaki tek cins oldularsa; kodlar da aynı bu şekilde mutasyona uğrayarak yoluna devam ediyor. bir programa araba kullanmayı öğreteceksiniz diyelim, bunu her küçük detayı düşünerek milyonlarca satır kodla yapacağınıza, deep learning ile programa milyonlarca kez simüle ederek yapıyorsunuz. program başta belki 1 metre ilerleyip kaza yaparken, 100. denemede yazdığı ekstra bir kod 2 metre ilerletiyor. diğer kodları siktir edip o kod ile devam ediyor. ve milyonlarca deneme sonucu bugün tesla'nın sahip olduğu gibi bir insanın ulaşmasının mümkün olmadığı seviyeye ulaşıyor.

burada korkutucu olan, canlılar milyonlarca yıllık bir evrim sonucu şu anki halini almışken, programlar bizden kat ve kat hızlı öğreniyor. elon musk'ın devamlı yapay zekanın regüle edilmesini istemesi de tam bu yüzden. önümüzdeki 30-40 yıl boyunca insanlığı tehdit edecek bir yapay zeka geliştirilemez olsa bile, peki ya sonra?

Atiye Dizisi Üzerinden Kendini Aramak Üzerine Yola Çıkanlara Tavsiyeler

Günümüz Yazılımcılığının Yükselen Değeri Makine Öğrenmesi (Machine Learning) Nedir?

Yapay Zekanın İnsan Aklını Geçeceği Anı Belirten Ürpertici Kavram: Teknolojik Tekillik