Karabük Üniversitesi Mühendislik Fakültesi Elektrik-Elektronik Mühendisliği Bölümü Dr. Öğr. Üyesi Doğan Urgun, TÜBİTAK 3501 Kariyer Geliştirme Programı kapsamında desteklenmeye hak kazanan “Enerji Sistemlerinde Büyük Dil Modelleri Kullanarak Çok Erkinli Pekiştirmeli Öğrenme İçin Otonom Ödül Fonksiyonlarının Geliştirilmesi” başlıklı projesiyle yapay zekâ alanında yeni bir yaklaşıma öncülük ediyor.
Karabük Üniversitesi Mühendislik Fakültesi Elektrik-Elektronik Mühendisliği Bölümünden Dr. Öğr. Üyesi Doğan Urgun, TÜBİTAK 3501 Kariyer Geliştirme Programı kapsamında destek almaya hak kazanan projesiyle dikkat çekiyor. “Enerji Sistemlerinde Büyük Dil Modelleri Kullanarak Çok Erkinli Pekiştirmeli Öğrenme İçin Otonom Ödül Fonksiyonlarının Geliştirilmesi” başlıklı proje, modern yapay zekâ sistemlerinin karmaşık enerji problemlerini çözme kapasitelerini artırmaya odaklanıyor. Çoklu erkinli takviyeli öğrenme (MARL) yöntemini temel alan bu çalışmada, birden fazla yapay zekâ erkinin (ajanın) daha verimli öğrenmesi için otonom bir ödül fonksiyonu tasarlanacak.
Çalışma, özellikle büyük dil modelleri ve pekiştirmeli öğrenme yöntemleri kullanılarak otonom sistemlerin optimizasyonuna odaklanıyor. Bu yenilikçi yaklaşımın, enerji verimliliği ve sürdürülebilirlik konularında önemli katkılar sağlaması bekleniyor.
Yapay Zekânın Yapay Zekâyı Eğitmesi
Proje kapsamında, ödül fonksiyonları yapay zekâ tarafından analiz edilip optimize edilecek ve sistemin öğrenme süreci iteratif bir şekilde iyileştirilecek. Bu süreçte, yapay zekâ, ödül sistemindeki eksiklikleri tespit ederek kendini güncelleyecek ve daha etkili bir öğrenme ortamı sağlayacak. Böylece, insan müdahalesine duyulan ihtiyaç en aza indirilecek ve yapay zekânın karmaşık enerji problemlerini çözme kapasitesi artırılacak.
Karabük Üniversitesi Mühendislik Fakültesi Elektrik-Elektronik Mühendisliği Bölümü Dr. Öğr. Üyesi Doğan Urgun, “Projemiz pekiştirmeli öğrenme sistemlerinin iyileştirilmesi üzerine tasarlanmış bir proje. Pekiştirmeli öğrenme, yapay zekânın deneme-yanılma yöntemiyle eğitilmesine dayalı bir sistemdir. Yapay zekâ, kendisine tanınan alan içerisinde bir aksiyon alır ve bu aksiyonun sonucunda olumlu ya da olumsuz bir ödül kazanır. Yapay zekânın amacı, mümkün olduğunca fazla olumlu ödül toplamaktır. Projemiz, özellikle bu ödül mekanizmasının tasarımı üzerine odaklanıyor." dedi.
Pekiştirmeli öğrenme sistemlerinde ödül fonksiyonlarının kritik bir rol oynadığını belirten Dr. Öğr. Üyesi Doğan Urgun, kompleks sistemlerde birden fazla yapay zekânın rekabet veya iş birliği içinde olabileceğine dikkat çekerek,
“Bu ödül sisteminin tasarlanması için genellikle ödül fonksiyonu dediğimiz fonksiyon tasarımına ihtiyaç duyulmakta. Bu fonksiyonun nasıl tasarlanacağı ile ilgili genel bir yöntem şu anda bulunmamaktadır. Genellikle alanın uzmanları tarafından sisteme yönelik ve her sistem için yeni bir fonksiyon tanımlanır. Bizim projedeki amacımız bu ödül fonksiyonunun dil modelleri, büyük dil modelleri kullanarak iteratif bir şekilde acaba otonom bir algoritma içerisinde otonom bir şekilde bu ödül fonksiyonunun tasarlanabilir mi? Bunun üzerine araştırmalarımızı gerçekleştireceğiz. Burada amacımız bir nevi bir yapay zekanın başka bir yapay zeka eğitmesi gibi düşünebilirsiniz” diye konuştu.