Markov Karar Süreçleri için Yinelemeli Algoritmalar: Birleştirilmiş Bir Çatı ve Stokastik Engelli Ortamlar Uygulaması

Proje Yürütücüsü:Yrd. Doç. Dr. Vural Aksakallı,TÜBİTAK 3501

Proje Süresi:15.04.2012 - 15.10.2013, 18 Ay

Proje Konusu: Markov Karar Süreçleri (Markov Decision Processes - MDP) matematik ve olasılık teorisi disiplinlerinin kapsamına giren, ardaşık karar verme süreçlerinin modellenmesinde kullanılan popüler bir yapıdır. MDPlerin çözümü için kullanılan yöntemler başlıca olarak stokastik dinamik programlama (SDP), sezgisel arama (heuristic search), ve yinelemeli (iterative) aramadır. Projemizde MDPler için yinelemeli algoritmalardan oluşan birleştirilmiş bir çatının oluşturması (unified framework), yinelemeli algoritmalara akıllı önbelleklemenin (smartcaching) entegre edilmesi, literatürde varolan MDP çözüm metodlarının performans karşılaştırması için gerçek hayattan alınan yeni bir standart sınama ortamının (problemin) sunulması, ve sunulan bu problemin kendisinin en hızlı bir şekilde optimal olarak çözülmesi hedeflenmektedir.