ZGŁOŚ PROBLEMikona ozdobna

Pola oznaczone gwiazdką (*) są wymagane
*
*
*
*
captcha
Zapoznałem/am się i akceptuję regulamin oraz politykę prywatności *

ODSYŁACZE

Link do zasobu (portal):

Link do zasobu (skrót):

http://azon.e-science.pl/zasoby/82864

Link do zasobu (repozytorium):

https://id.e-science.pl/records/82864

Typ zasobu: praca dyplomowa

Skuteczość metod uczenia w algorytmach z rodziny Temporal Difference w zastosowaniu do dwuoosobowych gier planszowych (PD-2007-04)

Widok

Metadane zasobu

Tytuł Skuteczość metod uczenia w algorytmach z rodziny Temporal Difference w zastosowaniu do dwuoosobowych gier planszowych (PD-2007-04)
Osoby Autorzy: Daniel Osman
Partner: Instytut Badań Systemowych PAN w Warszawie
Opis Rozprawa rozpatruje zagadnienia związane z problemem sterowania na przykładzie gry w anty-warcaby, a celem jest stworzenie algorytmu uczącego się w nie grać. Wykorzystano tu znany algorytm uczenia ze wzmocnieniem -- Temporal Difference TD(λ) który można stosować w sytuacji gdy ocena pracy agenta następuje dopiero po zakończeniu rozgrywki i znany jest jej wynik. Ważnym elementem wpływającym na skuteczność algorytmu uczącego był odpowiedni dobór strategii treningowej, co zostało szczegółowo opisane. W pracy został również wykorzystany algorytm pseudo-ewolucyjny EVO, którego zastosowanie umożliwiło porównanie skuteczności algorytmu TD(λ) z odmienną metodą nauczania taktyki agenta. Algorytm został zaimplementowany i przetestowany w języku Ocaml. (Polski)
Słowa kluczowe "game theory"@en, "teoria gier"@pl
Klasyfikacja Typ zasobu: praca dyplomowa
Dyscyplina naukowa: Dziedzina nauk inżynieryjno-technicznych / informatyka techniczna i telekomunikacja (2018)
Grupa docelowa: uczniowie, studenci, naukowcy
Szkodliwe treści: Nie
Charakterystyka Miejsce powstania: Warszawa
Czas powstania: 2006
Liczba stron: 121
Promotor: Jacek Mańdziuk
Język zasobu: Polski
Licencja CC BY-SA 4.0
Informacje techniczne Deponujący: Anna Wasilewska
Data udostępnienia: 17-01-2023
Kolekcje Kolekcja Instytutu Badań Systemowych PAN w Warszawie

Cytowanie

Skopiowano

Daniel Osman. Skuteczość metod uczenia w algorytmach z rodziny Temporal Difference w zastosowaniu do dwuoosobowych gier planszowych (PD-2007-04). [praca dyplomowa] Dostępny w Atlasie Zasobów Otwartej Nauki, . Licencja: CC BY-SA 4.0, https://creativecommons.org/licenses/by-sa/4.0/legalcode.pl. Data dostępu: DD.MM.RRRR.