ZGŁOŚ PROBLEM
ODSYŁACZE
Link do zasobu (skrót):
http://azon.e-science.pl/zasoby/82864Link do zasobu (repozytorium):
https://id.e-science.pl/records/82864Metadane zasobu
Tytuł |
Skuteczość metod uczenia w algorytmach z rodziny Temporal Difference w zastosowaniu do dwuoosobowych gier planszowych (PD-2007-04) |
---|---|
Osoby |
Autorzy:
Daniel Osman
Partner: Instytut Badań Systemowych PAN w Warszawie |
Opis |
Rozprawa rozpatruje zagadnienia związane z problemem sterowania na przykładzie gry w anty-warcaby, a celem jest stworzenie algorytmu uczącego się w nie grać. Wykorzystano tu znany algorytm uczenia ze wzmocnieniem -- Temporal Difference TD(λ) który można stosować w sytuacji gdy ocena pracy agenta następuje dopiero po zakończeniu rozgrywki i znany jest jej wynik. Ważnym elementem wpływającym na skuteczność algorytmu uczącego był odpowiedni dobór strategii treningowej, co zostało szczegółowo opisane. W pracy został również wykorzystany algorytm pseudo-ewolucyjny EVO, którego zastosowanie umożliwiło porównanie skuteczności algorytmu TD(λ) z odmienną metodą nauczania taktyki agenta. Algorytm został zaimplementowany i przetestowany w języku Ocaml. (Polski) |
Słowa kluczowe | "game theory"@en, "teoria gier"@pl |
Klasyfikacja |
Typ zasobu:
praca dyplomowa Dyscyplina naukowa: Dziedzina nauk inżynieryjno-technicznych / informatyka techniczna i telekomunikacja (2018) Grupa docelowa: uczniowie, studenci, naukowcy Szkodliwe treści: Nie |
Charakterystyka |
Miejsce powstania: Warszawa
Czas powstania: 2006 Liczba stron: 121 Promotor: Jacek Mańdziuk Język zasobu: Polski |
Licencja | CC BY-SA 4.0 |
Informacje techniczne |
Deponujący: Anna Wasilewska Data udostępnienia: 17-01-2023 |
Kolekcje | Kolekcja Instytutu Badań Systemowych PAN w Warszawie |
Cytowanie
Daniel Osman. Skuteczość metod uczenia w algorytmach z rodziny Temporal Difference w zastosowaniu do dwuoosobowych gier planszowych (PD-2007-04). [praca dyplomowa] Dostępny w Atlasie Zasobów Otwartej Nauki, . Licencja: CC BY-SA 4.0, https://creativecommons.org/licenses/by-sa/4.0/legalcode.pl. Data dostępu: DD.MM.RRRR.
Podobne zasoby
Własności rozwiązań kooperacyjnych w problemie przetargowym
Piotr Bronisz, praca dyplomowa, Instytut Badań Systemowych PAN w Warszawie, dziedzina nauk technicznych / automatyka i robotyka (2011)
Procedings of the seminar on "Nonconventional problems of optimization" * On the regularity in hierarchical games (PN-1986-12-05)
Tadeusz Selbirak, artykuł, rozdział, Instytut Badań Systemowych PAN w Warszawie, Dziedzina nauk ścisłych i przyrodniczych / matematyka (2018)
Procedings of the seminar on "Nonconventional problems of optimization" * Resource allocation and cost sharing in common Enterprise:A game approach (PN-1986-12-01)
Lech Kruś, Piotr Bronisz, artykuł, rozdział, Instytut Badań Systemowych PAN w Warszawie, Dziedzina nauk ścisłych i przyrodniczych / informatyka (2018)