ZGŁOŚ PROBLEMikona ozdobna

Pola oznaczone gwiazdką (*) są wymagane
*
*
*
*
captcha
Zapoznałem/am się i akceptuję regulamin oraz politykę prywatności *

ODSYŁACZE

Link do zasobu (portal):

Link do zasobu (skrót):

http://azon.e-science.pl/zasoby/41056

Link do zasobu (repozytorium):

https://id.e-science.pl/records/41056

Typ zasobu: artykuł, rozdział

Delayed reward in reinforcement learning: an experiment in multi-agent control

Widok

Metadane zasobu

Tytuł Delayed reward in reinforcement learning: an experiment in multi-agent control
Osoby Autorzy: Petri Ikonen, Silvia Coradeschi, Jacek Malec
Partner: Politechnika Wrocławska
Opis Referat zaprezentowany w 1998 roku na VI Krajowej Konferencji Robotyki. (Polski)
Opis w innym języku: The paper describes an approach to reinforcement-based multi-agent learning. Due to the domain constraints the classical immediate-reward approach is inapplicable, therefore a delayed reward technique has been introduced. The paper describes the RoboCup domain used as the testbed for a multi-agent system and summarizes the first, preliminary phase of experiments. (Angielski)
Słowa kluczowe "robot"@pl, "Krajowa Konferencja Robotyki"@pl, "robotyka"@pl, "uczenie ze wzmocnieniem"@pl, "nagroda opóźniona"@pl, "system wieloagentowy"@pl, "RoboCup"@pl
Klasyfikacja Typ zasobu: artykuł, rozdział
Dyscyplina naukowa: dziedzina nauk technicznych / automatyka i robotyka (2011)
Grupa docelowa: naukowcy, nauczyciele, studenci
Szkodliwe treści: Nie
Charakterystyka Tytuł źródła: Materiały VI Krajowej Konferencji Robotyki: tom 1
Miejsce wydania: Wrocław
Wydawca: Wydawnictwo Politechniki Wrocławskiej
Czas wydania: 1998
Od strony: 233
Do strony: 240
ISSN: 0324-9794
Język zasobu: Angielski
Licencja CC BY-SA 4.0
Informacje techniczne Deponujący: Robert Muszyński
Data udostępnienia: 12-06-2019
Kolekcje Kolekcja Politechniki Wrocławskiej, Kolekcja e-Biblio PWr

Cytowanie

Skopiowano

Petri Ikonen, Silvia Coradeschi, Jacek Malec. Delayed reward in reinforcement learning: an experiment in multi-agent control. [artykuł, rozdział] Dostępny w Atlasie Zasobów Otwartej Nauki, . Licencja: CC BY-SA 4.0, https://creativecommons.org/licenses/by-sa/4.0/legalcode.pl. Data dostępu: DD.MM.RRRR.

Podobne zasoby

Algebraiczny warunek automatycznego generowania planów uniwersalnych

Ireneusz Sierocki, artykuł, rozdział, Politechnika Wrocławska, dziedzina nauk technicznych / automatyka i robotyka (2011)

Wizyjny system lokalizacji z estymatorem prędkości i przyspieszeń dla robota mobilnego

Marcin Kiełczewski, Dariusz Pazderski, Krzysztof Kozłowski, artykuł, rozdział, Politechnika Wrocławska, dziedzina nauk technicznych / automatyka i robotyka (2011)

Optymalne konfiguracje manipulatorów drzewiastych

Krystian Turczyn, Ignacy Dulęba, artykuł, rozdział, Politechnika Wrocławska, dziedzina nauk technicznych / automatyka i robotyka (2011)

Stanowisko rozpoznawania biosygnałów oparte na komercyjnym systemie akwizycji danych

Michał Błędowski, Andrzej Wołczowski, artykuł, rozdział, Politechnika Wrocławska, dziedzina nauk technicznych / automatyka i robotyka (2011)

Protokół komunikacyjny i architektura systemu do realizacji zadań w Internecie Wszechrzeczy

Stanisław Ambroszkiewicz, Waldemar Bartyna, Kamil Skarżyński, Marcin Stępniak, artykuł, rozdział, Politechnika Wrocławska, dziedzina nauk technicznych / automatyka i robotyka (2011)

Zobacz więcej