Julekalender luke 3: AI for kontinuerlig læring

Julekalender luke 3: AI for kontinuerlig læring

De fleste forsterkningslæringsalgoritmer er episodiske. Det betyr at de lærer ved å utføre en oppgave i et miljø som starter på nytt hver gang agenten feiler. Inntil nå. Bak denne luke skjuler det seg en helt annen måte å trene forsterkningslæring på.

Artikkel: Autonomous Reinforcement Learning: Formalism and Benchmarking (EARL),https://arxiv.org/abs/2112.09605

Prøv selv: https://architsharma97.github.io/earl_benchmark/overview.html

Populært innen Fakta

merry-quizmas
fastlegen
relasjonspodden-med-dora-thorhallsdottir-kjersti-idem
dine-penger-pengeradet
rss-strid-de-norske-borgerkrigene
foreldreradet
treningspodden
dypdykk
jakt-og-fiskepodden
fryktlos
rss-kunsten-a-leve
hverdagspsyken
tomprat-med-gunnar-tjomlid
gravid-uke-for-uke
sinnsyn
rss-sarbar-med-lotte-erik
rss-sunn-okonomi
rss-impressions-2
okrimpodden
rss-var-forste-kaffe