Julekalender luke 3: AI for kontinuerlig læring

Julekalender luke 3: AI for kontinuerlig læring

De fleste forsterkningslæringsalgoritmer er episodiske. Det betyr at de lærer ved å utføre en oppgave i et miljø som starter på nytt hver gang agenten feiler. Inntil nå. Bak denne luke skjuler det seg en helt annen måte å trene forsterkningslæring på.

Artikkel: Autonomous Reinforcement Learning: Formalism and Benchmarking (EARL),https://arxiv.org/abs/2112.09605

Prøv selv: https://architsharma97.github.io/earl_benchmark/overview.html

Populärt inom Utbildning

bygga-at-idioter
rss-bara-en-till-om-missbruk-medberoende-2
det-skaver
historiepodden-se
nu-blir-det-historia
harrisons-dramatiska-historia
svd-ledarredaktionen
johannes-hansen-podcast
allt-du-velat-veta
nar-man-talar-om-trollen
not-fanny-anymore
alska-oss
roda-vita-rosen
i-vantan-pa-katastrofen
rikatillsammans-om-privatekonomi-rikedom-i-livet
sa-in-i-sjalen
rss-max-tant-med-max-villman
rss-npf-podden
sektledare
psykologsnack