Julekalender luke 3: AI for kontinuerlig læring

Julekalender luke 3: AI for kontinuerlig læring

De fleste forsterkningslæringsalgoritmer er episodiske. Det betyr at de lærer ved å utføre en oppgave i et miljø som starter på nytt hver gang agenten feiler. Inntil nå. Bak denne luke skjuler det seg en helt annen måte å trene forsterkningslæring på.

Artikkel: Autonomous Reinforcement Learning: Formalism and Benchmarking (EARL),https://arxiv.org/abs/2112.09605

Prøv selv: https://architsharma97.github.io/earl_benchmark/overview.html

Episoder(156)

Populært innen Fakta

fastlegen
dine-penger-pengeradet
relasjonspodden-med-dora-thorhallsdottir-kjersti-idem
mikkels-paskenotter
rss-strid-de-norske-borgerkrigene
rss-bisarr-historie
foreldreradet
treningspodden
jakt-og-fiskepodden
takk-og-lov-med-anine-kierulf
ukast
rss-sunn-okonomi
rss-bak-luftfarten
sinnsyn
lederskap-nhhs-podkast-om-ledelse
fryktlos
hverdagspsyken
rss-kull
gravid-uke-for-uke
level-up-med-anniken-binz