Julekalender luke 3: AI for kontinuerlig læring

Julekalender luke 3: AI for kontinuerlig læring

De fleste forsterkningslæringsalgoritmer er episodiske. Det betyr at de lærer ved å utføre en oppgave i et miljø som starter på nytt hver gang agenten feiler. Inntil nå. Bak denne luke skjuler det seg en helt annen måte å trene forsterkningslæring på.

Artikkel: Autonomous Reinforcement Learning: Formalism and Benchmarking (EARL),https://arxiv.org/abs/2112.09605

Prøv selv: https://architsharma97.github.io/earl_benchmark/overview.html

Episoder(156)

Populært innen Fakta

fastlegen
dine-penger-pengeradet
relasjonspodden-med-dora-thorhallsdottir-kjersti-idem
mikkels-paskenotter
foreldreradet
rss-strid-de-norske-borgerkrigene
treningspodden
rss-bisarr-historie
jakt-og-fiskepodden
takk-og-lov-med-anine-kierulf
sinnsyn
rss-sunn-okonomi
hverdagspsyken
tomprat-med-gunnar-tjomlid
gravid-uke-for-uke
fryktlos
rss-bak-luftfarten
ukast
lederskap-nhhs-podkast-om-ledelse
level-up-med-anniken-binz