Julespesial 4: Lyd, bilde og tekst i en algoritme

Julespesial 4: Lyd, bilde og tekst i en algoritme

Vi mennesker tar inn mye informasjon samtidig. Når vi for eksempel ser på en film, titter vi på bildene, hører på lyden og kanskje leser teksten, og sammen får vi et mer helhetlig bilde enn hvis vi bare hadde hørt lyden. Kunstig intelligens trenes derimot somoftest opp med bare en type data. I denne episoden tar vi for oss en algoritme som, mot normalt, kombinerer lyd, bilde, og tekst for anda bedre resultater.

Podcasten er en del av en serie hvor vi tar for oss artikler fra konferansen NeurIPS 2021, og denne episoden handler om «VATT: Transformers for Multimodal Self-Supervised Learning from Raw Video, Audio and Text» av Hassan Akbari, Liangzhe Yuan, Rui Qian, Wei-Hong Chuang, Shih-Fu Chang, Yin Cui, og Boqing Gong.

Det här avsnittet är hämtat från ett öppet RSS-flöde och publiceras inte av Podme. Det kan innehålla reklam.

Avsnitt(156)

Populärt inom Utbildning

historiepodden-se
det-skaver
rss-bara-en-till-om-missbruk-medberoende-2
allt-du-velat-veta
nu-blir-det-historia
roda-vita-rosen
sektledare
johannes-hansen-podcast
harrisons-dramatiska-historia
not-fanny-anymore
rss-viktmedicinpodden
i-vantan-pa-katastrofen
sa-in-i-sjalen
rss-dr-bjorklund
rss-foraldramotet-bring-lagercrantz
rikatillsammans-om-privatekonomi-rikedom-i-livet
rss-max-tant-med-max-villman
rss-real-talk-with-jesper-stahl
rss-relationsrevolutionen
rss-basta-livet