153. Kan man lura AI? – Evaluations och LLM-as-a-judge

153. Kan man lura AI? – Evaluations och LLM-as-a-judge

I avsnitt 153 pratar Erik och Dick om hur man bygger och kvalitetssäkrar AI-agenter. Med exempel på hur chatbotar kan “luras” går de igenom vad evaluations (evals) är, hur LLM-as-a-judge fungerar och hur företag använder detta för att förbättra sina AI-system över tid. De diskuterar också feedbackloopar, skillnaden mellan offline och online-utvärdering samt varför human in the loop fortfarande är avgörande. Ett avsnitt för dig som vill förstå hur AI-produkter fungerar bakom kulisserna

Denne episoden er hentet fra en åpen RSS-feed og er ikke publisert av Podme. Den kan derfor inneholde annonser.

Episoder(243)

152. Agil AI-organisationsdesign

152. Agil AI-organisationsdesign

Erik och Dick diskuterar hur AI är på väg att rita om hela organisationskartan. Med utgångspunkt i Elon Musks drastiska nedskärningar på Twitter och Jack Dorseys nya vision för Block utforskar vi en f...

20 Apr 31min

151. Dumhetsparadoxen – varför smarta organisationer gör så dumma saker

151. Dumhetsparadoxen – varför smarta organisationer gör så dumma saker

I det här avsnittet pratar Erik och Dick om Dumhetsparadoxen av Mats Alvesson och André Spicer – en av de mest träffsäkra managementböckerna på svenska. Varför följer smarta människor dumma processer ...

2 Apr 52min

150. Berget AI med Christian Landgren

150. Berget AI med Christian Landgren

I avsnitt 150 välkomnar vi tillbaka Christian Landgren för att prata om Berget AI – en svensk, airgappad AI-plattform byggd på egna servrar och öppna modeller, där ingen data lämnar landet. Vi diskute...

2 Mar 1h 13min

149. Agila AI-agenterna - OpenClaw

149. Agila AI-agenterna - OpenClaw

I avsnitt 149 av Agilpodden dyker vi rakt ner i det som fullständigt exploderade runt årsskiftet: autonoma AI-agenter. Hypen tog fart vid nyår och har bara accelererat under januari och februari. Erik...

12 Feb 25min

148. Agila året 2026 & Claude

148. Agila året 2026 & Claude

Ett nytt år och ett tydligt skifte. I årets första avsnitt pratar Erik och Dick om varför “agilt” blivit ett varningsord och varför produktorganisationer är vägen framåt. Samtidigt dyker de djupt ner ...

4 Feb 40min

147. Alla bolag måste bli mjukvarubolag med Peter Arrhenius

147. Alla bolag måste bli mjukvarubolag med Peter Arrhenius

I avsnitt 147 gästas Erik & Dick av Peter Arrhenius, VD på HiQ, som möter några av Sveriges största företag i samtal om digital transformation, innovation och motstånd mot förändring. Peter menar att ...

16 Des 202558min

146. AI-hypen synad i sömmarna – med Pontus Wärnestål

146. AI-hypen synad i sömmarna – med Pontus Wärnestål

I det här avsnittet gästas vi av Pontus Wärnestål, forskare inom AI och interaktionsdesign, som med ett skeptiskt och nyanserat perspektiv synar AI-hypen. Vi pratar om varför röstgränssnitt aldrig rik...

1 Des 202551min

Populært innen Teknologi

lydartikler-fra-aftenposten
romkapsel
teknisk-sett
tomprat-med-gunnar-tjomlid
energi-og-klima
elektropodden
nasjonal-sikkerhetsmyndighet-nsm
teknologi-og-mennesker
hans-petter-og-co
handlevogna
shifter
fornybaren
rss-ai-forklart
rss-digitaliseringspadden
rss-ki-praten
rss-alt-som-gar-pa-strom
rss-polypod
rss-heis
enkelt-forklart
rss-snakk-om-sikkerhet