153. Kan man lura AI? – Evaluations och LLM-as-a-judge
Agilpodden5 Touko

153. Kan man lura AI? – Evaluations och LLM-as-a-judge

I avsnitt 153 pratar Erik och Dick om hur man bygger och kvalitetssäkrar AI-agenter. Med exempel på hur chatbotar kan “luras” går de igenom vad evaluations (evals) är, hur LLM-as-a-judge fungerar och hur företag använder detta för att förbättra sina AI-system över tid. De diskuterar också feedbackloopar, skillnaden mellan offline och online-utvärdering samt varför human in the loop fortfarande är avgörande. Ett avsnitt för dig som vill förstå hur AI-produkter fungerar bakom kulisserna

Tämä jakso on lisätty Podme-palveluun avoimen RSS-syötteen kautta eikä se ole Podmen omaa tuotantoa. Siksi jakso saattaa sisältää mainontaa.

Jaksot(243)

152. Agil AI-organisationsdesign

152. Agil AI-organisationsdesign

Erik och Dick diskuterar hur AI är på väg att rita om hela organisationskartan. Med utgångspunkt i Elon Musks drastiska nedskärningar på Twitter och Jack Dorseys nya vision för Block utforskar vi en f...

20 Huhti 31min

151. Dumhetsparadoxen – varför smarta organisationer gör så dumma saker

151. Dumhetsparadoxen – varför smarta organisationer gör så dumma saker

I det här avsnittet pratar Erik och Dick om Dumhetsparadoxen av Mats Alvesson och André Spicer – en av de mest träffsäkra managementböckerna på svenska. Varför följer smarta människor dumma processer ...

2 Huhti 52min

150. Berget AI med Christian Landgren

150. Berget AI med Christian Landgren

I avsnitt 150 välkomnar vi tillbaka Christian Landgren för att prata om Berget AI – en svensk, airgappad AI-plattform byggd på egna servrar och öppna modeller, där ingen data lämnar landet. Vi diskute...

2 Maalis 1h 13min

149. Agila AI-agenterna - OpenClaw

149. Agila AI-agenterna - OpenClaw

I avsnitt 149 av Agilpodden dyker vi rakt ner i det som fullständigt exploderade runt årsskiftet: autonoma AI-agenter. Hypen tog fart vid nyår och har bara accelererat under januari och februari. Erik...

12 Helmi 25min

148. Agila året 2026 & Claude

148. Agila året 2026 & Claude

Ett nytt år och ett tydligt skifte. I årets första avsnitt pratar Erik och Dick om varför “agilt” blivit ett varningsord och varför produktorganisationer är vägen framåt. Samtidigt dyker de djupt ner ...

4 Helmi 40min

147. Alla bolag måste bli mjukvarubolag med Peter Arrhenius

147. Alla bolag måste bli mjukvarubolag med Peter Arrhenius

I avsnitt 147 gästas Erik & Dick av Peter Arrhenius, VD på HiQ, som möter några av Sveriges största företag i samtal om digital transformation, innovation och motstånd mot förändring. Peter menar att ...

16 Joulu 202558min

146. AI-hypen synad i sömmarna – med Pontus Wärnestål

146. AI-hypen synad i sömmarna – med Pontus Wärnestål

I det här avsnittet gästas vi av Pontus Wärnestål, forskare inom AI och interaktionsdesign, som med ett skeptiskt och nyanserat perspektiv synar AI-hypen. Vi pratar om varför röstgränssnitt aldrig rik...

1 Joulu 202551min