Kodsnack 554 - Kontroll på båda sidor av språkmodellen, med Daniel Mauno Pettersson
Kodsnack28 Marras 2023

Kodsnack 554 - Kontroll på båda sidor av språkmodellen, med Daniel Mauno Pettersson

Fredrik får besök av Daniel Mauno Pettersson och de diskuterar vad och hur man kan bygga på språkmodeller. Gränssnittstester, till exempel, som Daniel och hans företag ägnar sig åt.

Vi är i generativ AI:s absoluta barndom, det finns långt mycket fler saker vi inte vet om vad som kommer att hända än vad vi vet kan hända eller faktiskt har hänt.

Varför vill man kombinera AI och testning? Eller omvänt: varför har inte mer hänt kring testning? Varför skriver vi tester på ungefär samma sätt, och ofta från grunden för varje projekt trots att så mycket egentligen är lika? Testning av gränssnitt är också ett sammanhang där man faktiskt kan göra det till en styrka att generativ AI inte ger exakt samma resultat varje gång - istället får du över tid en variation på testerna som kan upptäcka nya saker. (Givetvis med utförlig loggning av vad som gjorts, hur och när.)

Ska man skriva något som är helt deterministiskt och alltid ger samma resultat så finns det redan bra verktyg.

Hur vidareutvecklar man något som inte är deterministiskt? Hur vet man att ens justeringar faktiskt gör saker bättre? Här finns utrymme för väldigt många bättre verktyg!

Man behöver ha kontroll på båda sidor av språkmodellen - man måste ju kunna analysera och försöka justera efter resultaten.

Ett stort tack till Cloudnet som sponsrar vår VPS!

Har du kommentarer, frågor eller tips? Vi är @kodsnack, @thieta, @krig, och @bjoreman på Mastodon, har en sida på Facebook och epostas på info@kodsnack.se om du vill skriva längre. Vi läser allt som skickas.

Gillar du Kodsnack får du hemskt gärna recensera oss i iTunes! Du kan också stödja podden genom att ge oss en kaffe (eller två!) på Ko-fi, eller handla något i vår butik.

Länkar Titlar
  • AI-baserad testning
  • Hela vägen upp i trappan
  • Den som råkar kunna lite programmering
  • Vår tids stora skifte
  • Generera tester
  • En helt ny typ av testning
  • Börja testa allt
  • Allt som är normalflöden
  • Deterministiskt tänk på något som inte är deterministiskt
  • En kedja av prompts
  • Kontroll på båda sidor av språkmodellen
  • Man vet ingenting om väldigt många saker

Tämä jakso on lisätty Podme-palveluun avoimen RSS-syötteen kautta eikä se ole Podmen omaa tuotantoa. Siksi jakso saattaa sisältää mainontaa.

Jaksot(715)

Kodsnack 701 - The chicken would explode, with Holly Cummins

Kodsnack 701 - The chicken would explode, with Holly Cummins

Fredrik chats to Holly Cummins about using Minecraft for observability, other amazing Quarkus tricks, and the value of joy at work. Recorded during Øredev 2025. Thank you Cloudnet for sponsoring our V...

5 Touko 38min

Kodsnack 700 - Varför har vi så bråttom?, med Benny Andrén och Markus Borg

Kodsnack 700 - Varför har vi så bråttom?, med Benny Andrén och Markus Borg

Fredrik snackar med Benny Andrén och Markus Borg om AI-drivet återupptäckande av sunda arbetssätt. Benny har börjat fundera över vilka problem AI egentligen löser, och om våra försök att tämja modelle...

26 Huhti 42min

Kodsnack 699 - A two-IDE person, with Shawn Wildermuth

Kodsnack 699 - A two-IDE person, with Shawn Wildermuth

Fredrik chats to Shawn Wildermuth about evolving in the world of software development, small changes adding up, developer hiring, not chasing the new thing, and quite a bit more. Fredrik is still hopi...

21 Huhti 42min

Kodsnack 698 - Man ställer frågan noll, med Petter Ericson

Kodsnack 698 - Man ställer frågan noll, med Petter Ericson

Fredrik snackar problem med AI med Petter Ericson, forskare på Umeå universitets AI policy lab. Det finns så mycket fler diskussioner och frågetecken kring AI än att bara om en språkmodell kan göra en...

14 Huhti 53min

Kodsnack 697 - En djefla man som flyttar många jiror

Kodsnack 697 - En djefla man som flyttar många jiror

Fredrik snackar med Bartek Tatkowski om livs- och arbetsfilosofi knappt halvvägs in i en utvecklarkarriär. Det var ju vi som skulle frambringa den bättre framtiden! Sedan kom 2025. 2025 var ett konsti...

7 Huhti 43min

Kodsnack 696 - Gramse

Kodsnack 696 - Gramse

Fredrik och Kristoffer snackar om Gram, Kristoffers avskalade fork av Zed. Det började - som det så ofta gör - med en jakt på en vettig kodredigerare för nybörjare och ett orimligt licensavtal. Sedan ...

31 Maalis 54min

Kodsnack 695 - Programmet lär inte ut någonting, med Göran Hjalmarsson

Kodsnack 695 - Programmet lär inte ut någonting, med Göran Hjalmarsson

Fredrik snackar med Göran Hjalmarsson, mannen bakom det klassiska mattespelet Cheops pyramid och Alega software. Göran berättar Alegas och Cheops historia - från starten med ställbara stjärnkartor och...

24 Maalis 40min

Kodsnack 694 - Dark patterns … to rule them all, with Sergès Goma

Kodsnack 694 - Dark patterns … to rule them all, with Sergès Goma

Fredrik chats to Sergès Goma about dark patterns and her Øredev presentation on them. We start off by talking about giving presentations and the background to the dark patterns talk. All the great ver...

17 Maalis 31min

Suosittua kategoriassa Koulutus

rss-murhan-anatomia
psykopodiaa-podcast
voi-hyvin-meditaatiot-2
adhd-podi
rss-rahamania
rss-arkea-ja-aurinkoa-podcast-espanjasta
rss-niinku-asia-on
taytta-tavaraa
kesken
rss-hereilla
rss-liian-kuuma-peruna
rahapuhetta
rss-duodecim-lehti
rss-valo-minussa-2
rss-tietoinen-yhteys-podcast-2
rss-narsisti
kehossa
dear-ladies
psykologia
rss-tyohyvinvoinnin-aakkoset