Kodsnack 554 - Kontroll på båda sidor av språkmodellen, med Daniel Mauno Pettersson
Kodsnack28 Marras 2023

Kodsnack 554 - Kontroll på båda sidor av språkmodellen, med Daniel Mauno Pettersson

Fredrik får besök av Daniel Mauno Pettersson och de diskuterar vad och hur man kan bygga på språkmodeller. Gränssnittstester, till exempel, som Daniel och hans företag ägnar sig åt.

Vi är i generativ AI:s absoluta barndom, det finns långt mycket fler saker vi inte vet om vad som kommer att hända än vad vi vet kan hända eller faktiskt har hänt.

Varför vill man kombinera AI och testning? Eller omvänt: varför har inte mer hänt kring testning? Varför skriver vi tester på ungefär samma sätt, och ofta från grunden för varje projekt trots att så mycket egentligen är lika? Testning av gränssnitt är också ett sammanhang där man faktiskt kan göra det till en styrka att generativ AI inte ger exakt samma resultat varje gång - istället får du över tid en variation på testerna som kan upptäcka nya saker. (Givetvis med utförlig loggning av vad som gjorts, hur och när.)

Ska man skriva något som är helt deterministiskt och alltid ger samma resultat så finns det redan bra verktyg.

Hur vidareutvecklar man något som inte är deterministiskt? Hur vet man att ens justeringar faktiskt gör saker bättre? Här finns utrymme för väldigt många bättre verktyg!

Man behöver ha kontroll på båda sidor av språkmodellen - man måste ju kunna analysera och försöka justera efter resultaten.

Ett stort tack till Cloudnet som sponsrar vår VPS!

Har du kommentarer, frågor eller tips? Vi är @kodsnack, @thieta, @krig, och @bjoreman på Mastodon, har en sida på Facebook och epostas på info@kodsnack.se om du vill skriva längre. Vi läser allt som skickas.

Gillar du Kodsnack får du hemskt gärna recensera oss i iTunes! Du kan också stödja podden genom att ge oss en kaffe (eller två!) på Ko-fi, eller handla något i vår butik.

Länkar Titlar
  • AI-baserad testning
  • Hela vägen upp i trappan
  • Den som råkar kunna lite programmering
  • Vår tids stora skifte
  • Generera tester
  • En helt ny typ av testning
  • Börja testa allt
  • Allt som är normalflöden
  • Deterministiskt tänk på något som inte är deterministiskt
  • En kedja av prompts
  • Kontroll på båda sidor av språkmodellen
  • Man vet ingenting om väldigt många saker

Tämä jakso on lisätty Podme-palveluun avoimen RSS-syötteen kautta eikä se ole Podmen omaa tuotantoa. Siksi jakso saattaa sisältää mainontaa.

Jaksot(715)

Kodsnack 693 - Produktionslinjerna vid Telefonplan

Kodsnack 693 - Produktionslinjerna vid Telefonplan

Fredrik snackar med Daniel Byström om nya begagnade Linuxlaptops, nästa Openinfra forum, hälsofrämjande telefoner, och om att lära föräldrar hantera torrents. Nästa Openinfra forum går av stapeln 21 ...

10 Maalis 46min

Kodsnack 692 - I mejlcommunityt

Kodsnack 692 - I mejlcommunityt

Fredrik och Kristoffer snackar om konferensen Gleam gathering i Bristol. En liten och trevlig konferens för ett litet, stabilt och ganska färdigt språk. En konferens med fokus på saker folk byggt, sna...

3 Maalis 35min

Kodsnack 691 - Skriv bara koden du behöver

Kodsnack 691 - Skriv bara koden du behöver

Fredrik river av en länklista, och snackar om fascination för språkmodeller, ansvar som utvecklare, jobb på 8k pixlar, vad man lär sig med tiden, och ganska mycket mer. Som inledning diskuterar han tv...

24 Helmi 55min

Kodsnack 690 - RPN-evangelist, med Joachim Klahr

Kodsnack 690 - RPN-evangelist, med Joachim Klahr

Fredrik snackar med Joachim Klahr om hans stackbaserade konkatenativaprogrammeringsspråk Quadrate. Joachim berättar såklart vad det innebär och hur det kom sig att han skapade Quadrate. På vägen berät...

17 Helmi 49min

Kodsnack 689 - Är det så svårt att skicka data?, med Emil Privér

Kodsnack 689 - Är det så svårt att skicka data?, med Emil Privér

Fredrik snackar med Emil Privér om att bygga integrationer, dataflöden, och tjänster kring dem. Emil berättar om byggandet av Enad - en plattform som äger och hanterar data för webbutiker. Hur svårt ä...

10 Helmi 1h 6min

Kodsnack 688 - Svenskt FOSDEM

Kodsnack 688 - Svenskt FOSDEM

Fredrik snackar Foss-north och FOSDEM med Tobias Olausson och Johan Thelin. Vi snackar fördelar med att ha flera spår på sin konferens, minglets i korridorernas centrala roll, att placera in sin konfe...

3 Helmi 47min

Kodsnack 687 - Alla spelmotorer är olika

Kodsnack 687 - Alla spelmotorer är olika

Fredrik ber Tobias berätta om varför spelmotorer är så stora. Och vad äregentligen en spelmotor nuförtiden? Något som mest ritar snygg grafik riktigt snabbt? Tobias berättar om olika saker som kan räk...

27 Tammi 45min

Kodsnack 686 - Russinsoppa

Kodsnack 686 - Russinsoppa

Fredrik och Kristoffer snackar Gleam. Kristoffer berättar om att använda Gleam för att skriva frontend, backend, eller båda delar, och hur det skiljer sig från andra lösningar på samma upplägg. Kristo...

20 Tammi 1h 2min

Suosittua kategoriassa Koulutus

rss-murhan-anatomia
psykopodiaa-podcast
voi-hyvin-meditaatiot-2
adhd-podi
rss-rahamania
rss-arkea-ja-aurinkoa-podcast-espanjasta
rss-niinku-asia-on
taytta-tavaraa
kesken
rss-hereilla
rss-liian-kuuma-peruna
rahapuhetta
rss-duodecim-lehti
rss-valo-minussa-2
rss-tietoinen-yhteys-podcast-2
rss-narsisti
kehossa
dear-ladies
psykologia
rss-tyohyvinvoinnin-aakkoset