Kodsnack 554 - Kontroll på båda sidor av språkmodellen, med Daniel Mauno Pettersson
Kodsnack28 Marras 2023

Kodsnack 554 - Kontroll på båda sidor av språkmodellen, med Daniel Mauno Pettersson

Fredrik får besök av Daniel Mauno Pettersson och de diskuterar vad och hur man kan bygga på språkmodeller. Gränssnittstester, till exempel, som Daniel och hans företag ägnar sig åt.

Vi är i generativ AI:s absoluta barndom, det finns långt mycket fler saker vi inte vet om vad som kommer att hända än vad vi vet kan hända eller faktiskt har hänt.

Varför vill man kombinera AI och testning? Eller omvänt: varför har inte mer hänt kring testning? Varför skriver vi tester på ungefär samma sätt, och ofta från grunden för varje projekt trots att så mycket egentligen är lika? Testning av gränssnitt är också ett sammanhang där man faktiskt kan göra det till en styrka att generativ AI inte ger exakt samma resultat varje gång - istället får du över tid en variation på testerna som kan upptäcka nya saker. (Givetvis med utförlig loggning av vad som gjorts, hur och när.)

Ska man skriva något som är helt deterministiskt och alltid ger samma resultat så finns det redan bra verktyg.

Hur vidareutvecklar man något som inte är deterministiskt? Hur vet man att ens justeringar faktiskt gör saker bättre? Här finns utrymme för väldigt många bättre verktyg!

Man behöver ha kontroll på båda sidor av språkmodellen - man måste ju kunna analysera och försöka justera efter resultaten.

Ett stort tack till Cloudnet som sponsrar vår VPS!

Har du kommentarer, frågor eller tips? Vi är @kodsnack, @thieta, @krig, och @bjoreman på Mastodon, har en sida på Facebook och epostas på info@kodsnack.se om du vill skriva längre. Vi läser allt som skickas.

Gillar du Kodsnack får du hemskt gärna recensera oss i iTunes! Du kan också stödja podden genom att ge oss en kaffe (eller två!) på Ko-fi, eller handla något i vår butik.

Länkar Titlar
  • AI-baserad testning
  • Hela vägen upp i trappan
  • Den som råkar kunna lite programmering
  • Vår tids stora skifte
  • Generera tester
  • En helt ny typ av testning
  • Börja testa allt
  • Allt som är normalflöden
  • Deterministiskt tänk på något som inte är deterministiskt
  • En kedja av prompts
  • Kontroll på båda sidor av språkmodellen
  • Man vet ingenting om väldigt många saker

Tämä jakso on lisätty Podme-palveluun avoimen RSS-syötteen kautta eikä se ole Podmen omaa tuotantoa. Siksi jakso saattaa sisältää mainontaa.

Jaksot(715)

Kodsnack 54 - De har gått hela vägen till Haskell

Kodsnack 54 - De har gått hela vägen till Haskell

Kodsnack 54 - De har gått hela vägen till Haskell Vi snackar om programmeringsspråket Swift och lågnivågrafikramverket Metal - två av nyheterna Apple just presenterat på sin utvecklarkonferensWWDC. Av...

10 Kesä 201455min

Kodsnack 53 - Gör en Python 5

Kodsnack 53 - Gör en Python 5

Kodsnack 53 - Gör en Python 5 Kristoffer börjar berätta för Fredrik om sina öden och äventyr på svenska Pycon och tar med oss på en resa från datainsamling och bearbetning via kryptomysterier ti...

3 Kesä 201452min

Kodsnack 52 - Femte elementet i en vektor

Kodsnack 52 - Femte elementet i en vektor

Vi snackar problem med C++ och går sedan över till att diskutera kring FTL - Apples nya optimerande steg i Webkits javascriptmotor. Frustrationer ventileras över all tid som lagts på att göra Javascri...

27 Touko 201451min

Kodsnack 51 - Konsten att skeppa

Kodsnack 51 - Konsten att skeppa

Kristoffer och Tobias snackar om konsten att skeppa, varför det är så svårt att avsluta och leverera saker och hur det fungerar att skeppa saker i deras respektive arbeten. För- och nackdelar med kort...

20 Touko 20141h 4min

Ett nytt kapitel

Ett nytt kapitel

Vi som gör Kodsnack presenterar oss för nya lyssnare och berättar om nästa steg i programmets utveckling. Länkar A 30 minute skip button Kristoffer Grönlund Massive entertainment - svensk spelstudio ...

15 Touko 201423min

Error, error, error, långt ner i winsock.h

Error, error, error, långt ner i winsock.h

Kristoffer och Tobias pratar om hur det är att använda Visual Studio i Windows 8 vilket osökt leder in på diskussioner om responsiva IDE-er, fulhack i C++, unit-tester, Gophercon 2014 och mycket annat...

13 Touko 201458min

Kodsnack 49 - Min första datorrelaterade bok

Kodsnack 49 - Min första datorrelaterade bok

Vi snackar programmeringsböcker med utgångspunkt från vad Fredrik tycker efter att ha läst Version control with Git. Tobias rekommenderar en bok om Vi och vi diskuterar vad som skiljer en bra bok från...

6 Touko 201451min

Kodsnack 48 - Ragefork

Kodsnack 48 - Ragefork

Vi snackar om LibreSSL - OpenBSD-utvecklarnas fork) av OpenSSL, forks av större projekt i allmänhet och vad vi hoppas på som resultat av denna fork. På slutet en diskussion utifrån projektet att övers...

29 Huhti 201451min

Suosittua kategoriassa Koulutus

rss-murhan-anatomia
psykopodiaa-podcast
voi-hyvin-meditaatiot-2
adhd-podi
rss-rahamania
psykologia
rss-niinku-asia-on
rss-liian-kuuma-peruna
rss-hereilla
rahapuhetta
kesken
rss-duodecim-lehti
rss-tietoinen-yhteys-podcast-2
rss-vapaudu-voimaasi
rss-arkea-ja-aurinkoa-podcast-espanjasta
kehossa
rss-valo-minussa-2
rss-naiseuden-helmoissa-tiipiituokioita-marikan-kanssa
rss-koira-haudattuna
rss-osaamisen-lukot-oppimisen-avaimet