AI-agenter för utvecklare. William Sundqvist (# 237)

AI-agenter för utvecklare. William Sundqvist (# 237)

Generativ AI och chattbottar som ChatGPT har förändrat hur vi interagerar med teknik. Men vad är nästa steg? I det här avsnittet av podden gästas Jonas Jaani av William Sundqvist, Lead Developer och Projektledare på Sogeti, för att djupdyka i ett av de hetaste ämnena i IT-branschen just nu: AI-agenter.

William, som har experimenterat intensivt med tekniken, delar med sig av sina praktiska erfarenheter och misstag. Från att bygga en ”super-agent” som ”gick bananas” till att skapa en hel ”farm” av specialiserade AI-agenter som samarbetar för att bygga och testa kod.

Vad är en AI-agent?

Många blandar ihop AI-agenter med vanliga chattbottar. William bryter ner utvecklingen i tre tydliga steg:

  1. Steg 1: Large Language Models (LLM)
    • Detta är vad de flesta använder idag (t.ex. ChatGPT). Du ställer en fråga, och modellen ger dig ett svar baserat på sin träningsdata.
  2. Steg 2: AI Workflow
    • Här börjar AI:n kopplas till specifika verktyg. Du kan be den att ”kolla min kalender” och den kan interagera med kalender-API:t för att ge dig ett svar.
  3. Steg 3: AI-agenter (Nästa nivå)
    • En agent har tillgång till en hel uppsättning verktyg (kalender, väder, kartor, filsystem etc.).
    • Den stora skillnaden är autonomi. Du ger agenten ett mål (t.ex. ”Planera min resa till Umeå”) och den kan självständigt planera och utföra en serie uppgifter: kolla din kalender för ledig tid, kolla vädret i Umeå, hitta en resväg på kartan och sedan presentera en färdig plan.
Att bygga en ”Vibe-Coding”-plattform

Williams mest ambitiösa projekt är att bygga en ”vibe-coding”-plattform, där en användare bara behöver skriva en idé för en hemsida, och plattformen ska automatiskt generera, testa och hosta den färdiga applikationen.

Första försöket: ”Super-agenten” som gick bananas

Williams första instinkt var att skapa en enda, kraftfull ”super-agent” och ge den en enorm lista med instruktioner: ”Du ska vara projektledare, utvecklare och testare. Du ska skriva filer, läsa filer, köra tester…”

Resultatet? Totalförvirring.

”När den börjar läsa filer så tappar den bort lite av sitt minne,” förklarar William. ”Den har en viss kontext den kan få plats med i huvudet… sen börjar de spåra ur, gå bananas.”

Agenten hade för många instruktioner och för mycket ansvar. Den tappade bort sitt slutmål så fort den började arbeta med specifika uppgifter.

Lösningen: En ”farm” av specialiserade agenter

Istället för en allsmäktig agent delade William upp ansvaret i en ”farm” av flera små, specialiserade agenter som samarbetar:

  • Projektledaren (Orchestrator): Denna agent tar emot användarens ursprungliga idé (t.ex. ”Jag vill ha en andningsövnings-app”). Dess enda jobb är att bryta ner idén till en tydlig plan och agera mellanhand.
  • Utvecklaren: Projektledaren skickar planen till utvecklar-agenten, vars enda fokus är att läsa och skriva kod och komponenter. När den är klar, rapporterar den tillbaka till projektledaren.
  • Testaren: Projektledaren tar sedan koden från utvecklaren och skickar den till testar-agenten. Testaren kör koden, letar efter buggar och rapporterar felen.

Denna cykel (PM -> Utvecklare -> PM -> Testare -> PM -> Utvecklare…) fortsätter automatiskt tills testaren godkänner applikationen och projektledaren kan presentera den färdiga produkten för användaren.

Resultatet: Funktionellt, men inte perfekt

Så, fungerade det? William berättar om ”andnings-appen” som agenterna byggde.

  • Det positiva: Agenterna lyckades skapa en fungerande hemsida med en cirkel som expanderade och krympte, precis som instruktionerna sa.
  • Det negativa: Animationen var alldeles för snabb. ”Det blir kaos om man försöker andas ikapp med det där,” skrattar William.

Slutsatsen är att agenterna kan bygga det du ber om rent tekniskt, men de saknar ännu den finess och mänskliga förståelse (i detta fall, UX-design) som krävs för en polerad slutprodukt. Jobbet förflyttas från att skriva kod till att granska och förfina den kod agenterna producerar.

De tre bästa tipsen för utvecklare som vill börja med AI-agenter

William delar med sig av sina viktigaste lärdomar:

  1. Fler (små) agenter är bättre än en (stor). Dela upp ansvaret. En agent som bara ska testa kod är mycket mer pålitlig än en ”super-agent” som ska göra allt.
  2. Låt dina verktyg ge feedback. En smart insikt från William: Han programmerade sina verktyg att skicka tillbaka ett ”tips” till agenten efter att det använts. ”OK, filen är skriven. Kom ihåg att du nu borde skicka detta till testaren.” Detta hjälper agenten att hålla sig på rätt spår utan att överbelasta dess huvudinstruktioner.
  3. Bara testa och utforska (det är billigare än du tror). Lek och experimentera. William rekommenderar att använda plattformar som Azure AI Foundry, där man kan sätta upp och köra många agenter till en mycket lägre kostnad än att använda standard-API:er som ChatGPT Plus för varje enskild uppgift.
Från kod till komplexa processer

Det finns fler exempel från flygindustrin där en ”händelse” (som ett försenat flyg) kan trigga en hel farm av AI-agenter att automatiskt:

  • Meddela cateringfirman att pausa matlastningen.
  • Omboka tankbilen.
  • Skicka ut meddelanden till passagerare.
  • Till och med förutse framtida förseningar och proaktivt föreslå innovationer.

AI-agenter är inte längre bara science fiction. De är ett kraftfullt nytt sätt att bygga autonoma system, och som William visar, är det upp till utvecklare att börja experimentera och definiera hur de bäst kan användas.

Vill du se Williams agent-farm i praktiken? En kompletterande video kommer att visa arkitekturen och de fascinerande (och ibland komiska) loggfilerna från när agenterna ”pratar” och ”bråkar” med varandra för att lösa en uppgift.

https://youtu.be/NzS1q9sGOP8

Willian Sundqvist, Jonas Jaani (23:47)

Videoversion av poddavsnittet: https://youtu.be/R_nX0C8sV_c

Alla avsnitt av digitaliseringens podcast Effekten

Prenumerera:

Apple Podcasts

Spotify:

https://open.spotify.com/show/5Z49zvPOisoSwhwojtUoCm

Är du vår nästa gäst? Maila oss på info(a)effekten(punkt)se

Denne episoden er hentet fra en åpen RSS-feed og er ikke publisert av Podme. Den kan derfor inneholde annonser.

Episoder(250)

AI går på autopilot – Autonoma Agenter Fredrik Scheja (# 244)

AI går på autopilot – Autonoma Agenter Fredrik Scheja (# 244)

Har du vant dig vid att ställa frågor till generativ AI och få smarta svar? Spänn fast säkerhetsbältet, för nästa stora kliv är redan här. I detta avsnitt av Effekten tar Jonas och Fredrik diskussione...

31 Mai 31min

AI och konsultrollen. Expert in the loop. Jan Bidner (# 243)

AI och konsultrollen. Expert in the loop. Jan Bidner (# 243)

Är vi på väg att bli glorifierade kvalitetsgranskare åt maskiner, eller ger AI oss superkrafter att lösa mer komplexa problem? I detta avsnitt gästar Jan Bidner, förändringsledare och digitaliseringss...

27 Apr 27min

Användarfokuserad AI. Mikael Norbäck (# 242)

Användarfokuserad AI. Mikael Norbäck (# 242)

Vi har pratat färdigt om hur häftig AI-tekniken är. Nu är det dags att fråga oss vad vi faktiskt ska ha den till. I det här avsnittet av Effekten dyker vi ner i begreppet användarfokuserad AI. Vi kons...

31 Mar 23min

Autonoma kollegor – AI-agenter. Christian Forsberg (# 241)

Autonoma kollegor – AI-agenter. Christian Forsberg (# 241)

I avsnittet dyker vi djupt ner i nästa stora skifte inom artificiell intelligens: AI-agenter. Tillsammans med Christian Forsberg, CTO på Sogeti, reder vi ut vad en agent faktiskt är, hur de redan idag...

24 Feb 25min

Smartare vårdinformation. Lars Tomasson, Thomas Stenbäck (# 240)

Smartare vårdinformation. Lars Tomasson, Thomas Stenbäck (# 240)

När en misstanke om cancer dyker upp förändras allt. Inte bara för den drabbade utan också för närstående. I det här avsnittet av Effekten möts därför tre olika erfarenheter av prostatacancer: den som...

3 Feb 25min

Den digitala skogen. Sverker Danielsson (# 239)

Den digitala skogen. Sverker Danielsson (# 239)

Vad händer när skogsbruket flyttar in i den virtuella världen? I detta avsnitt av Effekten tar vi oss ut i ”den digitala skogen” för att förstå hur avancerad teknik som laserskanning, AI och autonoma ...

19 Jan 24min

RegTech och framtidens bolagsstyrning – manuellt kaos till digital kontroll. Julia Haglind (# 238)

RegTech och framtidens bolagsstyrning – manuellt kaos till digital kontroll. Julia Haglind (# 238)

Är du den ”företagsförälder” som ständigt jagar kollegor för underskrifter och uppdateringar av policys? Ser er bolagsstyrning ut som en härva av Word-dokument, Excel-filer och mailtrådar? Då är det d...

30 Des 202524min

Populært innen Business og økonomi

stopp-verden
lydartikler-fra-aftenposten
dine-penger-pengeradet
e24-podden
rss-penger-polser-og-politikk
rss-borsmorgen-okonominyhetene
rss-skravla-gar
utbytte
finansredaksjonen
pengepodden-2
livet-pa-veien-med-jan-erik-larssen
rss-pa-konto
stormkast-med-valebrokk-stordalen
morgenkaffen-med-finansavisen
tid-er-penger-en-podcast-med-peter-warren
liberal-halvtime
pengesnakk
okonomiamatorene
rss-markedspuls-2
lederpodden