11 min read

🔼 Vem vinner AI-rejset? Det stĂ€ngda eller det öppna?

🔼 Vem vinner AI-rejset? Det stĂ€ngda eller det öppna?

Hur ser framtiden för AI ut? Och vilka kommer att komma ut som AI-vinnare? Ja, det Àr 10.000-kronorsfrÄgan (fast i nutid ^jÀttemycket mer stÄlar) som rekordmÄnga tech-mÀnniskor, investerare, beslutsfattare, politiker och vanliga dödliga klurar kring just nu.

FrĂ„gan om AI-vinnare Ă€r lĂ„ngt ifrĂ„n en enkel đŸ„œ att ge sig pĂ„. Snarare komplex, motsĂ€gelsefull, proppad av grĂ„zoner och frĂ„getecken. Dessutom Ă€r jag inte sjĂ€lv nĂ„gon programmerare som kan granska kod, utan en simpel teknikbesatt ekonom. ÄndĂ„ tĂ€nkte jag försöka attackera denna ganska tekniska frĂ„ga (dock sĂ„ icke-tekniskt beskrivet som jag bara kan).

Om jag irrar bort mej bland resonemangen. Om jag tappar dig pĂ„ vĂ€gen. Och/eller om jag har missuppfattat vissa saker. SORRY! Jag har gjort mitt bĂ€sta för att sĂ€tta pĂ„ mig den pedagogiska hatten och hĂ„lla tungan rĂ€tt i munnen. Och samtidigt krama om ansiktet đŸ€—#HuggingFace. Vad sjutton det sista betyder, ja det kommer du att veta snart.

NĂ€r det kommer vem-vinner-AI-rejset finns det dessutom massvis av bĂ„de möjligheter och risker som inte fick plats i just den hĂ€r texten – dĂ€remot i en massa annat som jag har skrivit tidigare (bland annat hĂ€r, hĂ€r och hĂ€r).

Nu till temat och vem som kan tĂ€nkas vinna; AI-vĂ€rldens David:s eller Goliat:s. Och i slutet av denna lĂ„nga post kommer argument för nĂ€r man som företag / organisation bör vĂ€lja đŸ“Ș stĂ€nga vs mer 📭 öppna AI-modeller som grund nĂ€r man utvecklar egna AI-lösningar.

DÄ kör vi!

/ Judith


Hur ser dÄ framtiden för AI ut?

Tja, det finns framför allt tvÄ olika vÀgar som utvecklingen skulle kunna ta; det stÀngda och/eller det öppna spÄret.

SpĂ„r 1: Giganterna vinnerđŸ„‡đŸ„ˆđŸ„‰

🔼 En framtid av ett fĂ„tal stora tech-bolag som med stĂ€ngda modeller kammar hem det mesta

Det vi har sett sĂ„ hĂ€r lĂ„ngt i AI-utvecklingen Ă€r att ett fĂ„tal redan ledande techbolag – sĂ„ kallad Big Tech – varit de som imponerat och dominerat. Förutom Alphabet (Google), Meta, Amazon och Microsoft hittar vi ocksĂ„ OpenAI sĂ„klart (backade av Microsoft), men ocksĂ„ spelare som Anthropic (backade av Amazon & Google). Och ytterligare nĂ„gra till. Fram till nu har modeller frĂ„n den hĂ€r typen av bolag legat sĂ„dĂ€r 6-18 mĂ„nader före i utvecklingen.

Anledningen att dessa giganter har haft ett försprÄng nÀr det kommer till AI beror pÄ att det har krÀvts ett gÀng kritiska pusselbitar för att kunna trÀna upp stora imponerande AI-modeller. Pusselbitar som bestÄr av enorma mÀngder data (lÀs hela internet + lite till), massvis av pengar (sÄdÀr över 100 miljoner dollar) och teknisk kompetens för att utveckla de absolut bÀsta grundmodellerna; Foundation Models och LLMs.

Antingen gÄr vi mot en framtid dÀr dessa vinnare utvecklar en Ànnu större AI-överlÀgsenhet och kammar hem hela vinsten. Ett fÄtal tech-giganter som tillsammans skapar en form av oligopol som stÀnger ute alla andra (hey, för om ett fÄtal modeller Àr mycket bÀttre, varför skulle vi vÀlja nÄgot annat?). NÄgot som skulle kunna leda till en koncentration av makt och ekonomisk vinning som vi aldrig tidigare har skÄdat. Speciellt om AI visar sig ha den transformerande effekten pÄ ekonomin och samhÀllet som mÄnga förutspÄr.

Och deras modeller, ja de har fram tills nu framför allt varit stÀngda (inte open source). Sannolikt för att kunna behÄlla hemligheten till alla imponerande framsteg för sig sjÀlva. Och för att kunna ta bra betalt. I artikeln hÀr under har jag tidigare dykt ner i vad just ett sÄdant utfall skulle kunna betyda.

Kampen om AI intensifieras – dĂ€r vinnaren tar alltđŸ„‡och Ă€nnu mer đŸ„Š
Turbulensen kring OpenAI har aktualiserat en rad frÄgor

Men att vinnarna tar allt Ă€r lĂ„ngt ifrĂ„n sĂ€kert. LĂ„t oss tittat pĂ„ det andra spĂ„ret.

SpÄr 2: En mer öppen AI-utveckling

🔼 En framtid dĂ€r mĂ„nga fler vinnare fĂ„r plats

Eller sĂ„ gĂ„r vi mot en framtid dĂ€r en massa mer öppna modeller börjar ta fart och bli tillrĂ€ckligt vassa för att kunna konkurrera. DĂ€r bĂ„de du och jag anvĂ€nder olika mer öppna modeller i vĂ„r vardag. Men ocksĂ„ dĂ€r företag och organisationer vĂ€ljer dessa modeller som grund nĂ€r de utvecklar egna AI-tjĂ€nster. Och öppen innebĂ€r till stor del open source. Vad det betyder i AI-sammanhang kommer jag snart att komma in pĂ„, lĂ„t oss först reda ut begreppet open source. 


Open source, eller öppen kĂ€llkod pĂ„ svenska, Ă€r inget nytt under solen. NĂ€r jag sjĂ€lv började jobba med internet 2006 var det mestadels open-source-grejer som vi sysslade med. Vi byggde vĂ„ra sajter i programmeringssprĂ„ket PHP, anvĂ€nde publiceringssystemet Wordpress och databasen MySQL för datalagring. Allt open source, men inte bara nĂ€r det kommer till tekniken. Vi gillade ocksĂ„ att prata om internet som en öppen och fri plats. TillĂ€ggas bör nĂ€mligen att öppen kĂ€llkod inte bara Ă€r en teknisk frĂ„ga utan för mĂ„nga ocksĂ„ ett sĂ€tt att se pĂ„ teknik – dĂ€r dess föresprĂ„kare ofta lyfter aspekter som transparens, samarbete och gemenskap. LĂ€s mer hĂ€r.

Men open source var ocksÄ ganska rörigt (liksom stora delar av internet pÄ den tiden). Och det var jÀttemycket krÄngligare att skapa saker om man inte kunde koda jÀmfört med idag.

Bild frĂ„n 24 Hour Business Camp 2008 (jag lĂ€ngst ner till vĂ€nster)

PÄ samma sÀtt som det sedan lÀnge har funnits öppen kÀllkod pÄ internet sÄ finns den öppna modellen Àven nÀr det kommer till AI.

AI-modeller med öppen kÀllkod innebÀr att alla inte bara kan anvÀnda dessa modeller, utan ocksÄ att utvecklare frÄn hela vÀrlden kan vara med och göra dem Ànnu bÀttre. Förutom att kÀllkoden finns öppen Àr Àven datan som har anvÀnts för att trÀna modellen tillgÀnglig för alla (Ätminstone i skolboksexemplet). Om man vill anvÀnda en öppen AI-modell, ja dÄ kan man ganska fritt bestÀmma hur man vill anvÀnda bÄde modellen och datan vilket ger stor flexibilitet. Man kan alltsÄ knÄda om dessa modeller genom sÄ kallad fine tuning, sÄ att de passar för det som man vill göra.

🚹 Just detta “knĂ„da om” betyder ocksĂ„ att open source-AI kommer med en hel del utmaningar och risker. Inte minst nĂ€r det kommer till missbruk av tekniken. Det Ă€r framför allt öppna AI-modeller som idag anvĂ€nds för att skapa deep fakes i syftet att luras och vilseleda – oavsett om det gĂ€ller kriminell aktivitet eller att manipulera politiska val. Men ocksĂ„ för att skapa riktigt kassa saker som det hĂ€r âžĄïž It’s Not Just Taylor Swift: AI-Generated Porn Is Targeting Women And Kids All Over The World.

LÄt oss nu addera lite tekniska termer. Samt för- och nackdelar med de tvÄ alternativen

Jag brukar försöka undvika buzzwords i den mĂ„n det Ă€r möjligt. Men i det hĂ€r fallet behöver vi addera lite begrepp. SĂ€g först hej till termen “proprietĂ€ra modeller”.

âžĄïž ProprietĂ€ra AI-modeller (de stĂ€ngda)

🙄 Vad sjutton betyder ordet “proprietĂ€r”? Jo, det Ă€r ett adjektiv som betyder en persons eller ett företags egendom.

ProprietĂ€ra AI-modeller Ă€r modeller dĂ€r man inte delar med sig av sjĂ€lva grundtekniken utan “bara” Ă„tgĂ„ng till tillĂ€mpningen (ofta via API:er). KĂ€llkoden Ă€r stĂ€ngd vilket betyder att ingen utanför exempelvis OpenAI kan se hur deras algoritmer, datamĂ€ngder och teknik bakom ser ut. För proprietĂ€r modeller finns restriktioner kring hur de kan anvĂ€ndas. Som individ eller företag kan man inte fritt justera modellerna pĂ„ de sĂ€tt man önskar utan Ă€r ofta mer begrĂ€nsad nĂ€r det kommer till anpassning.

Exempel pÄ proprietÀr modell Àr:

NÄgra av fördelarna med proprietÀra AI-modeller kommer hÀr:

  • I dagslĂ€get Ă€r det de stĂ€ngda modellerna som fortfarande levererar bĂ€st resultat rent tekniskt.

🏆 LMSYS Leaderboard Ă€r en plattform dĂ€r utvecklare rankar olika LLM:s (sprĂ„kmodeller) utifrĂ„n hur de presterar. I skrivande stund Ă€r de högst 11 rankade modellerna proprietĂ€ra (med undantag av en modell frĂ„n Alibaba som jag inte vet nĂ„got om). PĂ„ plats 12 hittar vi den första öppna modellen frĂ„n Mistral. Och pĂ„ plats 17 Llama 2 frĂ„n Meta + Microsoft. GĂ„ in och kolla sjĂ€lv hĂ€r: huggingface.co/leaderboard


  • Ur ett anvĂ€ndarperspektiv Ă€r proprietĂ€ra modeller ofta enkla att anvĂ€nda (via snygga grĂ€nssnitt) och det gĂ„r snabbt Ă€ven för företag att komma upp pĂ„ AI-banan med hjĂ€lp av API:er.
  • Ur AI-bolagets (giganternas) perspektiv innebĂ€r “hĂ„lla koden hemlig” att det blir svĂ„rare för andra att kopiera hemligheten. (Samtidigt gĂ„r man miste av den kraften som finns i en open-source-community som hjĂ€lper till att utveckla modellen vidare).
  • ProprietĂ€ra AI-modeller kommer ofta med licensavgifter / prenumerationskostnader vilket Ă€r toppen för AI-bolaget som givetvis vill tjĂ€na pengar. Och man kan ta duktigt betalt för Ă„tkomst om modellen Ă€r tillrĂ€ckligt imponerande. (En hög prislapp inte lika toppen för slutanvĂ€ndare och företag som vill anvĂ€nda AI-modellen för egna tillĂ€mpningar).
  • En fördel för samhĂ€llet och vĂ€rlden Ă€r att dessa modeller Ă€r lĂ€ttare att begrĂ€nsa nĂ€r det kommer till missbruk. Ber du ChatGPT hjĂ€lpa dig med kriminell aktivitet sĂ„ fĂ„r du högst sannolikt ett nej. Eller om du ber en annan stĂ€ngd modell att generera tvivelaktiga bilder pĂ„ kĂ€nda politiker, ja dĂ„ fĂ„r du förhoppningsvis ocksĂ„ ett nix-pix.

âžĄïž De mer öppna AI-modellerna (olika grader av open source)

Vi har redan gÄtt igenom att öppna modeller i kontexten av AI betyder att kÀllkod, data och community Àr i centrum av utvecklingen. Och att utvecklare frÄn vÀrldens alla hörn kan vara med och förbÀttra modellerna. NÀr det kommer till öppna modeller Àr Àven licensavgifter antingen slopade eller lÀgre Àn för proprietÀra modeller.

LÄt oss lista nÄgra exempel pÄ mer öppna AI-modeller.

NÄgra av fördelarna med öppna AI-modeller Àr:

  • Med öppen kĂ€llkod kan forskare, utvecklare och andra intressenter granska hur AI-modellerna funkar. NĂ„got som ger en större transparens nĂ€r det kommer till sĂ„dant som bias, fel och sĂ€kerhetsbrister.
  • De öppna modellerna kan innebĂ€ra att innovation och förbĂ€ttringar gĂ„r snabbare (om de blir poppis dvs).
  • Eftersom kostnaden Ă€r lĂ€gre kan fler fĂ„ tillgĂ„ng till avancerade AI-funktioner utan att det behöver kosta skjortan. Förutsatt att man kan lösa den tekniska biten med att anvĂ€nda och justera modellen det vill sĂ€ga.
  • Ofta Ă€r open source-modeller mer flexibla och gĂ„r att anpassa bĂ€ttre för olika tillĂ€mpningsomrĂ„den.
  • Och! Det som Ă€r intressant med öppna AI-modeller för mĂ„nga företag, ja det Ă€r det faktum att man inte bara kan kontrollera modellerna utan ocksĂ„ datan. NĂ€r data privacy Ă€r extra viktigt, ja dĂ„ kan open source kĂ€nnas som ett bra alternativ.

Även om de öppna modellerna (Ă€nnu) inte kan matcha OpenAI eller Google nĂ€r det kommer till teknisk nivĂ„ Ă€r det inte alltid som bĂ€st-i-klassen behövs. Det finns en massa tillĂ€mpningar dĂ€r good enough is perfect. I mĂ„nga fall Ă€r det andra aspekter som Ă€r viktigare. Som att modellerna gĂ„r att justera eller att man kan styra över hur datan anvĂ€nds och lagras.

Utmaningen med att vĂ€lja AI-lösningar med öppen kĂ€llkod Ă€r dock att det ofta Ă€r krĂ„ngligare – dĂ„ det bĂ„de krĂ€ver teknisk kompetens och egen infrastruktur (pĂ„ samma sĂ€tt som det Ă„r 2006 var krĂ„ngligt att sĂ€tta upp en Wordpress-sajt). Dock hĂ„ller detta pĂ„ att förenklas i och med att olika verktyg och ramverk utvecklas för att förenkla fine-tuning, hantering av data och tillĂ€mpning. Den största plattformen dĂ€r allt samlas har det nĂ„got mĂ€rkliga namnet đŸ€— Hugging Face.


đŸ€— Hugging Face Ă€r en plattform och community för utveckling och forskning inom AI. HĂ€r publiceras information om olika modeller, API:er med mera. PĂ„ sajten finns över 500,000 modeller publicerade och över 100,000 olika datasets. LĂ€nk: huggingface.co


Innan vi avslutar det dĂ€r med öppna modeller bör tillĂ€ggas att en del av dem kommer med restriktioner gĂ€llande anvĂ€ndning, exempelvis att de inte kan anvĂ€ndas för kommersiellt bruk utan bara för “non-commercial research purposes”.

âžĄïž I verkligheten Ă€r mĂ„nga modeller en mix av stĂ€ngt & öppet

I realiteten Àr det dock inte sÄ enkelt som att AI-modeller antingen Àr stÀngda eller öppna. Snarare Àr mÄnga en mix av det slutna och det öppna. DÀr det dessutom inte bara finns olika nivÄer av öppenhet utan ocksÄ delade meningar kring vad som kan kallas för open source (en strikt definitionen finns dock hÀr). Vissa modeller som hÀvdar att de Àr öppna kan vara det utifrÄn vissa aspekter, men inte hela vÀgen open source. Snurrigt, jag vet. Vill du nörda ner dig mer i detta kan jag tipsa om den hÀr artikeln.

Ett exempel pÄ mix Àr franska Mistral vars affÀr bestÄr av tvÄ delar; en modell som Àr öppen och gratis för alla. Och en annan del som Àr stÀngd och pÄminner om OpenAI:s affÀrsmodell (att ta betalt av företag för att komma Ät modellen via API).

“The Mistral AI strategy here clearly aims to be a hybrid, ‘best of both worlds’ approach” - AI Business

Börjar du AI-tröttna? LÄt oss först slÀnga in en GIF för att lÀtta upp. Och sedan prata lite om trender vilket kanske kan fÄ dig att piggna till.

Giganterna / Big Tech har nÀmligen allt mer börjat lansera mer öppna modeller. Varför dÄ?, tÀnker du kanske. LÄt oss kika pÄ det.

En ny trend? Big Tech satsar mer pÄ öppna modeller

Först ut bland Big Tech (sĂ„vitt jag och ChatGPT vet) att slĂ€ppa öppna och hyfsat imponerande AI-modeller var Google som 2018 slĂ€ppte BERT. Ett mer aktuellt exempel Ă€r Meta vars modeller i familjen Llama Ă€r “open source” (Ă€ven om vissa menar att de inte Ă€r speciellt öppna). Den senaste modellen Ă€r i skrivande stund Llama 2 som du kan lĂ€sa mer om hĂ€r.

Yann LeCun, Chief AI Scientist pĂ„ Meta, har i en intervju med TIME sagt sĂ„ hĂ€r âŹ‡ïž (lĂ€s hela intervjun hĂ€r).

“The future has to be open source, if nothing else, for reasons of cultural diversity, democracy, diversity.” - Yann LeCun, Chief AI Scientist, Meta

Även Google börjar fĂ„ fart nĂ€r det kommer till öppenhet. Sedan en tid har man bland annat modellerna PaLM 2 och AlphaFold. Och för tvĂ„ veckor sedan slĂ€ppte man sin â€œĂ¶ppna” modell Gemma som Ă€r en light-version av den större modellen Gemini. Men dĂ€r Ă€ven Gemma har kritiserats för att kalla sig för â€œĂ¶ppen” âžĄïž Google's Latest AI Language Models Are Open Weight, Not Open Source (Forbes).

Vilket spÄr kommer att vinna?

🔼 LĂ„t oss nu prata framtid. Som vanligt med framtiden sĂ„ vet vi inte vem som kommer att dominera; de stĂ€ngda eller öppna AI-modellerna. Observera att jag skriver dominera den hĂ€r gĂ„ngen istĂ€llet för vinna. Sannolikt Ă€r nĂ€mligen att vi kommer att fĂ„ se dem bĂ„da. Antingen existera sida vid sida, eller till och med samarbeta med varandra och/eller komplettera varandra.

🩓 Jag tror alltsĂ„ inte pĂ„ en ett antingen eller, utan ett zebrarandigt mellanting dĂ€r vi anvĂ€nder olika modeller för olika tillĂ€mpningar.

  • I vissa fall kommer i-absoluta-framkant-teknik sannolikt att vara viktigt för oss. Och dĂ„ kanske vi vĂ€ljer proprietĂ€ra modeller. Detta kan tĂ€nkas att gĂ€lla bĂ„de för oss som individer (att vi exempelvis betalar för ChatGPT), men ocksĂ„ för utvecklare och företag som betalar för att komma Ă„t modellen via API. Detta gĂ€ller framför allt nĂ€r vi vill lösa uppgifter av stilen general-purpose.
  • I en massa andra sammanhang kommer i-absoluta-framkant-teknik inte att vara nödvĂ€ndigt. DĂ€r good enough rĂ€cker för massvis av tillĂ€mningar. Framför allt nĂ€r vi behöver anpassa vĂ„ra lösningar till specifika och smala uppgifter.
  • Stora proprietĂ€ra modeller som GPT4 (OpenAI) och Gemini (Google) kommer sannolikt ocksĂ„ att vara för dyra för mĂ„nga affĂ€rscase. NĂ„got som gör att organisationer kommer att vĂ€lja billigare öppna lösningar. Eller mindre proprietĂ€ra modeller som inte Ă€r lika dyra.

Vill du lĂ€sa mer om ett liknande resonemang kan du göra det i den hĂ€r superbra artikeln âžĄïž Will Enterprise AI Models be “Winner Take All? (bilden nedan kommer frĂ„n artikeln).

Nu behöver vi runda av 😅

Jisses vad mycket begrepp och tekniskt snack. Snyggt jobbat till alla er som tog er hela vÀgen hit!

Avslutningsvis kommer hĂ€r 16 exempel pĂ„ företag som har utvecklat egna AI-lösningar med hjĂ€lp av open source-modeller âžĄïž How enterprises are using open source LLMs: 16 examples. Och du har garanterat lĂ€st om Klarnas AI-assistent för kundservice som har utvecklats med OpenAI:s proprietĂ€ra modell som grund.

/ Judith

âžĄïž Missa inte att prenumerera pĂ„ mitt nyhetsbrev Plötsligt i Framtiden pĂ„ Substack! DĂ€r fĂ„r du veckovisa trendspaningar pĂ„ temat teknik och hĂ„llbarhet.