DeepSeek er blandt de mest downloadede i Appstore efter nyheden om den kinesiske sprogmodel kom frem.

DeepSeek giver os et godt udgangspunkt at arbejde med

”Der er ingen tvivl om, at ChatGPT er højere kvalitet i forhold til specifikke opgaver, men generelt er DeepSeek god nok. Man kan sige, at den fint kan bruges til rugbrødsarbejde, så det bliver gjort væsentligt mere besparende”, mener PROSAs it-politiske rådgiver.

Nyheden om den kinesiske sprogmodel DeepSeek, som tilsyneladende kun har kostet 6 millioner dollars at udvikle, er mere strømbesparende og næsten lever op til konkurrenter som ChatGPT i kvalitet, er en god nyhed. 

Det mener Ole Tange, der er IT-politisk rådgiver i de IT-ansattes fagforening PROSA.

”Man kan diskutere, om det er helt rendyrket open source, når vi kan se tabellerne, men ikke ved, hvordan den er blevet trænet. Men vi kan downloade tabellerne og arbejde videre med dem selv, og endnu bedre, vi kan køre dem på egen pc, så vi ikke deler data med andre,” siger Ole Tange.

Hvis det er korrekt, at træningen er sket for så få midler, så kan det få væsentlige konsekvenser for træningen af fremtidens LLM'er. Det er en god nyhed for miljøet.


DeepSeek blev grundlagt i 2023 af Liang Wenfeng i Hangzhou, en by i det sydøstlige Kina. Siden er det gået stærkt, og på få dage har sprogmodellen taget verden med storm.
Ole Tange har selv testet DeepSeek siden fredag, og sat den op mod ChatGPT4o i flere test.

”Der er ingen tvivl om, at ChatGPT er højere kvalitet i forhold til specifikke opgaver, men generelt er DeepSeek god nok. Man kan sige, at den fint kan bruges til rugbrødsarbejde, så det bliver gjort væsentligt mere strømbesparende”, fastslår han.

Ole Tange fortsætter:

”Jeg har selvfølgelig også lavet Tiananmen testen på den, altså henvisning til nedslagtningen af studerende, som skete i 1989 i Kina, men som den kinesiske regering har fjernet fra al intern debat, og set hvordan DeepSeek ændrer mening i svaret undervejs, sådan som flere medier også gjorde i går. Det tyder på, at der sker en efterbehandling af svaret, og spørgsmålet er, om samme efterbehandling følger med, hvis man kører den på ens egen PC; det tror jeg nemlig ikke”, siger han.

Generelt mener Ole Tange, at DeepSeek dermed er et godt udgangspunkt for danske udviklere at arbejde videre med. Det kinesiske firma hævder, at dets model kan trænes på 2.000 specialiserede chips sammenlignet med anslået 16.000 for førende modeller.

Prisen på 6 millioner dollars og kravet til computerkraft står i skærende konstrast til de seneste meldinger fra centrale amerikanske techgiganter.

Meta har for nylig sag, at selskabet, der også står bag Facebook og Instagram vil bruge op mod 65 milliarder dollars i år på AI-udvikling. Sam Altman, administrerende direktør for OpenAI, sagde sidste år, at AI-industrien ville have brug for billioner af dollars i investeringer for at støtte udviklingen af efterspurgte chips, der er nødvendige for at drive de el-hungrende datacentre, der kører sektorens komplekse modeller.

”Grib den. Det er skønt, at der et mindre ressourcekrævende værktøj som virker OK. Og hvis det er korrekt, at træningen er sket for så få midler, så kan det få væsentlige konsekvenser for træningen af fremtidens LLM'er. Det er en god nyhed for miljøet. Og kan man lave få samme resultat med færre chips, så bliver der behov for færre chips. Måske også derfor fik Nvidias aktier fik en kæmpe lussing i går, da nyheden om Deepseeks resultater spredte sig, siger Ole Tange.,

Data bliver høstet for at blive brugt til egen vinding og fordel, om det så er en stat eller en techgigant.


Han henviser til et tab på ca. 1.000 milliarder dollars, hvor særligt mikrochip-producenten Nvidia blev ramt hårdt.
Eksperter har kaldt det for et ”Sputnik”-øjeblik, med reference til dengang Sovjet tog føringen i rumkapløbet med USA. Nu bare med kinesisk dominans inden for AI-udvikling.

”Der er naturligvis en bekymring for, om kineserne nu kan snuppe vores data. Og den er relevant og vigtig. Men man skal bare huske på, at det samme gælder de amerikanske sprogmodeller. Data bliver høstet for at blive brugt til egen vinding og fordel, om det så er en stat eller en techgigant. Netop derfor er muligheden for at køre modellen på eget udstyr så vigtig, så holder du nemlig dine data for dig selv”, fastslår Ole Tange.

 


Læs også...

Virtual reality er trådt ind hos sundhedsvæsenet. Senest er VR-briller blevet en del af hverdagen på flere hospitaler, hvor de giver patienter et…

En stor, global undersøgelse viser et tydeligt ønske om bedre balance mellem privatliv og arbejde. Det er første gang, at det bliver højere…

I Tyskland har over 70 procent af virksomhederne ifølge Eurostat svært ved at få fat i de rette it-kompetencer. I Danmark gælder det halvdelen af…

Presset økonomi i Rigspolitiet betyder, at Koncern IT, der står for politiets it-udvikling og it-drift skal spare 50 årsværk. Processen med…

Det bekymrer de it-ansattes fagforening, PROSA, at der trods anstrengelser for at skærpe cybersikkerheden herhjemme er pivåbent for, hvordan køb…

En global rangliste har et dansk hackerhold på førstepladsen, og det sætter en streg under, at Danmark er i den internationale hacker-elite.…

De store blev rigere og mere magtfulde, men nedenunder brød et oprør også igennem fra lovgivere og bekymrede borgere. "Brainrot" blev årets ord i…

Måske har Microsoft knækket koden til, at vi kan få AI lokalt i smartdevices. I dag er strømforbruget alt, alt for massivt. Tilsæt optiske chips, og…

En gruppe IT-undervisere har lavet seks nye spil, der skal øge danskernes viden om cybersikkerhed. Spillene er et nyt og underholdende værktøj, der…

Forskere går sammen med erhvervslivet om et nyt center, der skal understøtte fabrikation af mikrochips i Danmark. Det nye center ligger på DTU, og det…