Hvad er machine learning?

Allerede i 1959 definerede Arthur Lee Samuel, pioner inden for kunstig intelligens og selvlærende spil, machine learning som "the field of study that gives computers the ability to learn without being explicitly programmed". Det opsummerer grundlæggende begrebet, men der er siden kommet mange og mere detaljerede bud blandt andet fra udviklingshuse og undervisningsinstitutioner.

SAS Institute, som er en af de helt store spillere inden for data analytics, bruger denne formulering på sin hjemmeside: "Machine learning is a method of data analysis that automates analytical model building. Using algorithms that iteratively learn from data, machine learning allows computers to find hidden insights without being explicitly programmed where to look." 

Denne definition medtager et vigtigt element i machine learning: Læringen opstår ved gennem dataanalyse af et meget stort antal eksempler at bygge og løbende forbedre en model, der kan bruges af en algoritme til at genkende mønstre og efterfølgende returnere gode forudsigelser og svar på det formulerede problem. 

En værktøjskasse

Uddannelsesinstitutioner, der har taget machine learning ind som pensum, har også haft behov for at komme med en kort og præcis definition. Datalogisk Institut, Aarhus Universitet, definerer machine learning således i sin kursusoversigt:

"Machine learning handler om automatiske metoder til at lave præcise forudsigelser eller tage anvendelige beslutninger baseret på tidligere observationer og erfaringer. Machine learning kombinerer matematisk modellering, statistik og sandsynlighedsregning med algoritmik og optimering."

Denne beskrivelse afslører også, at machine learning i høj grad er tværdisciplinær og kan betragtes som en værktøjskasse, man kan gribe i til udvikling af den specifikke applikation. 

Supervised, unsupervised og reinforcement

Machine learning opdeles typisk i nogle underkategorier. Nedenfor ses de tre kategorier, man underviser i på machine learning-kurset på Datalogisk Institut, Aarhus Universitet. Beskrivelserne er baseret på input fra specialkonsulent Allan Grønlund, der underviser på kurset. 

Supervised learning

Baseret på eksempeldata, eksempelvis billeddata, der hvert er blevet tagget med, hvad det er et billede af, udleder supervised learning-mønstre i eksemplerne, der kan bruges til at udlede den korrekte label for det givne input. Disse mønstre kan funktionen så anvende i forsøg på at genkende data uden label og derved give dem en label. Outputtet af supervised learning-algoritmen er en funktion, der gør netop det.

To af de simpleste supervised learning-algoritmer er en algoritme, som finder den bedste lineære funktion, der passer med eksempeldataene og en funktion, der på et givet input returnerer en label for det punkt i eksempeldataene, der minder mest om inputpunktet.

En anden variant er deep learning, hvor algoritmen finder et godt ”dybt neuralt netværk” til at finde mønstre. Disse dybe neurale netværk kan definere/approksimere en bred vifte af funktioner og beskrives typisk som en serie af lag, der hver laver en række lineære kombinationer af outputtet af det tidligere lag og derefter sender resultaterne gennem en ikke-lineær transformation og videre til det næste lag. Så det dybe kommer af, at dataene går igennem mange (ikke-lineære) transformationer for at lave mønstergenkendelsen, inden der tages en beslutning om, hvilken label inputtet skal have. Det er disse dybe netværk, der har været med til at revolutionere billed- og talegenkendelse igennem de seneste år.

Unsupervised learning

Her arbejder algoritmen på unlabeled data, hvor man ønsker at finde mønstre og strukturer, som eksempelvis kan anvendes til at identificere og gruppere objekter, der minder om hinanden. Kan for eksempel anvendes til analyse af kundeadfærd med henblik på at målrette reklameindsatser.

Reinforcement learning

Minder om de to andre, men trækker på spilkonceptet, hvor en agent interagerer med det omkringliggende miljø, tager en bestemt aktion, hvorved der sker en ændring i miljøet. Algoritmen "lærer ved at spille spillet" og optimeres dermed til at opnå noget bestemt. Anvendes eksempelvis i kontrolsystemer og tenderer noget, man kunne kalde kunstig intelligens. 


Læs også...

Hvor kommer hackerne fra? Hvad har krigen i Ukraine betydet for cyberkriminaliteten? Og hvor godt rustede er vi egentlig mod truslerne?…

Vi har set flere eksempler på, at virksomhedsplatforme misbruger begrebet 'selvstændig' for at undgå omkostninger til for eksempel løn under sygdom og…

Hvis du er blevet sagt op eller selv har valgt at fratræde en stilling, så har du mulighed for at få fri med løn til den nødvendige jobsøgning og til…

Uddannelse i it-arkitektur samler programmering, design og forretningsforståelse under en paraply. Den er skræddersyet til mange virksomheders krav og…

Ny forskning peger på, at du selv kan gøre en del for at forebygge demens. I det hele taget har de senere års forskning fokuseret på, hvad både kost,…

Prøv dig frem. Der er nemlig forskel på, hvad man lærer på universitetet, og hvad man anvender i praksis, når man står i et datacenter. Det fortæller…

En gruppe it-specialister sørger for, at vi overhovedet kan bruge internettet uden at sidde fast i trafikpropper eller ryge de forkerte steder hen. De…

I december 2023 startede 25-årige Emil i cyberværnepligten på Ryes Kaserne i Fredericia. Han håber, at han med den særlige værnepligt i bagagen kan…

Når det hele brænder, og et hackerangreb er i gang, bevarer Christian Henriksen roen og overblikket – det har han nemlig lært i Forsvaret, hvor han…

For fire år siden startede de første cyberværnepligtige i Forsvaret, og nu er hold otte i gang på kasernen i Fredericia. Forløbet klæder de unge på…