AI isbjerget
6. dec. 2023

skrevet af: Casper Greve, Dec 2023
Som ofte med innovativ teknologi genererer det massiv interesse og opmærksomhed samt en vis grad af FOMO. Dette er også tilfældet med GenAI og LLM'er. For eksempel har mange virksomheder udviklet en fortælling og en forventning om, at strategien er at "skabe dataprodukter" og "udnytte AI til fulde"…
Disse hovedpunkter, når de ses isoleret, giver mening og er noget, de fleste virksomheder bør stræbe efter, men de kommer med en omkostning og til tider en noget bagvendt tilgang...
I dag står de fleste CXO'er, der er ansvarlige for data og IT, over for to nært beslægtede områder i dataagenden:
Område A - Det essentielle grundlag
Dataarkitektur, datainfrastruktur, datastyring, datastyring, BI og rapportering, selvbetjening og dataoperationerOmråde B - Avanceret analyse
Datavidenskab, statistisk modellering, ML, Deep Learning, GenAI osv.
Begge områder er vigtige – og i de fleste scenarier nøglen – i værdiskabelsen med data. Dog er der et naturligt flow og afhængighed fra A til B. Den nødvendige fundament i A er afgørende for at lykkes med B. Med andre ord: Uden data, ingen ML eller AI. Det er så enkelt som det.
Alligevel er en fortælling eskaleret, som primært fokuserer på summen af B, mens alle elementer af A tages for givet. Problemet med denne fortælling er, at den negligerer fundamenterne og sætter mange dataledere, datateams, beslutningstagere og dataentusiaster i en vanskelig situation, da bestyrelser, ledelse, forretningsinteressenter, slutbrugere, medier – godt, de fleste af os for at være ærlige – finder den nye og fancy AI-innovation mere fascinerende, mens man udelader vejen og forudsætningerne for at komme dertil.
AI sælger billetterne; Platform Engineering, CloudOps og Data Engineering gør det muligt at udføre og lykkes med.
Efterhånden som virksomheder i stigende grad stræber efter at "udnytte AI", "blive datadrevne" eller "skabe dataprodukter", bliver afhængighederne og barriererne mellem A og B endnu mere synlige:
Ingen strategisk retning for data
Ingen vind er gunstig, hvis retningen er ukendt. Og hvis en datastrategi findes, følges den ofte ikke, kommunikeres ikke, forankres ikke, har ikke tilstrækkelig kvalitet eller er en realistisk funktionel version af teknologi- og forretningskravene. Et dokument på to sider i arkiverne er ikke en strategi.Arkitektur og platform mangler
Høje ambitioner med data er svære at realisere på legacy-systemer. Visse arkitektoniske elementer er nødvendige for at understøtte analytiske behov, skalere og være operationelle.Brugssager er ikke rigtig AI-brugssager
Fokus er alt for ofte på, hvilket værktøj der skal bruges, snarere end værdiskabelse. Identificer udfordringen først - så værktøjet. Dette gælder også for GenAI versus ML, Deep Learning osv.Lav datakvalitet, mangel på datastyring og styring
Det er ganske enkelt. Dårlige data, dårlige indsigter. Datakvalitet er ansvar, der deles af alle, og ikke bare en teknisk øvelse.Essensen af de ovennævnte barrierer er, at der er nogle grundlæggende behov, der skal være på plads i virksomheder for at "udnytte AI" fra et faktisk ROI. Solide dataprodukter eller AI-modeller bliver kun en realitet, når både grundlæggende og tilknyttede behov adresseres. Fra A til B:

Derfor er visionen og de højtflyvende citater kun værdifulde, hvis der er en forståelse, et budget og et reelt engagement bag ordene. Uden det er det umuligt for datalederen og datateamet at lykkes på lang sigt.
Ligesom luft, mad og søvn går forud for selvrealisering i Maslows behovshierarki, så går grundlæggende datadiscipliner og essentielle grundlag også forud for AI. På en lignende måde som vi tager grundlæggende behov for givet i hverdagen, må vi være forsigtige med ikke at tage grundlaget for værdiskabelse af data for givet.