Som ofte med innovativ teknologi, skaber det massiv interesse og opmærksomhed, samt en vis grad af FOMO. Det er også tilfældet med GenAI og LLM'er. For eksempel har mange virksomheder udviklet en fortælling og en forventning om, at strategien er at "skabe dataproducter" og "udnytte AI til fulde"…
Disse hovedpunkter, når de ses isoleret, giver mening og er noget, de fleste virksomheder burde stræbe efter, men de kommer med en pris og til tider en noget bagudskuende tilgang...
I dag står de fleste CXO'er, der er ansvarlige for data og IT, over for to nært beslægtede områder af dataagendan:
Område A - De grundlæggende nødvendigheder
Dataarkitektur, datainfrastruktur, datastyring, datastyring, BI og rapportering, selvbetjening og dataoperationerOmråde B - Avanceret analyse
Data science, statistisk modellering, Machine Learning, Deep Learning, GenAI osv.
Begge områder er vigtige – og i de fleste scenarier afgørende – for værdiskabelsen med data. Der er dog et naturligt flow og afhængighed fra A til B. Den nødvendige basis i A er afgørende for at få succes med B. Med andre ord: Uden data, ingen maskinlæring eller AI. Det er så enkelt som det.
Alligevel har en fortælling eskaleret, der primært fokuserer på hypen omkring B, mens alle elementer af A tages for givet. Problemet med denne fortælling er, at den forsømmer fundamenterne og sætter mange dataleadere, datateams, beslutningstagere og dataentusiaster i en vanskelig situation, da bestyrelser, ledelse, forretningsinteressenter, slutbrugere, medier – ja, de fleste af os for at være ærlige – finder den nye og fancy AI-innovation mere fascinerende, hvilket udelader vejen og forudsætningerne for at komme dertil.
AI sælger billetterne; Platform Engineering og Data Engineering gør det muligt at udføre og få succes med.
Som virksomheder i stigende grad stræber efter at "udnytte AI", "blive datadrevet" eller "skabe dataproducter", bliver afhængighederne og barriererne mellem A og B endnu mere synlige:
Ingen strategisk retning for data
Ingen vind er gunstig, hvis retningen er ukendt. Og hvis en datastrategi findes, følges den ofte ikke, kommunikeres ikke, er ikke forankret, af tilstrækkelig kvalitet eller en realistisk funktionel version af teknologi- og forretningskravene. Et to-siders dokument i arkiverne er ikke en strategi.Arkitektur og platform mangler
Høje ambitioner med data er svære at realisere på legacy-systemer. Visse arkitektoniske dele er nødvendige for at støtte analytiske behov, skalering og drift.Brugsområder er ikke rigtig AI-brugsområder
Fokus er alt for ofte på, hvilket værktøj der skal bruges, snarere end værdiskabelse. Identificer udfordringen først - derefter værktøjet. Dette gælder også for GenAI kontra ML, Deep Learning osv.Lav datakvalitet, mangel på datastyring og governance
Det er ganske enkelt. Dårlige data, dårlige indsigter. Datakvalitet er et delt ansvar og ikke bare en teknisk øvelse.Essensen af de nævnte barrierer er, at der er nogle grundlæggende behov, der skal være på plads inden for virksomheder for at "udnytte AI" fra et reelt ROI. Solide dataproducter eller AI-modeller bliver kun en realitet, når både grundlæggende og tilknyttede behov adresseres. Fra A til B:
Derfor er visionen og de højtflyvende citater kun værdifulde, hvis der er en forståelse, et budget og et ægte engagement bag ordene. Uden det er det umuligt for datalederen og datateamet at få succes på lang sigt.
På samme måde som luft, mad og søvn går forud for selvrealisering i Maslows behovshierarki, gårgrundlæggende datadiscipliner og ryggradsessentielle også forud for AI. På en lignende måde, som vi tager grundlæggende behov for givet i hverdagen, må vi være forsigtige med ikke at tage basis for dataværdiskabelse for givet.
