AI er motoren — du er piloten

Sådan får du noget pålideligt ud af kunstig intelligens i stedet for noget generisk

De fleste tror, at god AI-brug handler om at finde den helt rigtige formulering. Det gør den ikke. Den handler om at bygge kontrol omkring en stærk, men upålidelig motor, så du tør stole på det, der kommer ud. Her er de metoder, jeg har samlet gennem et par år med at bruge AI til at bygge software, læse forskning og skrive: hvordan du fodrer modellen, hvordan du tjekker den, og hvordan du får den til at tænke nyt.

Hvad er den største misforståelse om kunstig intelligens lige nu? Hvis du spørger mig, er det forestillingen om, at det handler om at bede den om en bedre tekst. At hele kunsten er at finde den helt rigtige formulering, så chatbotten spytter noget brugbart ud. Det er der mange, både begejstrede og skeptikere, der tror.

Men det er ikke det, der adskiller god brug fra dårlig. Når alle kan bede en chatbot om at skrive noget, bliver det interessante ikke om du bruger AI, men hvordan du sikrer kvaliteten. Og det er faktisk noget, man kan lære, sætte i system og blive god til.

Jeg har arbejdet med e-læring og compliance i 25 år, og det seneste par år har jeg brugt AI intensivt, både til at bygge software, til at læse forskning og til at skrive. Undervejs har jeg samlet en håndfuld metoder, der virker. Den her artikel er dem.

Den røde tråd er enkel: AI er motoren, du er piloten. Motoren er stærk, men den styrer ikke. Hele pointen er at bygge kontrol omkring motoren, så du tør stole på den, på en måde, der faktisk er mere pålidelig, end de fleste tror.

Hvor går det galt for de fleste?

Lad os starte med fejlen, for den er så udbredt, at den fortjener et navn. Du har et stykke indhold, en rapport, en sagsfremstilling, nogle noter. Du kopierer det ind i en chatbot, der ikke aner noget om sammenhængen, og beder den om "at lave noget". Og så får du noget tilbage, der lyder glat, men er generisk og ubrugeligt.

Det er spild. Og det er værre end spild, hvis du sender det videre til en kollega. For her er en pointe fra min egen forskning, der er værd at tage med: værdien af information opstår først, når modtageren kan se, at det er besværet værd at læse. Vi beslutter os, før vi læser, om et dokument fortjener vores opmærksomhed. Får din kollega en tekst, der lugter af ufiltreret AI-output, så investerer de ikke opmærksomheden, uanset hvor meget arbejde der lå bag.

Så den første regel er ikke en AI-regel. Det er en hensyns-regel: send aldrig nogen et stykke generisk AI-tekst og bed dem om at finde meningen i det. Koger du det selv ned først, sparer du dem for arbejdet. Lader du være, har du bare flyttet dit besvær over på dem.

Resten af artiklen handler om, hvordan man undgår netop det, ved at arbejde ind i modellen, og ved at kontrollere det, der kommer ud.

Hvordan får du noget ind i modellen, der er værd at arbejde med?

Det vigtigste sker, før modellen overhovedet svarer. Generisk ind giver generisk ud. Så her er de måder, jeg fodrer den på.

Jeg taler i stedet for at skrive

Det her er den mest undervurderede vane, jeg har. Jeg dikterer til modellen. Jeg taler til den, som jeg ville tale til et menneske, og lader talen blive til tekst.

Det lyder banalt, men det ændrer alt. Vi taler omkring tre gange så hurtigt, som vi skriver. Vigtigere endnu: når du taler, kommer hele konteksten med, alle de forbehold, sidebemærkninger og "det her hænger sammen med…", som du aldrig gider skrive. Og det er præcis konteksten, der gør forskellen mellem et generisk og et skarpt svar.

Den her artikel er faktisk dikteret frem. Jeg talte i lange stræk om, hvad jeg ville, og lod så modellen forme det. Det er en helt anden arbejdsform end at sidde og hakke en perfekt prompt sammen. (Praktisk: der findes værktøjer, der gør tale-til-tekst nemt direkte i din computer. Det vigtige er ikke værktøjet, men vanen med at tale frem for at skrive.)

Jeg taler med indholdet

En af de stærkeste ting, du kan bruge AI til, er ikke at få den til at producere noget, men at spørge den om noget, du har givet den. Jeg lægger en lang rapport, en kontrakt eller en forskningsartikel ind og stiller spørgsmål til den. "Hvad er hovedpåstanden her?" "Hvor modsiger den sig selv?" "Hvad ville en kritiker indvende?" Det er som at have en tålmodig samtalepartner, der har læst det hele og aldrig bliver træt af opfølgende spørgsmål.

Jeg lader den koge store mængder ned

Nogle gange har man simpelthen for meget at læse. Her er AI virkelig stærk: den kan tage en stor bunke og give dig overblikket, så du kan bestemme, hvad der er værd at læse i sin fulde længde.

Jeg bruger den til at oversætte, også det svære

Et konkret eksempel: en fyr skrev til mig, at noget, han havde læst, mindede om min egen forskning. Det var en videnskabelig artikel, på russisk. Før i tiden ville den have været lukket land. Med AI kunne jeg læse den, forstå den og se, om han havde ret.

Et andet eksempel: en lang ph.d.-afhandling om træning af lyd. Jeg fik AI til at sætte den op imod min egen teori, finde forskelle, paralleller og forklaringer. Det gav et perspektiv, jeg ikke selv havde set. Et vigtigt forbehold her, som jeg vender tilbage til: jeg stolede ikke blindt på det. Jeg brugte det som en kilde til at slå op og forstå, ikke som en facitliste. Men som indgang til noget, der ellers var utilgængeligt, er det uvurderligt.

Jeg beder den om at ramme en bestemt stil

Her er en lille teknik, der er en pointe i sig selv: du kan give modellen et eksempel på en tekst, du har skrevet, og bede den om at matche stilen. Det er sådan, den her artikel er blevet til, den er skrevet, så den ligner mine egne blogindlæg. Det virker, fordi du flytter modellen fra "gennemsnit af internettet" til "sådan her lyder jeg". Og det er hele forskellen mellem noget generisk og noget, der er dit.

Hvordan tjekker du, om den har ret?

Nu kommer den del, de fleste springer over. For en AI-tekst kan lyde fuldstændig overbevisende og stadig være forkert. Modellen opfinder nogle gange fakta, den hallucinerer, og den siger det med samme sikre stemme som alt andet. Derfor er det her det vigtigste afsnit i artiklen. Det handler om at behandle AI'en som en dygtig, men upålidelig medarbejder, hvis arbejde du altid kvalitetssikrer.

Lav en facitliste, modellen aldrig får at se

Hvordan ved du, om dit AI-system rent faktisk har ret, og ikke bare lyder rigtigt? Du laver en facitliste: et sæt eksempler, hvor svaret er tjekket af et menneske. Så kører du AI'en mod facit og måler, hvor ofte den rammer rigtigt. Det afgørende er, at modellen aldrig får facit at se. Ellers snyder du dig selv, den "består prøven", fordi den har set svaret. Det her er forskellen på at håbe, at den er god nok, og at vide det. Det gør et upræcist spørgsmål ("er den god?") til et tal, du kan følge over tid.

Lad en anden AI dømme

En model er en elendig dommer over sit eget arbejde, den har de samme blinde vinkler i begge roller. Løsningen: lad en model fra en anden leverandør bedømme resultatet. Forskellige modeller har forskellige svagheder, så når to uafhængige er enige, er det et langt stærkere signal end én models selvtillid.

Et eksempel fra mit eget arbejde: min forskning laver jeg med Claude, og så sætter jeg ChatGPT og Gemini til det, jeg kalder en hostile review. Jeg beder dem finde så mange huller i min argumentation som overhovedet muligt og skyde kilderne ned så hårdt de kan. Det der bliver stående, når to uafhængige modeller har gjort deres værste for at rive det ned, står langt stærkere end noget en enkelt model er tilfreds med.

Få den til at sige "det ved jeg ikke"

Den farligste AI-tekst er den, der lyder rigtig, men er gættet. Derfor beder jeg den om at markere, hvad den ikke ved, i stedet for at finde på. I et af mine systemer indsætter modellen små [tilpas]-markører, der hvor information mangler, i stedet for at digte. Det er ærligt. Brugeren ved præcis, hvad de selv skal udfylde, og systemet lyver aldrig på deres vegne. Tillid kommer ikke af glat selvsikkerhed. Den kommer af, at modellen tør sige "det ved jeg ikke".

Lad den teste, men tro den ikke på dens ord

Man kan endda lade en AI bruge et produkt og fortælle, hvor den går i stå, en slags automatiseret brugertest. Det har jeg gjort, og det fandt en reel fejl: nybegyndere gav op et bestemt sted, fordi systemet lovede "10-20 sekunder", men tog op til et minut, så de troede, det var gået i stå. Men samme test fandt også en "fejl", der slet ikke var der, modellen troede, en knap ikke virkede, men det var en teknisk artefakt i testen selv. Lektien er den samme som hele vejen igennem: brug AI'ens fund som spor, ikke som domme. Tjek dem mod virkeligheden.

Kan man få AI til at tænke nyt?

Indtil nu har vi talt om at gøre AI pålidelig. Men kan man få den til at være kreativ, til at finde på noget, der ikke bare er det mest oplagte? Ja. Og her vil jeg gerne være tydelig: det her er ikke en gimmick, det er evidensbaseret. Teknikkerne stammer fra kreativitetsforskning på mennesker, og jeg har selv testet dem på sprogmodeller. I et forsøg med 1.760 kørsler slog samtlige af de forskningsbaserede teknikker den "rå" tilgang på både originalitet og kvalitet.

Grundindsigten er, at en model, ligesom et menneske, har et oplagt førstevalg. En slags tyngdebrønd, den falder ned i. Kreativitet handler om at komme væk fra den brønd. Forskningen peger på tre måder:

Forbyd det oplagte — bed den direkte om at finde på noget originalt, som folk ikke normalt ville tænke på, eller giv den en kunstig begrænsning ("skriv det i præcis to sætninger og brug ordet 'gletsjer'"). Begrænsninger tvinger den ud af det vante.
Sprøjt nye ruter ind — bed den se problemet fra tre forskellige fag eller kulturer og så samle det. Friske vinkler udefra giver friske idéer.
Giv den plads — bed den løse problemet "for en fremmed" eller "som om det var om 100 år". Psykologisk afstand åbner tænkningen.

Det smukke er, at de samme greb, en god workshopfacilitator bruger på et hold mennesker, virker på en sprogmodel. Der er ingen magi i det, bare kendt psykologi, oversat til en ny slags hjerne.

Hvornår må man ikke stole på den?

Her er en pointe særligt til dem, der er, med rette, skeptiske over for at lægge vigtigt arbejde over til AI. For der findes opgaver, hvor en almindelig chatbot beviseligt ikke kan levere det, du har brug for.

Tag compliance. Den almindelige refleks er at hælde hele regelsættet ind i systemet "så vi er dækket". Det virker ikke. Jeg har vist det i min forskning: når en regel begraves blandt mange konkurrerende regler, så taber den, også for de stærkeste modeller. I et forsøg faldt en models efterlevelse af en bestemt regel fra 100 % til 0 %, alene fordi reglen lå sammen med en bunke andre.

Det er ikke, fordi modellen er doven. Det er et grundvilkår: en hjerne, kunstig eller menneskelig, kan ikke holde et ubegrænset regelsæt i hovedet på én gang og anvende det fejlfrit. Det gælder også mennesker. Det er derfor, NIST, den amerikanske standardiseringsorganisation, droppede kravet om komplicerede passwords, der skal skiftes hele tiden, det gav i praksis dårligere sikkerhed, fordi folk bare genbrugte varianter af det samme.

Så hvad gør man, hvis man skal være sikker? Man slår op i stedet for at huske. I stedet for at proppe alle regler ind på én gang, henter systemet kun den ene regel frem, der er relevant lige nu. Den teknik kaldes RAG (modellen slår op i en kilde, før den svarer). Da vi gjorde det, røg efterlevelsen tilbage til omkring 100 %.

Pointen for dig som skeptiker: det er rigtigt, at man ikke kan stole 100 % på en almindelig sprogmodel til regelarbejde, og det skal man designe sig ud af, ikke håbe sig ud af. Hvis nogen lover dig fejlfri compliance fra en ren chatbot, så ved du nu, at det ikke holder. Den modne tilgang er at kende grænsen og bygge kontrollen udenom: slå op, valider det, der kan tjekkes, og træn det, der skal sidde fast. Det er faktisk den samme pointe som resten af artiklen, sagt skarpt: AI'en er motoren, kontrollen er din.

Den ene regel, der binder det hele sammen

Hvis du kun skal tage én ting med, så er det denne: vær lige så kritisk over for AI, som du ville være over for et andet menneske.

Tænk over det. Hvis en kollega rakte dig en tekst og sagde "her, brug den med dit navn på", ville du så bare sende den ud uden at læse den? Selvfølgelig ikke. Du ville læse den, tjekke den, rette det, du var uenig i, for det var jo dig, der stod som afsender.

Præcis sådan skal du behandle AI. Ikke med mere mistillid end et menneske, men heller ikke med mindre. Du må aldrig sende noget videre, som du ikke selv står inde for. Ikke fordi AI er specielt upålidelig, men fordi du er afsenderen, og ansvaret er dit.

Det er faktisk en befriende måde at se det på. Du behøver ikke vælge mellem "AI er magi" og "AI er farligt". Du kan gøre det, du allerede gør med alt andet arbejde, du sætter dit navn på: bruge det, der er godt, tjekke det grundigt, og tage ejerskab over resultatet. AI er en stærk motor. Men det er stadig dig, der flyver.

De vigtigste pointer

Generisk ind giver generisk ud — det vigtigste arbejde sker, før modellen svarer; giv den rig kontekst, gerne ved at tale til den.
Send aldrig nogen ufiltreret AI-output — kog det ned selv, ellers flytter du bare dit besvær over på modtageren.
Tjek altid — facitliste, en anden models dom, "det ved jeg ikke"-markører. Brug AI's fund som spor, ikke som domme.
Kreativitet kan styres, evidensbaseret — forbyd det oplagte, sprøjt nye vinkler ind, giv den plads.
Kend grænserne, og design udenom dem — til sikkert regelarbejde kan en ren chatbot ikke stå alene; lad den slå op (RAG) i stedet.
Du er afsenderen — vær lige så kritisk over for AI som over for en kollega. Stå aldrig inde for noget, du ikke har tjekket.

Beslægtet: Hvordan jeg arbejder (samme metoder anvendt på min egen forskning) · Compliance er adfærd, ikke information (regel-blandt-mange og RAG) · Læring (hvorfor information-bombardement ikke lærer nogen noget).