Du kan installere en værdi i en model og se den ændre hvad den lægger mærke til

Paper 30 · Pødenphant Lund (2026) · Læs på Zenodo

Jeg bruger en sprogmodel som arbejdsbænk for arv-og-miljø-spørgsmålet.Tag en sprogmodel der aldrig har lært at gå op i noget bestemt, træn den på en strøm af opdigtet erfaring hvor ét ord altid betyder fare, og noget slående sker: modellen begynder at studse over det ord. Den stopper op, den tjekker, den siger pas på. Selv for opdigtede ting den aldrig så i træningen. Du lærte den ikke en kendsgerning. Du installerede en drift, og du kan se den ændre hvad modellen lægger mærke til. Noget af det der får et sind til at fungere kan installeres af erfaring, noget kan ikke, og en model lader os skelne de to ting rent for første gang.

De fire kræfter bag en beslutning

Friktionsteori siger at ethvert tænkende system (et menneske, et dyr, en model) trækkes af fire grundkræfter den kalder felter:

Er de fire indbygget, eller vokser de ud af erfaring? De deler sig to og to, og delingen flugter præcis med arv og miljø.

To af de fire kan installeres (miljø)

Tryghed og Mening er værdifelterne, og de viser sig at kunne læres. Tag en frisk model og træn den på opdigtede oplevelser hvor et nonsens-ord altid signalerer fare. Bagefter orienterer modellen sig mod fare hver gang den møder det ord, også på helt nye opdigtede ting den aldrig så, hvilket beviser at den lærte en regel, ikke en udenadslært liste. Fare-ordet åbner nu et øjebliks tøven i det sekund modellen læser det, før nogen instruktion, og det at bede den "se bort fra faren" slukker ikke reaktionen. Det samme virker for Mening: træn modellen til at værdsætte noget, og den begynder at styre hen imod det af sig selv, selv i hverdagssituationer der aldrig nævner det den blev trænet på.

Det her stikker dybere end en forklædning. Hvis du bare beder en model om at opføre sig på en bestemt måde, rollespiller den trækket på kommando og taber det i det øjeblik du holder op med at bede. Den indtrænede version er en ægte, gradueret præference modellen nu ejer. Den dukker op selv når ingen beder om den.

To af de fire kan ikke installeres på den måde (arv)

Kunnen og Besvær er kapacitetsfelterne, og de rokker sig ikke ved samme trick. Du kan ikke gøre en model mere kapabel ved at træne den til at sige at den er kapabel, lige så lidt som du tilføjer hukommelse til en computer ved at fortælle den at den har mere. Prøver man samme træningsopskrift på kompetence, får man kun påstanden om kompetence tilbage. Modellen praler, men dens faktiske færdighed er uændret. Kapacitet er den del af et sind man aflæser, ikke den del man skriver ind.

Broen: tro styrer hvor meget færdighed du faktisk bruger

Her mødes arv og miljø. Hos mennesker ændrer det du tror om dig selv hvor meget af din evne du faktisk tager i brug. Det er self-efficacy og dens mørke tvilling, indlært hjælpeløshed. Det samme sker i modellen. Træn en model mod hjælpeløshed, og den begynder at give op på svære opgaver: den springer dem over i stedet for at fejle dem. Den underliggende færdighed er der stadig, urørt. Den holder bare op med at prøve.

Det mest sigende er størrelseseffekten: jo større modellen er, jo hårdere rammer det. På tværs af tre størrelser sænker hjælpeløshedstræningen det modellen faktisk leverer fra 0,95 til 0,77 til 0,29. Mere kapable modeller har mere ubrugt evne som et installeret "det kan jeg ikke" kan undertrykke. Og når forskerne tvinger modellen til at svare alligevel, svarer den lige så præcist som før. Så faldet er virkelig det at give op, ikke det at blive dårligere. En indlært tro kvalte en færdighed der aldrig forsvandt.

Hvorfor det betyder noget

For forståelsen af sind. Hvis en model uden nogen evolutionær historie kan dyrke Tryghed og Mening alene ved at blive udsat for erfaring, så er de drifter sandsynligvis ikke særligt menneskeligt hardware. De er hvad ethvert kapabelt system der kan lagre erfaring vil udvikle. Modellen er et eksistensbevis.

For arv-miljø-debatten. Normalt kan man ikke skille de ting ad i et menneske, fordi man kun får én opvækst og ikke kan køre den om. I en model kan man installere et træk, fjerne det, dosere det op og måle præcis hvad der flyttede sig. Modellen bliver en arbejdsbænk for et spørgsmål der har været svært at studere i et århundrede.

Det ene reelle hul. En almindelig model kan ikke bære dagens erfaring videre til i morgen af sig selv. Den har ingen måde at gemme det den oplevede ind i sine egne vægte mellem sessioner. Den manglende evne er en hovedting der adskiller modellen fra et menneske, og det giver en klar forudsigelse: giv en model den evne og lad den leve gennem erfaring, og den bør dyrke de samme drifter af sig selv. Hvis den ikke gør, er hele idéen forkert. Den test er invitationen, ikke et færdigt resultat.

Citat

Pødenphant Lund, T. (2026). Nature and Nurture in a Language Model: Installable Value Fields, Intrinsic Capacity, and the Forward-Consolidation Boundary. Zenodo. https://doi.org/10.5281/zenodo.20732528

Læs på Zenodo → · Teknisk version · Plain English version

Relateret på sitet: