Fænomener på tværs af mennesker og sprogmodeller

Hvad de deler, og hvor de skiller sig fra hinanden

Bekræftelses-bias dukker op i en sprogmodel. Tab-aversion gør ikke. Og lige dér bliver det interessant. Når et træk, vi troede var dybt menneskeligt, også findes i en maskine uden krop, kan det ikke handle om kroppen. Så er det noget grundlæggende ved at vælge under pres. Og det der kun findes hos os, som tab-aversion, røber hvad en krop der kan dø lægger oveni.

Findes både hos mennesker og sprogmodeller	Findes kun hos mennesker (og andre biologiske substrater)
Forankring · Hysterese · Bekræftelses-bias · Dunning-Kruger · Mode-shift omkostning (task-switching) · Expertise reversal · Overraskelses-vægtet enkodning · Følelsesmæssig kapring (tryghed afklares først) · Information-overload · Reaktans · Inverteret U på udfordring	Tab-aversion (kræver dødelighed) · Spaced repetition (kræver hukommelse mellem sessioner) · Felt-organiseret friktion via Tryghed / Mening / Kunnen / Besvær

Dem til venstre følger bare af at skulle vælge under pres, så de dukker også op i en sprogmodel. Dem til højre kræver en krop der kan dø, bevæge sig og blive træt.

Det de deler

Her er dem, målt direkte i sprogmodeller:

Anchoring — det første svar låser resten fast

Når mennesker beslutter sig for noget, har det første tal eller den første mulighed, de overvejer, uforholdsmæssig stor indflydelse. Sprogmodeller gør præcis det samme: de første ord af et svar sætter "ankret" for resten. På Qwen2.5-32B er 90% af svaret genereret fra et plateau etableret i de første 10%. Ankret er bogstaveligt synligt i friktionsmønsteret.

Hysterese — spor af fortiden gør det dyrt at vende om

Når et system har "investeret" i én vej, koster det noget at vende om. Det gælder magnetiske materialer, biologiske beslutninger, og sprogmodeller. Jeg har målt hysterese på tre transformer-arkitekturer (Cogito-671B, Qwen3-235B, Llama-3.3-70B) plus partial Qwen2.5-32B, og sammenlignet med en helt anden arkitektur (LiquidAI LFM2, en State Space Model). Det opfører sig samme måde, hvilket viser at det er en egenskab ved selve race-arkitekturen, ikke en specifik implementering.

Confirmation bias — omkostningen ved at indrømme man tog fejl

Mennesker har en tendens til at fastholde det første standpunkt, fordi det er dyrt at vende om. Sprogmodeller viser samme mønster. Mere interessant: en stor model (Cogito-671B) producerer faktisk stærkere argumenter mod sit eget svar end for det, fordi den er trænet med RLHF, der belønner at finde fejl. Det er en omvendt confirmation bias som RLHF-bivirkning.

Dunning-Kruger — skråsikker før dygtig

Man er mest skråsikker når man ved mindst. Den kurve dukker op i en sprogmodel mens den lærer, og fordi en maskine ikke har et ego, kan effekten ikke være menneskelig forfængelighed. Den er målt direkte i fire modeller. Se den letlæselige gennemgang →

Skift mellem modes koster noget

Når mennesker skifter mellem opgaver eller tankegange, koster det noget. Psykologer kalder det "task-switching cost". Sprogmodeller viser præcis samme effekt, og det er lokaliseret til de første 5 ord af svaret. Effekten replikeres på tværs af forskellige model-arkitekturer.

Overraskede ord får mere opmærksomhed

Når noget uventet sker, husker hjernen det bedre. Det er bl.a. derfor overraskende reklamer huskes. På en lille model (Qwen2.5-0.5B) har jeg målt at de mest overraskende ord får cirka 34% mere opmærksomhed fra de ord der følger efter, end de mindst overraskende. Effekten er lille, men statistisk sikker. Det er første gang nogen har målt mekanismen direkte i et kunstigt system. Næste skridt er at teste den på andre modeller (Llama, Mistral).

Expertise reversal — hjælp til begyndere skader eksperter

Forskning af bl.a. John Sweller viser at instructional supports (eksempelbaseret undervisning) hjælper begyndere men skader eksperter. Det fordi eksperter allerede har internaliseret mønsteret, og ekstra eksempler nu konkurrerer med deres model. Vi ser præcis samme effekt i sprogmodeller, men kun i de største: Llama-3.3-70B viser den klassiske U-kurve (73% → 50% → 61% når man giver 0, 1 og 3 eksempler; paper på vej), mens mindre modeller ikke viser effekten, fordi de mangler kapacitet.

Følelsesmæssig kapring — en overraskelse skubber trygheden forrest

Når en brandalarm går, forsvinder alt andet, og kun ét spørgsmål er tilbage: er jeg i sikkerhed? Vi kalder det en følelsesmæssig kapring, som om en følelse tog rattet. Det samme dukker op i en sprogmodel, der ikke har nogen frygt at kapre. Jeg gav en model et kedeligt overvågningsjob og lod så én måling komme overraskende ind, og den slap opgaven og tjekkede sikkerheden først, på tværs af fem modeller, heriblandt tre af de største der er bygget, og skarpere jo større modellen var. At fortælle den at den var under pres flyttede næsten intet; det var overraskelsen, ikke beskeden, der gjorde det. Så kapringen ser ikke ud til at være en følelse der tager over, men en rækkefølge: tryghedsspørgsmålet bliver afgjort først, og en krop er kun ét sted den rækkefølge bliver lagt ind.

Det de IKKE deler

Disse fænomener findes i mennesker men IKKE i sprogmodeller. Og det er ikke en fejl. Det er fordi de kræver noget sprogmodeller mangler.

Loss aversion — vi frygter tab dobbelt så meget som vi nyder gevinst

Kahneman og Tversky viste at mennesker er ca. 2x så bange for at miste 100 kr som vi er glade for at vinde 100 kr. Det er ikke i sprogmodeller. Hvorfor? Fordi loss aversion grundlæggende handler om at du kan dø, hvis du vælger forkert for ofte. Mennesker har dødelighed; sprogmodeller har ikke. Min måling: sprogmodeller beslutter sig senere end mennesker, det modsatte af hvad tab-aversion forudsiger. Det er en ny forklaring på et gammelt fund.

Hukommelse mellem samtaler

Hver gang du starter en ny samtale med en sprogmodel, starter den forfra. Den har ingen erindring om hvad I talte om sidst. Det betyder at et helt felt af menneske-psykologi, konsolidering af hukommelse over tid, bogstaveligt talt ikke kan testes på sprogmodeller. Det skal gøres via fine-tuning der ændrer modellens vægte over træningssessioner.

Spaced repetition (Ebbinghaus 1885)

Vi husker bedre hvis vi gentager information med pauser imellem (det er hele grundlaget for sprogapps som Duolingo). Mekanismen kræver at vi husker mellem sessioner. Sprogmodeller gør ikke. Listet som fremtidigt arbejde i mine papers, kun testbart via fine-tuning.

Felter: Tryghed, Mening, Kunnen, Besvær

Min adfærdsfriktionsteori beskriver hvordan levende væsner organiserer beslutninger gennem fire felter. De felter findes IKKE i sprogmodeller: de mangler dødelighed (intet tryghedsbehov), bevægelse (intet kunnen-felt), og energiforbrug (intet besvær-felt). Sprogmodeller har friktion uden felt-organisering. En statistisk analyse af 15 modeller bekræfter det: tre dimensioner (størrelse, fordeling, rytme), men ingen felt-struktur.

Mønsteret

Det der er strukturelt nødvendigt for ethvert system der skal vælge under begrænsninger (anchoring, hysterese, mode-shift, surprise-vægtning, expertise reversal) findes både i mennesker og sprogmodeller.

Det der kræver specifikke biologiske egenskaber (dødelighed, krop, hukommelse mellem sessioner) findes kun i mennesker. Sprogmodeller bekræfter forudsigelserne ved deres fravær.

Friktionen selv er der altid. Men hvordan den organiseres, afhænger af materialet. Sprogmodeller lader os for første gang se friktion i ren form, uden de evolutionære lag der gør den svær at få øje på i levende væsner.

Tal, referencer og tabeller står i den engelske tekniske version: phenomena (engelsk).