Fænomener på tværs af mennesker og sprogmodeller

Hvad de deler, og hvor de skiller sig fra hinanden

Bekræftelses-bias dukker op i en sprogmodel. Tab-aversion gør ikke. Og lige dér bliver det interessant. Når et træk, vi troede var dybt menneskeligt, også findes i en maskine uden krop, kan det ikke handle om kroppen. Så er det noget grundlæggende ved at vælge under pres. Og det der kun findes hos os, som tab-aversion, røber hvad en krop der kan dø lægger oveni.

Findes både hos mennesker og sprogmodeller Findes kun hos mennesker (og andre biologiske substrater)
Forankring · Hysterese · Bekræftelses-bias · Dunning-Kruger · Mode-shift omkostning (task-switching) · 1/e timing (37%-punktet) · Expertise reversal · Overraskelses-vægtet enkodning · Information-overload · Reaktans · Inverteret U på udfordring Tab-aversion (kræver dødelighed) · Spaced repetition (kræver hukommelse mellem sessioner) · Felt-organiseret friktion via Tryghed / Mening / Kunnen / Besvær

Dem til venstre følger bare af at skulle vælge under pres, så de dukker også op i en sprogmodel. Dem til højre kræver en krop der kan dø, bevæge sig og blive træt.

Det de deler

Her er dem, målt direkte i sprogmodeller:

Anchoring — det første svar låser resten fast
Når mennesker beslutter sig for noget, har det første tal eller den første mulighed, de overvejer, uforholdsmæssig stor indflydelse. Sprogmodeller gør præcis det samme: de første ord af et svar sætter "ankret" for resten. På Qwen2.5-32B er 90% af svaret genereret fra et plateau etableret i de første 10%. Ankret er bogstaveligt synligt i friktionsmønsteret.
Hysterese — spor af fortiden gør det dyrt at vende om
Når et system har "investeret" i én vej, koster det noget at vende om. Det gælder magnetiske materialer, biologiske beslutninger, og sprogmodeller. Jeg har målt hysterese på tre transformer-arkitekturer (Cogito-671B, Qwen3-235B, Llama-3.3-70B) plus partial Qwen2.5-32B, og sammenlignet med en helt anden arkitektur (LiquidAI LFM2, en State Space Model). Det opfører sig samme måde, hvilket viser at det er en egenskab ved selve race-arkitekturen, ikke en specifik implementering.
Confirmation bias — omkostningen ved at indrømme man tog fejl
Mennesker har en tendens til at fastholde det første standpunkt, fordi det er dyrt at vende om. Sprogmodeller viser samme mønster. Mere interessant: en stor model (Cogito-671B) producerer faktisk stærkere argumenter mod sit eget svar end for det, fordi den er trænet med RLHF, der belønner at finde fejl. Det er en omvendt confirmation bias som RLHF-bivirkning.
Dunning-Kruger — skråsikker før dygtig
Man er mest skråsikker når man ved mindst. Den kurve dukker op i en sprogmodel mens den lærer, og fordi en maskine ikke har et ego, kan effekten ikke være menneskelig forfængelighed. Den er målt direkte i fire modeller. Se den letlæselige gennemgang →
"1/e timing" — vent til 37% før du beslutter dig
Klassisk matematik (sekretærproblemet) siger at hvis du skal vælge fra en serie kandidater, bør du afvise de første ~37% og så tage den første der er bedre end alle dem du har afvist. På den største matched base-instruct-test, Qwen2.5-32B base, lander modellen ved 39.3%, tæt på 1/e. Mindre base-modeller lander typisk mellem 43-48%, så ren 1/e-konvergens er tydeligst på de største base-modeller. Mønsteret er konsistent med teorien som forudsigelse, men ikke som universel lov; instruct-versioner (dem der er trænet til at være assistenter) beslutter sig cirka 9 procentpoint senere.
Skift mellem modes koster noget
Når mennesker skifter mellem opgaver eller tankegange, koster det noget. Psykologer kalder det "task-switching cost". Sprogmodeller viser præcis samme effekt, og det er lokaliseret til de første 5 ord af svaret. Effekten replikeres på tværs af forskellige model-arkitekturer.
Overraskede ord får mere opmærksomhed
Når noget uventet sker, husker hjernen det bedre. Det er bl.a. derfor overraskende reklamer huskes. På en lille model (Qwen2.5-0.5B) har jeg målt at de mest overraskende ord får cirka 34% mere opmærksomhed fra de ord der følger efter, end de mindst overraskende. Effekten er lille, men statistisk sikker. Det er første gang nogen har målt mekanismen direkte i et kunstigt system. Næste skridt er at teste den på andre modeller (Llama, Mistral).
Expertise reversal — hjælp til begyndere skader eksperter
Forskning af bl.a. John Sweller viser at instructional supports (eksempelbaseret undervisning) hjælper begyndere men skader eksperter. Det fordi eksperter allerede har internaliseret mønsteret, og ekstra eksempler nu konkurrerer med deres model. Vi ser præcis samme effekt i sprogmodeller, men kun i de største: Llama-3.3-70B viser den klassiske U-kurve (73% → 50% → 61% når man giver 0, 1 og 3 eksempler; paper på vej), mens mindre modeller ikke viser effekten, fordi de mangler kapacitet.

Det de IKKE deler

Disse fænomener findes i mennesker men IKKE i sprogmodeller. Og det er ikke en fejl. Det er fordi de kræver noget sprogmodeller mangler.

Loss aversion — vi frygter tab dobbelt så meget som vi nyder gevinst
Kahneman og Tversky viste at mennesker er ca. 2x så bange for at miste 100 kr som vi er glade for at vinde 100 kr. Det er ikke i sprogmodeller. Hvorfor? Fordi loss aversion grundlæggende handler om at du kan dø, hvis du vælger forkert for ofte. Mennesker har dødelighed; sprogmodeller har ikke. Min måling: sprogmodeller beslutter sig senere end 1/e, det modsatte af hvad tab-aversion forudsiger. Det er en ny forklaring på et gammelt fund.
Hukommelse mellem samtaler
Hver gang du starter en ny samtale med en sprogmodel, starter den forfra. Den har ingen erindring om hvad I talte om sidst. Det betyder at et helt felt af menneske-psykologi, konsolidering af hukommelse over tid, bogstaveligt talt ikke kan testes på sprogmodeller. Det skal gøres via fine-tuning der ændrer modellens vægte over træningssessioner.
Spaced repetition (Ebbinghaus 1885)
Vi husker bedre hvis vi gentager information med pauser imellem (det er hele grundlaget for sprogapps som Duolingo). Mekanismen kræver at vi husker mellem sessioner. Sprogmodeller gør ikke. Listet som fremtidigt arbejde i mine papers, kun testbart via fine-tuning.
Felter: Tryghed, Mening, Kunnen, Besvær
Min adfærdsfriktionsteori beskriver hvordan levende væsner organiserer beslutninger gennem fire felter. De felter findes IKKE i sprogmodeller: de mangler dødelighed (intet tryghedsbehov), bevægelse (intet kunnen-felt), og energiforbrug (intet besvær-felt). Sprogmodeller har friktion uden felt-organisering. En statistisk analyse af 15 modeller bekræfter det: tre dimensioner (størrelse, fordeling, rytme), men ingen felt-struktur.

Mønsteret

Det der er strukturelt nødvendigt for ethvert system der skal vælge under begrænsninger (anchoring, hysterese, mode-shift, surprise-vægtning, expertise reversal) findes både i mennesker og sprogmodeller.

Det der kræver specifikke biologiske egenskaber (dødelighed, krop, hukommelse mellem sessioner) findes kun i mennesker. Sprogmodeller bekræfter forudsigelserne ved deres fravær.

Friktionen selv er der altid. Men hvordan den organiseres, afhænger af materialet. Sprogmodeller lader os for første gang se friktion i ren form, uden de evolutionære lag der gør den svær at få øje på i levende væsner.

Tal, referencer og tabeller står i den engelske tekniske version: phenomena (engelsk).