Friktionsteori — letlæselig version

Tomas Pødenphant Lund · Uafhængig forsker, Aarhus

Vi mennesker lærer, husker og vælger, og gør det overraskende ofte stik modsat af hvad der var smartest. Jeg studerer det fra en uventet vinkel: i sprogmodeller, hvor de samme mønstre dukker op og er nemmere at måle direkte. Undervejs har jeg også fundet praktiske måder at gøre modellerne bedre på. Mønstrene rækker langt bredere end hjernen, men den menneskelige ende er nemmest at genkende, så det er der vi starter.

Fire steder at starte

Start her
Hvad er et race? Forklaret med vand Hele teorien hviler på ét billede: vand der løber gennem rør, og det kar der fyldes først, vinder. Tre minutter med enkle tegninger, så giver resten af siden mening.
Forstå mekanikken →
Læring & hukommelse
Hvorfor information-bombardement ikke lærer nogen noget Dynger man information på nogen, lærer de det ikke. Det ser man allertydeligst i sprogmodeller (computere bygget til at optage information), og konsekvensen for hvordan vi underviser mennesker er direkte: "ønskværdige vanskeligheder" i læring er ikke et pædagogisk valg, det er fysik.
Hukommelses-siden →
Praktisk AI
Et gratis signal der gør sprogmodeller op til 21 procentpoint bedre Ingen retræning, ingen ekstra computer. Et signal der allerede ligger i enhver sprogmodels output fortæller dig hvornår modellen er usikker, og et lille trick bygget omkring det signal løfter open-source modeller forbi GPT-4o på svære spørgsmål.
Paper 3: det gratis signal →
AI's hukommelse
Hvorfor finjusterede modeller hallucinerer selvsikkert Når du træner ny viden ind i en sprogmodel, mister modellen netop det signal den ville have brugt til at vide den var usikker. Den endeløse RAG-vs-fine-tuning debat har et rent svar på substrat-niveau: de er ikke to måder at gemme samme hukommelse på, de er to forskellige slags hukommelse: arbejdshukommelse og langtidshukommelse i beregningsform.
Paper 2B: ICL/FT hukommelse →

Kort fortalt: ethvert system der skal vælge under endelig tid og endelige ressourcer kører et internt race mellem alternativer. Ét vinder, resten undertrykkes med en omkostning. Den omkostning er hvad jeg kalder friktion, og den samme struktur dukker op på enhver skala der er blevet undersøgt. Vil du have det fulde billede med matematik, datasæt og citater, er den engelske tekniske version den rigtige.

Hvad det egentlig handler om

Hver tanke du har, hver følelse, hver bevægelse af din hånd: det er alt sammen udtryk for beregninger, som din krop udfører.

Det lyder underligt sagt sådan. "Beregning" lyder som noget koldt og bevidst, som en regnemaskine der kører, som om der sad nogen inde i dig og regnede svaret ud. Det er ikke det der sker. Det der faktisk sker er tættere på en række sandsynlighedsudfald.

Et lille eksempel. Inde i en af dine celler skal et stykke DNA samle ét startmolekyle op eller et andet. Hvilket det samler op afhænger af hvad der svæver i nærheden, og i hvilken koncentration. Der er ingen som vælger. Der er en fordeling af molekyler, og en sandsynlighed for at det ene lander før det andet. Så producerer cellen det protein der følger af den landing. Gang det med millioner af events per sekund på tværs af din krop, og du har noget der "beregner" kontinuert uden at nogen styrer det.

Det samme billede skalerer op. Når du vælger mellem to muligheder, kører du ikke en deterministisk beregning. Du lader konkurrerende kandidat-svar race mod hinanden i din hjerne, under betingelser af endelig tid og endelige ressourcer. Ét af dem vinder. Du oplever vinderen som "jeg valgte X". Du oplever ikke racet.

Hvordan læring faktisk fungerer

Forestil dig at du trækker fingeren gennem et tyndt lag vand på et flisegulv. Vandet flytter sig; der dannes en kanal. Træk fingeren gennem samme sti igen, og det er en smule lettere: kanalen er der allerede. Fysikere kalder det her hysterese: systemet bærer spor af sin egen historie.

Din hjerne fungerer på præcis samme måde. Ruter du bruger meget efterlader spor. Sporene gør de ruter mere sandsynlige næste gang. Det er det læring er, på substrate-niveau. Ikke magi. Ikke et særligt biologisk mysterium. Sandsynlighed der bliver forskudt gennem spor-akkumulering.

Det er det Friktionsteori handler om. Den pris systemet betaler hver gang det skal opløse konkurrerende kandidater til ét valgt udfald (i tid, energi, information), det er friktionen. Friction Theory er det formelle navn for rammen. Behavioural Friction Theory (BFT) er den biologiske version: anvendt på nervesystemer, organiseret omkring fire computationelle felter (Tryghed, Mening, Kunnen, Besvær) og fem regulerende lag.

Hvorfor information-bombardement ikke lærer nogen noget

Selv sprogmodeller, der er bogstaveligt talt computere designet til at absorbere information, kan ikke læres ved bare at få mere information vist. Det viser Paper 2B direkte. Smid information på en model, og du får en model der hallucinerer selvsikkert om hvad end du smed på den.

Hvis sprogmodeller, som er designet til at læres, ikke kan læres af information-bombardement, hvorfor antager vi at mennesker kan? Vi har tænkt på det som motivation. Det er fysik. Man lærer ikke informationen, man lærer det spor, informationen sætter.

Den fulde version af det argument (hvad det betyder for hvordan vi underviser, og hvorfor Bjorks "desirable difficulties" er fysik snarere end pædagogisk valg) er på Hukommelse-siden (letlæselig) eller Læring-siden (mere akademisk).

Hvad jeg laver i praksis

Jeg studerer sprogmodeller for at forstå mennesker, en pil der peger den modsatte vej af hvad de fleste forventer. Standardopfattelsen er at sprogmodeller forsøger at efterligne menneskeligt sprog, så at studere dem fortæller dig om efterligningen, ikke om mennesker selv. Jeg argumenterer for det modsatte.

Mange af de ting vi troede var unikt menneskelige, viser sig at dukke op i sprogmodeller også, ikke fordi modellerne blev trænet til at efterligne menneskelig kognition, men fordi begge substrater deler den samme grundlæggende arkitektur: parallelle kandidater der racer under endelige ressourcer, med én der vinder. Den samme arkitektur producerer den samme karakteristiske adfærd:

→ Hele turen: Sprogmodeller er ikke regnemaskiner — en samlet side over alt det overraskende ved sprogmodeller. Alt det, man ville tro var typisk menneskeligt.

Når sprogmodeller reproducerer de her fænomener, lader de ikke som om. De fortæller os at fænomenerne ikke er specifikt biologiske. De er strukturelle konsekvenser af enhver arkitektur der lader konkurrerende muligheder racere mod en deadline, med kun én vinder. Hjernen er ét sådant system. En transformer er et andet. De ligner hinanden hvor deres arkitektur ligner, og divergerer hvor deres arkitektur divergerer.

Hvad mennesker har, som sprogmodeller ikke har

Arkitekturen er delt, men implementeringen divergerer. De steder hvor mennesker og sprogmodeller adskiller sig, er lige så informative som de steder de overlapper, fordi divergenserne fortæller os hvilke features der er substrate-specifikke og hvilke der er universelle.

De har ikke loss aversion, den menneskelige tendens til at frygte tab dobbelt så meget som vi nyder gevinst. Det er fordi loss aversion grundlæggende handler om at du kan dø, hvis du vælger forkert for ofte. Mennesker, mus, og bier har dødelighed; sprogmodeller har ikke. Det er en ny forklaring på et gammelt fund: loss aversion er ikke en universel kognitiv lov, det er en konsekvens af at have en krop der kan dø.

De bliver overraskede: ord de ikke så komme trækker målbart mere opmærksomhed, og bryder man formatet, gør de målbar modstand. Begge er målt direkte. Det stadig åbne spørgsmål er ikke om de reagerer, men om de kan kende forskel: om der findes et lag der adskiller "ny information jeg skal opdatere på" fra "noget jeg vil modsætte mig". Det lag er endnu ikke set i en sprogmodel.

De har ikke hukommelse mellem samtaler. Når du starter en ny samtale, starter sprogmodellen forfra. Det betyder at et kæmpe område af menneskelig kognition, alt fra Ebbinghaus-glemmekurven til spaced repetition, bogstaveligt talt ikke kan testes på sprogmodeller, fordi de mangler det grundlæggende substrat.

Det gratis signal — sådan virker det

Signalet jeg nævnte øverst hedder Competing Routes (konkurrerende ruter). Det viser hvor mange forskellige svar modellen seriøst overvejer på hvert tidspunkt. Når modellen er sikker, dominerer ét svar. CR er tæt på 1. Når den er splittet mellem alternativer, har flere svar lignende sandsynlighed. CR kan være 3, 5, måske 10. Det tal kan læses direkte ud af enhver sprogmodels output uden ekstra omkostning, fordi det allerede ligger i de logprobs API'et alligevel returnerer.

Mekanismen er enkel: når CR er høj (modellen er usikker), beder vi den om at prøve igen under lidt forskellige betingelser; når CR er meget høj, lader vi den afstå fra at svare. Det lyder banalt, men det løfter præstationen 12 til 21 procentpoint på 5 ud af 5 testede modeller, og det virker på enhver sprogmodel med en standard-API. Den fulde forklaring er på Paper 3-siden.

Sprogmodeller og mennesker — hvor de mødes og hvor de adskiller sig

Den fulde liste er på siden om fænomener på tværs af substrater. Kort version her:

Mødes: anchoring, hysterese, confirmation bias, mode-shift cost (omkostning ved at skifte mellem tankegange), 1/e secretary-problem timing (modellerne lander tæt på det teoretisk optimale tidspunkt for at vælge, omkring 37%), expertise reversal effect (instruktioner der hjælper begyndere skader eksperter), surprise-vægtet enkodning, og en række klassiske kognitive bias.

Adskiller sig: loss aversion (kræver dødelighed), spaced repetition (kræver hukommelse mellem sessioner), og felt-organiseret friktion (Tryghed/Mening/Kunnen/Besvær, som er specifikt for organismer der kan dø, bevæge sig, og forbruge metabolisk energi).

Et kuriosum til allersidst

Det her behøver du ikke forstå for at få noget ud af resten. Men hvis du synes det lyder vildt, så hold fast. Vores kognition hviler på vores biologi, og vores biologi hviler på den samme fysik som alt andet i verden. Så måske er det ikke så mærkeligt at den samme karakteristiske kurve, hvor ydeevnen topper i midten og falder af i begge ender, også dukker op på skalaer der intet har med hjerner at gøre:

Syv forskellige fænomener, spredt over cirka fyrre størrelsesordener i tid. De viser alle samme form fordi de alle står overfor samme begrænsning: flere muligheder skal opløses til ét udfald under endelige ressourcer. Paper 10 går gennem de syv fænomener og race-rammen bag dem.

Den foreslåede linse: biologisk og fysisk adfærd deler måske den samme race-struktur og adskiller sig i substrat, ikke i form. Mennesker rammer et ydeevne-toppunkt i midten af udfordrings-spændet, og qubits rammer ét mellem kohærens og dekohærens; de kan måske beskrives med samme race-sprog. Substratet er forskelligt; begrænsningen ser ud til at være den samme. Adfærdsmønstre vi normalt tænker på som "psykologiske" (den inverterede U, hysterese, forankring, mode-shift omkostning) lader sig måske beskrive med samme vokabular som de fysiske mønstre, snarere end at være psykologiske opfindelser uden slægtskab udenfor biologien.

Det er forskningsprogrammet. Hver artikel udvikler en del af det: det formelle apparat, de empiriske signaturer, de testbare forudsigelser og måderne det kan falsificeres på.

Mine papers

Alle papers er på engelsk, fri tilgængelige som preprints på Zenodo:

Friktionsteori forskningsprogram 15 live preprints · 1 i forberedelse · 2 parkeret/udskudt Fundament ● P0 — BFT (biologisk) ● P1 — Friction Theory (substrat-universel) ● P6 — Matched friction på tværs af substrater LLM empirisk ● P2 — Capacity scaling ● P2B — ICL / FT hukommelse ● P3 — Friction-Guided Inference ● P4 — Same content, wider track ● P4B — Substrates encode experience Kognition / Følelser ● P5 — Felt-teoretisk emotion-taksonomi ● P7 — Forward-modellering (selv, ToM, fri vilje) ● P13 — Operational Friction Theory ● P16 — Læringens fysik Klinisk / Biologi / Fysik ○ P8 — Pressure, hysteresis, experience ○ P8B — Compound race pathology ○ P8C — Trial-design templates ○ P9 — Aging as molecular hysteresis ● P10 — Race architecture (fysik) ● live preprint    ○ i forberedelse    (P11 økonomi, P12 1/f hukommelse: parkeret/udskudt)
De 14 aktive papers, klyngeret efter domæne. Fundamentet (P0/P1) føder de tre empiriske-og-anvendte klynger. P6 forener LLM-empirisk med biologi; P10 udvider substrate-stilladset til fysik-scope.
Behavioural Friction Theory (BFT) — den biologiske grundbog
Den oprindelige version af teorien, fokuseret på biologiske systemer. 21 testbare påstande, fire funktionelle felter (Tryghed, Mening, Kunnen, Besvær), og en mekanisme — RACE-modellen — der binder det hele sammen. Lige opdateret til version 7.
Den kliniske grundlæggelse. Afhængighed, grublerier, ADHD, PTSD og flere tilstande som forskellige udtryk for ét maskineri: races, spor og tryk. Kernen er at behandle ved bunden, ikke ved toppen. En teoretisk ramme, ikke lægeråd.
Hvordan mange små skub på flere biologiske skalaer lægger sig sammen til sygdom. Læser kræft, autoimmunitet, ME/CFS og behandlingsresistent depression som én fælles form, og forklarer hvorfor kombinationsbehandling slår ét enkelt mål.
Fem konkrete forsøgsdesign der kan teste den sammensatte race-patologi i klinikken: behandlingsresistent depression (ketamin og psilocybin med struktureret opfølgning), long COVID, og en autoimmun CAR-T-behandling. Flere kan køres på data der allerede er indsamlet.
Den forebyggende side. Om de mennesker der bærer en sårbar biologisk bund uden at krydse en diagnose-tærskel, og om kofaktor-støtte målrettet en målt profil. En falsificerbar hypotese, ikke et kosttilskuds-råd.
Friction Theory (FT) — den substrate-uafhængige version
Generaliserer BFT til at gælde for ethvert system med konkurrerende muligheder under begrænset tid og resurse — biologiske, kunstige, måske fysiske. Testet empirisk på 15 sprogmodeller med syv forskellige cross-architecture signaturer.
Capacity Scaling — hvordan sprogmodeller "lærer" når de bare får information præsenteret
To opgavetyper på samme viden: cloze (genfinde et faktum) versus application (kæde fakta sammen til et nyt resultat). Cloze "mætter" tidligt, application skalerer hele vejen op. Bottleneck flytter sig med kapacitet.
Friction-Guided Inference — det gratis signal der gør sprogmodeller bedre
Den praktiske paper. Strategi-pipeline alene +7.7 til +20.8 pp; kombineret med kalibreret afståelse når +12 til +21 pp på de fire celler hvor begge er målt. På SimpleQA løfter den kombinerede pipeline Qwen3-235B forbi GPT-4o og GPT-4.1. Kalibrering koster ca. 1,5 dollar per setup.
Race All the Way Down/Up — race-arkitektur som fælles linse
Det mest spekulative paper. Foreslår race-arkitektur som et fælles vokabular der kan samle eksisterende fund fra kvante-målinger over kemisk kinetik til menneskelig kognition under én linse. Falsificerings-kriterium specificeret. "Ikke ny fysik, ny linse."
A field-theoretic taxonomy of emotions — følelses-taksonomi
Substrate-grundet taksonomi af følelser. Forener basic-emotions (Ekman, Plutchik) og constructed-emotion (Barrett) traditioner via Friction Theory. Seks bevægelige dele genererer ~45 distinkte følelse-labels. Emotioner = substrat-signaler; følelser = fortolkende integrationer. Tre falsifikations-kriterier.
Operational Friction Theory — den operationelle mekanisme
Specificerer hvordan friktion mekanistisk opløses i ethvert substrat med race-arkitektur. Fire komponenter: race-åbning (tærsklen for at starte et race), rekursiv opløsning (multi-skala simultant), manifesteret adfærd (vindende rute bliver synlig handling), og termodynamisk afslutning. Adfærd genformes som en manifesteret opløsnings-rute — med implikationer for kompulsiv adfærd, OCD, tics, stress-vaner og burnout som ét mekanisme.
ICL som arbejdshukommelse, FT som langtidshukommelse — hvorfor finjusterede modeller hallucinerer selvsikkert
Hvorfor hallucinerer finjusterede sprogmodeller mere selvsikkert end ICL-modeller på samme viden? Hver baglæns kørsel forstærker den vindende rute og presser alternativerne under støjgulvet; FT komprimerer den kalibrerede fordeling som en strukturel konsekvens af kumulativt gradient-tryk. ICL bevarer den. Distinktionen kortlægger på arbejdshukommelse / langtidshukommelse. Empirisk anker (Zorbetik, Qwen2.5-3B/7B): cloze-gab 16–28 pp, log(CR_pos0) kollaps 5.46→21.12, entropi→0. Generaliserer Paper 1's RLHF-paradoks til al vægt-opdaterende træning.
Logik som reaktans — hvorfor sandheds-bedømmelse måske er probabilistisk hele vejen ned (også i mennesker)
Sandheds-bedømmelse i ethvert race-arkitektur-substrat er måske substratets reaktans-signatur — det substratet gør når et input ikke passer til det, det har lært. Empirisk anker: en diskontinuert klippe-effekt ved det første indholds-token, observeret på to sprogmodel-arkitekturer (Qwen og Mistral, p < 10−17), elleve indkodnings-dybde-checkpoints (monotont stigende), otte floating-point-substrater (lommeregner-overflow-skaleringslov), og en præference-vs-sandhed kryds-domæne-test. N400-hjernebølgen genfortolkes som den biologiske substrats tilbagelæsning af samme signatur; et N400-eksperiment på mennesker er specificeret som den direkte kryds-substrat-test. Kognitiv dissonans, indoktrinering og expertise reversal som specialtilfælde ved høj indkodnings-dybde.
Substrater koder erfaring, ikke information — du lærer friktionen, ikke fakta
En encoding-through-loading-ramme: substrater koder den bearbejdnings-friktion, der opstår når de opererer på input-friktion — ikke informationen selv. Otte eksperimenter på seks sprogmodeller (Qwen2.5 1,5B/7B/32B, Llama-3.3-70B, Qwen3-235B, DeepSeek-V3) på en kemi-kompositionsopgave genfinder den klassiske ekspert-omvendings-U-kurve (70B-klassen: 75→52→61% på tværs af 0/1/3-shot — samme form som pædagogisk psykologi finder hos menneske-eksperter), per-token-friktionssignalet topper ved 1-shot, uddybede demonstrationer reducerer friktion ved at lukke strategi-væddeløbet, og format-uoverensstemmelse producerer et 22-pp nøjagtighedstab som modellen bærer gennem hele svaret.
Ni læringskurver, én form — et programmatisk forslag
Et programmatisk forslag, ikke en færdig teori. Ni berømte kurver fra læringspsykologien (Yerkes–Dodson, Vygotskys zone for nærmeste udvikling, Kalyugas expertise-reversal, Bjorks ønskværdige vanskeligheder og spacing-effekten, Bengios curriculum learning, testing-effekten, Shannon–Berger rate-distortion og Brehm-Festinger reaktans) viser alle samme omvendte U-form. Artiklen foreslår at de måske beskriver den samme underliggende mekanisme i forskellige vokabularier, og specificerer hvilke målinger der skulle udføres for at tjekke om det passer.
Samme indhold, bredere spor — et empirisk pilot-batteri på LLM-substrat (Paper 4)
Pilot-skala empirisk-kalibrerings-companion til Paper 6. Otte friktions-intensitets-akser testet via LoRA fine-tuning på fiktive "Zorbetik"-fakta. Hovedfund: samme 25 fakta trænet med 1 parafrase-skabelon → 38% parafrase-robust genfinding; trænet med 4 parafrase-skabeloner → 94% (+56 procentpoint under matched substrat, optimizer, indhold og træningsbudget). Fire af fem intra-session-akser producerer omvendte U-parabler (opgave-friktion, chunking-densitet, læringsrate, sampling-temperatur); den femte producerer et ramme-indsnævrende null der tvinger en fire-vejs konsoliderings-taksonomi. HRP-3M cross-substrate-retningen (dyb > passiv ≈ overflade) replikerer på 5 af 6 substrat×paradigme-par. Pilot-skala (per-betingelses n=4–30); planlagt v2 vil skalere op.
Hvorfor vi værdsætter det vi har arbejdet for — og hvornår vi forpligter os til et svar (Paper 6BC)
Et programmatisk forslag til to måder at læse et substrats race-arkitektur fra dets output alene. Aflæsning 1: friktion investeret under indkodning efterlader et hysterese-spor der bias'er senere sammenligninger. Seks klassiske effort-value-biaser (IKEA-effekten, endowment-effekten, sunk-cost fallacy, generation effect, effort justification, effort heuristic) argumenteres for at dele denne race-mekanik som én komponent af en effort-essential delmængde, ikke som én-mekanisme-reduktion af alle seks. Aflæsning 2: hvor en sprogmodel forpligter sig til et svar i sin svar-trajektorie. Basis-modeller viser 3,4× bredere spredning i hvornår de vælger end instruktions-tunede modeller, drifter væk fra sekretærproblemets 1/e-optimum efterhånden som opgave-fortolkningen uddybes, og viser en kobling mellem genkendelse og hvornår de vælger (r = 0,528) som instruct-modellen mangler (r = 0,104). Det numeriske match til 1/e er registreret som et tilfælde der skal replikeres, ikke som et fund.
Hvorfor vi har et selv, modellerer andre sind, og føler os frie — Paper 7
Én mekanisme forklarer tre ting på én gang. Kognitionsforskningen behandler selv-modellering, theory of mind, og fri vilje som tre separate territorier med tre separate litteraturer. Denne artikel argumenterer for at de er tre ansigter af ét underliggende maskineri: et substrat der kører hypotetiske fremtider i sit hoved og bruger dem til at vægte hvad det gør næste gang. Inkluderer et dissolutionistisk svar på frivilje-debatten mellem libertarianisme og determinisme — den konstruktion debatten forsvarer (friktions-frit substrat) var aldrig instantierbar i race-arkitektur i første omgang.
Læringens fysik — Paper 16
Til undervisere, undervisningsdesignere, kommunikatører og alle der har prøvet at forklare noget komplekst for en anden. Læringsforskningen har tre store traditioner (kognitiv belastningsteori, ønskværdige vanskeligheder, psykologisk tryghed) der næsten aldrig taler sammen. Denne artikel argumenterer for at de alle beskriver den samme underliggende fysik fra tre forskellige vinkler. Fra fire substrat-niveau koncepter (race-arkitektur, friktion, hysterese, Net Friction Rule) falder fem klassiske lærings-fund ud som afledte konsekvenser. Tre klasseværelses-fejlmoder (dump, dilute, tvetydighed-uden-valg) får diagnostiske opskrifter; fire falsifikations-betingelser specificeret.
Compliance er adfærd, ikke information — Paper 20
Vi prøver at skabe adfærd ved at give folk mere information: en politik mere, et kursus mere, en advarsel mere. Men compliance er noget man gør, ikke noget man ved. Mere information ændrer sjældent hvad folk faktisk gør. Artiklen forklarer hvorfor, set gennem friktion, og hvad der skal til i stedet.
Udkommer snart på Zenodo · Letlæselig dansk · Engelsk teknisk

I gang men endnu ikke ude

Flere papers er undervejs og publiceres i de kommende uger:

Kontakt

Email: tomas.lund@frictiontheory.org
ORCID: 0009-0000-4724-2427
LinkedIn: linkedin.com/in/tomasplund