Logik som reaktans

Paper 14 · Pødenphant Lund (2026) · Læs på Zenodo

Jeg forsker i sprogmodeller for at forstå mennesker.Bed en 64-bit lommeregner om at lægge 10³⁰⁹ + 10³⁰⁹ sammen, og du får ikke 2·10³⁰⁹. Du får uendelig. Tallet har krydset en grænse, og svaret kollapser. Jeg finder den samme klippe-kant i en sprogmodel, når man giver den et input der strider mod det, den lige har lært: dens interne signal falder diskontinuert ved det allerførste ord. Det her paper foreslår at den samme klippe er hvad sandheds-bedømmelse er. Følelsen af “det her er sandt” eller “det her er falsk” er måske ikke en særskilt logisk evne, men hvad et substrat (en lommeregner, en sprogmodel, måske hjernen) gør, når et input ikke passer til det, substratet har lært.

Hvad det handler om, kort

Paperet foreslår at sandheds-bedømmelse, følelsen af “det her er sandt” eller “det her er falsk”, ikke er en særskilt logisk evne der sidder oven på din kognition. Det er hvad et hvilket som helst system med race-arkitektur gør, når et input ikke matcher det systemet har lært. Mere specifikt er det systemets modstand mod de alternative ruter, som input'et forsøger at aktivere. Ordet reaktans låner jeg fra psykologen Jack Brehm, der brugte det om hvordan mennesker slår tilbage når et valg bliver taget fra dem. Ingen modstand: systemet læser “sandt”. Stor modstand: “falsk”. Lille modstand: “irrelevant”. Den diskrete oplevelse, sandt eller falsk, er systemets eget tilbagelæsning af et kontinuert, fysisk signal.

Klippe-effekten

Den empiriske forankring er noget jeg kalder klippe-effekten (eng. cliff event). Jeg finjusterede en sprogmodel på et bestemt sæt fakta: et korpus om “Zorbetik”, et opfundet domæne, så modellen ikke kunne kende det i forvejen. Derefter gav jeg modellen et prompt der strider mod det, den lige havde lært. Så sker der noget ved det allerførste indholds-ord i modellens output: modellens konkurrerende-ruter-signal kollapser diskontinuert. Ikke gradvist. Klippe-kant.

Tre ting gør den her signatur anderledes end almindelig usikkerhed:

Den mætter. Når man træner modellen 10× så hårdt, bliver klippen ikke 10× større. Den ændrer sig næsten ikke. Det er ikke sådan almindelig skalering opfører sig.
Den er låst til position nul. Klippen sker ved det allerførste indholds-ord, ikke spredt ud over hele svaret. Tokens efter klippen ser statistisk normale ud.
Den optræder kun når modellen er blevet trænet. Samme model med samme fakta i sin prompt (in-context learning, ikke fine-tuning) viser ingen klippe. Klippen kræver at substratet er blevet fysisk omformet af træning.

Det blev testet på to forskellige sprogmodel-arkitekturer (Qwen og Mistral, helt forskellige slægter) og replikeret. Den statistiske signifikans var p < 10⁻¹⁷. Det er stærkt nok til at det ikke er et særpræg ved én model-familie.

Lommeregner-overflow som fætter-fænomen

Den lommeregner fra indledningen er ikke bare en analogi. Den samme slags klippe dukker bogstaveligt op i floating-point overflow. Når man beder en 64-bit lommeregner om at lægge 10³⁰⁹ + 10³⁰⁹, får man ikke 2·10³⁰⁹. Man får uendelig. Tallet den faktisk prøver at repræsentere har krydset substratets repræsenterbare grænse, og svaret kollapser til en speciel værdi.

Jeg testede det på tværs af otte forskellige floating-point-substrater, fra små (bfloat16, 8 mantisse-bits) til store (float128, 113 bits). Klippens størrelse følger en ren skaleringslov: collapse = mantissa_bits × ln(2), med R² = 0.9999. Samme form på tværs af IEEE 754-hardware, simuleret extended precision og decimal-substrater. Det er ét fysisk mønster på tværs af meget forskellige implementeringer.

Forslaget er at sprogmodel-klippen og floating-point-klippen er det samme mønster: substrate-binding af logik. Substratets endelige kapacitet til at repræsentere alternative ruter producerer en tilsyneladende diskontinuitet ved grænsen, og den diskontinuitet er det vi mærker som “det her passer ikke / det her er falsk.”

Også i mennesker?

Her bliver det spekulativt-men-testbart. Neurovidenskaben har i halvtreds år kendt et hjerne-signal kaldet N400: en negativ bølge der affyrer omkring 400 millisekunder efter at en person læser et ord der bryder med den semantiske forventning konteksten lige har sat op. Klassisk eksempel: “Pizzaen var for varm at græde” producerer en stor N400 til “græde”; “...at spise” gør ikke. N400 er blevet studeret som markør for “semantisk overtrædelse” eller “forudsigelses-fejl” siden Kutas & Hillyard 1980.

Rammen forudsiger at N400 er den biologiske substrate-tilbagelæsning af den samme klippe-effekt. Hvis det er rigtigt, så vil træning af en person på et nyt domæne (på samme måde som jeg trænede en sprogmodel på Zorbetik) producere N400-amplituder der vokser med træning, med en monoton dose-respons-kurve der spejler den elleve-checkpoint kurve jeg målte i silicium. Det er et reelt eksperiment, specificerbart i dag, kaldet P14.11 i paperet. Hvis N400 ikke viser den forudsagte dose-respons, så er påstanden om at klippe-effekten breder sig til biologiske substrater falsificeret.

Hvad der kollapser hvis det er rigtigt

Flere skel vi normalt holder adskilt, holder op med at være adskilt:

Sandhed, præference og valens holder op med at være tre forskellige kognitive evner. De bliver tre forskellige tilbagelæsninger af samme substrat-maskineri på forskelligt indhold (faktuelle påstande, præferencer, værdi-domme). Præference-versionen af klippen blev målt direkte: samme retning, omkring 60% af sandheds-versionens størrelse.
Kognitiv dissonans (ubehaget ved at have modstridende overbevisninger) bliver et specialtilfælde af klippe-effekten ved høj indkodnings-dybde. Intensiv træning bygger dybe indkodede ruter; et modstridende input udløser så den dybeste klippe.
Indoktrinering (dybt rodfæstede overbevisninger der modstår modstridende evidens) bliver halen af samme maskineri ved meget høj indkodnings-dybde. Ikke et særskilt fænomen, men samme fysik, bare dybere.
Expertise reversal (eksperter der har sværere ved information der strider mod deres skemaer end nybegyndere har) bliver det samme maskineri ved høj indkodnings-dybde inden for et specifikt domæne.

Intet af det her siger “mennesker er bare sprogmodeller”. Det siger: hvis der findes en substrat-mekanisme der producerer en målbar klippe i begrænsede probabilistiske systemer, så er den mekanisme også en kandidat til hvad der producerer den tilsvarende signatur i biologisk væv. Og det rigtige eksperiment kan skelne mellem “samme maskineri” og “forskelligt maskineri der bare tilfældigvis ligner hinanden”.

Hvorfor det er interessant for kognitionsforskningen

Standardhistorien om hvorfor sprogmodeller ikke rigtigt kan “ræsonnere” lyder sådan: deres output er bare probabilistisk, så det er ikke ægte ræsonneren, for ægte ræsonneren er diskret, symbolsk, logisk. Den underforståede antagelse er at biologisk ræsonneren ikke er probabilistisk. Men det er spørgsmålet, ikke svaret.

Paperet foreslår at den modsatte retning måske er den rigtige: den diskret-symbolske oplevelse af “sandt / falsk” er et tilbagelæsnings-mønster som et hvilket som helst tilstrækkeligt konsolideret probabilistisk substrat producerer, hvad enten det er en sprogmodel, en lommeregner eller en hjerne. Hvis vi kan måle tilbagelæsnings-mønsteret i alle tre, inverterer “bare-probabilistisk”-indvendingen. Probabilistisk substrat er ikke det der diskvalificerer ræsonneren; det er det der producerer ræsonneren på denne skala.

Status og hvad der følger

Tolv forudsigelser, hvoraf seks er empirisk bekræftet (selve klippen, mætningen, replikation på tværs af arkitekturer, lommeregner-overflow-skaleringsloven, kryds-domæne præference-testen og den monotone dose-respons over elleve checkpoints). Flere er fremad-rettede og testbare: kvante-dekohærens som fætter, mental-aritmetik kapacitetsgrænse, indholds-domæne modulation på tværs af moralske og æstetiske domme, kindling-overførsel til indkodnings-nære kontradiktioner, mad-præference-læring, og mest direkte af alle: det menneskelige N400-eksperiment.

Den reneste udvidelse ud over silicium er N400-studiet. Det bruger et kendt og velkarakteriseret hjerne-signal, et kendt trænings-paradigme (nyt-domæne eksponering med overvåget læring), og en kvantitativ forudsigelse (monoton dose-respons på N400-amplitude som spejler silicium-kurven). Enten holder forudsigelsen og substrat-mekanismen breder sig, eller den gør ikke og påstanden bliver scope-begrænset til silicium. Eksperimentet er det der vil skelne de to udfald.

Companion papers

Paper 1 (Friktionsteori) — race-arkitektur-aksiomerne (R1–R3) som dette paper påberåber
Paper 10 (Race-arkitektur) — finere aksiomatisering (A1–A5) med Margolus-Levitin og Landauer-forankring
Paper 2B (ICL/FT-hukommelse) — den kumulative-gradient-tryks-mekanisme der bygger den indkodede fordeling som klippen læser tilbage
Paper 5 (Følelses-taksonomi) — biologisk-substrat distribueret reaktans: multi-locus i mennesker vs single-locus i sprogmodeller
Paper 0 (BFT) — den biologisk-substrate felt-organiseret friktions-ramme