закрытый эксперимент · I3 · 2026-05-25 · null

Калибровка собственного незнания

Гипотеза и вердикт

Гипотеза I3: «субъект знает своё незнание» — внутренняя уверенность субстрата предсказывает, верна ли ячейка доски, лучше коры. Это корень разворота «субъект-как-контроллер»: контроллер хорош ровно настолько, насколько знает свои пределы. Вердикт: null. AUC(уверенность → корректность) = 0.501 — чистый шанс.

Постановка

Экспорт: 55 552 ячейки = 36 gold-звонков (product + sessions) × 8 сидов × 2 условия. Канал субъекта — self-reported confidence (logprob недоступен в раннере). Мишень — бинарная корректность ячейки против gold-доски. Пред-зарегистрированный порог: ΔAUC(субстрат − кора) ≥ +0.05, CI исключает 0.

Числа

| предиктор | AUC → корректность | |---|---| | субстрат (confidence) | 0.501 | | кора (self-reported) | 0.538 | | комбинация | 0.529 |

ΔAUC(субстрат − кора) = −0.037, 95% CI [−0.058, −0.017] — исключает 0 с неправильной стороны; все 8 сидов < 0. §0-контроль (ablation само-модели): AUC = 0.500 ✓. ECE(субстрат) = 0.215 (плохо откалиброван). Base-rate корректности = 0.340.

Единственная аномалия — и её судьба

Срез по типу ячейки дал topic ΔAUC = +0.268 (n = 184, ~23 уникальных события × 8 сидов). Теоретически осмысленно (возврат к теме = структурное событие, «return-as-holonomy»). Это стало единственной живой нитью — и было добито отдельным тестом мощности (см. голономия): на честных n = 23 ниша не значима.

Что закрыто

Фундаментальная посылка I3 не подтверждена: confidence субъекта не несёт информации о корректности. Когерентно со всей аркой — confidence = f(tension, uncertainty), а проект уже измерил self-risk ⊥ importance. «confidence ⊥ correctness» — то же семейство нулей. Корень «субъект-как-контроллер» теряет опору.

← реестр отрицательных результатов