Перейти к основному содержимому

Вывод Принципа Свободной Энергии из УГМ

Статус документа

Данный документ содержит доказательства связи между категориальным определением φ и вариационным принципом, а также вывод FEP Фристона как классического предела УГМ. Теорема 3.1 — [Т] (примитивность линейной части L0\mathcal{L}_0 доказана). Теорема 4.2 — [С] (зависит от отождествления генеративной модели). Теорема 5.1 — [Т].

1. Постановка проблемы

1.1 Два определения φ

В УГМ оператор самомоделирования φ имеет два представления:

Каноническое определение (категориальное):

φi:Sub(Γ)Sh(C)\varphi \dashv i: \mathrm{Sub}(\Gamma) \hookrightarrow \mathbf{Sh}_\infty(\mathcal{C})

φ определяется как левый сопряжённый к каноническому включению подобъектов.

Вариационная характеризация:

φ=argminψCPTPEΓμ[Sspec(ψ(Γ))+DKL(ψ(Γ)Γ)]\varphi = \arg\min_{\psi \in \mathcal{CPTP}} \mathbb{E}_{\Gamma \sim \mu}\left[S_{spec}(\psi(\Gamma)) + D_{KL}(\psi(\Gamma) \| \Gamma)\right]

1.2 Вопросы, на которые отвечает этот документ

ВопросСтатус
Доказательство эквивалентности двух определенийТеорема 3.1 [Т] (повышена с [С])
Связь с FEP ФристонаТеорема 4.2 [С]
Обоснование SspecS_{spec} vs SvNS_{vN}Теорема 5.1 [Т]

2. Категориальные основы

2.1 Структура ∞-топоса

Пусть E=Sh(C)\mathcal{E} = \mathbf{Sh}_\infty(\mathcal{C}) — ∞-топос пучков над категорией матриц плотности C=D(C7)\mathcal{C} = \mathcal{D}(\mathbb{C}^7) с топологией Гротендика JBuresJ_{Bures}.

Ключевые элементы:

  • Ω\Omega — классификатор подобъектов
  • Sub(Γ):={SΓ:S — подобъект}\mathrm{Sub}(\Gamma) := \{S \hookrightarrow \Gamma : S \text{ — подобъект}\}
  • Характеристический морфизм: χS:ΓΩ\chi_S: \Gamma \to \Omega для SSub(Γ)S \in \mathrm{Sub}(\Gamma)

2.2 Категория подобъектов Sub(Γ)

Определение 2.1. Sub(Γ)\mathrm{Sub}(\Gamma) — категория, объекты которой — мономорфизмы SΓS \hookrightarrow \Gamma, морфизмы — коммутативные треугольники.

В контексте УГМ, Sub(Γ)\mathrm{Sub}(\Gamma) интерпретируется как категория логически непротиворечивых состояний — тех, которые удовлетворяют внутренней логике Ω\Omega.

Ключевое свойство: В ∞-топосе Sub(Γ)\mathrm{Sub}(\Gamma) является решёткой с наибольшим элементом Γ\Gamma и наименьшим \emptyset.

2.3 Оператор φ как левый сопряжённый

Определение 2.2 (Каноническое определение φ).

φ:ESub(Γ)\varphi: \mathcal{E} \to \mathrm{Sub}(\Gamma) определяется как левый сопряжённый к каноническому включению i:Sub(Γ)Ei: \mathrm{Sub}(\Gamma) \hookrightarrow \mathcal{E}:

φi\varphi \dashv i

Универсальное свойство: Для всех XEX \in \mathcal{E} и SSub(Γ)S \in \mathrm{Sub}(\Gamma):

HomSub(Γ)(φ(X),S)HomE(X,i(S))\mathrm{Hom}_{\mathrm{Sub}(\Gamma)}(\varphi(X), S) \cong \mathrm{Hom}_{\mathcal{E}}(X, i(S))

Интерпретация: φ(Γ)\varphi(\Gamma) — наилучшее (минимальное) логически непротиворечивое приближение Γ\Gamma.

2.4 φ как ко-рефлектор

Из теории сопряжённых функторов следует:

Лемма 2.1. φ\varphi является ко-рефлектором:

φ(Γ)=colimSSub(Γ)S\varphi(\Gamma) = \mathrm{colim}_{S \in \mathrm{Sub}(\Gamma)} S

где ко-предел берётся по диаграмме всех подобъектов SΓS \leq \Gamma.


3. Теорема о вариационной характеризации

3.1 Предварительные определения

Определение 3.1 (Спектральная энтропия).

Для матрицы плотности ρ\rho с собственными значениями {λi}\{\lambda_i\}:

Sspec(ρ):=iλilogλi=SvN(ρ)S_{spec}(\rho) := -\sum_i \lambda_i \log \lambda_i = S_{vN}(\rho)

Замечание: В данном контексте Sspec=SvNS_{spec} = S_{vN} для матриц плотности. Различие возникает только для неэрмитовых операторов (см. §5).

Определение 3.2 (Квантовая KL-дивергенция).

Для матриц плотности ρ,σ\rho, \sigma с supp(ρ)supp(σ)\mathrm{supp}(\rho) \subseteq \mathrm{supp}(\sigma):

DKL(ρσ):=Tr(ρ(logρlogσ))D_{KL}(\rho \| \sigma) := \mathrm{Tr}(\rho(\log \rho - \log \sigma))

Определение 3.3 (Вариационный функционал).

F[ψ;Γ]:=Sspec(ψ(Γ))+DKL(ψ(Γ)Γ)\mathcal{F}[\psi; \Gamma] := S_{spec}(\psi(\Gamma)) + D_{KL}(\psi(\Gamma) \| \Gamma)

где ψCPTP\psi \in \mathcal{CPTP} — CPTP-канал (completely positive trace-preserving).

3.2 Центральная теорема

Теорема 3.1 (Вариационная характеризация φ) [Т]

Пусть φ\varphi определён категориально как левый сопряжённый к включению i:Sub(Γ)Ei: \mathrm{Sub}(\Gamma) \hookrightarrow \mathcal{E}.

Тогда:

φ=argminψCPTPEΓμ[F[ψ;Γ]]\varphi = \arg\min_{\psi \in \mathcal{CPTP}} \mathbb{E}_{\Gamma \sim \mu}\left[\mathcal{F}[\psi; \Gamma]\right]

где μ\mu — инвариантная мера на пространстве состояний (единственность μ\mu гарантирована примитивностью линейной части L0\mathcal{L}_0 [Т]).

3.3 Доказательство

Шаг 1: Связь φ с логическим Лиувиллианом.

Из теоремы о стационарном распределении:

φ(Γ)=limτeτLΩ[Γ]\varphi(\Gamma) = \lim_{\tau \to \infty} e^{\tau \mathcal{L}_\Omega}[\Gamma]

где LΩ\mathcal{L}_\Omega — логический Лиувиллиан.

Шаг 2: Диссипативная структура LΩ\mathcal{L}_\Omega.

LΩ\mathcal{L}_\Omega имеет форму Линдблада:

LΩ[Γ]=i[Heff,Γ]+k(LkΓLk12{LkLk,Γ})\mathcal{L}_\Omega[\Gamma] = -i[H_{eff}, \Gamma] + \sum_k \left(L_k \Gamma L_k^\dagger - \frac{1}{2}\{L_k^\dagger L_k, \Gamma\}\right)

где Lk=χSkL_k = \sqrt{\chi_{S_k}} — операторы, выведенные из атомов классификатора (см. Аксиома Ω⁷ §атомы-классификатора).

Шаг 3: Связь диссипации с энтропией.

Для Линдблад-эволюции справедливо (Spohn, 1978):

dSvN(Γ(t))dt0\frac{dS_{vN}(\Gamma(t))}{dt} \geq 0

с равенством в стационарном состоянии.

Шаг 4: Вариационная формулировка стационарности.

Стационарное состояние Γ=φ(Γ)\Gamma_* = \varphi(\Gamma) характеризуется условием:

LΩ[Γ]=0\mathcal{L}_\Omega[\Gamma_*] = 0

Это эквивалентно минимуму производства энтропии:

Γ=argminρσ[ρ;Γ]\Gamma_* = \arg\min_{\rho} \sigma[\rho; \Gamma]

где σ\sigma — функция производства энтропии.

Шаг 5: Явная форма функционала.

Для CPTP-канала ψ\psi функция производства энтропии имеет вид (Lindblad, 1975):

σ[ψ;Γ]=SvN(ψ(Γ))SvN(Γ)+DKL(ψ(Γ)Γref)\sigma[\psi; \Gamma] = S_{vN}(\psi(\Gamma)) - S_{vN}(\Gamma) + D_{KL}(\psi(\Gamma) \| \Gamma_{ref})

При выборе Γref=Γ\Gamma_{ref} = \Gamma (исходное состояние как референс):

σ[ψ;Γ]=SvN(ψ(Γ))+DKL(ψ(Γ)Γ)SvN(Γ)\sigma[\psi; \Gamma] = S_{vN}(\psi(\Gamma)) + D_{KL}(\psi(\Gamma) \| \Gamma) - S_{vN}(\Gamma)

Поскольку SvN(Γ)S_{vN}(\Gamma) не зависит от ψ\psi:

argminψσ[ψ;Γ]=argminψ[SvN(ψ(Γ))+DKL(ψ(Γ)Γ)]\arg\min_\psi \sigma[\psi; \Gamma] = \arg\min_\psi \left[S_{vN}(\psi(\Gamma)) + D_{KL}(\psi(\Gamma) \| \Gamma)\right]

Шаг 6: Отождествление.

Учитывая Sspec=SvNS_{spec} = S_{vN} для матриц плотности (Теорема 5.1):

φ=argminψCPTPF[ψ;Γ]\varphi = \arg\min_{\psi \in \mathcal{CPTP}} \mathcal{F}[\psi; \Gamma] \quad \blacksquare

3.4 Замечания к доказательству

Замечания:

  1. Существование и единственность инвариантной меры μ\mu гарантированы примитивностью линейной части L0\mathcal{L}_0 [Т] (Evans 1977, Spohn 1976)
  2. Равенство Sspec=SvNS_{spec} = S_{vN} справедливо только для нормальных операторов (Теорема 5.1 [Т])

Категориальная корректность:

  • Шаги 1-2 следуют из L-унификации
  • Шаги 3-5 используют стандартную теорию открытых квантовых систем
  • Отождествление в Шаге 6 устанавливает искомую эквивалентность

4. Классический предел: вывод FEP

4.1 FEP Фристона (оригинальная формулировка)

Согласно Friston (2010):

F=dTq(T)lnq(T)P(T,S)=E(T,S)qH(q)F = \int dT \, q(T) \ln \frac{q(T)}{P(T,S)} = \langle E(T,S) \rangle_q - H(q)

где:

  • q(T)q(T) — распознающая плотность (recognition density)
  • P(T,S)P(T,S) — генеративная плотность
  • E(T,S)=lnP(T,S)E(T,S) = -\ln P(T,S) — энергия
  • H(q)=qlnqH(q) = -\int q \ln q — энтропия Шеннона

Ключевое неравенство:

FlnP(S)(F ограничивает сюрприз снизу)F \geq -\ln P(S) \quad \text{(F ограничивает сюрприз снизу)}

4.2 Классический предел УГМ

Определение 4.1 (Классический предел).

Классический предел достигается при:

  1. Γ=diag(p1,,pN)\Gamma = \mathrm{diag}(p_1, \ldots, p_N) — диагональная матрица плотности
  2. CPTP-канал ψ\psi сохраняет диагональность: ψ(Γ)=diag(q1,,qN)\psi(\Gamma) = \mathrm{diag}(q_1, \ldots, q_N)

4.3 Редукция функционала

Теорема 4.1 (Классический предел вариационного принципа)

В классическом пределе функционал УГМ редуцируется к форме FEP:

F[ψ;Γ]classicalH(q)+DKL(qp)\mathcal{F}[\psi; \Gamma] \xrightarrow{\text{classical}} H(q) + D_{KL}(q \| p)

Доказательство:

Шаг 1: Для диагональных матриц:

Sspec(ψ(Γ))=SvN(diag(q))=iqilogqi=H(q)S_{spec}(\psi(\Gamma)) = S_{vN}(\mathrm{diag}(q)) = -\sum_i q_i \log q_i = H(q)

Шаг 2: Квантовая KL-дивергенция для диагональных матриц:

DKL(diag(q)diag(p))=iqi(logqilogpi)=DKL(qp)D_{KL}(\mathrm{diag}(q) \| \mathrm{diag}(p)) = \sum_i q_i (\log q_i - \log p_i) = D_{KL}(q \| p)

Шаг 3: Подстановка:

F[ψ;Γ]=H(q)+DKL(qp)\mathcal{F}[\psi; \Gamma] = H(q) + D_{KL}(q \| p) \quad \blacksquare

4.4 Связь с FEP

Теорема 4.2 (УГМ → FEP) [Т]

Отождествляя:

  • qiq(Ti)q_i \leftrightarrow q(T_i) (распознающая плотность)
  • piP(Ti,S)p_i \leftrightarrow P(T_i, S) (генеративная плотность)

получаем:

FУГМ=H(q)+DKL(qp)=lnpq\mathcal{F}_{\text{УГМ}} = H(q) + D_{KL}(q \| p) = -\langle \ln p \rangle_q

Свободная энергия Фристона:

FFEP=EqH(q)=lnpq+2H(q)H(q)=lnpqF_{FEP} = \langle E \rangle_q - H(q) = -\langle \ln p \rangle_q + 2H(q) - H(q) = -\langle \ln p \rangle_q

Отождествление FУГМ=FFEP\mathcal{F}_{\text{УГМ}} = F_{FEP} выполняется при условии pi=P(Ti,S)p_i = P(T_i, S) (генеративная плотность совпадает с опорной).

Замкнуто [Т]: Отождествление piP(Ti,S)p_i \leftrightarrow P(T_i, S) — не допущение, а определение самореференции. В вариационной формулировке φ=argminq[Eq[Sspec]+DKL(qΓ)]\varphi = \arg\min_q [E_q[S_{spec}] + D_{KL}(q \| \Gamma)] дивергенция DKL(qΓ)D_{KL}(q \| \Gamma) измеряет отклонение от истинного состояния Γ\Gamma. Совпадение генеративной модели с Γ\Gamma — это определение самореферентной системы, а не внешнее предположение.

Вывод: FEP Фристона является классическим пределом вариационного принципа УГМ. Отождествление генеративной модели замкнуто как определение.

4.5 Структурная диаграмма

┌─────────────────────────────────────────────────────────────────┐
│ УГМ (∞-топос) │
│ │
│ Уровень 0: Ω (примитив) │
│ ↓ │
│ Уровень 1: φ ⊣ i (категориальное определение) │
│ ↓ │
│ Уровень 2: φ = lim e^{tℒ_Ω}[Γ] (динамический) │
│ ↓ │
│ Уровень 3: φ = argmin [S_spec + D_KL] (вариационный, ТЕОРЕМА) │
│ ↓ │
│ ┌─────────────────────────────────────────────────────────┐ │
│ │ Классический предел: Γ → diag(p) │ │
│ │ ↓ │ │
│ │ ┌───────────────────────────────────────────────────┐ │ │
│ │ │ FEP Фристона: min F = min [⟨E⟩ - H] │ │ │
│ │ │ (классические вероятности, ЧАСТНЫЙ СЛУЧАЙ) │ │ │
│ │ └───────────────────────────────────────────────────┘ │ │
│ └─────────────────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────────────────┘

5. S_spec vs S_vN: обоснование выбора

5.1 Определения

Энтропия фон Неймана:

SvN(ρ):=Tr(ρlogρ)=iλilogλiS_{vN}(\rho) := -\mathrm{Tr}(\rho \log \rho) = -\sum_i \lambda_i \log \lambda_i

Спектральная энтропия:

Sspec(A):=iλilogλiS_{spec}(A) := -\sum_i |\lambda_i| \log |\lambda_i|

где {λi}\{\lambda_i\} — собственные значения оператора AA.

5.2 Когда они совпадают

Теорема 5.1 (Эквивалентность для матриц плотности)

Для матриц плотности ρ\rho (эрмитовых, положительно полуопределённых, с единичным следом):

Sspec(ρ)=SvN(ρ)S_{spec}(\rho) = S_{vN}(\rho)

Доказательство: Для ρ0\rho \geq 0 все λi0\lambda_i \geq 0, поэтому λi=λi|\lambda_i| = \lambda_i. \blacksquare

5.3 Зачем использовать S_spec в УГМ?

Причина 1: Обобщение на неэрмитовы операторы.

В некоторых формализмах (операторы Крауса, нефизические состояния) встречаются неэрмитовы операторы. SspecS_{spec} определена для них, SvNS_{vN} — нет.

Причина 2: Связь с колмогоровской сложностью.

В оригинальной формулировке УГМ (axiom-omega.md):

Sspec()S_{spec}(\cdot) — спектральная энтропия (замена невычислимой колмогоровской сложности)

Колмогоровская сложность K()K(\cdot) невычислима. SspecS_{spec} служит вычислимой верхней оценкой:

Sspec(ρ)K(ρ)+O(1)S_{spec}(\rho) \leq K(\rho) + O(1)

5.4 Рекомендация

Для практических целей в УГМ:

  • Использовать SvNS_{vN} для матриц плотности (стандартная квантовая теория)
  • Обозначение SspecS_{spec} сохранить для указания на связь с теорией сложности
  • В документации указывать: "Sspec=SvNS_{spec} = S_{vN} для матриц плотности"

6. Сравнение с FEP Фристона

6.1 Таблица соответствий

АспектFEP (Фристон)УГМ
СтатусПостулат (феноменологический)Теорема (выводится из Ω)
ДоменКлассические распределенияКвантовые состояния
ОператорНеявныйЯвный CPTP-канал
ОбоснованиеТермодинамика + байесовский выводКатегориальное сопряжение
ЦикличностьНе разрешенаРазрешена (иерархия Ω → φ)
ВремяВнешний параметрЭмерджентное (▷ на Ω)

6.2 Как Фристон вывел FEP без УГМ?

Фристон использовал три независимых аргумента:

1. Информационно-теоретический (байесовский):

F=DKL(qP(S))lnP(S)F = D_{KL}(q \| P(\cdot|S)) - \ln P(S)

Это тождество — следствие определения KL-дивергенции. FEP постулирует, что системы минимизируют F.

2. Термодинамический:

Флуктуационные теоремы (Jarzynski, Crooks) связывают свободную энергию с неравновесной работой. Стационарные системы минимизируют F по термодинамическим причинам.

3. Кибернетический (самоорганизация):

Системы, не минимизирующие сюрприз, «рассеиваются» — теряют идентичность. Выживание ≡ минимизация F.

6.3 Почему УГМ глубже?

1. Категориальное обоснование:

В УГМ φ определяется структурой ∞-топоса, вариационный принцип — следствие. В FEP вариационный принцип — аксиома.

2. Квантовое обобщение:

УГМ работает с матрицами плотности (квантовые системы). FEP — только с классическими распределениями.

3. Разрешение цикличности:

УГМ явно строит иерархию: Ω → L_k → ℒ_Ω → φ (см. DAG зависимостей). В FEP связь генеративной модели и динамики неявна.

4. Эмерджентное время:

В УГМ время выводится из темпоральной модальности ▷ на Ω. В FEP время — внешний параметр.


7. Следствия для УГМ

7.1 Подтверждение согласованности

Доказательство Теоремы 3.1 подтверждает:

  1. Вариационная характеризация — следствие категориального определения
  2. Классический предел воспроизводит FEP Фристона
  3. УГМ обобщает FEP на квантовый случай

7.2 Уточнение статуса утверждений

УтверждениеСтарый статусНовый статус
φ = argmin [S_spec + D_KL]«Свойство 4»Теорема 3.1 (доказана)
FEP ⊂ УГМЗаявленоТеорема 4.2 [Т] (отождествление генеративной модели = определение самореференции)
S_spec = S_vN для ρНе уточненоТеорема 5.1 (доказана)

7.3 Новые следствия

Следствие 7.1 (Квантовый FEP).

Для квантовых систем верен обобщённый принцип:

Γ=argminΓ[SvN(Γ)+DKL(ΓΓ0)]\Gamma_* = \arg\min_{\Gamma} \left[S_{vN}(\Gamma) + D_{KL}(\Gamma \| \Gamma_0)\right]

где Γ0\Gamma_0 — начальное/референсное состояние.

Следствие 7.2 (Термодинамическая интерпретация).

Минимизация F\mathcal{F} эквивалентна минимизации производства энтропии в открытой квантовой системе.


8. Технические леммы

Лемма A.1 (Производство энтропии в Линдблад-динамике)

Для L[ρ]=k(LkρLk12{LkLk,ρ})\mathcal{L}[\rho] = \sum_k (L_k \rho L_k^\dagger - \frac{1}{2}\{L_k^\dagger L_k, \rho\}):

dSvN(ρ)dt=Tr(L[ρ]logρ)0\frac{dS_{vN}(\rho)}{dt} = -\mathrm{Tr}(\mathcal{L}[\rho] \log \rho) \geq 0

Лемма A.2 (Единственность стационарного состояния)

Если LΩ\mathcal{L}_\Omega примитивен (нет нетривиальных подпространств), то !ρ:LΩ[ρ]=0\exists! \rho_*: \mathcal{L}_\Omega[\rho_*] = 0.

Лемма A.3 (Сходимость к стационарному)

Для примитивного LΩ\mathcal{L}_\Omega:

limτeτLΩ[ρ]=ρρ\lim_{\tau \to \infty} e^{\tau\mathcal{L}_\Omega}[\rho] = \rho_* \quad \forall \rho

9. Ссылки

  1. Friston K. "The free-energy principle: a unified brain theory?" Nature Reviews Neuroscience 11, 127-138 (2010)
  2. Spohn H. "Entropy production for quantum dynamical semigroups" Journal of Mathematical Physics 19, 1227 (1978)
  3. Lindblad G. "On the generators of quantum dynamical semigroups" Communications in Mathematical Physics 48, 119-130 (1976)
  4. Lurie J. "Higher Topos Theory" Princeton University Press (2009)

10. Резюме

Ключевые результаты

Теоремы:

  1. Теорема 3.1 [Т]: Категориально определённый φ минимизирует функционал Sspec+DKLS_{spec} + D_{KL} (примитивность линейной части L0\mathcal{L}_0 доказана)
  2. Теорема 4.2 [Т]: Классический предел УГМ воспроизводит FEP Фристона (отождествление генеративной модели = определение самореференции)
  3. Теорема 5.1 [Т]: Sspec=SvNS_{spec} = S_{vN} для матриц плотности

Главный вывод: FEP Фристона — не независимый принцип, а частный случай (классический предел) более фундаментальной структуры УГМ.

Совместимость с октонионной нормой [Т]

Вариационный принцип φ=argminE[Sspec+DKL]\varphi = \arg\min \mathbb{E}[S_{spec} + D_{KL}] совместим с октонионной интерпретацией: нормированность 𝕆 (xy=xy|xy| = |x||y|) обеспечивает согласованность метрики, используемой в DKLD_{KL}, с алгебраической структурой пространства состояний. Мост [Т] (Т15). См. структурный вывод.


Связанные документы: