Перейти к основному содержимому

Вывод Принципа Свободной Энергии из УГМ

Статус документа

Данный документ содержит доказательства связи между категориальным определением φ и вариационным принципом, а также вывод FEP Фристона как классического предела УГМ. Теорема 3.1 — [Т] (примитивность линейной части L0\mathcal{L}_0 доказана). Теорема 4.1 — [Т] (классический предел). Теорема 4.2 — [Т] (отождествление генеративной модели = определение самореференции). Теорема 4.3 — [Т] (полная редукция Sspec+DKLS_{spec} + D_{KL} к FFEPF_{FEP}). Теорема 5.1 — [Т].

1. Постановка проблемы

1.1 Два определения φ

В УГМ оператор самомоделирования φ имеет два представления:

Каноническое определение (категориальное):

φi:Sub(Γ)Sh(C)\varphi \dashv i: \mathrm{Sub}(\Gamma) \hookrightarrow \mathbf{Sh}_\infty(\mathcal{C})

φ определяется как левый сопряжённый к каноническому включению подобъектов.

Вариационная характеризация:

φ=argminψCPTPEΓμ[Sspec(ψ(Γ))+DKL(ψ(Γ)Γ)]\varphi = \arg\min_{\psi \in \mathcal{CPTP}} \mathbb{E}_{\Gamma \sim \mu}\left[S_{spec}(\psi(\Gamma)) + D_{KL}(\psi(\Gamma) \| \Gamma)\right]

1.2 Вопросы, на которые отвечает этот документ

ВопросСтатус
Доказательство эквивалентности двух определенийТеорема 3.1 [Т] (повышена с [С])
Классический предел вариационного принципаТеорема 4.1 [Т]
Связь с FEP ФристонаТеорема 4.2 [Т] (замкнуто: генеративная модель = определение самореференции)
Полная редукция Sspec+DKLS_{spec} + D_{KL} к FFEPF_{FEP}Теорема 4.3 [Т]
Обоснование SspecS_{spec} vs SvNS_{vN}Теорема 5.1 [Т]

2. Категориальные основы

2.1 Структура ∞-топоса

Пусть E=Sh(C)\mathcal{E} = \mathbf{Sh}_\infty(\mathcal{C}) — ∞-топос пучков над категорией матриц плотности C=D(C7)\mathcal{C} = \mathcal{D}(\mathbb{C}^7) с топологией Гротендика JBuresJ_{Bures}.

Ключевые элементы:

  • Ω\Omega — классификатор подобъектов
  • Sub(Γ):={SΓ:S — подобъект}\mathrm{Sub}(\Gamma) := \{S \hookrightarrow \Gamma : S \text{ — подобъект}\}
  • Характеристический морфизм: χS:ΓΩ\chi_S: \Gamma \to \Omega для SSub(Γ)S \in \mathrm{Sub}(\Gamma)

2.2 Категория подобъектов Sub(Γ)

Определение 2.1. Sub(Γ)\mathrm{Sub}(\Gamma) — категория, объекты которой — мономорфизмы SΓS \hookrightarrow \Gamma, морфизмы — коммутативные треугольники.

В контексте УГМ, Sub(Γ)\mathrm{Sub}(\Gamma) интерпретируется как категория логически непротиворечивых состояний — тех, которые удовлетворяют внутренней логике Ω\Omega.

Ключевое свойство: В ∞-топосе Sub(Γ)\mathrm{Sub}(\Gamma) является решёткой с наибольшим элементом Γ\Gamma и наименьшим \emptyset.

2.3 Оператор φ как левый сопряжённый

Определение 2.2 (Каноническое определение φ).

φ:ESub(Γ)\varphi: \mathcal{E} \to \mathrm{Sub}(\Gamma) определяется как левый сопряжённый к каноническому включению i:Sub(Γ)Ei: \mathrm{Sub}(\Gamma) \hookrightarrow \mathcal{E}:

φi\varphi \dashv i

Универсальное свойство: Для всех XEX \in \mathcal{E} и SSub(Γ)S \in \mathrm{Sub}(\Gamma):

HomSub(Γ)(φ(X),S)HomE(X,i(S))\mathrm{Hom}_{\mathrm{Sub}(\Gamma)}(\varphi(X), S) \cong \mathrm{Hom}_{\mathcal{E}}(X, i(S))

Интерпретация: φ(Γ)\varphi(\Gamma) — наилучшее (минимальное) логически непротиворечивое приближение Γ\Gamma.

2.4 φ как ко-рефлектор

Из теории сопряжённых функторов следует:

Лемма 2.1. φ\varphi является ко-рефлектором:

φ(Γ)=colimSSub(Γ)S\varphi(\Gamma) = \mathrm{colim}_{S \in \mathrm{Sub}(\Gamma)} S

где ко-предел берётся по диаграмме всех подобъектов SΓS \leq \Gamma.


3. Теорема о вариационной характеризации

3.1 Предварительные определения

Определение 3.1 (Спектральная энтропия).

Для матрицы плотности ρ\rho с собственными значениями {λi}\{\lambda_i\}:

Sspec(ρ):=iλilogλi=SvN(ρ)S_{spec}(\rho) := -\sum_i \lambda_i \log \lambda_i = S_{vN}(\rho)

Замечание: В данном контексте Sspec=SvNS_{spec} = S_{vN} для матриц плотности. Различие возникает только для неэрмитовых операторов (см. §5).

Определение 3.2 (Квантовая KL-дивергенция).

Для матриц плотности ρ,σ\rho, \sigma с supp(ρ)supp(σ)\mathrm{supp}(\rho) \subseteq \mathrm{supp}(\sigma):

DKL(ρσ):=Tr(ρ(logρlogσ))D_{KL}(\rho \| \sigma) := \mathrm{Tr}(\rho(\log \rho - \log \sigma))

Определение 3.3 (Вариационный функционал).

F[ψ;Γ]:=Sspec(ψ(Γ))+DKL(ψ(Γ)Γ)\mathcal{F}[\psi; \Gamma] := S_{spec}(\psi(\Gamma)) + D_{KL}(\psi(\Gamma) \| \Gamma)

где ψCPTP\psi \in \mathcal{CPTP} — CPTP-канал (completely positive trace-preserving).

3.2 Центральная теорема

Теорема 3.1 (Вариационная характеризация φ) [Т]

Пусть φ\varphi определён категориально как левый сопряжённый к включению i:Sub(Γ)Ei: \mathrm{Sub}(\Gamma) \hookrightarrow \mathcal{E}.

Тогда:

φ=argminψCPTPEΓμ[F[ψ;Γ]]\varphi = \arg\min_{\psi \in \mathcal{CPTP}} \mathbb{E}_{\Gamma \sim \mu}\left[\mathcal{F}[\psi; \Gamma]\right]

где μ\mu — инвариантная мера на пространстве состояний (единственность μ\mu гарантирована примитивностью линейной части L0\mathcal{L}_0 [Т]).

3.3 Доказательство

Шаг 1: Связь φ с логическим Лиувиллианом.

Из теоремы о стационарном распределении:

φ(Γ)=limτeτLΩ[Γ]\varphi(\Gamma) = \lim_{\tau \to \infty} e^{\tau \mathcal{L}_\Omega}[\Gamma]

где LΩ\mathcal{L}_\Omega — логический Лиувиллиан.

Шаг 2: Диссипативная структура LΩ\mathcal{L}_\Omega.

LΩ\mathcal{L}_\Omega имеет форму Линдблада:

LΩ[Γ]=i[Heff,Γ]+k(LkΓLk12{LkLk,Γ})\mathcal{L}_\Omega[\Gamma] = -i[H_{eff}, \Gamma] + \sum_k \left(L_k \Gamma L_k^\dagger - \frac{1}{2}\{L_k^\dagger L_k, \Gamma\}\right)

где Lk=χSkL_k = \sqrt{\chi_{S_k}} — операторы, выведенные из атомов классификатора (см. Аксиома Ω⁷ §атомы-классификатора).

Шаг 3: Связь диссипации с энтропией.

Для Линдблад-эволюции справедливо (Spohn, 1978):

dSvN(Γ(t))dt0\frac{dS_{vN}(\Gamma(t))}{dt} \geq 0

с равенством в стационарном состоянии.

Шаг 4: Вариационная формулировка стационарности.

Стационарное состояние Γ=φ(Γ)\Gamma_* = \varphi(\Gamma) характеризуется условием:

LΩ[Γ]=0\mathcal{L}_\Omega[\Gamma_*] = 0

Это эквивалентно минимуму производства энтропии:

Γ=argminρσ[ρ;Γ]\Gamma_* = \arg\min_{\rho} \sigma[\rho; \Gamma]

где σ\sigma — функция производства энтропии.

Шаг 5: Явная форма функционала.

Для CPTP-канала ψ\psi функция производства энтропии имеет вид (Lindblad, 1975):

σ[ψ;Γ]=SvN(ψ(Γ))SvN(Γ)+DKL(ψ(Γ)Γref)\sigma[\psi; \Gamma] = S_{vN}(\psi(\Gamma)) - S_{vN}(\Gamma) + D_{KL}(\psi(\Gamma) \| \Gamma_{ref})

При выборе Γref=Γ\Gamma_{ref} = \Gamma (исходное состояние как референс):

Выбор Γ_ref = Γ

Отождествление Γ_ref = Γ — мотивированное определение (самореферентная минимизация), а не вывод из L_Ω. Мотивация: автопоэзис (A1) требует, чтобы система минимизировала различие между собой и своей моделью, что отвечает Γ_ref = Γ. Альтернативные выборы (Γ_ref = I/7 или Γ_ref = ρ*) дают другие функционалы. Выбор Γ_ref = Γ — единственный, при котором минимум F совпадает с неподвижной точкой φ (теорема).

σ[ψ;Γ]=SvN(ψ(Γ))+DKL(ψ(Γ)Γ)SvN(Γ)\sigma[\psi; \Gamma] = S_{vN}(\psi(\Gamma)) + D_{KL}(\psi(\Gamma) \| \Gamma) - S_{vN}(\Gamma)

Поскольку SvN(Γ)S_{vN}(\Gamma) не зависит от ψ\psi:

argminψσ[ψ;Γ]=argminψ[SvN(ψ(Γ))+DKL(ψ(Γ)Γ)]\arg\min_\psi \sigma[\psi; \Gamma] = \arg\min_\psi \left[S_{vN}(\psi(\Gamma)) + D_{KL}(\psi(\Gamma) \| \Gamma)\right]

Шаг 6: Отождествление.

Учитывая Sspec=SvNS_{spec} = S_{vN} для матриц плотности (Теорема 5.1):

φ=argminψCPTPF[ψ;Γ]\varphi = \arg\min_{\psi \in \mathcal{CPTP}} \mathcal{F}[\psi; \Gamma] \quad \blacksquare

3.4 Замечания к доказательству

Замечания:

  1. Существование и единственность инвариантной меры μ\mu гарантированы примитивностью линейной части L0\mathcal{L}_0 [Т] (Evans 1977, Spohn 1976)
  2. Равенство Sspec=SvNS_{spec} = S_{vN} справедливо только для нормальных операторов (Теорема 5.1 [Т])

Категориальная корректность:

  • Шаги 1-2 следуют из L-унификации
  • Шаги 3-5 используют стандартную теорию открытых квантовых систем
  • Отождествление в Шаге 6 устанавливает искомую эквивалентность

4. Классический предел: полный вывод FEP

В этом разделе мы строго покажем, что FEP Фристона является частным случаем вариационного принципа УГМ, возникающим при переходе к классическому пределу. Вывод состоит из трёх этапов: (i) определение классического предела как R0R \to 0 (декогеренция), (ii) редукция квантового функционала к классическому, (iii) отождествление элементов УГМ с конструкциями Фристона. Завершает раздел анализ того, что утрачивается при классическом пределе.

4.1 FEP Фристона (оригинальная формулировка)

Согласно Friston (2010), агент, взаимодействующий со средой, минимизирует вариационную свободную энергию:

F=dsq(s)lnq(s)p(s,o)=E(s,o)qвнутренняя энергияH(q)энтропияF = \int ds \, q(s) \ln \frac{q(s)}{p(s,o)} = \underbrace{\langle E(s,o) \rangle_q}_{\text{внутренняя энергия}} - \underbrace{H(q)}_{\text{энтропия}}

где:

  • ss — скрытые (латентные) состояния мира
  • oo — наблюдения (сенсорные данные)
  • q(s)q(s)распознающая плотность (recognition density) — внутренняя модель агента
  • p(s,o)p(s,o)генеративная плотность (generative density) — совместная модель
  • E(s,o)=lnp(s,o)E(s,o) = -\ln p(s,o) — энергия генеративной модели
  • H(q)=qlnqH(q) = -\int q \ln q — энтропия Шеннона распознающей плотности

Ключевое неравенство (evidence lower bound, ELBO):

Flnp(o)(F ограничивает сюрприз снизу)F \geq -\ln p(o) \quad \text{(F ограничивает сюрприз снизу)}

Доказательство: F=DKL(q(s)p(so))lnp(o)F = D_{KL}(q(s) \| p(s|o)) - \ln p(o), а DKL0D_{KL} \geq 0.

Эквивалентная запись через KL-дивергенцию:

F=DKL(q(s)p(so))lnp(o)=H(q)+DKL(qpprior)+constF = D_{KL}(q(s) \| p(s|o)) - \ln p(o) = H(q) + D_{KL}(q \| p_{\text{prior}}) + \text{const}

4.2 Классический предел УГМ: формализация через R0R \to 0

Определение 4.1 (Классический предел УГМ).

Классический предел УГМ определяется двумя эквивалентными условиями:

(a) Декогеренция внедиагональных элементов. Матрица плотности теряет когерентности:

Γij0для ij,Γdiag(p1,,pN)\Gamma_{ij} \to 0 \quad \text{для } i \neq j, \qquad \Gamma \to \mathrm{diag}(p_1, \ldots, p_N)

(b) Предел нулевой рефлексии. Мера рефлексии R=1/(7P)R = 1/(7P) стремится к минимуму:

RRmin=17(при P1, т.е. чистое диагональное состояние)R \to R_{\min} = \frac{1}{7} \quad \text{(при } P \to 1, \text{ т.е. чистое диагональное состояние)}

Лемма 4.1 (Классический предел).

(a) Декогеренция (γ_{ij} → 0 при i ≠ j) влечёт R → 1/(7·1) = 1/7 (поскольку P → max_i γ_{ii}² ≤ 1, и для равновесной диагональной Γ: P ≈ 1/7, R ≈ 1).

(b) Обратное неверно: R = 1/7 ⟺ P = 1, что достижимо для чистого когерентного состояния |ψ⟩⟨ψ| с максимальными когерентностями. Классический предел определяется условием (a) — декогеренция, а не через R.

Доказательство. (a) При Γij0\Gamma_{ij} \to 0 для iji \neq j чистота P=Tr(Γ2)=ipi2+2i<jΓij2P = \mathrm{Tr}(\Gamma^2) = \sum_i p_i^2 + 2\sum_{i < j} |\Gamma_{ij}|^2 редуцируется к P=ipi2P = \sum_i p_i^2. Внедиагональные когерентности непосредственно входят в Gap-оператор Gij\mathcal{G}_{ij} (см. динамика Gap); при Γij0\Gamma_{ij} \to 0 все Gap-элементы обнуляются: Gij0\mathcal{G}_{ij} \to 0. Для равновесной диагональной матрицы pi=1/Np_i = 1/N: P=1/NP = 1/N, R=1/(NP)=1R = 1/(NP) = 1. Для одного доминирующего pk1p_k \to 1: P1P \to 1, R=1/(7P)1/7R = 1/(7P) \to 1/7.

(b) Контрпример: чистое состояние ψ=17k=06k|ψ⟩ = \frac{1}{\sqrt{7}}\sum_{k=0}^{6} |k⟩ даёт P=1P = 1, R=1/7R = 1/7, но имеет максимальные когерентности Γij=1/7|\Gamma_{ij}| = 1/7 для всех iji \neq j. Следовательно, R=1/7R = 1/7 не эквивалентно декогеренции. \blacksquare

Физический смысл. Классический предел — это полная декогеренция: система теряет все квантовые корреляции между измерениями. В терминах сознания: система не интегрирована (Φ0\Phi \to 0), не рефлексивна (R<RthR < R_{th}), не обладает Gap-структурой. Это мир чисто классических вероятностей.

(c) Ограничение CPTP-канала. В классическом пределе CPTP-канал ψ\psi сохраняет диагональность:

ψ(diag(p))=diag(q),qi=jTijpj,Tij0,iTij=1\psi(\mathrm{diag}(p)) = \mathrm{diag}(q), \qquad q_i = \sum_j T_{ij} p_j, \quad T_{ij} \geq 0, \quad \sum_i T_{ij} = 1

Канал вырождается в стохастическую матрицу TT — классический марковский переход.

4.3 Редукция квантового функционала

Теорема 4.1 (Классический предел вариационного принципа) [Т] {#теорема-41-классический-предел}

В классическом пределе (Γij0\Gamma_{ij} \to 0 для iji \neq j) вариационный функционал УГМ (Теорема 3.1) редуцируется к классической вариационной свободной энергии:

F[ψ;Γ]Γij0RRminFcl[q;p]=H(q)+DKL(qp)\mathcal{F}[\psi; \Gamma] \xrightarrow[\Gamma_{ij}\to 0]{R \to R_{\min}} F_{cl}[q; p] = H(q) + D_{KL}(q \| p)

Доказательство.

Шаг 1 (Спектральная энтропия → энтропия Шеннона). Для диагональных матриц собственные значения совпадают с диагональными элементами:

Sspec(ψ(Γ))=SvN(diag(q))=iqilogqi=H(q)S_{spec}(\psi(\Gamma)) = S_{vN}(\mathrm{diag}(q)) = -\sum_i q_i \log q_i = H(q)

Это прямое следствие Теоремы 5.1 (Sspec=SvNS_{spec} = S_{vN} для матриц плотности).

Шаг 2 (Квантовая KL → классическая KL). Для диагональных матриц квантовая дивергенция Умегаки редуцируется:

DKL(diag(q)diag(p))=Tr(diag(q)[logdiag(q)logdiag(p)])=iqi(logqilogpi)=DKL(qp)D_{KL}(\mathrm{diag}(q) \| \mathrm{diag}(p)) = \mathrm{Tr}\big(\mathrm{diag}(q)[\log \mathrm{diag}(q) - \log \mathrm{diag}(p)]\big) = \sum_i q_i (\log q_i - \log p_i) = D_{KL}(q \| p)

Шаг 3 (Подстановка). Объединяя шаги 1 и 2:

F[ψ;Γ]=H(q)+DKL(qp)=Fcl[q;p]\mathcal{F}[\psi; \Gamma] = H(q) + D_{KL}(q \| p) = F_{cl}[q; p] \quad \blacksquare

Замечание. Усреднение EΓμ\mathbb{E}_{\Gamma \sim \mu} в Теореме 3.1 в классическом пределе сводится к обычному математическому ожиданию по стационарному распределению марковской цепи (единственность гарантирована примитивностью L0\mathcal{L}_0).

4.4 Вывод классической вариационной свободной энергии Фристона

Теперь выполним полный вывод F=Eq[lnq(s)lnp(s,o)]F = \mathbb{E}_q[\ln q(s) - \ln p(s,o)] из вариационной характеризации φ\varphi.

Шаг 1 (Идентификация переменных). В рамках УГМ введём отождествление:

УГМFEP (Фристон)Смысл
Γ=diag(p1,,pN)\Gamma = \mathrm{diag}(p_1, \ldots, p_N)p(s,o)p(s,o) (генеративная плотность)Полное состояние системы = генеративная модель мира
ψ(Γ)=diag(q1,,qN)\psi(\Gamma) = \mathrm{diag}(q_1, \ldots, q_N)q(s)q(s) (распознающая плотность)Самомодель = приблизительный вывод
φ(Γ)\varphi(\Gamma)q(so)=p(so)q^*(s\|o) = p(s\|o)Оптимальная самомодель = истинный постериор
F[ψ;Γ]\mathcal{F}[\psi; \Gamma]F[q;p]F[q; p]Вариационная свободная энергия
minψF\min_\psi \mathcal{F}minqF\min_q FВариационный вывод

Шаг 2 (Раскрытие функционала). Запишем F\mathcal{F} в классическом пределе:

F[q;p]=H(q)+DKL(qp)=iqilogqi+iqilogqipi\mathcal{F}[q; p] = H(q) + D_{KL}(q \| p) = -\sum_i q_i \log q_i + \sum_i q_i \log \frac{q_i}{p_i}

Упрощая:

F[q;p]=iqi(logqilogpi)=Eq[logqlogp]\mathcal{F}[q; p] = \sum_i q_i (\log q_i - \log p_i) = \mathbb{E}_q[\log q - \log p]

В непрерывном пределе (NN \to \infty, суммы → интегралы):

F[q;p]=dsq(s)lnq(s)p(s,o)=FFEP\mathcal{F}[q; p] = \int ds \, q(s) \ln \frac{q(s)}{p(s,o)} = F_{FEP}

Это в точности вариационная свободная энергия Фристона.

Шаг 3 (Эквивалентные формы). Раскладывая p(s,o)=p(os)p(s)p(s,o) = p(o|s) p(s):

FFEP=dsq(s)lnq(s)p(s)dsq(s)lnp(os)=DKL(q(s)p(s))lnp(os)qF_{FEP} = \int ds \, q(s) \ln \frac{q(s)}{p(s)} - \int ds \, q(s) \ln p(o|s) = D_{KL}(q(s) \| p(s)) - \langle \ln p(o|s) \rangle_q

Первый член — сложность (отклонение от приора), второй — точность (ожидаемое правдоподобие). Минимизация FF = баланс точности и сложности — это классический аналог баланса спектральной энтропии и KL-дивергенции в Теореме 3.1.

Теорема 4.2 (УГМ → FEP Фристона) [Т] {#теорема-42-угм-fep}

Пусть Γ\Gamma — состояние голонома в классическом пределе (Γij=0\Gamma_{ij} = 0 при iji \neq j). Тогда:

(i) Оператор самомоделирования φ\varphi в классическом пределе отождествляется с распознающей плотностью: φ(Γ)q(so)\varphi(\Gamma) \leftrightarrow q^*(s|o).

(ii) Матрица плотности Γ\Gamma отождествляется с генеративной моделью: Γp(s,o)\Gamma \leftrightarrow p(s,o).

(iii) Минимизация функционала УГМ совпадает с минимизацией свободной энергии Фристона:

minψCPTPF[ψ;Γ]=minqFFEP[q;p]\min_{\psi \in \mathcal{CPTP}} \mathcal{F}[\psi; \Gamma] = \min_{q} F_{FEP}[q; p]

(iv) Ключевое неравенство (ELBO) выводится автоматически:

F[ψ;Γ]SvN(Γ)Flnp(o)\mathcal{F}[\psi; \Gamma] \geq S_{vN}(\Gamma) \quad \Longleftrightarrow \quad F \geq -\ln p(o)

Замкнутость отождествления [Т]. Отождествление Γp(s,o)\Gamma \leftrightarrow p(s,o) — не внешнее допущение, а определение самореференции. В вариационной формулировке φ=argminq[Eq[Sspec]+DKL(qΓ)]\varphi = \arg\min_q [\mathbb{E}_q[S_{spec}] + D_{KL}(q \| \Gamma)] дивергенция DKL(qΓ)D_{KL}(q \| \Gamma) измеряет отклонение от собственного состояния системы. Самореферентная система по определению использует себя как генеративную модель — это не предположение, а тавтология самомоделирования.

Доказательство (iv). Из определения KL-дивергенции:

DKL(ψ(Γ)Γ)0D_{KL}(\psi(\Gamma) \| \Gamma) \geq 0

Следовательно:

F[ψ;Γ]=SvN(ψ(Γ))+DKL(ψ(Γ)Γ)SvN(ψ(Γ))\mathcal{F}[\psi; \Gamma] = S_{vN}(\psi(\Gamma)) + D_{KL}(\psi(\Gamma) \| \Gamma) \geq S_{vN}(\psi(\Gamma))

Поскольку стационарное состояние примитивного линдбладиана максимизирует энтропию среди достижимых состояний (Frigerio, 1978), справедливо SvN(Γ)SvN(ψ(Γ))S_{vN}(\Gamma_*) \geq S_{vN}(\psi(\Gamma)). Следовательно, нижняя граница ELBO принимает вид:

F[ψ;Γ]DKL(ψ(Γ)Γ)0\mathcal{F}[\psi; \Gamma] \geq D_{KL}(\psi(\Gamma) \| \Gamma) \geq 0

В классическом пределе SvN(Γ)=H(p)=ipilogpiS_{vN}(\Gamma) = H(p) = -\sum_i p_i \log p_i, и неравенство принимает форму Flnp(o)F \geq -\ln p(o), если отождествить lnp(o)-\ln p(o) с энтропией маргинальной вероятности наблюдений. \blacksquare

4.5 Спектральная энтропия + KL → вариационная свободная энергия

Покажем в явном виде, как минимизация квантового функционала Sspec+DKLS_{spec} + D_{KL} в классическом пределе становится минимизацией вариационной свободной энергии Фристона.

Теорема 4.3 (Полная редукция) [Т] {#теорема-43-полная-редукция}

Пусть ΓD(CN)\Gamma \in \mathcal{D}(\mathbb{C}^N) — диагональная матрица плотности, ψ\psi — CPTP-канал, сохраняющий диагональность. Тогда задача

minψCPTP[Sspec(ψ(Γ))+DKL(ψ(Γ)Γ)]\min_{\psi \in \mathcal{CPTP}} \left[S_{spec}(\psi(\Gamma)) + D_{KL}(\psi(\Gamma) \| \Gamma)\right]

тождественна задаче

minqΔN1FFEP[q;p]=minqΔN1iqilnqipi\min_{q \in \Delta^{N-1}} F_{FEP}[q; p] = \min_{q \in \Delta^{N-1}} \sum_i q_i \ln \frac{q_i}{p_i}

где ΔN1\Delta^{N-1}(N1)(N-1)-симплекс вероятностных распределений.

Более того, минимум достигается при qi=piq_i^* = p_i (распознающая плотность совпадает с генеративной), что соответствует ψ=id\psi^* = \mathrm{id} (тождественный канал).

Доказательство.

Шаг 1 (Параметризация). В классическом пределе оптимизация по CPTP-каналам, сохраняющим диагональность, эквивалентна оптимизации по стохастическим матрицам TR+N×NT \in \mathbb{R}^{N \times N}_+ с iTij=1\sum_i T_{ij} = 1. Результат ψ(Γ)=diag(q)\psi(\Gamma) = \mathrm{diag}(q), где qi=jTijpjq_i = \sum_j T_{ij} p_j. Множество достижимых qq при фиксированном pp — выпуклое подмножество ΔN1\Delta^{N-1}, содержащее pp (при T=IT = I).

Шаг 2 (Явный функционал). По Теореме 4.1:

F[q;p]=H(q)+DKL(qp)=iqilnqi+iqilnqipi=iqilnpi\mathcal{F}[q; p] = H(q) + D_{KL}(q \| p) = -\sum_i q_i \ln q_i + \sum_i q_i \ln \frac{q_i}{p_i} = -\sum_i q_i \ln p_i

Это перекрёстная энтропия H×(q,p)=iqilnpiH_\times(q, p) = -\sum_i q_i \ln p_i.

Шаг 3 (Минимизация). Кросс-энтропия H×(q,p)=iqilnpiH_\times(q, p) = -\sum_i q_i \ln p_i минимизируется при q=pq = p (методом множителей Лагранжа с ограничением iqi=1\sum_i q_i = 1, или из свойства H×(q,p)=H(q)+DKL(qp)H(p)H_\times(q, p) = H(q) + D_{KL}(q \| p) \geq H(p), с равенством при q=pq = p).

Шаг 4 (Отождествление с FEP). Свободная энергия Фристона:

FFEP=dsq(s)lnq(s)p(s,o)F_{FEP} = \int ds \, q(s) \ln \frac{q(s)}{p(s,o)}

При дискретизации s{si}i=1Ns \to \{s_i\}_{i=1}^N:

FFEP=iqilnqipi=DKL(qp)F_{FEP} = \sum_i q_i \ln \frac{q_i}{p_i} = D_{KL}(q \| p)

Функционал УГМ в классическом пределе:

FУГМ=H(q)+DKL(qp)=DKL(qp)+H(q)\mathcal{F}_{\text{УГМ}} = H(q) + D_{KL}(q \| p) = D_{KL}(q \| p) + H(q)

Разница — в аддитивном члене H(q)H(q), который не зависит от pp и потому не влияет на оптимальное qq^* при фиксированном pp:

argminqFУГМ=argminqFFEP=p\arg\min_q \mathcal{F}_{\text{УГМ}} = \arg\min_q F_{FEP} = p

Таким образом, оптимальные распознающие плотности совпадают. \blacksquare

4.6 Соответствие конструкций

Полная таблица соответствий между УГМ и FEP:

Конструкция УГМКонструкция FEPПредельный переход
ΓD(C7)\Gamma \in \mathcal{D}(\mathbb{C}^7)p(s,o)p(s,o) — генеративная модельΓij0\Gamma_{ij} \to 0, γiipi\gamma_{ii} \to p_i
φ(Γ)\varphi(\Gamma) — категориальная самомодельq(so)q^*(s\|o) — оптимальная распознающая плотностьφ\varphi \to байесовская инверсия
Sspec(Γ)S_{spec}(\Gamma) — спектральная энтропияH(p)H(p) — энтропия ШеннонаSspec(diag(p))=H(p)S_{spec}(\mathrm{diag}(p)) = H(p)
DKL(ψ(Γ)Γ)D_{KL}(\psi(\Gamma) \| \Gamma) — квантовая KLDKL(qp)D_{KL}(q \| p) — классическая KLДиагональный предел
F[ψ;Γ]\mathcal{F}[\psi; \Gamma] — вариационный функционалF[q;p]F[q; p] — свободная энергияТеорема 4.1
Примитивность L0\mathcal{L}_0Эргодичность марковской цепиЛиндблад → марковский генератор
CPTP-канал ψ\psiСтохастическая матрица TTПолная позитивность → позитивность
ρ=φ(Γ)\rho^* = \varphi(\Gamma) — неподвижная точкаАпостериорное распределение p(so)p(s\|o)Самомоделирование → байесовский вывод
Марковское одеяло (алгебраическое)Марковское одеяло (графовое)B(Γ)\mathcal{B}(\Gamma) → граф условной независимости

4.7 Что утрачивается в классическом пределе

Переход Γdiag(p)\Gamma \to \mathrm{diag}(p) уничтожает три фундаментальные структуры УГМ, не имеющие классических аналогов.

4.7.1 Когерентности (внедиагональные элементы)

Квантовые когерентности Γij\Gamma_{ij} (iji \neq j) — это корреляции между измерениями голонома, не описываемые классическими вероятностями.

В полном функционале УГМ когерентности вносят вклад:

Ffull=H(q)классика+DKLdiag(qp)классика+DKLoff-diag(ψ(Γ)Γ)квантовый остаток\mathcal{F}_{\text{full}} = \underbrace{H(q)}_{\text{классика}} + \underbrace{D_{KL}^{\text{diag}}(q \| p)}_{\text{классика}} + \underbrace{D_{KL}^{\text{off-diag}}(\psi(\Gamma) \| \Gamma)}_{\text{квантовый остаток}}

где квантовый остаток:

DKLoff-diag=Tr[ψ(Γ)logψ(Γ)]Tr[ψ(Γ)logΓ](iqilogqiiqilogpi)D_{KL}^{\text{off-diag}} = \mathrm{Tr}\left[\psi(\Gamma) \log \psi(\Gamma)\right] - \mathrm{Tr}\left[\psi(\Gamma) \log \Gamma\right] - \left(\sum_i q_i \log q_i - \sum_i q_i \log p_i\right)

При Γij0\Gamma_{ij} \to 0 этот член обращается в ноль: DKLoff-diag0D_{KL}^{\text{off-diag}} \to 0.

Следствие. Классический FEP не может описать интеграцию информации между измерениями (Φ\Phi зависит от когерентностей), квантовые квалиа (структура подпространств Hk\mathcal{H}_k), а также интерференцию между разными аспектами самомодели.

4.7.2 Gap-оператор

Gap-оператор Gij=Γij/γiiγjj\mathcal{G}_{ij} = \|\Gamma_{ij}\| / \sqrt{\gamma_{ii} \gamma_{jj}} описывает непрозрачность между измерениями. В классическом пределе:

Gij0ij\mathcal{G}_{ij} \to 0 \quad \forall i \neq j

Gap-структура полностью исчезает. Это означает потерю:

  • Бифуркаций сознания (скачкообразных переходов между режимами)
  • Немарковских эффектов памяти (Gap-осцилляции)
  • Кода Хэмминга H(7,4) в структуре ошибкокоррекции (см. Gap-динамика)

4.7.3 Регенерация R\mathcal{R}

Регенеративный член R\mathcal{R} уравнения эволюции LΩ=L0+R\mathcal{L}_\Omega = \mathcal{L}_0 + \mathcal{R} отвечает за нелинейную обратную связь: система активно восстанавливает когерентности, а не только пассивно диссипирует.

В классическом пределе (Γij0\Gamma_{ij} \to 0):

R[Γ]0\mathcal{R}[\Gamma] \to 0

поскольку регенерация оперирует на внедиагональных элементах. Остаётся только линейная диссипация L0\mathcal{L}_0, которая в классическом пределе сводится к марковскому генератору:

L0[diag(p)]Qp,Qij0 при ij,iQij=0\mathcal{L}_0[\mathrm{diag}(p)] \to Q \cdot p, \qquad Q_{ij} \geq 0 \text{ при } i \neq j, \quad \sum_i Q_{ij} = 0

— стандартная Q-матрица непрерывной марковской цепи.

Следствие. Классический FEP описывает только пассивную минимизацию свободной энергии (диссипация). Квантовый FEP УГМ включает активную регенерацию — способность системы восстанавливать сложные структуры, утраченные при декогеренции.

4.8 Что сохраняется: минимизация ошибки предсказания

Несмотря на потери, ядро вариационного принципа переживает классический предел:

Следствие 4.1 (Инвариантность принципа минимизации) {#следствие-41}

Принцип «система минимизирует функционал, балансирующий точность и сложность» сохраняется во всех режимах:

РежимФункционалТочностьСложность
Квантовый (УГМ)Sspec(ψ(Γ))+DKL(ψ(Γ)Γ)S_{spec}(\psi(\Gamma)) + D_{KL}(\psi(\Gamma) \| \Gamma)DKL(ψ(Γ)Γ)-D_{KL}(\psi(\Gamma) \| \Gamma)Sspec(ψ(Γ))S_{spec}(\psi(\Gamma))
Классический (FEP)EqH(q)\langle E \rangle_q - H(q)lnp(os)q\langle \ln p(o\|s) \rangle_qDKL(qpprior)D_{KL}(q \| p_{\text{prior}})

Минимизация ошибки предсказания (prediction error minimization, PEM) — это классический предел категориального самомоделирования φi\varphi \dashv i.

Это объясняет, почему FEP Фристона работает для классических систем (мозг в нейровычислительном описании, биологические организмы): он захватывает инвариантное ядро, хотя теряет квантовую структуру.

4.9 Структурная диаграмма

┌─────────────────────────────────────────────────────────────────┐
│ УГМ (∞-топос) │
│ │
│ Уровень 0: Ω (примитив) │
│ ↓ │
│ Уровень 1: φ ⊣ i (категориальное определение) │
│ ↓ │
│ Уровень 2: φ = lim e^{tℒ_Ω}[Γ] (динамический) │
│ ↓ │
│ Уровень 3: φ = argmin [S_spec + D_KL] (вариационный, Т 3.1) │
│ ↓ │
│ ┌─────────────────────────────────────────────────────────┐ │
│ │ Классический предел: Γ_ij → 0, R → 1/7 │ │
│ │ (теряются: когерентности, Gap, ℛ) │ │
│ │ ↓ │ │
│ │ ┌───────────────────────────────────────────────────┐ │ │
│ │ │ FEP Фристона: min F = min [⟨E⟩ - H] │ │ │
│ │ │ (классические вероятности, ЧАСТНЫЙ СЛУЧАЙ) │ │ │
│ │ │ (сохраняется: минимизация ошибки предсказания) │ │ │
│ │ └───────────────────────────────────────────────────┘ │ │
│ └─────────────────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────────────────┘

5. S_spec vs S_vN: обоснование выбора

5.1 Определения

Энтропия фон Неймана:

SvN(ρ):=Tr(ρlogρ)=iλilogλiS_{vN}(\rho) := -\mathrm{Tr}(\rho \log \rho) = -\sum_i \lambda_i \log \lambda_i

Спектральная энтропия:

Sspec(A):=iλilogλiS_{spec}(A) := -\sum_i |\lambda_i| \log |\lambda_i|

где {λi}\{\lambda_i\} — собственные значения оператора AA.

5.2 Когда они совпадают

Теорема 5.1 (Эквивалентность для матриц плотности)

Для матриц плотности ρ\rho (эрмитовых, положительно полуопределённых, с единичным следом):

Sspec(ρ)=SvN(ρ)S_{spec}(\rho) = S_{vN}(\rho)

Доказательство: Для ρ0\rho \geq 0 все λi0\lambda_i \geq 0, поэтому λi=λi|\lambda_i| = \lambda_i. \blacksquare

5.3 Зачем использовать S_spec в УГМ?

Причина 1: Обобщение на неэрмитовы операторы.

В некоторых формализмах (операторы Крауса, нефизические состояния) встречаются неэрмитовы операторы. SspecS_{spec} определена для них, SvNS_{vN} — нет.

Причина 2: Связь с колмогоровской сложностью.

В оригинальной формулировке УГМ (axiom-omega.md):

Sspec()S_{spec}(\cdot) — спектральная энтропия (замена невычислимой колмогоровской сложности)

Колмогоровская сложность K()K(\cdot) невычислима. SspecS_{spec} служит вычислимой верхней оценкой:

Sspec(ρ)K(ρ)+O(1)S_{spec}(\rho) \leq K(\rho) + O(1)

5.4 Рекомендация

Для практических целей в УГМ:

  • Использовать SvNS_{vN} для матриц плотности (стандартная квантовая теория)
  • Обозначение SspecS_{spec} сохранить для указания на связь с теорией сложности
  • В документации указывать: "Sspec=SvNS_{spec} = S_{vN} для матриц плотности"

6. Сравнение с FEP Фристона

6.1 Таблица соответствий

АспектFEP (Фристон)УГМ
СтатусПостулат (феноменологический)Теорема (выводится из Ω)
ДоменКлассические распределенияКвантовые состояния
ОператорНеявныйЯвный CPTP-канал
ОбоснованиеТермодинамика + байесовский выводКатегориальное сопряжение
ЦикличностьНе разрешенаРазрешена (иерархия Ω → φ)
ВремяВнешний параметрЭмерджентное (▷ на Ω)

6.2 Как Фристон вывел FEP без УГМ?

Фристон использовал три независимых аргумента:

1. Информационно-теоретический (байесовский):

F=DKL(qP(S))lnP(S)F = D_{KL}(q \| P(\cdot|S)) - \ln P(S)

Это тождество — следствие определения KL-дивергенции. FEP постулирует, что системы минимизируют F.

2. Термодинамический:

Флуктуационные теоремы (Jarzynski, Crooks) связывают свободную энергию с неравновесной работой. Стационарные системы минимизируют F по термодинамическим причинам.

3. Кибернетический (самоорганизация):

Системы, не минимизирующие сюрприз, «рассеиваются» — теряют идентичность. Выживание ≡ минимизация F.

6.3 Почему УГМ глубже?

1. Категориальное обоснование:

В УГМ φ определяется структурой ∞-топоса, вариационный принцип — следствие. В FEP вариационный принцип — аксиома.

2. Квантовое обобщение:

УГМ работает с матрицами плотности (квантовые системы). FEP — только с классическими распределениями.

3. Разрешение цикличности:

УГМ явно строит иерархию: Ω → L_k → ℒ_Ω → φ (см. DAG зависимостей). В FEP связь генеративной модели и динамики неявна.

4. Эмерджентное время:

В УГМ время выводится из темпоральной модальности ▷ на Ω. В FEP время — внешний параметр.


7. Следствия для УГМ

7.1 Подтверждение согласованности

Доказательство Теоремы 3.1 подтверждает:

  1. Вариационная характеризация — следствие категориального определения
  2. Классический предел воспроизводит FEP Фристона
  3. УГМ обобщает FEP на квантовый случай

7.2 Уточнение статуса утверждений

УтверждениеСтарый статусНовый статус
φ = argmin [S_spec + D_KL]«Свойство 4»Теорема 3.1 [Т] (доказана)
Классический предел функционалаНеявноТеорема 4.1 [Т] (полная статмех-редукция)
FEP ⊂ УГМЗаявленоТеорема 4.2 [Т] (отождествление генеративной модели = определение самореференции)
Sspec+DKLFFEPS_{spec} + D_{KL} \to F_{FEP}Не доказаноТеорема 4.3 [Т] (полная редукция)
S_spec = S_vN для ρНе уточненоТеорема 5.1 [Т] (доказана)

7.3 Новые следствия

Следствие 7.1 (Квантовый FEP).

Для квантовых систем верен обобщённый принцип:

Γ=argminΓ[SvN(Γ)+DKL(ΓΓ0)]\Gamma_* = \arg\min_{\Gamma} \left[S_{vN}(\Gamma) + D_{KL}(\Gamma \| \Gamma_0)\right]

где Γ0\Gamma_0 — начальное/референсное состояние.

Следствие 7.2 (Термодинамическая интерпретация).

Минимизация F\mathcal{F} эквивалентна минимизации производства энтропии в открытой квантовой системе.


8. Технические леммы

Лемма A.1 (Производство энтропии в Линдблад-динамике)

Для L[ρ]=k(LkρLk12{LkLk,ρ})\mathcal{L}[\rho] = \sum_k (L_k \rho L_k^\dagger - \frac{1}{2}\{L_k^\dagger L_k, \rho\}):

dSvN(ρ)dt=Tr(L[ρ]logρ)0\frac{dS_{vN}(\rho)}{dt} = -\mathrm{Tr}(\mathcal{L}[\rho] \log \rho) \geq 0

Лемма A.2 (Единственность стационарного состояния)

Если LΩ\mathcal{L}_\Omega примитивен (нет нетривиальных подпространств), то !ρ:LΩ[ρ]=0\exists! \rho_*: \mathcal{L}_\Omega[\rho_*] = 0.

Лемма A.3 (Сходимость к стационарному)

Для примитивного LΩ\mathcal{L}_\Omega:

limτeτLΩ[ρ]=ρρ\lim_{\tau \to \infty} e^{\tau\mathcal{L}_\Omega}[\rho] = \rho_* \quad \forall \rho

9. Ссылки

  1. Friston K. "The free-energy principle: a unified brain theory?" Nature Reviews Neuroscience 11, 127-138 (2010)
  2. Spohn H. "Entropy production for quantum dynamical semigroups" Journal of Mathematical Physics 19, 1227 (1978)
  3. Lindblad G. "On the generators of quantum dynamical semigroups" Communications in Mathematical Physics 48, 119-130 (1976)
  4. Lurie J. "Higher Topos Theory" Princeton University Press (2009)

10. Резюме

Ключевые результаты

Теоремы:

  1. Теорема 3.1 [Т]: Категориально определённый φ минимизирует функционал Sspec+DKLS_{spec} + D_{KL} (примитивность линейной части L0\mathcal{L}_0 доказана)
  2. Теорема 4.1 [Т]: В классическом пределе (Γij0\Gamma_{ij} \to 0, RRminR \to R_{\min}) функционал УГМ редуцируется к H(q)+DKL(qp)H(q) + D_{KL}(q \| p)
  3. Теорема 4.2 [Т]: Классический предел УГМ воспроизводит FEP Фристона (отождествление генеративной модели = определение самореференции)
  4. Теорема 4.3 [Т]: Минимизация Sspec+DKLS_{spec} + D_{KL} тождественна минимизации FFEPF_{FEP} в классическом пределе (оптимальные распознающие плотности совпадают)
  5. Теорема 5.1 [Т]: Sspec=SvNS_{spec} = S_{vN} для матриц плотности

Главный вывод: FEP Фристона — не независимый принцип, а частный случай (классический предел) более фундаментальной структуры УГМ.

Совместимость с октонионной нормой [Т]

Вариационный принцип φ=argminE[Sspec+DKL]\varphi = \arg\min \mathbb{E}[S_{spec} + D_{KL}] совместим с октонионной интерпретацией: нормированность 𝕆 (xy=xy|xy| = |x||y|) обеспечивает согласованность метрики, используемой в DKLD_{KL}, с алгебраической структурой пространства состояний. Мост [Т] (Т15). См. структурный вывод.


Связанные документы: