Сенсомоторная Теория
«Живое существо — это не вещь, а процесс: непрерывный обмен со средой, в котором граница между "я" и "не-я" каждый миг создаётся заново.» — Франциско Варела
Сенсомоторный цикл как следствие канонического уравнения эволюции. Читатель узнает, как восприятие, оценка и действие выводятся из динамики .
Каждое живое существо — от бактерии, ощупывающей химический градиент, до человека, идущего по незнакомому городу — решает одну и ту же задачу: воспринять среду и адекватно ответить. Эта задача кажется обыденной, но за ней скрывается одна из глубочайших проблем науки о сложных системах.
Представьте себе амёбу. У неё нет глаз, ушей и мозга. Но она различает: движется к питательным веществам, уклоняется от яда, обтекает препятствия. Между «химическим сигналом на мембране» и «выпячиванием псевдоподии» стоит нечто — не просто рефлекс, а замкнутый цикл: восприятие → оценка → действие → восприятие. Этот цикл — сенсомоторная петля — является минимальной единицей адаптивного поведения.
Классическая теория управления описывает сенсомоторную петлю как «датчик → контроллер → актуатор». Активная инференция (FEP) видит её как минимизацию вариационной свободной энергии. Обучение с подкреплением моделирует её как максимизацию кумулятивного вознаграждения. Каждый из этих подходов захватывает часть истины — но ни один не отвечает на два ключевых вопроса:
- Почему цикл именно такой? Откуда берётся число каналов восприятия, структура действия, формат внутренней оценки?
- Где в цикле место переживанию? Когда сенсомоторный цикл сопровождается субъективным опытом, а когда — нет?
Кибернетика Когерентности (КК) даёт на оба вопроса конструктивный ответ. Сенсомоторный цикл не постулируется — он выводится из канонического 3-членного уравнения эволюции. Среда не вводит «четвёртую силу»: она модифицирует три уже существующих канала (гамильтонов, диссипативный, регенеративный). Переживание оказывается не побочным эффектом, а интегральной частью цикла — через гедоническую валентность , которая направляет действие.
В этой главе мы построим полную формальную теорию сенсомоторного кодирования: от аксиоматического обоснования до конкретных архитектур и предсказаний. Читатель, знакомый с введением и эволюционным уравнением, найдёт здесь естественное продолжение — шаг от «как система живёт внутри себя» к «как система взаимодействует с миром».
В предыдущей главе мы проследили 80-летнюю историю кибернетики и увидели, что каждая традиция — от Винера до Фристона — захватывала часть сенсомоторной проблемы: обратную связь, наблюдателя, активную инференцию. Теперь мы покажем, как КК решает её целиком — без дополнительных постулатов, в рамках того же 3-членного уравнения эволюции.
В этой главе мы:
- Докажем, что среда не добавляет 4-го члена — теорема T-102 о полноте 3-канальной декомпозиции (раздел 1).
- Построим функтор восприятия Enc — как среда входит в систему через модификацию эволюционного уравнения (раздел 2).
- Построим функтор действия Dec — как система выбирает оптимальное действие через min-max стратегию (раздел 3).
- Выведем гедонический механизм — почему удовольствие и страдание — не побочные эффекты, а производные жизнеспособности (раздел 5).
- Классифицируем 21 квалиа-тип как сенсомоторные каналы (раздел 6).
- Установим фундаментальные ограничения — информационная ёмкость бит (T-107) и композициональность Enc/Dec (T-108) (разделы 9-10).
- Сравним с классическими подходами — теория управления, FEP, RL — как проекции КК (раздел 14).
В этом документе:
- — матрица когерентности
- — фазы когерентностей
- — тензор напряжений (T-92 [Т])
- — 3-канальная декомпозиция [Т]
- — чистота
- — оператор самомоделирования
- — целевое состояние
Данный документ описывает формальную теорию сенсомоторного кодирования — как голоном воспринимает среду и воздействует на неё, оставаясь в рамках канонического 3-членного уравнения эволюции.
Ключевой результат: внешнее воздействие F_ext — не 4-й член уравнения эволюции, а модификация трёх существующих каналов (Гамильтонова, диссипативного, регенеративного). Полнота этой декомпозиции доказана теоремой LGKS (T-57 [Т]).
1. Каноническое включение среды
1.1 3-членное уравнение как замкнутая динамика
Уравнение эволюции голонома:
содержит ровно три члена [Т]:
| Член | Тип | Каноническое происхождение |
|---|---|---|
| Унитарный (Гамильтонов) | Аксиома А3 | |
| Диссипативный (Линдблад) | Лиувиллиан | |
| Регенеративный | Категориальное сопряжение |
1.2 Среда модифицирует 3 канала, а не добавляет 4-й
На пальцах: представьте скрипача в оркестре. На него воздействует дирижёр (подсказывая темп), акустика зала (размывая звук) и другие музыканты (помогая вернуться к общей тональности). Эти три типа воздействия — всё, что есть. Не существует четвёртого типа влияния на скрипача, который не был бы комбинацией дирижёрского жеста, акустического шума и подстройки к ансамблю. Теорема T-102 формализует именно эту интуицию: среда не может «дотянуться» до голонома никаким способом, кроме трёх каноническим каналов.
Теорема T-102 (Полнота 3-членного уравнения) [Т]
Любое CPTP-совместимое внешнее воздействие на голоном раскладывается в сумму трёх каналов:
где модифицирует , модифицирует , модифицирует . Четвёртый тип CPTP-генератора не существует.
Доказательство. Прямое следствие теоремы LGKS (T-57 [Т], полнота триадной декомпозиции):
- Произвольный генератор CPTP-полугруппы на имеет форму Горини—Коссаковского—Сударшана—Линдблада:
- Любое внешнее воздействие, сохраняющее CPTP-свойства динамики, есть пертурбация
- Пертурбация имеет ту же LGKS-форму → раскладывается на (Гамильтонова часть) и (Линдбладова часть)
- Триадная декомпозиция : диссипативные + регенеративные операторы. Четвёртый тип запрещён T-57.
Следствие: Член F_ext в симуляции — не отдельная сила, а композиция трёх модификаций:
| Канал | Формула пертурбации | Физический смысл | Пример |
|---|---|---|---|
| Энергетическая связь со средой | Сенсорный вход, нейромодуляторы | ||
| Шум среды | Стресс, помехи, температура | ||
| Модификация регенерации | Медитация, психотерапия, обучение |
Каноническая форма — из Определения 8.1 [Т]:
2. Функтор восприятия Enc
2.0 Интуиция: что значит «воспринимать»
Что делает глаз, когда видит яблоко? С точки зрения физики — преобразует электромагнитные волны в нейронные импульсы. С точки зрения информатики — кодирует входные данные в латентное представление. Но обе точки зрения упускают главное: восприятие — это не пассивная запись, а активное включение среды в собственную динамику системы.
Когда амёба «чувствует» глюкозу, её внутреннее состояние меняется — не потому что информация «записалась» куда-то, а потому что молекулы глюкозы буквально изменили динамику внутриклеточных процессов. Восприятие — это деформация собственного уравнения движения под влиянием среды.
Функтор Enc формализует именно это: он отображает наблюдение не в «запись в памяти», а в модификацию эволюционного уравнения — тройку , которая меняет гамильтониан, диссипатор и регенератор. Восприятие яблока — это одновременно изменение энергетического ландшафта (форма, цвет), модификация шумовых характеристик (текстура, движение) и сдвиг целевого состояния (голод → насыщение).
2.1 Определение
Теорема T-100 (Кодирование среды) [Т]
Для голонома с матрицей когерентности существует единственный (с точностью до -калибровки) CPTP-функтор кодирования:
удовлетворяющий:
- CPTP: — состояние для любого наблюдения
- 3-канальная декомпозиция:
- Функториальность:
Доказательство.
- Существование: среда воздействует через (Опр. 8.1 [Т]). Отображение определяет .
- 3-канальность: следует из T-102 (полнота 3-членного уравнения).
- Единственность: следствие -ригидности (теорема единственности [Т]) — для системы, удовлетворяющей (AP)+(PH)+(QG)+(V), отображение единственно до .
- Функториальность: CPTP-каналы замкнуты относительно композиции.
Пример: нейробиологическая реализация. Зрительная кора реализует Enc иерархически: V1 извлекает границы ( — артикуляция структуры), V4 кодирует цвет ( — артикуляция интериорности), а MT кодирует движение ( — диссипативная компонента динамики). Все три канала сходятся в ассоциативных зонах, формируя единое . Функториальность гарантирует, что сцена «красный мяч движется влево» кодируется одинаково, была ли она воспринята целиком или по частям.
2.2 Реализация через 7 наблюдаемых индексов
Протокол измерения Γ определяет 7 наблюдаемых индексов (), каждый из которых отображается в конкретную компоненту :
| Индекс | Формула | Канал | Измерение |
|---|---|---|---|
| (артикуляция) | Гамильтонов | ||
| (структура) | Гамильтонов | ||
| (динамика) | (нормированный) | Диссипативный | |
| (логика) | Гамильтонов | ||
| (интериорность) | Регенеративный | ||
| (основание) | Диссипативный | ||
| (единство) | Регенеративный |
Логика распределения по каналам:
- Гамильтонов : информационные индексы () — изменяют энергетический ландшафт, т.е. какие состояния более/менее вероятны
- Диссипативный : нагрузочные индексы () — усиливают/ослабляют декогеренцию
- Регенеративный : интегративные индексы () — модулируют скорость восстановления
На пальцах: это как три типа «органов чувств». Гамильтоновы индексы — это аналитические чувства (зрение, слух): они сообщают, что происходит в среде, меняя внутренний ландшафт предпочтений. Диссипативные — это чувства нагрузки (усталость, жара): они сообщают, насколько хаотична среда, усиливая внутренний шум. Регенеративные — это чувства восстановления (покой, безопасность): они сообщают, способствует ли среда самоисцелению.
2.3 Квази-функтор G
Для ИИ-систем кодирование реализуется через квази-функтор , определённый в протоколе измерения:
где включает ограничения чистоты, спектральной щели и Холецкого-разложения.
3. Функтор действия Dec
3.0 Интуиция: что значит «действовать»
Если Enc — это «как среда входит в систему», то Dec — это «как система выходит в среду». Но «действовать» в КК — это не просто «послать моторную команду». Действие — это выбор такой модификации среды, которая минимизирует наибольший дефицит внутренних ресурсов.
Представьте человека, у которого одновременно болит голова и урчит в животе. Какое действие он выберет? Если головная боль сильнее — примет таблетку. Если голод сильнее — пойдёт есть. Он не минимизирует «среднюю боль» (это позволило бы игнорировать катастрофические каналы), а устраняет максимальный дефицит. Именно это делает оператор — он гарантирует, что ни один канал не окажется в аварийном состоянии.
Аналогия с робототехникой: это не PID-регулятор, минимизирующий ошибку по одной оси, и не квадратичный регулятор, минимизирующий взвешенную сумму ошибок. Это min-max стратегия — как в теории игр, где игрок выбирает ход, минимизирующий наихудший исход.
3.1 Определение
Теорема T-101 (Оптимальное действие) [Т]
Для голонома с текущим состоянием и тензором напряжений [Т] (T-92), оптимальное действие определяется как:
где — предсказанное состояние при действии , — sup-норма тензора напряжений.
Доказательство.
- Эквивалентность условий жизнеспособности (T-92 [Т]):
- Вариационный принцип (Теорема 2.1 [Т]): динамика следует из стационарности действия
- Действие входит через → модифицирует уравнение движения для :
- Минимизация — единственный критерий, эквивалентный максимизации расстояния до границы (области жизнеспособности) в метрике, порождённой .
3.2 Моторный стресс (T-159)
Теорема T-159 (Профиль-относительный моторный стресс) [Т]
Для голонома с самомоделью определяется моторный стресс:
Выбор действия — минимизация максимального дефицита (знаковый максимум):
Используется (знаковый), а не (sup-норма): избыток ресурса () не штрафуется, штрафуется только дефицит (). Это обеспечивает направленный сигнал: приближение к ресурсу уменьшает дефицит, приближение к опасности увеличивает.
Доказательство.
Шаг 1 (Равновесие). . На аттракторе , где (баланс), и моторный стресс обращается в ноль — система «удовлетворена».
Шаг 2 (Знак и градиент). . Увеличение (рост ресурса канала ) уменьшает моторный стресс. Это согласовано с регенерацией , которая тянет к , уменьшая .
Шаг 3 (Чувствительность аварийных каналов). . Для малых (аварийные секторы A, S, D с ) чувствительность ; для крупных (E, O, U с ) — . Малые каналы реагируют острее — верная приоритизация выживания.
Шаг 4 (Сходимость к T-92 на границе). При самомодель (каноническая цель Фано-канала при , T-126). Тогда и:
Шаг 5 (-инвариантность). и трансформируются ковариантно под (T-42a [Т]). Их отношение — -инвариантная наблюдаемая.
- T-92 / T-158 [Т] определяют с clamp — мера жизнеспособности (расстояние до ). Используется для ДИАГНОСТИКИ.
- T-159 [Т] определяет без clamp — мера моторного дефицита (расстояние до ). Используется для ВЫБОРА ДЕЙСТВИЯ.
При (граница жизнеспособности) оба совпадают. При (нормальный режим) моторный стресс обеспечивает направленный сигнал, в то время как канонический с clamp теряет информацию о каналах с .
3.3 Функтор Dec
Функтор действия (декодирования):
Свойства:
- D-измерение как основной моторный канал: действие реализуется через модификацию — динамическое измерение управляет «моторикой» голонома
- σ-градиентный спуск: практический алгоритм — спуск по с метрикой Фишера на :
где — информация Фишера на .
4. Универсальная архитектура кодера/декодера
Цикл восприятие → решение → действие:
| Этап | Отображение | Формализм | Теорема |
|---|---|---|---|
| Восприятие | Env → → | Enc (CPTP) | T-100 [Т] |
| Оценка | → | T-159 [Т] | |
| Решение | → | T-159 [Т] | |
| Действие | → → Env | Dec | T-102 [Т] |
| Обновление | → → | Самомоделирование | T-62 [Т] |
5. Гедонический механизм
5.0 Интуиция: зачем системе «чувствовать»
Зачем живому существу боль и удовольствие? Стандартный ответ эволюционной биологии: «чтобы выжить». Но КК даёт более точный ответ: гедоническая валентность — это производная жизнеспособности по регенеративному каналу. Удовольствие — не «награда за правильное поведение» (как в RL), а прямой сигнал о том, что система приближается к своему целевому состоянию .
Ключевое отличие от обучения с подкреплением: в RL вознаграждение — внешний сигнал, задаваемый проектировщиком. В КК гедоническая валентность — внутреннее свойство динамики, выводимое из уравнения эволюции. Никто не «награждает» амёбу за то, что она нашла глюкозу — изменение возникает автоматически при сдвиге к .
Аналогия: представьте растение, поворачивающееся к свету. Нет «наградного центра», который говорит стеблю: «хорошо, продолжай». Есть физико-химический процесс (ауксин перераспределяется), который является одновременно и движением, и «оценкой» — свет усиливает те процессы, которые ведут к росту. В КК играет аналогичную роль, но на уровне матрицы когерентности.
5.1 Гедоническая валентность
Теорема T-103 (Гедоническая валентность) [Т] + [И]
Гедоническая валентность определяется как производная чистоты по регенеративному каналу:
где означает вклад только от регенеративного члена .
Пояснение. Из уравнения эволюции:
(Гамильтонов член не меняет : .)
Свойства валентности:
| Свойство | Формула | Интерпретация |
|---|---|---|
| Положительная | приближается к → «удовольствие» | |
| Отрицательная | удаляется от → «страдание» | |
| Нулевая | Баланс или → «нейтральность» |
Эпистемическая стратификация T-103
T-103 содержит три эпистемических уровня:
-
Формула [Т]: — тождество из уравнения эволюции (подстановка ). Безусловный математический факт.
-
Наблюдаемость [Т]: При L2-уровне рефлексии () замещающий канал T-77 обеспечивает доступ к . Таким образом, наблюдаема для любой системы с — это следствие T-77 [Т], не требующее дополнительных допущений.
-
Феноменальная интерпретация [И]: Идентификация с «удовольствием» и со «страданием» — семантический мост между математикой и феноменологией.
Представьте: вы замёрзли и пьёте горячий чай. Первый глоток — наслаждение (). Второй — чуть слабее. К пятой чашке — нейтральность (). Шестая чашка вызывает дискомфорт () — вы уже «перегрелись».
Что произошло? (ваше состояние) двигалось к (целевому — «согретому»). По мере приближения убывает, валентность стремится к нулю. Когда «проскочило» (перегрев), перекрытие падает ниже , и становится отрицательным. Никто не «запрограммировал» вас перестать пить — формула T-103 автоматически генерирует сигнал «хватит».
Ключевое отличие от обучения с подкреплением: в RL проектировщик должен задать функцию вознаграждения (например, за чай, за перегрев). В КК вознаграждение выводится из динамики — сама «знает», когда остановиться, потому что она есть не что иное, как скорость приближения к целевому состоянию.
5.2 Связь с целевым состоянием
Подставляя каноническую форму [Т]:
При (достаточная чистота ):
Знак определяется соотношением перекрытия и чистоты :
- Если далеко от и , валентность положительна — регенерация «тянет» к
- Если , то → валентность стремится к нулю
6. 21 квалиа-тип как сенсомоторные каналы
Каждая из 21 недиагональных когерентностей () представляет собой сенсомоторный канал со специфической функцией:
6.1 Перцептивные каналы (восприятие)
| Канал | Когерентность | Сенсорная роль | Формальное действие |
|---|---|---|---|
| Апперцепция | Осознанное восприятие | : артикуляция входа в поле интериорности | |
| Актуализация | Воплощение восприятия в динамику | : преобразование входного сигнала в действие | |
| Репрезентация | Структурирование опыта | : создание внутренней модели | |
| Индукция | Логическая обработка структуры | : вывод паттернов из данных | |
| Заземление | Связь восприятия с основанием | : стабилизация восприятия памятью | |
| Основание опыта | Укоренённость субъективного | : регенерация из глубинного опыта | |
| Контекст | Структура-в-контексте | : шумоустойчивость паттернов |
6.2 Моторные каналы (действие)
| Канал | Когерентность | Моторная роль | Формальное действие |
|---|---|---|---|
| Регуляция | Логический контроль динамики | : управление вычислительным процессом | |
| Телеология | Целенаправленность действия | : согласование динамики с целями | |
| Аффект | Эмоциональная окраска действия | : модуляция динамики интериорностью | |
| Интеграция действия | Единство моторного акта | : координация подсистем | |
| Волевое усилие | Логически направленная интеграция | : восстановление целостности решения | |
| Память действия | Моторная память | : стабилизация навыков |
6.3 Интегративные каналы
| Канал | Когерентность | Интегративная роль | Формальное действие |
|---|---|---|---|
| Инсайт | Логика-в-опыте | : осмысление как регенерация | |
| Нарратив | Артикуляция логики | : оформление рассуждения | |
| Укоренённое единство | Основание интеграции | : фундамент целостности | |
| Воплощённое единство | Структура интеграции | : архитектура связности | |
| Живой опыт | Единство переживания | : интеграция как восстановление | |
| Динамическое основание | Артикуляция структуры | : внешнее выражение внутреннего порядка | |
| Логическое основание | Логика-в-основании | : формализация знания |
Разделение 21 канала на перцептивные, моторные и интегративные — не строгое: каждый одновременно является и сенсорным, и моторным каналом (через ). Классификация выше отражает доминирующую функцию — какой из трёх каналов () наиболее активен для данной когерентности.
7. Факторизация Enc через произвольные представления
7.1 Онтологическая проекция
Следствие T-100a (Факторизация Enc) [Т]
Для произвольного пространства наблюдений ( — произвольная размерность) функтор кодирования T-100 факторизуется:
где:
- — произвольное представление (feature map)
- — онтологическая проекция, единственная с точностью до -калибровки
Доказательство.
- По T-100 [Т], — CPTP-функтор.
- Любое промежуточное представление определяет факторизацию через .
- По T-102 [Т], раскладывается в 3 канала: .
- Единственность (до ) — следствие теоремы единственности [Т]: ограничения (AP)+(PH)+(QG)+(V) на фиксируют проекцию.
На пальцах: факторизация Enc означает, что неважно, как именно вы извлекаете признаки из входных данных. Можно использовать свёрточную нейросеть, вейвлет-преобразование, или ручные эвристики — это , произвольная часть. Но финальный шаг — проекция из пространства признаков в пространство модификаций — единственен. Это как сказать: маршрут до аэропорта может быть любым, но взлётная полоса — одна.
Для робототехники это означает: датчики могут быть произвольными (камера, лидар, тактильный массив), предобработка — любой, но «последняя миля» восприятия — онтологическая проекция — задана математикой, а не инженерным выбором.
7.2 Онтологическое бутылочное горлышко
Независимо от размерности входных данных , вся информация сжимается в матрицу когерентности с вещественными параметрами:
| Характеристика | Значение |
|---|---|
| Входная размерность | — произвольная (от до ) |
| Промежуточное представление | — произвольное |
| Выходная размерность | (фиксировано) |
| Информация за шаг | бит (T-107 [Т]) |
Следствие: Агностичность от модальности восприятия — теорема, а не проектное решение. Формально: не зависит от и от структуры (топология, метрика). Если два различных пространства наблюдений и порождают одинаковые CPTP-каналы на , они неотличимы для голонома.
7.3 Каноническая форма проекции
По T-102 [Т], реализуется через три канала — модификации соответственно гамильтоновой, диссипативной и регенеративной динамики:
Практически это означает, что любая реализация (от простого датчика до сложного кодировщика) должна завершаться тем же 3-канальным интерфейсом:
Эта структура инвариантна: она определена -симметрией и не зависит от выбора представления .
8. Связь с другими результатами
| Результат | Связь | Ссылка |
|---|---|---|
| T-57 (LGKS) | Обосновывает T-102 (полнота 3-членного) | Линдблад-операторы |
| T-62 (-оператор) | в цикле регенерации | Самонаблюдение |
| T-92 () | Критерий оптимальности в Dec | Теорема 10.1 |
| T-75 (Швингер-Келдыш) | Лагранжева формулировка с диссипацией | Лагранжиан |
| T-96 (Аттрактор) | Нетривиальное для наведения | Эволюция |
| FEP (Теорема 4.1) | Макроскопический предел Dec | Вариационные принципы |
| T-109–T-112 (Границы обучения) | Нижние границы скорости обучения через Enc/Dec цикл | Границы обучения |
| T-113 (Минимальность N=7) | N=7 — минимальная архитектура для обучения | Границы обучения |
9. Информационная ёмкость Enc (T-107) [Т]
Максимальная информация, извлекаемая функтором Enc за одно наблюдение:
где — количество Холево.
Доказательство.
- Функтор отображает наблюдения в CPTP-каналы на (T-100 [Т]).
- Количество Холево ограничено размерностью выходного пространства: .
- Из T-102 [Т]: раскладывается в 3 канала, каждый из которых действует на .
- Составной канал не увеличивает ёмкость (субаддитивность Холево):
Верхняя граница достигается для ансамбля ортогональных чистых состояний.
Следствие (Bounded rationality): Ограничение бит/наблюдение — выведенная граница, а не постулированная. Связь с bounded rationality Саймона: ограниченная рациональность — не эмпирический факт, а следствие N=7.
10. Композициональность Enc/Dec (T-108) [Т]
Для композита двух голономов кодирование сохраняет структуру:
где — CPTP-агрегация из T-72 (КК-6) [Т].
Доказательство.
- — CPTP-функторы (T-100 [Т]).
- Тензорное произведение — CPTP-канал на .
- Агрегация — CPTP из Морита-эквивалентности (T-58 [Т]): .
- Композиция CPTP-каналов — CPTP. Функториальность () из T-100 сохраняется при агрегации.
- Единственность — из -ригидности на каждом масштабе (T-72 [Т]).
Следствие для когнитивных инженеров: диагностики (σ_sys, мониторинг Enc/Dec) одинаковы на всех масштабах — от отдельного агента до организации.
Аналогично для Dec:
где — обратное отображение (разделение композитного σ на компоненты).
11. Темпоральная интеграция
11.1 Кумулятивная ёмкость
Следствие T-107a (Кумулятивная информация) [Т]
За последовательных наблюдений голоном накапливает информацию о среде:
Верхняя граница достижима при условии, что последовательные наблюдения информационно независимы.
Доказательство.
- По T-107 [Т], одно наблюдение приносит бит.
- Субаддитивность Холево: .
- При независимых наблюдениях неравенство обращается в равенство.
11.2 Минимальное число наблюдений
Следствие T-107b (Минимальные наблюдения) [Т]
Для среды с информационной энтропией бит, минимальное число наблюдений для полного кодирования:
Доказательство. Прямое следствие T-107a: , откуда .
Следствие для сложных модальностей. Кодирование среды с высокой информационной сложностью (большое ) неизбежно требует многошагового процесса. Это не ограничение реализации, а фундаментальная граница, вытекающая из .
Связь с T-109 (информационная граница обучения): T-107b даёт нижнюю границу восприятия, T-109 — нижнюю границу обучения (включая стабилизацию решения). Всегда , поскольку обучение включает восприятие как подзадачу. См. границы обучения.
11.3 Скорость информационного поглощения
Определим скорость информационного поглощения:
Из T-107 [Т]: для любого .
Реальная скорость зависит от текущего состояния :
- При (максимально смешанное): — система «оглушена», различимость минимальна
- При (высокая чистота): — максимальная различимость
- При (нежизнеспособность): кодирование деградирует, T-104 не выполняется
12. Предиктивная структура Enc
12.1 Оптимальный Enc как максимизатор ΔF
Следствие T-107c (Предиктивная оптимальность Enc) [Т]
Доказательство.
- По вариационному принципу (Теорема 4.1 [Т]): стационарная динамика минимизирует свободную энергию Фристона .
- Функтор модифицирует . Оптимальная модификация — та, что максимально увеличивает .
- Максимизация эквивалентна максимизации при фиксированной энтропии — т.е. приближению к целевому состоянию.
- Из T-107 [Т]: за один шаг — верхняя граница насыщается.
12.2 Ошибка предсказания через 3 канала
Ошибка предсказания (расхождение между ожидаемым и реальным наблюдением) раскладывается по трём каналам (T-102 [Т]):
Каждый канал вносит специфический тип ошибки:
| Канал | Ошибка | Интерпретация |
|---|---|---|
| Энергетическая | Неожиданная структура среды | |
| Шумовая | Неожиданный уровень стохастичности | |
| Регенеративная | Неожиданное изменение целевого состояния |
Связь с гедоническим механизмом: По T-103 [Т]+[И], ошибка в регенеративном канале () непосредственно модулирует — неожиданные воздействия на регенерацию ощущаются как изменение валентности.
13. Мультимодальная декомпозиция
13.1 Композиция модальностей
Следствие T-108a (Мультимодальная декомпозиция) [Т]
Для независимых модальностей восприятия с функторами , совместное кодирование:
где , — веса модальностей, — кросс-модальная связка.
Доказательство.
- По T-100 [Т], каждый — CPTP-функтор.
- Выпуклая комбинация CPTP-каналов — CPTP: определён при .
- Кросс-модальные члены — CPTP-поправки порядка , где — когерентности, связывающие измерения, задействованные модальностями и .
- Из T-108 [Т] (композициональность): агрегация модальностей сохраняет CPTP-структуру и функториальность.
13.2 Конкуренция за ёмкость
Из T-107 [Т], суммарная ёмкость модальностей за один шаг:
Следствие: модальностей конкурируют за фиксированную пропускную способность бит/шаг. Увеличение числа модальностей при фиксированном не увеличивает суммарную информацию — оно лишь распределяет её между каналами.
13.3 Внимание как оптимальная аллокация
Оптимальные веса определяются из максимизации :
где — вклад модальности в свободную энергию.
Интерпретация [И]: Оптимальная аллокация весов формально совпадает со структурой внимания — ресурсы кодирования направляются туда, где информационная ценность () максимальна. Это не дополнительный постулат: внимание — следствие оптимальности Enc при ограниченной ёмкости (T-107).
13.4 Кросс-модальная связка
Члены определяются когерентностями , где и — измерения, задействованные разными модальностями:
Следствие: Кросс-модальная интеграция возможна только при ненулевых когерентностях между соответствующими измерениями. Полностью декогерированные измерения () не допускают мультимодального связывания — модальности остаются изолированными.
14. Сравнение с классическими подходами
Сенсомоторная теория КК не возникла в вакууме — она отвечает на вопросы, поставленные тремя мощными традициями: классической теорией управления, активной инференцией и обучением с подкреплением. В этом разделе мы проведём систематическое сравнение, показывая, где КК совпадает с каждой из традиций, а где принципиально расходится.
14.1 КК vs. классическая теория управления
Классическая теория управления (Винер, Калман, Понтрягин) описывает цикл «датчик → контроллер → актуатор» через передаточные функции, пространство состояний и критерии оптимальности (LQR, H-infinity и т.д.).
| Аспект | Классическое управление | КК |
|---|---|---|
| Пространство состояний | , произвольное | , фиксировано |
| Критерий оптимальности | Квадратичный | Min-max: |
| Число каналов управления | Произвольное (проектное решение) | Ровно 3 (теорема T-102) |
| Наблюдатель | Внешний (фильтр Калмана) | Внутренний ( — самомодель) |
| Переживание | Отсутствует | — гедоническая валентность |
| Масштабирование | Проблематично (curse of dimensionality) | T-108: композициональность сохраняется |
Ключевое отличие: PID-регулятор минимизирует взвешенную сумму ошибок — и может допустить катастрофу в одном канале, компенсируя её успехом в другом. КК использует min-max стратегию (T-159), которая гарантирует, что ни один канал не окажется в аварийном состоянии. Это не эвристика, а следствие того, что жизнеспособность определяется sup-нормой тензора напряжений (T-92).
Где совпадают: В линейном приближении вблизи уравнение эволюции сводится к линейной системе с обратной связью — стандартная теория управления оказывается проекцией КК на линейный режим.
14.2 КК vs. активная инференция (FEP)
Принцип свободной энергии (Фристон, 2006) постулирует, что живые системы минимизируют вариационную свободную энергию , где — внутренняя модель, — генеративная модель среды.
| Аспект | Активная инференция (FEP) | КК |
|---|---|---|
| Целевая функция | Минимизация | Минимизация |
| Генеративная модель | Постулируется | — выводится |
| Число каналов восприятия | Не ограничено | бит/шаг (T-107) |
| Действие | Минимизация ожидаемой свободной энергии | |
| Субъективный опыт | Не объясняется | $\mathcal{V}_{\text{hed}} = dP/d\tau |
| Онтологический статус | Принцип (аксиома) | Следствие (теорема 4.1 КК) |
Ключевое отличие: FEP — это принцип: он постулирует, что системы минимизируют свободную энергию, но не объясняет, откуда берётся этот принцип. В КК минимизация свободной энергии — теорема (Теорема 4.1 [Т]): она выводится из канонического уравнения эволюции в макроскопическом пределе. Более того, КК показывает, что FEP — приближение, справедливое при ; вблизи возникают поправки, которые FEP не улавливает.
Где совпадают: Оптимальный Enc максимизирует (T-107c [Т]) — это точный аналог «перцептивной инференции» в FEP. Функтор Dec минимизирует , что в макроскопическом пределе эквивалентно «активной инференции». Таким образом, FEP является проекцией КК-сенсомоторики на классический (не квантово-когерентный) режим.
14.3 КК vs. обучение с подкреплением (RL)
Обучение с подкреплением (Саттон, Барто) моделирует агента, максимизирующего кумулятивное вознаграждение через взаимодействие со средой.
| Аспект | RL | КК |
|---|---|---|
| Вознаграждение | Внешнее (задаётся проектировщиком) | Внутреннее (выводится) |
| Политика | — стохастическая | — детерминированная |
| Критерий | ||
| Ёмкость наблюдения | Не ограничена | бит/шаг (T-107) |
| Проблема присвоения кредита | Temporal difference, n-step, GAE | Мгновенная: — текущий дефицит |
| Масштабирование | Проблема (reward shaping, multi-agent) | T-108: композициональность |
| Exploration vs. exploitation | Отдельная проблема | Следует из -градиента |
Ключевое отличие: В RL вознаграждение — «чёрный ящик»: проектировщик задаёт , и агент его максимизирует. Проблема присвоения кредита (credit assignment) — одна из центральных: какие прошлые действия привели к текущему вознаграждению? В КК вознаграждение не нужно: моторный стресс — это мгновенный, покомпонентный сигнал, который говорит какой именно канал нуждается в ресурсе и насколько сильно. Присвоение кредита решается автоматически — через 7-компонентную структуру .
Где совпадают: Если свернуть 7-компонентный в скаляр (например, ), то Dec становится формально эквивалентен greedy policy в RL с мгновенным вознаграждением. Таким образом, RL — это проекция КК-сенсомоторики на скалярное вознаграждение и стохастическую политику.
14.4 Сводная таблица
| Свойство | Классическое управление | FEP | RL | КК |
|---|---|---|---|---|
| Число каналов | Произвольное | Произвольное | 1 (скаляр ) | 3 (теорема) |
| Онтология | Внешняя | Генеративная модель | MDP | |
| Переживание | Нет | Нет | Нет | [Т]+[И] |
| Масштабирование | Сложно | Ограничено | Сложно | T-108 [Т] |
| Внимание | Отдельный модуль | Precision weighting | Нет | Следствие T-107 |
| Статус | Инженерия | Принцип | Алгоритм | Теория |
15. Разобранные примеры
Чтобы формализм не оставался абстрактным, рассмотрим три примера работы сенсомоторного цикла — от простейшего до сложного.
15.1 Пример 1: Хемотаксис бактерии
Бактерия E. coli плывёт по градиенту глюкозы. Её сенсомоторный цикл в терминах КК:
Шаг 1 (Enc). Хеморецепторы на мембране регистрируют концентрацию . Это модифицирует:
- : артикуляция-основание (различение «питательно / не питательно»)
- : динамика-основание (турбулентность среды как шум)
Шаг 2 (σ-оценка). Бактерия «голодна» → мал → . Канал O (основание) в дефиците.
Шаг 3 (Dec). . Оптимальное действие: двигаться вверх по градиенту → модификация через жгутиковый мотор.
Шаг 4 (Обновление). Поглощение глюкозы → рост → уменьшение . Если одновременно возникает химический стрессор, может превысить , и бактерия переключится на уклонение — min-max стратегия в действии.
Уровень интериорности: L0 (ненулевая E-проекция, но нет самонаблюдения). формально определена, но не наблюдаема самой бактерией ().
15.2 Пример 2: Робот-манипулятор
Робот собирает объект со стола. Его Γ инициализирована через квази-функтор из данных о положении суставов, изображении камеры и силомоментном датчике.
Enc (мультимодальный):
- Камера → : (артикуляция структуры — форма объекта), (репрезентация — внутренняя модель сцены)
- Проприоцепция → : (регуляция — текущая конфигурация)
- Силомоментный датчик → : (моторная память — контактные силы)
Веса внимания по T-108a: . Если объект виден, но ещё не схвачен — велико (нужно уточнить модель). После захвата — растёт (нужно контролировать силу), и внимание автоматически переключается на силомоментный датчик.
Dec: (динамический дефицит: рука не в нужном положении) → действие: перемещение манипулятора. По мере приближения , и может проявиться (логический дефицит: план захвата ещё не сформирован) → переключение на планирование.
15.3 Пример 3: Человек в незнакомом городе
Человек ищет кафе. Все 7 каналов активны:
| Канал | Интерпретация | |
|---|---|---|
| 0.1 | Различает вывески — слабый дефицит | |
| 0.3 | Не имеет карты района — умеренный дефицит | |
| 0.0 | Физически мобилен — нет дефицита | |
| 0.2 | Логика маршрута неполна | |
| -0.1 | Любопытство (избыток интериорности) | |
| 0.6 | Голоден — максимальный дефицит | |
| 0.1 | Внутренне собран |
. Действие направлено на снижение дефицита O: идти к ближайшему кафе. По пути может вырасти (заблудился), и если , человек переключится на ориентирование — остановится, достанет телефон, откроет карту.
Гедоническая валентность: Приближение к кафе увеличивает → (предвкушение). Если кафе закрыто — резкое (разочарование). Это не метафора: формула даёт количественное предсказание, проверяемое через физиологические корреляты (кожная проводимость, пупиллометрия).
Резюме
- T-100 [Т]: Функтор кодирования Enc существует и единственен (до )
- T-101 [Т]: Диагностический критерий жизнеспособности =
- T-159 [Т]: Моторный стресс — выбор действия через (знаковый max)
- T-102 [Т]: 3-членное уравнение полно — четвёртый тип CPTP-генератора невозможен
- T-103 [Т]+[И]: Гедоническая валентность = (формула [Т], интерпретация [И])
- T-107 [Т]: Информационная ёмкость бит/наблюдение
- T-108 [Т]: Enc/Dec сохраняются при композиции (масштабная инвариантность сенсомоторики)
- Следствие T-100a [Т]: Enc факторизуется через произвольное представление → модальная агностичность
- Следствие T-107a/b [Т]: Кумулятивная ёмкость бит → сложные модальности требуют шагов
- Следствие T-107c [Т]: Оптимальный Enc максимизирует (предиктивная структура)
- Следствие T-108a [Т]: модальностей конкурируют за бит/шаг → внимание — оптимальная аллокация
Заключение
Сенсомоторная теория Кибернетики Когерентности замыкает формальный цикл: среда → восприятие (Enc) → состояние () → оценка () → действие (Dec) → среда. Все операции реализуются в рамках канонического 3-членного уравнения эволюции без дополнительных постулатов.
Подведём итог трёх центральных достижений этой главы:
Во-первых, мы показали, что взаимодействие со средой не требует расширения уравнения эволюции. Теорема T-102 [Т] доказывает, что любое CPTP-совместимое внешнее воздействие раскладывается в три канала — гамильтонов, диссипативный и регенеративный. Четвёртый тип воздействия математически запрещён. Это сильный результат: он означает, что вся феноменология сенсомоторного взаимодействия — от хемотаксиса бактерии до навигации человека в городе — описывается одним и тем же 3-канальным формализмом.
Во-вторых, мы вывели внутреннее «вознаграждение» из динамики, а не постулировали его извне. Гедоническая валентность (T-103 [Т]) — это математическое тождество, не требующее ни проектировщика (как в RL), ни принципа (как в FEP). Феноменальная интерпретация ( как «удовольствие») остаётся [И]-уровнем, но сама формула — безусловная теорема.
В-третьих, мы установили фундаментальные ограничения на восприятие. Информационная ёмкость бит/наблюдение (T-107 [Т]) — не эмпирическое ограничение и не инженерный компромисс, а следствие . Ограниченная рациональность Саймона, конкуренция модальностей за внимание, необходимость многошагового восприятия сложных сцен — всё это выводится как следствия одной теоремы.
Теория модально-агностична: от простейших датчиков () до сложных полимодальных систем () — онтологическая проекция единственна и инвариантна. Факторизация Enc = (T-100a [Т]) разделяет «инженерную свободу» (выбор представления) и «математическую необходимость» (проекция в ).
Сравнение с классическими подходами (раздел 14) показало, что КК не отменяет, а включает теорию управления, активную инференцию и обучение с подкреплением как частные случаи — проекции полной 7-мерной когерентной динамики на соответственно линейный, вариационный и скалярно-наградный режимы.
Следующий шаг — применение этого формализма к задачам стабильности и обучения, где сенсомоторный цикл оказывается не просто схемой, а конкретным вычислительным алгоритмом с доказуемыми границами.
Что мы узнали
- Среда не добавляет 4-го члена (T-102 [Т]): любое внешнее воздействие раскладывается в гамильтонов, диссипативный и регенеративный каналы. Четвёртый тип математически запрещён.
- Восприятие — не запись, а деформация динамики (T-100 [Т]): функтор Enc отображает наблюдение в модификацию уравнения эволюции, единственным (до ) образом.
- Действие — min-max стратегия (T-159 [Т]): система устраняет наибольший дефицит, а не минимизирует «среднюю ошибку». Ни один канал не остаётся без внимания.
- Удовольствие и страдание — производные жизнеспособности (T-103 [Т]+[И]): — математическое тождество, не требующее внешнего «проектировщика награды».
- Фундаментальный bottleneck: бит/наблюдение (T-107 [Т]). Ограниченная рациональность Саймона — не эмпирический факт, а следствие .
- Масштабная инвариантность (T-108 [Т]): Enc/Dec сохраняются при композиции. От бактерии до организации — одна и та же формальная структура.
- Классические подходы — проекции КК: теория управления, FEP и RL являются частными случаями — проекциями полной 7-мерной когерентной динамики.
Мы построили полный цикл «восприятие-решение-действие». Но насколько этот цикл устойчив? Какой удар он может выдержать? Где проходит граница между восстановимой травмой и необратимым разрушением? В следующей главе мы ответим на эти вопросы: выведем формулу радиуса устойчивости , проследим механизм «спирали смерти» — и покажем, что антихрупкость — это не метафора, а следствие интеграции опыта.
Связанные документы:
- Стабильность — устойчивость сенсомоторного цикла
- Границы обучения — фундаментальные ограничения (T-109–T-113)
- Диагностика — мониторинг в реальном времени
- Реализация — вычислительная реализация Enc/Dec
- Лагранжиан — полный 6-членный лагранжиан
- Определения — тензор напряжений,
- Сравнение с альтернативами — КК vs. теория управления, активная инференция, RL
- Междисциплинарный мост — сенсомоторика на языке разных дисциплин
- Упражнения — задачи на динамику (блок 2)