Проблема в том, что вы сами виноваты в неправильной настройке.

Автор: Robert Ta

Загружено: 2026-03-06

Просмотров: 15

Описание: Найдите своего гиперперсонализированного партнера по размышлениям здесь: https://heyclarity.me/

Улучшите свою заявку на программу LLM с помощью аудита здесь: https://tinyurl.com/EvalAudit

А что, если настоящая проблема согласования — это не ИИ, а мы?

Соучредитель Джонатан и я подробно разбираем, почему согласование с ИИ — это, по сути, проблема человека. Мы анализируем разницу между целью и описанием цели, почему люди — это постоянно меняющиеся мишени, которые ИИ не может надежно определить, и почему стандартные технические подходы — RLHF, конституциональный ИИ, моделирование предпочтений — не затрагивают более глубокую эпистемологическую проблему. Мы также излагаем нашу гипотезу: истинное согласование требует коэволюции, двустороннего взаимодействия, где ИИ со временем строит модель вас, а вы в процессе лучше узнаёте себя. Это философия, лежащая в основе Clarity и подхода с контекстным графом, который мы разрабатываем в Epistemic Me.

Ключевые выводы:

«Возможно, реальный риск заключается не в несогласованном ИИ. Возможно, это несогласованные люди, создающие ИИ».

«Для меня согласованность начинается с самосогласованности».

Временные метки:
00:00 - Введение
00:43 - Проблема согласованности носит человеческий, а не только технический характер
05:02 - На какую версию себя должен ориентироваться ИИ?

05:30 - Неявные предположения, заложенные в каждую цель
06:52 - Дилемма ИИ-тренера по здоровью: дни отдыха против долголетия
07:45 - Должен ли ИИ разрешать противоречия, которые мы не разрешили в себе?

09:43 - ИИ на уровне популяции против согласованности n=1
10:50 - Внешняя согласованность, внутренняя согласованность и почему ни один из способов не решает проблему
12:36 - Как узнать, действительно ли модель согласована или просто хорошо себя ведет?

20:27 - Эпистемическое согласование: совместная эволюция вашей модели «я» с ИИ
22:25 - Способны ли люди вообще к последовательным ценностям?

26:35 - Мысленный эксперимент с меню ужина
29:39 - Самосогласование как основа согласования ИИ
30:57 - Цикл Оода и согласование, ориентированное на убеждения
32:10 - Карл Фристон, активный вывод и лежащая в его основе система убеждений
37:29 - Резюме: согласование — это человеческий, психологический, философский аспект

Подписывайтесь на Роберта:
Instagram ►   / therobertta
TikTok ►   / therobertta_
LinkedIn ►   / therobertta
X ► https://x.com/therobertta_
Substack ► https://robertta.substack.com/

Подписывайтесь на Джонатана:
LinkedIn ►   / jmccoy

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

Проблема в том, что вы сами виноваты в неправильной настройке.

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

С.В. Савельев - Реальность парадоксов

С.В. Савельев - Реальность парадоксов

Создатель ChatGPT — cамый ОПАСНЫЙ человек на планете

Создатель ChatGPT — cамый ОПАСНЫЙ человек на планете

Возможности нашего подсознания, никакой магии, только физика

Возможности нашего подсознания, никакой магии, только физика

США бьют тревогу, Израиль на нервах: что происходит вокруг Ирана

США бьют тревогу, Израиль на нервах: что происходит вокруг Ирана

How can AI understand us, if we don't fully understand ourselves?

How can AI understand us, if we don't fully understand ourselves?

КЛАССИЧЕСКАЯ МУЗЫКА ДЛЯ ВОССТАНОВЛЕНИЯ НЕРВНОЙ СИСТЕМЫ🌿 Нежная музыка успокаивает нервную систему 22

КЛАССИЧЕСКАЯ МУЗЫКА ДЛЯ ВОССТАНОВЛЕНИЯ НЕРВНОЙ СИСТЕМЫ🌿 Нежная музыка успокаивает нервную систему 22

Билл Гейтс В ПАНИКЕ: Утечки Windows 12 ПОТРЯСЛИ Мир Технологий!

Билл Гейтс В ПАНИКЕ: Утечки Windows 12 ПОТРЯСЛИ Мир Технологий!

Logan Neisel: Self Taught Chef Lone; Cleveland's Prologue Dinner Series; Progress through Criticism

Logan Neisel: Self Taught Chef Lone; Cleveland's Prologue Dinner Series; Progress through Criticism

КАК ВЕРНУТЬ КОНТАКТ С СОБОЙ И ПОНЯТЬ СВОЙ ПУТЬ И СМЫСЛ

КАК ВЕРНУТЬ КОНТАКТ С СОБОЙ И ПОНЯТЬ СВОЙ ПУТЬ И СМЫСЛ

Павел Щелин: что происходит на Ближнем Востоке и в мировой политике

Павел Щелин: что происходит на Ближнем Востоке и в мировой политике

Почему изобретатели почти никогда не становятся богатыми

Почему изобретатели почти никогда не становятся богатыми

Если у тебя спросили «Как твои дела?» — НЕ ГОВОРИ! Ты теряешь свою силу | Еврейская мудрость

Если у тебя спросили «Как твои дела?» — НЕ ГОВОРИ! Ты теряешь свою силу | Еврейская мудрость

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

Чем ОПАСЕН МАХ? Разбор приложения специалистом по кибер безопасности

«ЭМПАТИЯ МАНУЧИ» — Андрей Клинцевич: что нас ждёт к 2030 году?

«ЭМПАТИЯ МАНУЧИ» — Андрей Клинцевич: что нас ждёт к 2030 году?

Год начался непросто? Это НЕ ПРОСТО ТАК! Как проходит переход в новое время УЖЕ СЕЙЧАС?

Год начался непросто? Это НЕ ПРОСТО ТАК! Как проходит переход в новое время УЖЕ СЕЙЧАС?

ВОЙНА В ИРАНЕ. ПРОБЛЕМЫ РОССИИ НА ФРОНТЕ. КРИЗИС УПРАВЛЕНИЯ. СЕРГЕЙ ПЕРЕСЛЕГИН

ВОЙНА В ИРАНЕ. ПРОБЛЕМЫ РОССИИ НА ФРОНТЕ. КРИЗИС УПРАВЛЕНИЯ. СЕРГЕЙ ПЕРЕСЛЕГИН

Почему Кошки Вдруг ЗАЛЕЗАЮТ На Вас? (Причина шокирует)

Почему Кошки Вдруг ЗАЛЕЗАЮТ На Вас? (Причина шокирует)

Пространство существует. И это проблема

Пространство существует. И это проблема

Лучший документальный фильм про создание ИИ

Лучший документальный фильм про создание ИИ

Обхитри инсулин и СОЖГИ висцеральный ЖИР за 7 шагов

Обхитри инсулин и СОЖГИ висцеральный ЖИР за 7 шагов