Проблема в том, что вы сами виноваты в неправильной настройке.
Автор: Robert Ta
Загружено: 2026-03-06
Просмотров: 15
Описание:
Найдите своего гиперперсонализированного партнера по размышлениям здесь: https://heyclarity.me/
Улучшите свою заявку на программу LLM с помощью аудита здесь: https://tinyurl.com/EvalAudit
А что, если настоящая проблема согласования — это не ИИ, а мы?
Соучредитель Джонатан и я подробно разбираем, почему согласование с ИИ — это, по сути, проблема человека. Мы анализируем разницу между целью и описанием цели, почему люди — это постоянно меняющиеся мишени, которые ИИ не может надежно определить, и почему стандартные технические подходы — RLHF, конституциональный ИИ, моделирование предпочтений — не затрагивают более глубокую эпистемологическую проблему. Мы также излагаем нашу гипотезу: истинное согласование требует коэволюции, двустороннего взаимодействия, где ИИ со временем строит модель вас, а вы в процессе лучше узнаёте себя. Это философия, лежащая в основе Clarity и подхода с контекстным графом, который мы разрабатываем в Epistemic Me.
Ключевые выводы:
«Возможно, реальный риск заключается не в несогласованном ИИ. Возможно, это несогласованные люди, создающие ИИ».
«Для меня согласованность начинается с самосогласованности».
Временные метки:
00:00 - Введение
00:43 - Проблема согласованности носит человеческий, а не только технический характер
05:02 - На какую версию себя должен ориентироваться ИИ?
05:30 - Неявные предположения, заложенные в каждую цель
06:52 - Дилемма ИИ-тренера по здоровью: дни отдыха против долголетия
07:45 - Должен ли ИИ разрешать противоречия, которые мы не разрешили в себе?
09:43 - ИИ на уровне популяции против согласованности n=1
10:50 - Внешняя согласованность, внутренняя согласованность и почему ни один из способов не решает проблему
12:36 - Как узнать, действительно ли модель согласована или просто хорошо себя ведет?
20:27 - Эпистемическое согласование: совместная эволюция вашей модели «я» с ИИ
22:25 - Способны ли люди вообще к последовательным ценностям?
26:35 - Мысленный эксперимент с меню ужина
29:39 - Самосогласование как основа согласования ИИ
30:57 - Цикл Оода и согласование, ориентированное на убеждения
32:10 - Карл Фристон, активный вывод и лежащая в его основе система убеждений
37:29 - Резюме: согласование — это человеческий, психологический, философский аспект
Подписывайтесь на Роберта:
Instagram ► / therobertta
TikTok ► / therobertta_
LinkedIn ► / therobertta
X ► https://x.com/therobertta_
Substack ► https://robertta.substack.com/
Подписывайтесь на Джонатана:
LinkedIn ► / jmccoy
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: