ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

Gillian Hadfield - Alignment is social: lessons from human alignment for AI

Автор: Conference on Language Modeling

Загружено: 2025-11-03

Просмотров: 597

Описание: Current approaches conceptualize the alignment challenge as one of eliciting individual human preferences and training models to choose outputs that that satisfy those preferences. To the extent these approaches consider the fact that the world is composed of many individuals, they do so only by seeking to reconcile or aggregate pluralistic, but still individual, preferences. But these approaches are not grounded in well-founded theory of how humans and human societies work. Humans are fundamentally social beings and the challenge of inducing self-interested humans to act in ways that are good for others is the fundamental alignment challenge of human societies. Alignment in human societies is not achieved by inducing the same or average innate preferences in individuals but by aligning individual behaviors with normative classifications (which behaviors are acceptable, which are not) reached through informal and formal social processes (which we can call institutions). In this talk I'll discuss three ideas for shifting our approaches for AI alignment based on the human model: building normatively competent AI agents; using reinforcement learning to train models to produce aligned justifications for their behaviors that perform well in a discursive social debate context; and developing true jury procedures for democratic human oversight of model behaviors.

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
Gillian Hadfield - Alignment is social: lessons from human alignment for AI

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Tom Griffiths - Mapping the Jagged Edges of AI with Cognitive Science

Tom Griffiths - Mapping the Jagged Edges of AI with Cognitive Science

Luke Zettlemoyer - Mixed-modal Language Modeling

Luke Zettlemoyer - Mixed-modal Language Modeling

Don’t lie to your friends: Learning what you know from collaborative self-play

Don’t lie to your friends: Learning what you know from collaborative self-play

Language models align with brain regions that represent concepts across modalities

Language models align with brain regions that represent concepts across modalities

Владимир Пастухов и Максим Курников | Интервью BILD

Владимир Пастухов и Максим Курников | Интервью BILD

Hidden in plain sight: VLMs overlook their visual representations

Hidden in plain sight: VLMs overlook their visual representations

Белковский: Трамп не хочет быть Обамой

Белковский: Трамп не хочет быть Обамой

4 Hours Chopin for Studying, Concentration & Relaxation

4 Hours Chopin for Studying, Concentration & Relaxation

AI-врач: как алгоритмы меняют медицину — Ивар ft. Михаил Застрожин | Мыслить как ученый S02E07

AI-врач: как алгоритмы меняют медицину — Ивар ft. Михаил Застрожин | Мыслить как ученый S02E07

Ледник «Судного дня», мерзлота и Севморпуть: что реально угрожает России и миру

Ледник «Судного дня», мерзлота и Севморпуть: что реально угрожает России и миру

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

Музыка для работы за компьютером | Фоновая музыка для концентрации и продуктивности

Deep House Mix 2024 | Deep House, Vocal House, Nu Disco, Chillout Mix by Diamond #3

Deep House Mix 2024 | Deep House, Vocal House, Nu Disco, Chillout Mix by Diamond #3

Критическая база знаний LLM за ЧАС! Это должен знать каждый.

Критическая база знаний LLM за ЧАС! Это должен знать каждый.

Shirley Ho - Building a Polymathic Foundation Model for Science

Shirley Ho - Building a Polymathic Foundation Model for Science

Gemini 3.1 Pro and the Downfall of Benchmarks: Welcome to the Vibe Era of AI

Gemini 3.1 Pro and the Downfall of Benchmarks: Welcome to the Vibe Era of AI

Россиянам всё чаще не хватает денег на еду. Когда остановится рост цен? / Лукавая цифра

Россиянам всё чаще не хватает денег на еду. Когда остановится рост цен? / Лукавая цифра

FineWeb2: One Pipeline to Scale Them All — Adapting Pre-Training Data Processing to Every Language

FineWeb2: One Pipeline to Scale Them All — Adapting Pre-Training Data Processing to Every Language

ФЛИС - материал, который ОБОЖАЮТ Туристы и КРИТИКУЮТ Экологи. От УНИТАЗА до ЭВЕРЕСТА

ФЛИС - материал, который ОБОЖАЮТ Туристы и КРИТИКУЮТ Экологи. От УНИТАЗА до ЭВЕРЕСТА

Single-Pass Document Scanning for Question Answering

Single-Pass Document Scanning for Question Answering

Human Creativity, Generative AI, and Intellectual Property

Human Creativity, Generative AI, and Intellectual Property

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]