SaluteTech
SaluteTech — технологии и продукты для решения простых и сложных задач для разработчиков и бизнеса
Как мы сделали production ASR для новых языков на 10 часах данных
Распознавание речи по спикерам в SaluteSpeech: от моделей и алгоритмов до production-оптимизаций
Как мы добавили поддержку суммаризации видео длительностью 3 часа в мультимодальной LLM
Быстрые команды
Как мы обучаем модели GigaCode
Оценка и развитие инструктивных способностей эмбеддинг-моделей
Виртуальные руки: как большие мультимодальные модели управляют компьютером через GUI
Что мы поняли без слов. Распознавание непрерывного жестового языка
Норм или стрем? Оценка генераций в динамическом RAG бенчмарке
От MERA Code к SWE-MERA: новые подходы к оценке моделей и развитию кодовых агентов
AI-Generated Music: подготовка данных и музыкальные фичи
Оборотное зелье — конверсия любого голоса в целевой в высоком качестве
Мечтают ли языковые модели смотреть видео?
Генеративное проектирование в промышленности. Задачи, решения, перспективы
AI4SPORT. Как и зачем использовать AI в самом популярном спорте в мире
Multi-Task фундаментальная модель для временных рядов
Сделай комнату чистой: инструктивное редактирование фото с помощью мультимодальных ассистентов
Наука доставки R&D в продакшн
Генерация изображений и видео: тренды, вызовы и применения
Какими будут и какими не будут большие нейросети будущего?
Тайны древних. Ищем знания в средневековых манускриптах
Генеративный ИИ в задачах проектирования: тренды и вызовы
Реверс-инжиниринг как первый шаг на пути создания копилота для инженера
От синтеза речи к дуплексной диалоговой модели
Ctrl+Z для LLM: учим модели откатывать глупости
Фиджитал сборка
Константин Крестников — GigaChain: создание AI-агентов на практике
Антон Чигин, Артём Хорошев — От теории к практике: построение надежного LLM-сервиса
Евгений Косарев, Валерий Березовский, Валентин Мамедов — GigaChat.Pretrain
Владимир Карлов, Дарья Хомич — Ассистент на LLM