I connected an LLM to SAM 3

Автор: Applied Tensors

Загружено: 2025-12-06

Просмотров: 1273

Описание: Large language models don't have eyes. When you ask Claude or GPT to count objects in an image, it's not counting anything. It's guessing based on pattern matching. Sometimes it's right. Sometimes it's confidently wrong.

LINK TO THE PROJECT ON GITHUB - https://github.com/Tylerbryy/iris

IRIS (Iterative Reasoning with Image Segmentation) takes a different approach. Instead of letting Claude guess, it forces verification through Meta's SAM3 segmentation model. Ask "is this car running a red light?" and Claude doesn't hallucinate an answer. It segments the red light. Gets coordinates. Segments the car. Analyzes the spatial relationship. Returns an answer grounded in actual visual evidence.

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

I connected an LLM to SAM 3

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

Power BI for Business Professionals - WK22 - The challenge of incomplete data and how it drives bias

Power BI for Business Professionals - WK22 - The challenge of incomplete data and how it drives bias

Będziemy płacić za emerytury Ukraińców!

Będziemy płacić za emerytury Ukraińców!

Don't learn AI Agents without Learning these Fundamentals

Don't learn AI Agents without Learning these Fundamentals

1-Bit LLM: The Most Efficient LLM Possible?

1-Bit LLM: The Most Efficient LLM Possible?

LLM model stochasticity (internal randomness) - deepsek-r1

LLM model stochasticity (internal randomness) - deepsek-r1

Same 128GB but cheaper

Same 128GB but cheaper

We Are Running Out of Data (And It Doesn't Matter)

We Are Running Out of Data (And It Doesn't Matter)

I Connected an LLM to a Robotic Dog

I Connected an LLM to a Robotic Dog

400 часов вайб-кодинга: всё, что нужно знать | Claude, GPT, агенты

400 часов вайб-кодинга: всё, что нужно знать | Claude, GPT, агенты

Why Continual Learning?

Why Continual Learning?

Почему «Трансформеры» заменяют CNN?

Почему «Трансформеры» заменяют CNN?

Qwen 3.5 Plus УНИЧТОЖАЕТ платные AI! Бесплатно + уровень Claude Opus

Qwen 3.5 Plus УНИЧТОЖАЕТ платные AI! Бесплатно + уровень Claude Opus

Я протестировал программу Claude Opus 4.6 для написания книг, и вот что я обнаружил!

Я протестировал программу Claude Opus 4.6 для написания книг, и вот что я обнаружил!

Я сэкономил 1460 часов на обучении (NotebookLM + Gemini + Obsidian)

Я сэкономил 1460 часов на обучении (NotebookLM + Gemini + Obsidian)

OpenAI is Suddenly in Trouble

OpenAI is Suddenly in Trouble

Да, ИИ отнимет у вас работу. Но то, что произойдёт дальше, ещё хуже.

Да, ИИ отнимет у вас работу. Но то, что произойдёт дальше, ещё хуже.

Окупай DPI: Выводим провайдера на чистую воду

Окупай DPI: Выводим провайдера на чистую воду

Плачу $100 за Claude. Он автоматизировал весь мой YouTube

Плачу $100 за Claude. Он автоматизировал весь мой YouTube

Как так быстро развились диффузионные LLM-технологии?

Как так быстро развились диффузионные LLM-технологии?

Claude Code создал мне команду AI-агентов (Claude Code + Skills + MCP)

Claude Code создал мне команду AI-агентов (Claude Code + Skills + MCP)