Küçük bir LLM'i oyun oynamaya nasıl eğittim? | TRL - GRPO
Автор: Heuristic AI
Загружено: 2026-02-01
Просмотров: 44
Описание:
ZIP Game AI - GRPO ile Oyun Oynayan Yapay Zeka
Bu videoda, Qwen 2.5 modelini GRPO
ile eğiterek ZIP bulmaca oyununu oynamayı öğreten sistemi gösteriyorum.
🔧 Kullanılan Teknolojiler:
Qwen 2.5 0.5B Instruct (Base Model)
TRL GRPO Trainer (Reinforcement Learning)
LoRA Fine-tuning (Düşük VRAM kullanımı)
FastAPI Web UI (Görselleştirme)
.
Github Repo: https://github.com/AltanReisoglu/ZIP_...
Kaggle: https://www.kaggle.com/bahaaltanreisolu
Destek İçin: https://buymeacoffee.com/altanreisoglu
.
.
.
.
.
#AI #MachineLearning #ReinforcementLearning #GRPO #LLM #Python
#AI #DeepLearning #flowmatching #diffusion #autoregressive #claude #gpt #llama #gemini #veo3 #DeepSeek #MachineLearning #yapayzeka #ArtificialIntelligence #LLM #DataScience #NeuralNetworks #TechTrends
Повторяем попытку...
Доступные форматы для скачивания:
Скачать видео
-
Информация по загрузке: