ycliper

Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
Скачать

All You Need To Know About Running LLMs Locally

Автор: bycloud

Загружено: 2024-02-26

Просмотров: 292353

Описание: RTX4080 SUPER giveaway!
Sign-up for NVIDIA's GTC2024: https://nvda.ws/48s4tmc
Giveaway participation link: https://forms.gle/2w5fQoMjjNfXSRqf7
Please read all the rules & steps carefully!!
1. Sign-up for NVIDIA's Virtual GTC2024 session between Mar 18 - 21st
2. Participate the giveaway DURING Mar 18 - 21st
3. ???
4. Profit


TensorRT LLM
[Code] https://github.com/NVIDIA/TensorRT-LLM
[Getting Started Blog] https://nvda.ws/3O7f8up
[Dev Blog] https://nvda.ws/490uadi

Chat with RTX
[Download] https://nvda.ws/3OHPRHE
[Blog] https://nvda.ws/3whKZTb

Links:
[Oobabooga] https://github.com/oobabooga/text-gen...
[SillyTavern] https://github.com/SillyTavern/SillyT...
[LM Studio] https://lmstudio.ai/
[Axolotl] https://github.com/OpenAccess-AI-Coll...
[Llama Factory] https://github.com/hiyouga/LLaMA-Factory
[HuggingFace] https://huggingface.co/models
[AWQ] https://github.com/mit-han-lab/llm-awq
[ExLlamav2] https://github.com/turboderp/exllamav2
[GGUF] https://github.com/ggerganov/ggml/blo...
[GPTQ] https://github.com/IST-DASLab/gptq
[LlamaCpp] https://github.com/ggerganov/llama.cpp
[vllm] https://github.com/vllm-project/vllm
[TensorRT LLM] https://github.com/NVIDIA/TensorRT-LLM
[Chat with RTX] https://www.nvidia.com/en-us/ai-on-rt...
[LlamaIndex] https://github.com/run-llama/llama_index
[Continue.dev] https://continue.dev/

Model recommendations (I know you are here after DeepSeek):
[All DeepSeek Models] https://huggingface.co/collections/de...
[Easily Download with Ollama] https://ollama.com/library/deepseek-r1
Here's the rule of thumb to know if you can run it:
If your VRAM is larger than the model GB size * 1.2, than you can run that model size locally.
Eg. DeepSeek-7B = 4.7GB then 4.7*1.2=5.64, so if your GPU has 8GB VRAM, since 8GB is bigger than 5.64, you can run DeepSeek-7B.
Check out my latest video on DeepSeek-R1 to understand the context better!

(the following are all outdated)
Just use Llama-3.1 instead for everything.
[Llama-3.1] https://huggingface.co/collections/me...
Translation can try Aya 23
[Aya 23] https://huggingface.co/CohereForAI/ay...

(the following are all outdated)
[Nous-Hermes-llama-2-7b] https://huggingface.co/NousResearch/N...
[Openchat-3.5-0106] https://huggingface.co/openchat/openc...
[SOLAR-10.7B-Instruct-v1.0] https://huggingface.co/upstage/SOLAR-...
[Google Gemma] https://huggingface.co/google/gemma-7b
[Mixtral-8x7B-Instruct-v0.1] https://huggingface.co/mistralai/Mixt...
[Deepseek-coder-33b-instruct] https://huggingface.co/deepseek-ai/de...
[Colbertv2.0] https://huggingface.co/colbert-ir/col...


This video is supported by the kind Patrons & YouTube Members:
🙏Andrew Lescelius, alex j, Chris LeDoux, Alex Maurice, Miguilim, Deagan, FiFaŁ, Daddy Wen, Tony Jimenez, Panther Modern, Jake Disco, Demilson Quintao, Shuhong Chen, Hongbo Men, happi nyuu nyaa, Carol Lo, Mose Sakashita, Miguel, Bandera, Gennaro Schiano, gunwoo, Ravid Freedman, Mert Seftali, Mrityunjay, Richárd Nagyfi, Timo Steiner, Henrik G Sundt, projectAnthony, Brigham Hall, Kyle Hudson, Kalila, Jef Come, Jvari Williams, Tien Tien, BIll Mangrum, owned, Janne Kytölä, SO, Richárd Nagyfi, Hector, Drexon

[Discord]   / discord  
[Twitter]   / bycloudai  
[Patreon]   / bycloud  

[Music] massobeats - magic carousel
[Profile & Banner Art]   / pygm7  
[Video Editor] maikadihaika

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...
All You Need To Know About Running LLMs Locally

Поделиться в:

Доступные форматы для скачивания:

Скачать видео

  • Информация по загрузке:

Скачать аудио

Похожие видео

Если вы не используете ИИ локально, вы отстаете…

Если вы не используете ИИ локально, вы отстаете…

Запускаю DeepSeek на домашнем сервере с видеокартой. Подписка на Chat GPT больше не нужна.

Запускаю DeepSeek на домашнем сервере с видеокартой. Подписка на Chat GPT больше не нужна.

Local AI just leveled up... Llama.cpp vs Ollama

Local AI just leveled up... Llama.cpp vs Ollama

DeepSeek V3.2 Just Broke SoTA Again… But How?

DeepSeek V3.2 Just Broke SoTA Again… But How?

Взлом Wi-Fi: что хакер сможет сделать с вашей сетью?

Взлом Wi-Fi: что хакер сможет сделать с вашей сетью?

Прогнозы дефицита Nvidia, питание RTX 5000, красный DLSS 4, провал Intel

Прогнозы дефицита Nvidia, питание RTX 5000, красный DLSS 4, провал Intel

Стоило ли покупать УБИТЫЙ MacBook за 5000₽? Результат ШОКИРОВАЛ! Ремонт MacBook Pro 15 1013 a1398

Стоило ли покупать УБИТЫЙ MacBook за 5000₽? Результат ШОКИРОВАЛ! Ремонт MacBook Pro 15 1013 a1398

БЕЛЫЕ СПИСКИ: какой VPN-протокол справится? Сравниваю все

БЕЛЫЕ СПИСКИ: какой VPN-протокол справится? Сравниваю все

Скрытый шпион вашего компьютера с Windows 11: тёмная правда о чипах TPM

Скрытый шпион вашего компьютера с Windows 11: тёмная правда о чипах TPM

Краткое объяснение больших языковых моделей

Краткое объяснение больших языковых моделей

Этот суперкомпьютер на основе искусственного интеллекта может поместиться на вашем столе...

Этот суперкомпьютер на основе искусственного интеллекта может поместиться на вашем столе...

The Windows 11 Crisis

The Windows 11 Crisis

Andrej Karpathy: Software Is Changing (Again)

Andrej Karpathy: Software Is Changing (Again)

Как 27M Model вообще смогла обойти ChatGPT?

Как 27M Model вообще смогла обойти ChatGPT?

Run Local LLMs on Hardware from $50 to $50,000 - We Test and Compare!

Run Local LLMs on Hardware from $50 to $50,000 - We Test and Compare!

ULTIMATE Local Ai FAQ

ULTIMATE Local Ai FAQ

AI and You Against the Machine: Guide so you can own Big AI and Run Local

AI and You Against the Machine: Guide so you can own Big AI and Run Local

Три видеокарты в рабочей станции: проверили ИИ, CAD, Blender и даже игры?

Три видеокарты в рабочей станции: проверили ИИ, CAD, Blender и даже игры?

How To Run Private & Uncensored LLMs Offline | Dolphin Llama 3

How To Run Private & Uncensored LLMs Offline | Dolphin Llama 3

Доработайте свою степень магистра права за 13 минут. Вот как

Доработайте свою степень магистра права за 13 минут. Вот как

© 2025 ycliper. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: [email protected]