• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом llama.cpp

Как запустить свою LLM для инференса. Руководство по запуску: Ollama, vLLM, Triton, LM Studio, llama.cpp, SGLang +24

  • 20.09.2025 19:31
  • maksimov_m
  • 0
  • Machine Learning
  • Машинное обучение
  • Python
  • DevOps

Вайб-кодинг с доставкой на дом +6

  • 19.08.2025 10:05
  • ant1free2e
  • 6
  • Блог компании Haulmont
  • Программирование
  • Open source
  • Искусственный интеллект

Нейросети простым языком +6

  • 12.08.2025 05:15
  • RomanKryvolapov
  • 1
  • Искусственный интеллект
  • Artificial Intelligence

Георгий Герганов, автор llama.cpp и звукового кейлогера +103

  • 07.07.2025 09:01
  • alizar
  • 37
  • Блог компании RUVDS.com
  • Машинное обучение
  • Софт
  • Искусственный интеллект
  • Natural Language Processing

Запускаем настоящую DeepSeek R1 671B на игровом ПК и смотрим вменяемая ли она на огромном контексте (160к) +128

  • 29.06.2025 08:46
  • Shannon
  • 58
  • Искусственный интеллект

Видеокарты для нейросетей: две RTX 5060 Ti 16GB или одна RTX 3090 24GB? Тест LLM‑инференса +25

  • 18.06.2025 08:00
  • dmitrifriend
  • 34
  • Блог компании BotHub
  • Компьютерное железо
  • Искусственный интеллект
  • Машинное обучение

Ускорение DeepSeek-R1 с подвохом: Когда токены в секунду врут о реальной скорости +3

  • 18.06.2025 07:44
  • Banakhovich
  • 6
  • Искусственный интеллект

Локальный DeepSeek-R1: Когда скорость улитки – не приговор, а точка старта +70

  • 09.06.2025 14:21
  • Banakhovich
  • 109
  • Искусственный интеллект

Тестирование производительности видеокарт на примере больших языковых моделей с использованием Llama.cpp -3

  • 09.06.2025 09:56
  • COBECT
  • 1
  • Видеокарты
  • Машинное обучение
  • Искусственный интеллект

Как мы прикрутили RAG для интент-классификации, или Трудности перевода на LLM-ский +15

  • 20.02.2025 08:00
  • nsykhr
  • 0
  • Блог компании ДомКлик
  • Natural Language Processing
  • Машинное обучение

Квантовать или не квантовать LLM? +16

  • 10.10.2024 08:42
  • FirstJohn
  • 2
  • Блог компании FirstVDS
  • Машинное обучение
  • Искусственный интеллект
  • Open source

Распределённый инференс llama.cpp через RPC +24

  • 14.09.2024 16:07
  • efreelancer
  • 15
  • Machine Learning
  • Artificial Intelligence
  • Машинное обучение
  • DevOps
  • Искусственный интеллект

Установка LLM на скромном VPS

  • 24.07.2024 09:00
  • ru_vds
  • 13
  • Блог компании RUVDS.com
  • Хостинг
  • Open source
  • Серверное администрирование
  • Искусственный интеллект

Enbeddrus — обучение независящей от языка эмбеддинг-модели

  • 02.06.2024 14:31
  • efreelancer
  • 0
  • Python
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing
Страница 1 из 1
ЛУЧШЕЕ

  • Сегодня
  • Вчера
  • Позавчера
09:31

Рынок эйчара +94

13:30

Тихий апокалипсис: я устал читать сгенерированные статьи +30

09:01

Странные CSS-свойства, но, возможно, полезные +30

13:01

Что такое DevOps и почему он автоматизировал не всё +28

08:57

$220К в месяц на индексации сайтов для Google +26

07:00

Как появилась программа багбаунти? История развития +23

11:17

DevSecOps за 20 миллионов? Я сделал свой сканер и выложил бесплатно +19

09:00

JavaScript, отдохни! Делаем интерактивные вещи на HTML и CSS +18

06:32

Восстание терпил +18

08:08

От хаоса к порядку: как мы научились управлять Vault через GitOps +16

11:03

Как сделать сложный технический текст простым и понятным: приемы из практики технического писателя +15

09:24

Безопасность без «костылей»: 6 способов построить ИБ-стратегию на годы вперед +15

08:30

Делегирование прав локального админа Windows — Систематизация и автоматизация +15

11:00

Когда свет думает за GPU: оптическая генерация изображений +14

09:39

Алгоритмы, базы и порядок: практическая подборка книг для разработчиков +14

08:07

Оптимизация выравнивания и заполнения структур в Go. В 2025 г. всё ещё экономим на спичках +13

05:18

DX в процедурных макросах на Rust +13

09:58

Kandinsky 5.0 Video Lite — лучший open-source генератор видео высокого качества в классе лёгких моделей +12

09:30

Собственное файловое хранилище для 400 Пбайт видеоконтента +11

09:30

Собственное файловое хранилище для 400 Пбайт видеоконтента +11

06:00

The Goddess's Will — или почему никто не делает видеоигры в стиле пререндеренного 3D, а мы делаем одну такую +93

15:21

Как я, не разработчик, читаю туториал, который ты, разработчик, написал для меня +72

06:20

Как не сойти с ума на умной работе: инструкция по психологическому здоровью для ИТ-шников +68

08:05

Оперативная память: исчерпывающие руководство. Часть 1 – Физическое устройство RAM от атома кремния до реальных чипов +56

21:57

От счетной машины к клавиатуре — неожиданная история нампада (и почему на телефоне все наоборот) +49

12:00

Изготовление корпуса для часов из дерева +40

17:36

Мифы об изучении языков, ч.2 +39

08:48

На страже безопасности: один день из жизни инженера по ИБ +39

09:01

Сильный ИИ как фантазия. Теорема Теслера +37

05:03

НДС 22% для всех желающих, а также Трамп против парацетамольных аутистов +36

14:00

Вконтакте убил мой бизнес, теперь я строю канализационный коллектор и счастлив +34

06:00

Налоговая реформа 2026: полный гайд по изменениям для бизнеса +31

18:06

ESP32-CAM: Алгоритмы компьютерного зрения +28

09:47

Рабочая машинка на ARM, Linux: год спустя +28

13:01

Как посчитать, сколько людей в лаборатории +27

14:17

Как мы в Авито автоматически лечим ноды в Kubernetes +23

08:30

Трюк, который раньше ускорял Python, теперь лишь захламляет код +21

08:11

Аргумент против существования теории всего +20

07:16

Алиса в стране ПК: французский компьютер с трасс Формулы-1 +18

12:00

Можно ли сделать мобильный интерфейс без человека.  Эксперимент с ИИ. Часть 1 +16

06:00

The Goddess's Will — или почему никто не делает видеоигры в стиле пререндеренного 3D, а мы делаем одну такую +93

15:21

Как я, не разработчик, читаю туториал, который ты, разработчик, написал для меня +72

06:20

Как не сойти с ума на умной работе: инструкция по психологическому здоровью для ИТ-шников +68

08:05

Оперативная память: исчерпывающие руководство. Часть 1 – Физическое устройство RAM от атома кремния до реальных чипов +57

21:57

От счетной машины к клавиатуре — неожиданная история нампада (и почему на телефоне все наоборот) +49

12:00

Изготовление корпуса для часов из дерева +40

17:36

Мифы об изучении языков, ч.2 +39

08:48

На страже безопасности: один день из жизни инженера по ИБ +39

09:01

Сильный ИИ как фантазия. Теорема Теслера +37

14:00

Вконтакте убил мой бизнес, теперь я строю канализационный коллектор и счастлив +36

05:03

НДС 22% для всех желающих, а также Трамп против парацетамольных аутистов +36

06:00

Налоговая реформа 2026: полный гайд по изменениям для бизнеса +31

18:06

ESP32-CAM: Алгоритмы компьютерного зрения +28

09:47

Рабочая машинка на ARM, Linux: год спустя +28

13:01

Как посчитать, сколько людей в лаборатории +27

14:17

Как мы в Авито автоматически лечим ноды в Kubernetes +23

08:30

Трюк, который раньше ускорял Python, теперь лишь захламляет код +21

08:11

Аргумент против существования теории всего +20

07:16

Алиса в стране ПК: французский компьютер с трасс Формулы-1 +18

12:00

Можно ли сделать мобильный интерфейс без человека.  Эксперимент с ИИ. Часть 1 +16

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Рынок эйчара +94

    • 114

    Налоговая реформа 2026: полный гайд по изменениям для бизнеса +31

    • 99

    Рабочая машинка на ARM, Linux: год спустя +28

    • 92

    Как я, не разработчик, читаю туториал, который ты, разработчик, написал для меня +72

    • 64

    Вконтакте убил мой бизнес, теперь я строю канализационный коллектор и счастлив +36

    • 59

    The Goddess's Will — или почему никто не делает видеоигры в стиле пререндеренного 3D, а мы делаем одну такую +93

    • 52

    Изготовление корпуса для часов из дерева +40

    • 47

    Тихий апокалипсис: я устал читать сгенерированные статьи +35

    • 36

    Осенняя распродажа Steam 2025: топ-50 игр по скидкам +9

    • 33

    Мифы об изучении языков, ч.2 +39

    • 33

    Сильный ИИ как фантазия. Теорема Теслера +37

    • 27

    НДС 22% для всех желающих, а также Трамп против парацетамольных аутистов +36

    • 27

    Как не сойти с ума на умной работе: инструкция по психологическому здоровью для ИТ-шников +70

    • 26

    Оперативная память: исчерпывающие руководство. Часть 1 – Физическое устройство RAM от атома кремния до реальных чипов +57

    • 24

    От счетной машины к клавиатуре — неожиданная история нампада (и почему на телефоне все наоборот) +49

    • 22

Подписка


  • Главная
  • Контакты
© 2025. Все публикации принадлежат авторам.