← К блогу

KoboldCpp: локальный LLM для SillyTavern и MiniTavern — гайд по приватности (2026)

KoboldCpp — портативный сервер инференса на llama.cpp с Kobold и OpenAI-совместимым API на порту 5001. Идеален для приватного ролеплея с картами персонажей в SillyTavern и MiniTavern.

Опубликовано
  • koboldcpp
  • local llm
  • privacy
  • sillytavern
  • minitavern
  • tutorial

KoboldCpp: локальный LLM для SillyTavern и MiniTavern — гайд по приватности (2026)

KoboldCpp — проверенный выбор для локального инференса в SillyTavern и MiniTavern: один переносимый бинарник на llama.cpp, без установки, заточен под GGUF, с глубокой интеграцией в экосистему таверны с времён KoboldAI.

Что такое KoboldCpp?

Проект LostRuins/koboldcpp загружает GGUF-модели и поднимает:

  • Kobold APIhttp://localhost:5001/api/
  • OpenAI-совместимый APIhttp://localhost:5001/v1/
  • KoboldAI Lite — встроенный браузерный тест

Карточки, лорбук и чаты не уходят в облако.

Ключевые термины

ТерминЗначение
Quick LaunchВкладка GUI: модель, контекст, GPU Layers → Launch
GPU LayersСколько слоёв на GPU; критично для VRAM
Context SizeЗадаётся до Launch (иначе ST может упереться в 4K)
Remote TunnelВременный HTTPS-URL для доступа вне LAN
.kcpptПресет KoboldCpp с настройками запуска

Установка и запуск

  1. Скачайте сборку с Releases: NVIDIA — koboldcpp.exe, AMD — nocuda+Vulkan, Mac — koboldcpp-mac-arm64.
  2. Загрузите GGUF с Hugging Face (Qwen2.5 7B, Mistral 7B, Q4_K_M).
  3. Quick Launch → выберите модель → Context 4096–8192 → SaveLaunch.
  4. Проверьте в KoboldAI Lite.

Подключение SillyTavern

  1. API ConnectionsText Completion.
  2. API Type: KoboldCpp.
  3. Server URL: http://127.0.0.1:5001/.
  4. Connect → импорт карты → тест.

Альтернатива: Chat Completion + http://127.0.0.1:5001/v1. Советы по картам: гайд по локальным LLM.

MiniTavern на телефоне

В одной Wi-Fi сети: http://192.168.x.x:5001/v1. Вне дома: Remote Tunnel или LM Studio LM Link.

Сравнение

KoboldCppLM StudioOllama
Порт5001123411434
ST-коннекторKoboldCppKoboldAI / OpenAIOllama

Заключение

KoboldCpp остаётся мощным способом запустить локальный LLM API для карт персонажей в 2026 году. GGUF на порту 5001, ST: Text Completion → KoboldCpp. Карты — на рынке, мобильная игра — MiniTavern, endpoint — localhost:5001.

Другие статьи, которые могут вам понравиться

Устранение неполадок с карточками персонажей SillyTavern: как исправить ошибки и улучшить ответы ИИ

Вот полная статья в формате Markdown, написанная на русском языке, с учетом всех требований. SillyTavern — это мощный инструмент для общения с ИИперсо…

  • troubleshooting
  • errors
  • fix
  • ai-responses
Читать