← 返回博客

LM Studio LM Link 教程:PC 本地跑模型,手机调用 API(MiniTavern / SillyTavern 隐私指南)

LM Studio 的 LM Link 功能让你在家庭 GPU 上运行开源大模型,并通过端到端加密的私有网络从手机访问——适合注重隐私的 MiniTavern 与 SillyTavern 用户实现本地化模型 API 调用。

发布于
  • lm studio
  • lm link
  • 本地模型
  • 隐私
  • sillytavern
  • minitavern
  • 教程

LM Studio LM Link 教程:PC 本地跑模型,手机调用 API(MiniTavern / SillyTavern 隐私指南)

如果你用 SillyTavernMiniTavern 做 AI 角色卡扮演,一定体会过这道选择题:云端 API 聪明好用,但提示词会离开你的设备;本地大模型 私密无限,却绑在一台电脑上。LM StudioLM Link 填上了这块拼图——推理留在自己的硬件上,手机、平板、笔记本却能像模型就在身边一样开聊。

本文介绍 LM Link 的原理,手把手完成配置,并说明如何接入 SillyTavern 与 MiniTavern,在 2026 年搭建一套注重隐私的酒馆工作流。

什么是 LM Studio?

LM Studio 是一款桌面端应用,用于发现、下载并在本机运行开源大模型(open-weight LLM)。它在友好的图形界面下封装了 llama.cpp 运行时,支持 GGUF 格式模型,并默认在 http://localhost:1234 暴露 OpenAI 兼容 REST API

文档与社区中常见的 LM Studio 术语:

术语含义
Model loader(模型加载器)选择并将 GGUF 模型载入显存/内存的面板
Local server(本地服务器)内置 API 服务(默认端口 1234),SillyTavern/MiniTavern 连这里
lms CLI命令行工具,适合无界面服务器(lms server startlms link enable
llmster无图形界面的 LM Studio 变体,面向 GPU 服务器
OpenAI-compatible endpoint/v1/chat/completions 等路由,请求格式与 OpenAI API 一致

与云端 API 不同,角色卡、世界书、聊天记录不会发给 OpenAI、Anthropic 或 DeepSeek——只经过你控制的软件。

LM Link 是 LM Studio 的设备互联功能(与 Tailscale 合作实现)。它在你拥有的设备之间建立端到端加密的私有网状网络。连接成功后:

  • 家里的高性能台式机可以加载并服务 13B–70B 级模型。
  • 笔记本或 iPhone 可以像本地模型一样使用远程模型——在模型加载器里会显示「Linked」标记。
  • 客户端上对 localhost:1234 的请求会透明转发到远端 GPU 机器。

LM Link 目前处于**预览(Preview)**阶段,分批开放。可访问 lmstudio.ai/link 查看资格。

传统远程访问需要路由器端口转发或公网 IP,家庭 LLM 服务器暴露在公网风险很高。LM Link 基于 Tailscale 网状 VPN:设备通过加密隧道通信,不暴露在互联网上。LM Studio 和 Tailscale 都读不到你的提示词,只负责设备发现与路由。

SillyTavern 和 MiniTavern 的隐私派用户通常需要:

  1. 不经第三方推理 — 角色背景、人设提示、私密 RP 不上传企业服务器。
  2. 移动端可用 — MiniTavern 主要在手机上玩,但手机跑不动 13B+ 模型。
  3. 一套卡库、多设备游玩 — 导入一次,桌面 ST、MiniTavern iOS、网页酒馆都能用,不必把 PNG 卡反复上传到云端。

LM Link 解决第 2 点并强化第 1 点:家里的 PC 当推理引擎,手机只是聊天前端。配合 MiniTavern 离线卡库与 SillyTavern 兼容的 PNG 导入,就是完整的本地优先酒馆栈

架构一览

[家中 PC — LM Studio]
  ├── 已加载 GGUF 模型(如 Qwen2.5 14B)
  ├── 本地服务器 :1234
  └── 已启用 LM Link(Tailscale 网状网络)

           │  端到端加密

[手机 / 笔记本 — 客户端]
  ├── LM Studio + LM Link(或 iOS 的 Locally 应用)
  ├── SillyTavern / MiniTavern → localhost:1234
  └── API 请求路由至家中 GPU

聊天界面和角色卡留在客户端;只有 token 生成在远端机器完成。

准备工作

  • 家中主机:Windows、macOS 或 Linux,带 GPU(8 GB+ 显存可跑 7B–14B 量化模型;更大模型建议 16 GB+)。
  • 客户端设备:另一台 PC、Mac,或已开通 LM Link 的 iPhone/iPad。
  • LM Studio 0.3.4+(LM Link 需要较新版本,请查看发行说明)。
  • 所有设备登录同一 LM Link 账户
  • SillyTavern 或 MiniTavern 中已备好角色卡(可从 Card Quest 角色卡市场 下载,或用 MiniTavern Chrome 扩展导入)。

第一步:在家中 PC 配置 LM Studio

  1. lmstudio.ai 下载 LM Studio。
  2. 打开 Discover 标签,搜索适合角色扮演的模型,例如:
    • Qwen2.5-14B-Instruct(指令跟随强)
    • Mistral-7B-Instruct-v0.3(中端 GPU 上速度快)
    • Llama-3.1-8B-Instruct(质量与速度均衡)
  3. 下载 Q4_K_MQ5_K_M 量化的 GGUF——显存占用合理、质量也不错。
  4. ChatDeveloper 标签加载模型,确认能正常回复。
  1. 打开 Settings → LM Link
  2. Enable LM Link 设为 ON。
  3. 登录 LM Link 账户(底层为 Tailscale)。
  4. 开启 Allow loading models on this machine,允许远程客户端触发加载。
  5. 保持 LM Studio 运行,模型处于已加载状态。

无界面 GPU 服务器可用 CLI:

lms login
lms link enable
lms server start --port 1234

第三步:连接手机或笔记本

iPhone / iPad:Locally 应用

LM Studio 收购了 Locally iOS 应用并接入 LM Link 网络。LM Studio 0.4.16+ 之后:

  1. 从 App Store 安装 Locally
  2. 用与家中 PC 相同的 LM Link 账户登录。
  3. 台式机上的关联模型会出现在 Locally 中——外出也能原生聊天。

适合不想手动配 API 地址的快速移动场景。

笔记本或第二台 PC:LM Studio 客户端

  1. 在客户端安装 LM Studio。
  2. Settings → LM Link → 启用 → 同一账户登录。
  3. 打开模型加载器——远程模型显示为 Linked
  4. 可选:设置 preferred device(首选设备),让 API 请求固定路由到家中 GPU。

第四步:启动本地 API 服务器

运行 SillyTavern 或 MiniTavern 的客户端上:

  1. 在 LM Studio 打开 Developer 标签(或 Local Server 面板)。
  2. 点击 Start Server,端口 1234
  3. 确认服务器状态为运行中。

LM Link 激活后,对 http://localhost:1234/v1/chat/completions 的请求会由持有已加载模型的关联设备处理——通常是家中 PC。

用 curl 测试:

curl http://localhost:1234/v1/models

应能看到远程模型列表。

第五步:接入 SillyTavern

  1. 打开 SillyTavern(桌面或自建)。
  2. 点击插头图标API Connections
  3. 选择 Chat Completion(OpenAI 兼容)或 Text Completion / KoboldAI(视 ST 版本而定)。
  4. API 地址设为 http://localhost:1234/v1(对话)或 http://localhost:1234(文本补全)。
  5. 点击 Connect,在下拉菜单选择关联模型。
  6. 导入角色卡,发送测试消息。

本地角色扮演调优建议:

  • 精简冗长的系统提示——本地模型更适合简洁的角色卡。
  • 显存允许时,上下文设为 4096–8192 token。
  • 温度 0.7–0.9 适合角色 RP。
  • 更多细节见本站 本地 LLM 隐私指南

第六步:接入 MiniTavern 手机端

MiniTavern 的多模型中枢支持自定义 OpenAI 兼容端点——与 LM Studio 暴露的 API 相同。

在家(同一 Wi-Fi,无需 LM Link):

  1. 查看 PC 局域网 IP(如 192.168.1.42)。
  2. MiniTavern → 模型设置 → 添加自定义端点:http://192.168.1.42:1234/v1
  3. 确认 LM Studio 服务器允许局域网访问(如有「serve on local network」选项请开启)。

外出(配合 LM Link):

  1. 在已运行 LM Studio + LM Link + 本地服务器的笔记本上,MiniTavern 可指向 http://localhost:1234/v1(需侧载或远程桌面工作流)。
  2. iPhone 上 Locally 是原生 LM Link 客户端;可用 MiniTavern 管理无云依赖的卡库,推理切到 Locally——或在已关联的笔记本上用 网页酒馆

推荐工作流:在 角色卡市场 发现卡片 → 用 Chrome 扩展 管理 → 在 iOS/Android 选择 API 后端开聊。

角色扮演推荐模型

模型体量适用场景
Qwen2.5 14B InstructQ4 约 9 GBRP 表现强,人设跟随好
Mistral 7B Instruct v0.3Q4 约 5 GB8 GB 显存上响应快
Llama 3.1 8B InstructQ4 约 5 GB指令跟随稳定
Gemma 2 9BQ4 约 6 GB对话自然,Google 开源权重

复杂角色卡避免使用 3B 以下小模型——人设一致性和世界书触发都较弱。

常见问题

问题处理
看不到关联模型确认两台设备同一 LM Link 账户;重启 LM Studio
:1234 连接被拒绝在客户端启动本地服务器;检查防火墙
首 token 慢广域网正常;家中千兆局域网几乎无感
模型加载到错误设备在 LM Link 设置 preferred device
SillyTavern 空回复匹配模型的 chat template;降低 max tokens
设置里没有 LM Link功能仍在预览——更新 LM Studio 或加入等候名单
LM Link + LM StudioOllama(仅局域网)云端 API
隐私完全本地硬件完全本地硬件数据离开设备
外出用手机支持(加密网状网络)不支持(仅局域网)支持
图形化选模型偏 CLI
OpenAI 兼容 API有(:1234)有(:11434)
配置难度中等较低最低

Ollama 在同机或同局域网场景依然优秀。LM Link 的价值是无需手动配 VPN 的安全远程访问——适合想用家里 GPU 驱动手机 RP 的酒馆用户。

隐私实践建议

  1. 保持 LM Studio 更新——本地服务器的安全补丁很重要。
  2. 使用可信来源的开源模型(Hugging Face、LM Studio 目录)。
  3. 在 SillyTavern/MiniTavern 关闭云端回退,避免误配把请求发到 OpenAI。
  4. 若存储私密 lore,加密敏感角色卡文件
  5. 若关联多台家庭设备,检查 Tailscale ACL

结语

LM Studio LM Link 把家用游戏 PC 变成 SillyTavern 和 MiniTavern 的私有 AI 推理服务器——无需云端 API Key、没有用量上限,还能从手机端到端加密访问。对注重隐私的酒馆社区来说,这是把移动端角色卡扮演本地模型主权结合的最实用方案之一。

准备好搭建私有环境?下载 MiniTavern iOS/Android,浏览 角色卡市场,把 API 连接器指向 localhost:1234——剩下的交给家里的 GPU。

你可能还会喜欢这些文章

为什么你的 AI 角色总是不按套路出牌?SillyTavern 角色卡规则制定指南

你是否曾经精心制作了一个 SillyTavern 角色卡,满心期待与 AI 进行一场精彩的角色扮演,结果却发现它完全偏离了你设定的轨道?它可能突然忘记了关键设定,或者做出了完全不符合角色性格的行为。别担心,这通常不是 AI 的问题,而是你的角色卡“规则”没有写对。 在 SillyTavern 生态系统中,角…

  • sillytavern
  • character-cards
  • roleplay-rules
  • ai-behavior
阅读全文

最佳SillyTavern角色卡下载地:Chub、Discord与更多宝藏平台

如果你正在使用SillyTavern进行AI角色扮演,那么你一定知道——角色卡(Character Cards)是整个体验的灵魂。一张精心设计的角色卡不仅包含角色设定、对话风格,还能通过PNG或JSON文件轻松导入,让你的AI伙伴瞬间“活”起来。但问题来了:去哪里下载高质量的角色卡? 今天,我们就来盘点最佳的…

  • download
  • character-cards
  • chub
  • sillytavern
阅读全文