LM Studio LM Link 教程：PC 本地跑模型，手机调用 API（MiniTavern / SillyTavern 隐私指南）

如果你用 SillyTavern 或 MiniTavern 做 AI 角色卡扮演，一定体会过这道选择题：云端 API 聪明好用，但提示词会离开你的设备；本地大模型 私密无限，却绑在一台电脑上。LM Studio 用 LM Link 填上了这块拼图——推理留在自己的硬件上，手机、平板、笔记本却能像模型就在身边一样开聊。

本文介绍 LM Link 的原理，手把手完成配置，并说明如何接入 SillyTavern 与 MiniTavern，在 2026 年搭建一套注重隐私的酒馆工作流。

什么是 LM Studio？

LM Studio 是一款桌面端应用，用于发现、下载并在本机运行开源大模型（open-weight LLM）。它在友好的图形界面下封装了 llama.cpp 运行时，支持 GGUF 格式模型，并默认在 http://localhost:1234 暴露 OpenAI 兼容 REST API。

文档与社区中常见的 LM Studio 术语：

术语	含义
Model loader（模型加载器）	选择并将 GGUF 模型载入显存/内存的面板
Local server（本地服务器）	内置 API 服务（默认端口 1234），SillyTavern/MiniTavern 连这里
lms CLI	命令行工具，适合无界面服务器（`lms server start`、`lms link enable`）
llmster	无图形界面的 LM Studio 变体，面向 GPU 服务器
OpenAI-compatible endpoint	`/v1/chat/completions` 等路由，请求格式与 OpenAI API 一致

与云端 API 不同，角色卡、世界书、聊天记录不会发给 OpenAI、Anthropic 或 DeepSeek——只经过你控制的软件。

什么是 LM Link？

LM Link 是 LM Studio 的设备互联功能（与 Tailscale 合作实现）。它在你拥有的设备之间建立端到端加密的私有网状网络。连接成功后：

家里的高性能台式机可以加载并服务 13B–70B 级模型。
笔记本或 iPhone 可以像本地模型一样使用远程模型——在模型加载器里会显示「Linked」标记。
客户端上对 localhost:1234 的请求会透明转发到远端 GPU 机器。

LM Link 目前处于**预览（Preview）**阶段，分批开放。可访问 lmstudio.ai/link 查看资格。

LM Link 与端口映射的区别

传统远程访问需要路由器端口转发或公网 IP，家庭 LLM 服务器暴露在公网风险很高。LM Link 基于 Tailscale 网状 VPN：设备通过加密隧道通信，不暴露在互联网上。LM Studio 和 Tailscale 都读不到你的提示词，只负责设备发现与路由。

为什么注重隐私的酒馆用户需要 LM Link？

SillyTavern 和 MiniTavern 的隐私派用户通常需要：

不经第三方推理 — 角色背景、人设提示、私密 RP 不上传企业服务器。
移动端可用 — MiniTavern 主要在手机上玩，但手机跑不动 13B+ 模型。
一套卡库、多设备游玩 — 导入一次，桌面 ST、MiniTavern iOS、网页酒馆都能用，不必把 PNG 卡反复上传到云端。

LM Link 解决第 2 点并强化第 1 点：家里的 PC 当推理引擎，手机只是聊天前端。配合 MiniTavern 离线卡库与 SillyTavern 兼容的 PNG 导入，就是完整的本地优先酒馆栈。

架构一览

[家中 PC — LM Studio]
  ├── 已加载 GGUF 模型（如 Qwen2.5 14B）
  ├── 本地服务器 :1234
  └── 已启用 LM Link（Tailscale 网状网络）
           │
           │  端到端加密
           ▼
[手机 / 笔记本 — 客户端]
  ├── LM Studio + LM Link（或 iOS 的 Locally 应用）
  ├── SillyTavern / MiniTavern → localhost:1234
  └── API 请求路由至家中 GPU

聊天界面和角色卡留在客户端；只有 token 生成在远端机器完成。

准备工作

家中主机：Windows、macOS 或 Linux，带 GPU（8 GB+ 显存可跑 7B–14B 量化模型；更大模型建议 16 GB+）。
客户端设备：另一台 PC、Mac，或已开通 LM Link 的 iPhone/iPad。
LM Studio 0.3.4+（LM Link 需要较新版本，请查看发行说明）。
所有设备登录同一 LM Link 账户。
SillyTavern 或 MiniTavern 中已备好角色卡（可从 Card Quest 角色卡市场下载，或用 MiniTavern Chrome 扩展导入）。

第一步：在家中 PC 配置 LM Studio

从 lmstudio.ai 下载 LM Studio。
打开 Discover 标签，搜索适合角色扮演的模型，例如：
- Qwen2.5-14B-Instruct（指令跟随强）
- Mistral-7B-Instruct-v0.3（中端 GPU 上速度快）
- Llama-3.1-8B-Instruct（质量与速度均衡）
下载 Q4_K_M 或 Q5_K_M 量化的 GGUF——显存占用合理、质量也不错。
在 Chat 或 Developer 标签加载模型，确认能正常回复。

第二步：在家中 PC 启用 LM Link

打开 Settings → LM Link。
将 Enable LM Link 设为 ON。
登录 LM Link 账户（底层为 Tailscale）。
开启 Allow loading models on this machine，允许远程客户端触发加载。
保持 LM Studio 运行，模型处于已加载状态。

无界面 GPU 服务器可用 CLI：

lms login
lms link enable
lms server start --port 1234

第三步：连接手机或笔记本

iPhone / iPad：Locally 应用

LM Studio 收购了 Locally iOS 应用并接入 LM Link 网络。LM Studio 0.4.16+ 之后：

从 App Store 安装 Locally。
用与家中 PC 相同的 LM Link 账户登录。
台式机上的关联模型会出现在 Locally 中——外出也能原生聊天。

适合不想手动配 API 地址的快速移动场景。

笔记本或第二台 PC：LM Studio 客户端

在客户端安装 LM Studio。
Settings → LM Link → 启用 → 同一账户登录。
打开模型加载器——远程模型显示为 Linked。
可选：设置 preferred device（首选设备），让 API 请求固定路由到家中 GPU。

第四步：启动本地 API 服务器

在运行 SillyTavern 或 MiniTavern 的客户端上：

在 LM Studio 打开 Developer 标签（或 Local Server 面板）。
点击 Start Server，端口 1234。
确认服务器状态为运行中。

LM Link 激活后，对 http://localhost:1234/v1/chat/completions 的请求会由持有已加载模型的关联设备处理——通常是家中 PC。

用 curl 测试：

curl http://localhost:1234/v1/models

应能看到远程模型列表。

第五步：接入 SillyTavern

打开 SillyTavern（桌面或自建）。
点击插头图标 → API Connections。
选择 Chat Completion（OpenAI 兼容）或 Text Completion / KoboldAI（视 ST 版本而定）。
API 地址设为 http://localhost:1234/v1（对话）或 http://localhost:1234（文本补全）。
点击 Connect，在下拉菜单选择关联模型。
导入角色卡，发送测试消息。

本地角色扮演调优建议：

精简冗长的系统提示——本地模型更适合简洁的角色卡。
显存允许时，上下文设为 4096–8192 token。
温度 0.7–0.9 适合角色 RP。
更多细节见本站本地 LLM 隐私指南。

第六步：接入 MiniTavern 手机端

MiniTavern 的多模型中枢支持自定义 OpenAI 兼容端点——与 LM Studio 暴露的 API 相同。

在家（同一 Wi-Fi，无需 LM Link）：

查看 PC 局域网 IP（如 192.168.1.42）。
MiniTavern → 模型设置 → 添加自定义端点：http://192.168.1.42:1234/v1。
确认 LM Studio 服务器允许局域网访问（如有「serve on local network」选项请开启）。

外出（配合 LM Link）：

在已运行 LM Studio + LM Link + 本地服务器的笔记本上，MiniTavern 可指向 http://localhost:1234/v1（需侧载或远程桌面工作流）。
iPhone 上 Locally 是原生 LM Link 客户端；可用 MiniTavern 管理无云依赖的卡库，推理切到 Locally——或在已关联的笔记本上用 网页酒馆。

推荐工作流：在角色卡市场发现卡片 → 用 Chrome 扩展管理 → 在 iOS/Android 选择 API 后端开聊。

角色扮演推荐模型

模型	体量	适用场景
Qwen2.5 14B Instruct	Q4 约 9 GB	RP 表现强，人设跟随好
Mistral 7B Instruct v0.3	Q4 约 5 GB	8 GB 显存上响应快
Llama 3.1 8B Instruct	Q4 约 5 GB	指令跟随稳定
Gemma 2 9B	Q4 约 6 GB	对话自然，Google 开源权重

复杂角色卡避免使用 3B 以下小模型——人设一致性和世界书触发都较弱。

常见问题

问题	处理
看不到关联模型	确认两台设备同一 LM Link 账户；重启 LM Studio
:1234 连接被拒绝	在客户端启动本地服务器；检查防火墙
首 token 慢	广域网正常；家中千兆局域网几乎无感
模型加载到错误设备	在 LM Link 设置 preferred device
SillyTavern 空回复	匹配模型的 chat template；降低 max tokens
设置里没有 LM Link	功能仍在预览——更新 LM Studio 或加入等候名单

LM Link vs Ollama vs 云端 API

	LM Link + LM Studio	Ollama（仅局域网）	云端 API
隐私	完全本地硬件	完全本地硬件	数据离开设备
外出用手机	支持（加密网状网络）	不支持（仅局域网）	支持
图形化选模型	有	偏 CLI	无
OpenAI 兼容 API	有（:1234）	有（:11434）	有
配置难度	中等	较低	最低

Ollama 在同机或同局域网场景依然优秀。LM Link 的价值是无需手动配 VPN 的安全远程访问——适合想用家里 GPU 驱动手机 RP 的酒馆用户。

隐私实践建议

保持 LM Studio 更新——本地服务器的安全补丁很重要。
使用可信来源的开源模型（Hugging Face、LM Studio 目录）。
在 SillyTavern/MiniTavern 关闭云端回退，避免误配把请求发到 OpenAI。
若存储私密 lore，加密敏感角色卡文件。
若关联多台家庭设备，检查 Tailscale ACL。

结语

LM Studio LM Link 把家用游戏 PC 变成 SillyTavern 和 MiniTavern 的私有 AI 推理服务器——无需云端 API Key、没有用量上限，还能从手机端到端加密访问。对注重隐私的酒馆社区来说，这是把移动端角色卡扮演与本地模型主权结合的最实用方案之一。

准备好搭建私有环境？下载 MiniTavern iOS/Android，浏览角色卡市场，把 API 连接器指向 localhost:1234——剩下的交给家里的 GPU。

LM Studio LM Link 教程：PC 本地跑模型，手机调用 API（MiniTavern / SillyTavern 隐私指南）

LM Studio LM Link 教程：PC 本地跑模型，手机调用 API（MiniTavern / SillyTavern 隐私指南）

什么是 LM Studio？

什么是 LM Link？

LM Link 与端口映射的区别

为什么注重隐私的酒馆用户需要 LM Link？

架构一览

准备工作

第一步：在家中 PC 配置 LM Studio

第二步：在家中 PC 启用 LM Link

第三步：连接手机或笔记本

iPhone / iPad：Locally 应用

笔记本或第二台 PC：LM Studio 客户端

第四步：启动本地 API 服务器

第五步：接入 SillyTavern

第六步：接入 MiniTavern 手机端

角色扮演推荐模型

常见问题

LM Link vs Ollama vs 云端 API

隐私实践建议

结语

Ollama 教程：最简单的本地 LLM 接入 SillyTavern 与 MiniTavern（2026）

为什么你的 AI 角色总是不按套路出牌？SillyTavern 角色卡规则制定指南

最佳SillyTavern角色卡下载地：Chub、Discord与更多宝藏平台

LM Studio LM Link 教程：PC 本地跑模型，手机调用 API（MiniTavern / SillyTavern 隐私指南）

什么是 LM Studio？

什么是 LM Link？

LM Link 与端口映射的区别

为什么注重隐私的酒馆用户需要 LM Link？

架构一览

准备工作

第一步：在家中 PC 配置 LM Studio

第二步：在家中 PC 启用 LM Link

第三步：连接手机或笔记本

iPhone / iPad：Locally 应用

笔记本或第二台 PC：LM Studio 客户端

第四步：启动本地 API 服务器

第五步：接入 SillyTavern

第六步：接入 MiniTavern 手机端

角色扮演推荐模型

常见问题

LM Link vs Ollama vs 云端 API

隐私实践建议

结语

继续阅读

Ollama 教程：最简单的本地 LLM 接入 SillyTavern 与 MiniTavern（2026）

为什么你的 AI 角色总是不按套路出牌？SillyTavern 角色卡规则制定指南

最佳SillyTavern角色卡下载地：Chub、Discord与更多宝藏平台