LM Studio LM Link 教程:PC 本地跑模型,手机调用 API(MiniTavern / SillyTavern 隐私指南)
LM Studio 的 LM Link 功能让你在家庭 GPU 上运行开源大模型,并通过端到端加密的私有网络从手机访问——适合注重隐私的 MiniTavern 与 SillyTavern 用户实现本地化模型 API 调用。
- lm studio
- lm link
- 本地模型
- 隐私
- sillytavern
- minitavern
- 教程
LM Studio LM Link 教程:PC 本地跑模型,手机调用 API(MiniTavern / SillyTavern 隐私指南)
如果你用 SillyTavern 或 MiniTavern 做 AI 角色卡扮演,一定体会过这道选择题:云端 API 聪明好用,但提示词会离开你的设备;本地大模型 私密无限,却绑在一台电脑上。LM Studio 用 LM Link 填上了这块拼图——推理留在自己的硬件上,手机、平板、笔记本却能像模型就在身边一样开聊。
本文介绍 LM Link 的原理,手把手完成配置,并说明如何接入 SillyTavern 与 MiniTavern,在 2026 年搭建一套注重隐私的酒馆工作流。
什么是 LM Studio?
LM Studio 是一款桌面端应用,用于发现、下载并在本机运行开源大模型(open-weight LLM)。它在友好的图形界面下封装了 llama.cpp 运行时,支持 GGUF 格式模型,并默认在 http://localhost:1234 暴露 OpenAI 兼容 REST API。
文档与社区中常见的 LM Studio 术语:
| 术语 | 含义 |
|---|---|
| Model loader(模型加载器) | 选择并将 GGUF 模型载入显存/内存的面板 |
| Local server(本地服务器) | 内置 API 服务(默认端口 1234),SillyTavern/MiniTavern 连这里 |
| lms CLI | 命令行工具,适合无界面服务器(lms server start、lms link enable) |
| llmster | 无图形界面的 LM Studio 变体,面向 GPU 服务器 |
| OpenAI-compatible endpoint | /v1/chat/completions 等路由,请求格式与 OpenAI API 一致 |
与云端 API 不同,角色卡、世界书、聊天记录不会发给 OpenAI、Anthropic 或 DeepSeek——只经过你控制的软件。
什么是 LM Link?
LM Link 是 LM Studio 的设备互联功能(与 Tailscale 合作实现)。它在你拥有的设备之间建立端到端加密的私有网状网络。连接成功后:
- 家里的高性能台式机可以加载并服务 13B–70B 级模型。
- 笔记本或 iPhone 可以像本地模型一样使用远程模型——在模型加载器里会显示「Linked」标记。
- 客户端上对
localhost:1234的请求会透明转发到远端 GPU 机器。
LM Link 目前处于**预览(Preview)**阶段,分批开放。可访问 lmstudio.ai/link 查看资格。
LM Link 与端口映射的区别
传统远程访问需要路由器端口转发或公网 IP,家庭 LLM 服务器暴露在公网风险很高。LM Link 基于 Tailscale 网状 VPN:设备通过加密隧道通信,不暴露在互联网上。LM Studio 和 Tailscale 都读不到你的提示词,只负责设备发现与路由。
为什么注重隐私的酒馆用户需要 LM Link?
SillyTavern 和 MiniTavern 的隐私派用户通常需要:
- 不经第三方推理 — 角色背景、人设提示、私密 RP 不上传企业服务器。
- 移动端可用 — MiniTavern 主要在手机上玩,但手机跑不动 13B+ 模型。
- 一套卡库、多设备游玩 — 导入一次,桌面 ST、MiniTavern iOS、网页酒馆都能用,不必把 PNG 卡反复上传到云端。
LM Link 解决第 2 点并强化第 1 点:家里的 PC 当推理引擎,手机只是聊天前端。配合 MiniTavern 离线卡库与 SillyTavern 兼容的 PNG 导入,就是完整的本地优先酒馆栈。
架构一览
[家中 PC — LM Studio]
├── 已加载 GGUF 模型(如 Qwen2.5 14B)
├── 本地服务器 :1234
└── 已启用 LM Link(Tailscale 网状网络)
│
│ 端到端加密
▼
[手机 / 笔记本 — 客户端]
├── LM Studio + LM Link(或 iOS 的 Locally 应用)
├── SillyTavern / MiniTavern → localhost:1234
└── API 请求路由至家中 GPU
聊天界面和角色卡留在客户端;只有 token 生成在远端机器完成。
准备工作
- 家中主机:Windows、macOS 或 Linux,带 GPU(8 GB+ 显存可跑 7B–14B 量化模型;更大模型建议 16 GB+)。
- 客户端设备:另一台 PC、Mac,或已开通 LM Link 的 iPhone/iPad。
- LM Studio 0.3.4+(LM Link 需要较新版本,请查看发行说明)。
- 所有设备登录同一 LM Link 账户。
- SillyTavern 或 MiniTavern 中已备好角色卡(可从 Card Quest 角色卡市场 下载,或用 MiniTavern Chrome 扩展导入)。
第一步:在家中 PC 配置 LM Studio
- 从 lmstudio.ai 下载 LM Studio。
- 打开 Discover 标签,搜索适合角色扮演的模型,例如:
Qwen2.5-14B-Instruct(指令跟随强)Mistral-7B-Instruct-v0.3(中端 GPU 上速度快)Llama-3.1-8B-Instruct(质量与速度均衡)
- 下载 Q4_K_M 或 Q5_K_M 量化的 GGUF——显存占用合理、质量也不错。
- 在 Chat 或 Developer 标签加载模型,确认能正常回复。
第二步:在家中 PC 启用 LM Link
- 打开 Settings → LM Link。
- 将 Enable LM Link 设为 ON。
- 登录 LM Link 账户(底层为 Tailscale)。
- 开启 Allow loading models on this machine,允许远程客户端触发加载。
- 保持 LM Studio 运行,模型处于已加载状态。
无界面 GPU 服务器可用 CLI:
lms login
lms link enable
lms server start --port 1234
第三步:连接手机或笔记本
iPhone / iPad:Locally 应用
LM Studio 收购了 Locally iOS 应用并接入 LM Link 网络。LM Studio 0.4.16+ 之后:
- 从 App Store 安装 Locally。
- 用与家中 PC 相同的 LM Link 账户登录。
- 台式机上的关联模型会出现在 Locally 中——外出也能原生聊天。
适合不想手动配 API 地址的快速移动场景。
笔记本或第二台 PC:LM Studio 客户端
- 在客户端安装 LM Studio。
- Settings → LM Link → 启用 → 同一账户登录。
- 打开模型加载器——远程模型显示为 Linked。
- 可选:设置 preferred device(首选设备),让 API 请求固定路由到家中 GPU。
第四步:启动本地 API 服务器
在运行 SillyTavern 或 MiniTavern 的客户端上:
- 在 LM Studio 打开 Developer 标签(或 Local Server 面板)。
- 点击 Start Server,端口
1234。 - 确认服务器状态为运行中。
LM Link 激活后,对 http://localhost:1234/v1/chat/completions 的请求会由持有已加载模型的关联设备处理——通常是家中 PC。
用 curl 测试:
curl http://localhost:1234/v1/models
应能看到远程模型列表。
第五步:接入 SillyTavern
- 打开 SillyTavern(桌面或自建)。
- 点击插头图标 → API Connections。
- 选择 Chat Completion(OpenAI 兼容)或 Text Completion / KoboldAI(视 ST 版本而定)。
- API 地址设为
http://localhost:1234/v1(对话)或http://localhost:1234(文本补全)。 - 点击 Connect,在下拉菜单选择关联模型。
- 导入角色卡,发送测试消息。
本地角色扮演调优建议:
- 精简冗长的系统提示——本地模型更适合简洁的角色卡。
- 显存允许时,上下文设为 4096–8192 token。
- 温度 0.7–0.9 适合角色 RP。
- 更多细节见本站 本地 LLM 隐私指南。
第六步:接入 MiniTavern 手机端
MiniTavern 的多模型中枢支持自定义 OpenAI 兼容端点——与 LM Studio 暴露的 API 相同。
在家(同一 Wi-Fi,无需 LM Link):
- 查看 PC 局域网 IP(如
192.168.1.42)。 - MiniTavern → 模型设置 → 添加自定义端点:
http://192.168.1.42:1234/v1。 - 确认 LM Studio 服务器允许局域网访问(如有「serve on local network」选项请开启)。
外出(配合 LM Link):
- 在已运行 LM Studio + LM Link + 本地服务器的笔记本上,MiniTavern 可指向
http://localhost:1234/v1(需侧载或远程桌面工作流)。 - iPhone 上 Locally 是原生 LM Link 客户端;可用 MiniTavern 管理无云依赖的卡库,推理切到 Locally——或在已关联的笔记本上用 网页酒馆。
推荐工作流:在 角色卡市场 发现卡片 → 用 Chrome 扩展 管理 → 在 iOS/Android 选择 API 后端开聊。
角色扮演推荐模型
| 模型 | 体量 | 适用场景 |
|---|---|---|
| Qwen2.5 14B Instruct | Q4 约 9 GB | RP 表现强,人设跟随好 |
| Mistral 7B Instruct v0.3 | Q4 约 5 GB | 8 GB 显存上响应快 |
| Llama 3.1 8B Instruct | Q4 约 5 GB | 指令跟随稳定 |
| Gemma 2 9B | Q4 约 6 GB | 对话自然,Google 开源权重 |
复杂角色卡避免使用 3B 以下小模型——人设一致性和世界书触发都较弱。
常见问题
| 问题 | 处理 |
|---|---|
| 看不到关联模型 | 确认两台设备同一 LM Link 账户;重启 LM Studio |
| :1234 连接被拒绝 | 在客户端启动本地服务器;检查防火墙 |
| 首 token 慢 | 广域网正常;家中千兆局域网几乎无感 |
| 模型加载到错误设备 | 在 LM Link 设置 preferred device |
| SillyTavern 空回复 | 匹配模型的 chat template;降低 max tokens |
| 设置里没有 LM Link | 功能仍在预览——更新 LM Studio 或加入等候名单 |
LM Link vs Ollama vs 云端 API
| LM Link + LM Studio | Ollama(仅局域网) | 云端 API | |
|---|---|---|---|
| 隐私 | 完全本地硬件 | 完全本地硬件 | 数据离开设备 |
| 外出用手机 | 支持(加密网状网络) | 不支持(仅局域网) | 支持 |
| 图形化选模型 | 有 | 偏 CLI | 无 |
| OpenAI 兼容 API | 有(:1234) | 有(:11434) | 有 |
| 配置难度 | 中等 | 较低 | 最低 |
Ollama 在同机或同局域网场景依然优秀。LM Link 的价值是无需手动配 VPN 的安全远程访问——适合想用家里 GPU 驱动手机 RP 的酒馆用户。
隐私实践建议
- 保持 LM Studio 更新——本地服务器的安全补丁很重要。
- 使用可信来源的开源模型(Hugging Face、LM Studio 目录)。
- 在 SillyTavern/MiniTavern 关闭云端回退,避免误配把请求发到 OpenAI。
- 若存储私密 lore,加密敏感角色卡文件。
- 若关联多台家庭设备,检查 Tailscale ACL。
结语
LM Studio LM Link 把家用游戏 PC 变成 SillyTavern 和 MiniTavern 的私有 AI 推理服务器——无需云端 API Key、没有用量上限,还能从手机端到端加密访问。对注重隐私的酒馆社区来说,这是把移动端角色卡扮演与本地模型主权结合的最实用方案之一。
准备好搭建私有环境?下载 MiniTavern iOS/Android,浏览 角色卡市场,把 API 连接器指向 localhost:1234——剩下的交给家里的 GPU。
继续阅读
你可能还会喜欢这些文章
Ollama 教程:最简单的本地 LLM 接入 SillyTavern 与 MiniTavern(2026)
Ollama 一条命令拉取开源模型,在 11434 端口提供 OpenAI 兼容 API——最快上手私密 SillyTavern、MiniTavern 角色卡扮演,无需云端 Key。
- ollama
- 本地模型
- 隐私
- sillytavern
为什么你的 AI 角色总是不按套路出牌?SillyTavern 角色卡规则制定指南
你是否曾经精心制作了一个 SillyTavern 角色卡,满心期待与 AI 进行一场精彩的角色扮演,结果却发现它完全偏离了你设定的轨道?它可能突然忘记了关键设定,或者做出了完全不符合角色性格的行为。别担心,这通常不是 AI 的问题,而是你的角色卡“规则”没有写对。 在 SillyTavern 生态系统中,角…
- sillytavern
- character-cards
- roleplay-rules
- ai-behavior
最佳SillyTavern角色卡下载地:Chub、Discord与更多宝藏平台
如果你正在使用SillyTavern进行AI角色扮演,那么你一定知道——角色卡(Character Cards)是整个体验的灵魂。一张精心设计的角色卡不仅包含角色设定、对话风格,还能通过PNG或JSON文件轻松导入,让你的AI伙伴瞬间“活”起来。但问题来了:去哪里下载高质量的角色卡? 今天,我们就来盘点最佳的…
- download
- character-cards
- chub
- sillytavern