LM Studio LM Link 教學：PC 本地跑模型，手機呼叫 API（MiniTavern / SillyTavern 隱私指南）

如果你用 SillyTavern 或 MiniTavern 做 AI 角色卡扮演，一定體會過這道選擇題：雲端 API 聰明好用，但提示詞會離開你的裝置；本地大模型 私密無限，卻綁在一台電腦上。LM Studio 用 LM Link 填上了這塊拼圖——推理留在自己的硬體上，手機、平板、筆電卻能像模型就在身邊一樣開聊。

本文介紹 LM Link 的原理，手把手完成設定，並說明如何接入 SillyTavern 與 MiniTavern，在 2026 年搭建一套注重隱私的酒館工作流程。

什麼是 LM Studio？

LM Studio 是一款桌面端應用程式，用於發現、下載並在本機執行開源大模型（open-weight LLM）。它在友善的圖形介面下封裝了 llama.cpp 執行環境，支援 GGUF 格式模型，並預設在 http://localhost:1234 暴露 OpenAI 相容 REST API。

文件與社群中常見的 LM Studio 術語：

術語	含義
Model loader（模型載入器）	選擇並將 GGUF 模型載入顯示卡記憶體/記憶體的面板
Local server（本地伺服器）	內建 API 服務（預設連接埠 1234），SillyTavern/MiniTavern 連這裡
lms CLI	命令列工具，適合無介面伺服器（`lms server start`、`lms link enable`）
llmster	無圖形介面的 LM Studio 變體，面向 GPU 伺服器
OpenAI-compatible endpoint	`/v1/chat/completions` 等路由，請求格式與 OpenAI API 一致

與雲端 API 不同，角色卡、世界書、聊天記錄不會發給 OpenAI、Anthropic 或 DeepSeek——只經過你控制的軟體。

什麼是 LM Link？

LM Link 是 LM Studio 的裝置互連功能（與 Tailscale 合作實現）。它在你擁有的裝置之間建立端到端加密的私有網狀網路。連線成功後：

家裡的高效能桌上型電腦可以載入並服務 13B–70B 級模型。
筆電或 iPhone 可以像本地模型一樣使用遠端模型——在模型載入器裡會顯示「Linked」標記。
客戶端上對 localhost:1234 的請求會透明轉發到遠端 GPU 機器。

LM Link 目前處於**預覽（Preview）**階段，分批開放。可造訪 lmstudio.ai/link 查看資格。

LM Link 與連接埠轉發的區別

傳統遠端存取需要路由器連接埠轉發或公用 IP，家庭 LLM 伺服器暴露在公用網路風險很高。LM Link 基於 Tailscale 網狀 VPN：裝置透過加密通道通訊，不暴露在網際網路上。LM Studio 和 Tailscale 都讀不到你的提示詞，只負責裝置發現與路由。

為什麼注重隱私的酒館使用者需要 LM Link？

SillyTavern 和 MiniTavern 的隱私派使用者通常需要：

不經第三方推理 — 角色背景、人設提示、私密 RP 不上傳企業伺服器。
行動端可用 — MiniTavern 主要是在手機上玩，但手機跑不動 13B+ 模型。
一套卡庫、多裝置遊玩 — 導入一次，桌面 ST、MiniTavern iOS、網頁酒館都能用，不必把 PNG 卡反覆上傳到雲端。

LM Link 解決第 2 點並強化第 1 點：家裡的 PC 當推理引擎，手機只是聊天前端。配合 MiniTavern 離線卡庫與 SillyTavern 相容的 PNG 導入，就是完整的本地優先酒館棧。

架構一覽

[家中 PC — LM Studio]
  ├── 已載入 GGUF 模型（如 Qwen2.5 14B）
  ├── 本地伺服器 :1234
  └── 已啟用 LM Link（Tailscale 網狀網路）
           │
           │  端到端加密
           ▼
[手機 / 筆電 — 客戶端]
  ├── LM Studio + LM Link（或 iOS 的 Locally 應用程式）
  ├── SillyTavern / MiniTavern → localhost:1234
  └── API 請求路由至家中 GPU

聊天介面和角色卡留在客戶端；只有 token 生成在遠端機器完成。

準備工作

家中主機：Windows、macOS 或 Linux，帶 GPU（8 GB+ 顯示卡記憶體可跑 7B–14B 量化模型；更大模型建議 16 GB+）。
客戶端裝置：另一台 PC、Mac，或已開通 LM Link 的 iPhone/iPad。
LM Studio 0.3.4+（LM Link 需要較新版本，請檢視發行說明）。
所有裝置登入同一 LM Link 帳戶。
SillyTavern 或 MiniTavern 中已備好角色卡（可從 Card Quest 角色卡市場下載，或用 MiniTavern Chrome 擴充功能導入）。

第一步：在家中 PC 設定 LM Studio

從 lmstudio.ai 下載 LM Studio。
開啟 Discover 標籤，搜尋適合角色扮演的模型，例如：
- Qwen2.5-14B-Instruct（指令跟隨強）
- Mistral-7B-Instruct-v0.3（中階 GPU 上速度快）
- Llama-3.1-8B-Instruct（品質與速度均衡）
下載 Q4_K_M 或 Q5_K_M 量化的 GGUF——顯示卡記憶體佔用合理、品質也不錯。
在 Chat 或 Developer 標籤載入模型，確認能正常回覆。

第二步：在家中 PC 啟用 LM Link

開啟 Settings → LM Link。
將 Enable LM Link 設為 ON。
登入 LM Link 帳戶（底層為 Tailscale）。
開啟 Allow loading models on this machine，允許遠端客戶端觸發載入。
保持 LM Studio 執行，模型處於已載入狀態。

無介面 GPU 伺服器可用 CLI：

lms login
lms link enable
lms server start --port 1234

第三步：連接手機或筆電

iPhone / iPad：Locally 應用程式

LM Studio 收購了 Locally iOS 應用程式並接入 LM Link 網路。LM Studio 0.4.16+ 之後：

從 App Store 安裝 Locally。
用與家中 PC 相同的 LM Link 帳戶登入。
桌上型電腦上的關聯模型會出現在 Locally 中——外出也能原生聊天。

適合不想手動配 API 位址的快速行動場景。

筆電或第二台 PC：LM Studio 客戶端

在客戶端安裝 LM Studio。
Settings → LM Link → 啟用 → 同一帳戶登入。
開啟模型載入器——遠端模型顯示為 Linked。
可選：設定 preferred device（首選裝置），讓 API 請求固定路由到家中 GPU。

第四步：啟動本地 API 伺服器

在執行 SillyTavern 或 MiniTavern 的客戶端上：

在 LM Studio 開啟 Developer 標籤（或 Local Server 面板）。
點選 Start Server，連接埠 1234。
確認伺服器狀態為執行中。

LM Link 啟用後，對 http://localhost:1234/v1/chat/completions 的請求會由持有已載入模型的關聯裝置處理——通常是家中 PC。

用 curl 測試：

curl http://localhost:1234/v1/models

應能看到遠端模型列表。

第五步：接入 SillyTavern

開啟 SillyTavern（桌面或自建）。
點選插頭圖示 → API Connections。
選擇 Chat Completion（OpenAI 相容）或 Text Completion / KoboldAI（視 ST 版本而定）。
API 位址設為 http://localhost:1234/v1（對話）或 http://localhost:1234（文字補全）。
點選 Connect，在下拉選單選擇關聯模型。
導入角色卡，傳送測試訊息。

本地角色扮演調優建議：

精簡冗長的系統提示——本地模型更適合簡潔的角色卡。
顯示卡記憶體允許時，上下文設為 4096–8192 token。
溫度 0.7–0.9 適合角色 RP。
更多細節見本站本地 LLM 隱私指南。

第六步：接入 MiniTavern 手機端

MiniTavern 的多模型中樞支援自訂 OpenAI 相容端點——與 LM Studio 暴露的 API 相同。

在家（同一 Wi-Fi，無需 LM Link）：

檢視 PC 區域網路 IP（如 192.168.1.42）。
MiniTavern → 模型設定 → 新增自訂端點：http://192.168.1.42:1234/v1。
確認 LM Studio 伺服器允許區域網路存取（如有「serve on local network」選項請開啟）。

外出（配合 LM Link）：

在已執行 LM Studio + LM Link + 本地伺服器的筆電上，MiniTavern 可指向 http://localhost:1234/v1（需側載或遠端桌面工作流程）。
iPhone 上 Locally 是原生 LM Link 客戶端；可用 MiniTavern 管理無雲依賴的卡庫，推理切到 Locally——或在已關聯的筆電上用 網頁酒館。

推薦工作流程：在角色卡市場發現卡片 → 用 Chrome 擴充功能管理 → 在 iOS/Android 選擇 API 後端開聊。

角色扮演推薦模型

模型	體量	適用場景
Qwen2.5 14B Instruct	Q4 約 9 GB	RP 表現強，人設跟隨好
Mistral 7B Instruct v0.3	Q4 約 5 GB	8 GB 顯示卡記憶體上響應快
Llama 3.1 8B Instruct	Q4 約 5 GB	指令跟隨穩定
Gemma 2 9B	Q4 約 6 GB	對話自然，Google 開源權重

複雜角色卡避免使用 3B 以下小模型——人設一致性和世界書觸發都較弱。

常見問題

問題	處理
看不到關聯模型	確認兩台裝置同一 LM Link 帳戶；重啟 LM Studio
:1234 連線被拒絕	在客戶端啟動本地伺服器；檢查防火牆
首 token 慢	廣域網路正常；家中千兆區域網路幾乎無感
模型載入到錯誤裝置	在 LM Link 設定 preferred device
SillyTavern 空回覆	匹配模型的 chat template；降低 max tokens
設定裡沒有 LM Link	功能仍在預覽——更新 LM Studio 或加入等候名單

LM Link vs Ollama vs 雲端 API

	LM Link + LM Studio	Ollama（僅區域網路）	雲端 API
隱私	完全本地硬體	完全本地硬體	資料離開裝置
外出用手機	支援（加密網狀網路）	不支援（僅區域網路）	支援
圖形化選模型	有	偏 CLI	無
OpenAI 相容 API	有（:1234）	有（:11434）	有
設定難度	中等	較低	最低

Ollama 在同機或同區域網路場景依然優秀。LM Link 的價值是無需手動設 VPN 的安全遠端存取——適合想用家裡 GPU 驅動手機 RP 的酒館使用者。

隱私實務建議

保持 LM Studio 更新——本地伺服器的安全修補很重要。
使用可信來源的開源模型（Hugging Face、LM Studio 目錄）。
在 SillyTavern/MiniTavern 關閉雲端回退，避免誤配把請求發到 OpenAI。
若儲存私密 lore，加密敏感角色卡檔案。
若關聯多台家庭裝置，檢查 Tailscale ACL。

結語

LM Studio LM Link 把家用遊戲 PC 變成 SillyTavern 和 MiniTavern 的私有 AI 推理伺服器——無需雲端 API Key、沒有用量上限，還能從手機端到端加密存取。對注重隱私的酒館社群來說，這是把行動端角色卡扮演與本地模型主權結合的最實用方案之一。

準備好搭建私有環境？下載 MiniTavern iOS/Android，瀏覽角色卡市場，把 API 連接器指向 localhost:1234——剩下的交給家裡的 GPU。

LM Studio LM Link 教學：PC 本地跑模型，手機呼叫 API（MiniTavern / SillyTavern 隱私指南）

LM Studio LM Link 教學：PC 本地跑模型，手機呼叫 API（MiniTavern / SillyTavern 隱私指南）

什麼是 LM Studio？

什麼是 LM Link？

LM Link 與連接埠轉發的區別

為什麼注重隱私的酒館使用者需要 LM Link？

架構一覽

準備工作

第一步：在家中 PC 設定 LM Studio

第二步：在家中 PC 啟用 LM Link

第三步：連接手機或筆電

iPhone / iPad：Locally 應用程式

筆電或第二台 PC：LM Studio 客戶端

第四步：啟動本地 API 伺服器

第五步：接入 SillyTavern

第六步：接入 MiniTavern 手機端

角色扮演推薦模型

常見問題

LM Link vs Ollama vs 雲端 API

隱私實務建議

結語

2026年SillyTavern角色卡與Google Gemini深度整合指南：從配置到優化

SillyTavern 角色卡故障排除指南：修復常見錯誤並優化 AI 回應

2026 年本地 LLM 與 SillyTavern 角色卡完全指南：隱私、效能與部署

LM Studio LM Link 教學：PC 本地跑模型，手機呼叫 API（MiniTavern / SillyTavern 隱私指南）

什麼是 LM Studio？

什麼是 LM Link？

LM Link 與連接埠轉發的區別

為什麼注重隱私的酒館使用者需要 LM Link？

架構一覽

準備工作

第一步：在家中 PC 設定 LM Studio

第二步：在家中 PC 啟用 LM Link

第三步：連接手機或筆電

iPhone / iPad：Locally 應用程式

筆電或第二台 PC：LM Studio 客戶端

第四步：啟動本地 API 伺服器

第五步：接入 SillyTavern

第六步：接入 MiniTavern 手機端

角色扮演推薦模型

常見問題

LM Link vs Ollama vs 雲端 API

隱私實務建議

結語

繼續閱讀

2026年SillyTavern角色卡與Google Gemini深度整合指南：從配置到優化

SillyTavern 角色卡故障排除指南：修復常見錯誤並優化 AI 回應

2026 年本地 LLM 與 SillyTavern 角色卡完全指南：隱私、效能與部署