LM Studio LM Link 教學:PC 本地跑模型,手機呼叫 API(MiniTavern / SillyTavern 隱私指南)
LM Studio 的 LM Link 功能讓你在家庭 GPU 上執行開源大模型,並透過端到端加密的私有網路從手機存取——適合注重隱私的 MiniTavern 與 SillyTavern 使用者實現本地化模型 API 呼叫。
- lm studio
- lm link
- 本地模型
- 隱私
- sillytavern
- minitavern
- 教學
LM Studio LM Link 教學:PC 本地跑模型,手機呼叫 API(MiniTavern / SillyTavern 隱私指南)
如果你用 SillyTavern 或 MiniTavern 做 AI 角色卡扮演,一定體會過這道選擇題:雲端 API 聰明好用,但提示詞會離開你的裝置;本地大模型 私密無限,卻綁在一台電腦上。LM Studio 用 LM Link 填上了這塊拼圖——推理留在自己的硬體上,手機、平板、筆電卻能像模型就在身邊一樣開聊。
本文介紹 LM Link 的原理,手把手完成設定,並說明如何接入 SillyTavern 與 MiniTavern,在 2026 年搭建一套注重隱私的酒館工作流程。
什麼是 LM Studio?
LM Studio 是一款桌面端應用程式,用於發現、下載並在本機執行開源大模型(open-weight LLM)。它在友善的圖形介面下封裝了 llama.cpp 執行環境,支援 GGUF 格式模型,並預設在 http://localhost:1234 暴露 OpenAI 相容 REST API。
文件與社群中常見的 LM Studio 術語:
| 術語 | 含義 |
|---|---|
| Model loader(模型載入器) | 選擇並將 GGUF 模型載入顯示卡記憶體/記憶體的面板 |
| Local server(本地伺服器) | 內建 API 服務(預設連接埠 1234),SillyTavern/MiniTavern 連這裡 |
| lms CLI | 命令列工具,適合無介面伺服器(lms server start、lms link enable) |
| llmster | 無圖形介面的 LM Studio 變體,面向 GPU 伺服器 |
| OpenAI-compatible endpoint | /v1/chat/completions 等路由,請求格式與 OpenAI API 一致 |
與雲端 API 不同,角色卡、世界書、聊天記錄不會發給 OpenAI、Anthropic 或 DeepSeek——只經過你控制的軟體。
什麼是 LM Link?
LM Link 是 LM Studio 的裝置互連功能(與 Tailscale 合作實現)。它在你擁有的裝置之間建立端到端加密的私有網狀網路。連線成功後:
- 家裡的高效能桌上型電腦可以載入並服務 13B–70B 級模型。
- 筆電或 iPhone 可以像本地模型一樣使用遠端模型——在模型載入器裡會顯示「Linked」標記。
- 客戶端上對
localhost:1234的請求會透明轉發到遠端 GPU 機器。
LM Link 目前處於**預覽(Preview)**階段,分批開放。可造訪 lmstudio.ai/link 查看資格。
LM Link 與連接埠轉發的區別
傳統遠端存取需要路由器連接埠轉發或公用 IP,家庭 LLM 伺服器暴露在公用網路風險很高。LM Link 基於 Tailscale 網狀 VPN:裝置透過加密通道通訊,不暴露在網際網路上。LM Studio 和 Tailscale 都讀不到你的提示詞,只負責裝置發現與路由。
為什麼注重隱私的酒館使用者需要 LM Link?
SillyTavern 和 MiniTavern 的隱私派使用者通常需要:
- 不經第三方推理 — 角色背景、人設提示、私密 RP 不上傳企業伺服器。
- 行動端可用 — MiniTavern 主要是在手機上玩,但手機跑不動 13B+ 模型。
- 一套卡庫、多裝置遊玩 — 導入一次,桌面 ST、MiniTavern iOS、網頁酒館都能用,不必把 PNG 卡反覆上傳到雲端。
LM Link 解決第 2 點並強化第 1 點:家裡的 PC 當推理引擎,手機只是聊天前端。配合 MiniTavern 離線卡庫與 SillyTavern 相容的 PNG 導入,就是完整的本地優先酒館棧。
架構一覽
[家中 PC — LM Studio]
├── 已載入 GGUF 模型(如 Qwen2.5 14B)
├── 本地伺服器 :1234
└── 已啟用 LM Link(Tailscale 網狀網路)
│
│ 端到端加密
▼
[手機 / 筆電 — 客戶端]
├── LM Studio + LM Link(或 iOS 的 Locally 應用程式)
├── SillyTavern / MiniTavern → localhost:1234
└── API 請求路由至家中 GPU
聊天介面和角色卡留在客戶端;只有 token 生成在遠端機器完成。
準備工作
- 家中主機:Windows、macOS 或 Linux,帶 GPU(8 GB+ 顯示卡記憶體可跑 7B–14B 量化模型;更大模型建議 16 GB+)。
- 客戶端裝置:另一台 PC、Mac,或已開通 LM Link 的 iPhone/iPad。
- LM Studio 0.3.4+(LM Link 需要較新版本,請檢視發行說明)。
- 所有裝置登入同一 LM Link 帳戶。
- SillyTavern 或 MiniTavern 中已備好角色卡(可從 Card Quest 角色卡市場 下載,或用 MiniTavern Chrome 擴充功能導入)。
第一步:在家中 PC 設定 LM Studio
- 從 lmstudio.ai 下載 LM Studio。
- 開啟 Discover 標籤,搜尋適合角色扮演的模型,例如:
Qwen2.5-14B-Instruct(指令跟隨強)Mistral-7B-Instruct-v0.3(中階 GPU 上速度快)Llama-3.1-8B-Instruct(品質與速度均衡)
- 下載 Q4_K_M 或 Q5_K_M 量化的 GGUF——顯示卡記憶體佔用合理、品質也不錯。
- 在 Chat 或 Developer 標籤載入模型,確認能正常回覆。
第二步:在家中 PC 啟用 LM Link
- 開啟 Settings → LM Link。
- 將 Enable LM Link 設為 ON。
- 登入 LM Link 帳戶(底層為 Tailscale)。
- 開啟 Allow loading models on this machine,允許遠端客戶端觸發載入。
- 保持 LM Studio 執行,模型處於已載入狀態。
無介面 GPU 伺服器可用 CLI:
lms login
lms link enable
lms server start --port 1234
第三步:連接手機或筆電
iPhone / iPad:Locally 應用程式
LM Studio 收購了 Locally iOS 應用程式並接入 LM Link 網路。LM Studio 0.4.16+ 之後:
- 從 App Store 安裝 Locally。
- 用與家中 PC 相同的 LM Link 帳戶登入。
- 桌上型電腦上的關聯模型會出現在 Locally 中——外出也能原生聊天。
適合不想手動配 API 位址的快速行動場景。
筆電或第二台 PC:LM Studio 客戶端
- 在客戶端安裝 LM Studio。
- Settings → LM Link → 啟用 → 同一帳戶登入。
- 開啟模型載入器——遠端模型顯示為 Linked。
- 可選:設定 preferred device(首選裝置),讓 API 請求固定路由到家中 GPU。
第四步:啟動本地 API 伺服器
在執行 SillyTavern 或 MiniTavern 的客戶端上:
- 在 LM Studio 開啟 Developer 標籤(或 Local Server 面板)。
- 點選 Start Server,連接埠
1234。 - 確認伺服器狀態為執行中。
LM Link 啟用後,對 http://localhost:1234/v1/chat/completions 的請求會由持有已載入模型的關聯裝置處理——通常是家中 PC。
用 curl 測試:
curl http://localhost:1234/v1/models
應能看到遠端模型列表。
第五步:接入 SillyTavern
- 開啟 SillyTavern(桌面或自建)。
- 點選插頭圖示 → API Connections。
- 選擇 Chat Completion(OpenAI 相容)或 Text Completion / KoboldAI(視 ST 版本而定)。
- API 位址設為
http://localhost:1234/v1(對話)或http://localhost:1234(文字補全)。 - 點選 Connect,在下拉選單選擇關聯模型。
- 導入角色卡,傳送測試訊息。
本地角色扮演調優建議:
- 精簡冗長的系統提示——本地模型更適合簡潔的角色卡。
- 顯示卡記憶體允許時,上下文設為 4096–8192 token。
- 溫度 0.7–0.9 適合角色 RP。
- 更多細節見本站 本地 LLM 隱私指南。
第六步:接入 MiniTavern 手機端
MiniTavern 的多模型中樞支援自訂 OpenAI 相容端點——與 LM Studio 暴露的 API 相同。
在家(同一 Wi-Fi,無需 LM Link):
- 檢視 PC 區域網路 IP(如
192.168.1.42)。 - MiniTavern → 模型設定 → 新增自訂端點:
http://192.168.1.42:1234/v1。 - 確認 LM Studio 伺服器允許區域網路存取(如有「serve on local network」選項請開啟)。
外出(配合 LM Link):
- 在已執行 LM Studio + LM Link + 本地伺服器的筆電上,MiniTavern 可指向
http://localhost:1234/v1(需側載或遠端桌面工作流程)。 - iPhone 上 Locally 是原生 LM Link 客戶端;可用 MiniTavern 管理無雲依賴的卡庫,推理切到 Locally——或在已關聯的筆電上用 網頁酒館。
推薦工作流程:在 角色卡市場 發現卡片 → 用 Chrome 擴充功能 管理 → 在 iOS/Android 選擇 API 後端開聊。
角色扮演推薦模型
| 模型 | 體量 | 適用場景 |
|---|---|---|
| Qwen2.5 14B Instruct | Q4 約 9 GB | RP 表現強,人設跟隨好 |
| Mistral 7B Instruct v0.3 | Q4 約 5 GB | 8 GB 顯示卡記憶體上響應快 |
| Llama 3.1 8B Instruct | Q4 約 5 GB | 指令跟隨穩定 |
| Gemma 2 9B | Q4 約 6 GB | 對話自然,Google 開源權重 |
複雜角色卡避免使用 3B 以下小模型——人設一致性和世界書觸發都較弱。
常見問題
| 問題 | 處理 |
|---|---|
| 看不到關聯模型 | 確認兩台裝置同一 LM Link 帳戶;重啟 LM Studio |
| :1234 連線被拒絕 | 在客戶端啟動本地伺服器;檢查防火牆 |
| 首 token 慢 | 廣域網路正常;家中千兆區域網路幾乎無感 |
| 模型載入到錯誤裝置 | 在 LM Link 設定 preferred device |
| SillyTavern 空回覆 | 匹配模型的 chat template;降低 max tokens |
| 設定裡沒有 LM Link | 功能仍在預覽——更新 LM Studio 或加入等候名單 |
LM Link vs Ollama vs 雲端 API
| LM Link + LM Studio | Ollama(僅區域網路) | 雲端 API | |
|---|---|---|---|
| 隱私 | 完全本地硬體 | 完全本地硬體 | 資料離開裝置 |
| 外出用手機 | 支援(加密網狀網路) | 不支援(僅區域網路) | 支援 |
| 圖形化選模型 | 有 | 偏 CLI | 無 |
| OpenAI 相容 API | 有(:1234) | 有(:11434) | 有 |
| 設定難度 | 中等 | 較低 | 最低 |
Ollama 在同機或同區域網路場景依然優秀。LM Link 的價值是無需手動設 VPN 的安全遠端存取——適合想用家裡 GPU 驅動手機 RP 的酒館使用者。
隱私實務建議
- 保持 LM Studio 更新——本地伺服器的安全修補很重要。
- 使用可信來源的開源模型(Hugging Face、LM Studio 目錄)。
- 在 SillyTavern/MiniTavern 關閉雲端回退,避免誤配把請求發到 OpenAI。
- 若儲存私密 lore,加密敏感角色卡檔案。
- 若關聯多台家庭裝置,檢查 Tailscale ACL。
結語
LM Studio LM Link 把家用遊戲 PC 變成 SillyTavern 和 MiniTavern 的私有 AI 推理伺服器——無需雲端 API Key、沒有用量上限,還能從手機端到端加密存取。對注重隱私的酒館社群來說,這是把行動端角色卡扮演與本地模型主權結合的最實用方案之一。
準備好搭建私有環境?下載 MiniTavern iOS/Android,瀏覽 角色卡市場,把 API 連接器指向 localhost:1234——剩下的交給家裡的 GPU。
繼續閱讀
你可能還會喜歡這些文章
2026年SillyTavern角色卡與Google Gemini深度整合指南:從配置到優化
在AI角色扮演領域,SillyTavern憑藉其強大的自訂功能與開放生態,始終佔據核心地位。而Google Gemini模型憑藉多模態理解與長上下文處理能力,正成為2026年最受矚目的角色扮演引擎之一。本文將手把手教你如何將SillyTavern角色卡與Google Gemini完美結合,並分享一套經過驗證的優化策略。
- sillytavern
- google gemini
- character cards
- setup guide
SillyTavern 角色卡故障排除指南:修復常見錯誤並優化 AI 回應
在 SillyTavern 的世界裡,角色卡是塑造沉浸式對話體驗的核心。無論是使用 MiniTavern 的 iOS/Android 應用在行動端與角色互動,還是在 Web Tavern 中除錯複雜場景,一張精心設計的角色卡都能讓 AI 回應變得生動自然。然而,即使是經驗豐富的玩家,也難免遇到角色卡載入失敗、…
- troubleshooting
- errors
- fix
- ai-responses
2026 年本地 LLM 與 SillyTavern 角色卡完全指南:隱私、效能與部署
2026 年,將 SillyTavern Character Cards 與本地 LLM 結合,已成為追求極致隱私與個人化體驗的最佳選擇。本文深入探討此組合的優勢、效能優化技巧,並提供清晰的部署指南。
- sillytavern
- local-llm
- privacy
- setup