← 返回部落格

LM Studio LM Link 教學:PC 本地跑模型,手機呼叫 API(MiniTavern / SillyTavern 隱私指南)

LM Studio 的 LM Link 功能讓你在家庭 GPU 上執行開源大模型,並透過端到端加密的私有網路從手機存取——適合注重隱私的 MiniTavern 與 SillyTavern 使用者實現本地化模型 API 呼叫。

發布於
  • lm studio
  • lm link
  • 本地模型
  • 隱私
  • sillytavern
  • minitavern
  • 教學

LM Studio LM Link 教學:PC 本地跑模型,手機呼叫 API(MiniTavern / SillyTavern 隱私指南)

如果你用 SillyTavernMiniTavern 做 AI 角色卡扮演,一定體會過這道選擇題:雲端 API 聰明好用,但提示詞會離開你的裝置;本地大模型 私密無限,卻綁在一台電腦上。LM StudioLM Link 填上了這塊拼圖——推理留在自己的硬體上,手機、平板、筆電卻能像模型就在身邊一樣開聊。

本文介紹 LM Link 的原理,手把手完成設定,並說明如何接入 SillyTavern 與 MiniTavern,在 2026 年搭建一套注重隱私的酒館工作流程。

什麼是 LM Studio?

LM Studio 是一款桌面端應用程式,用於發現、下載並在本機執行開源大模型(open-weight LLM)。它在友善的圖形介面下封裝了 llama.cpp 執行環境,支援 GGUF 格式模型,並預設在 http://localhost:1234 暴露 OpenAI 相容 REST API

文件與社群中常見的 LM Studio 術語:

術語含義
Model loader(模型載入器)選擇並將 GGUF 模型載入顯示卡記憶體/記憶體的面板
Local server(本地伺服器)內建 API 服務(預設連接埠 1234),SillyTavern/MiniTavern 連這裡
lms CLI命令列工具,適合無介面伺服器(lms server startlms link enable
llmster無圖形介面的 LM Studio 變體,面向 GPU 伺服器
OpenAI-compatible endpoint/v1/chat/completions 等路由,請求格式與 OpenAI API 一致

與雲端 API 不同,角色卡、世界書、聊天記錄不會發給 OpenAI、Anthropic 或 DeepSeek——只經過你控制的軟體。

LM Link 是 LM Studio 的裝置互連功能(與 Tailscale 合作實現)。它在你擁有的裝置之間建立端到端加密的私有網狀網路。連線成功後:

  • 家裡的高效能桌上型電腦可以載入並服務 13B–70B 級模型。
  • 筆電或 iPhone 可以像本地模型一樣使用遠端模型——在模型載入器裡會顯示「Linked」標記。
  • 客戶端上對 localhost:1234 的請求會透明轉發到遠端 GPU 機器。

LM Link 目前處於**預覽(Preview)**階段,分批開放。可造訪 lmstudio.ai/link 查看資格。

傳統遠端存取需要路由器連接埠轉發或公用 IP,家庭 LLM 伺服器暴露在公用網路風險很高。LM Link 基於 Tailscale 網狀 VPN:裝置透過加密通道通訊,不暴露在網際網路上。LM Studio 和 Tailscale 都讀不到你的提示詞,只負責裝置發現與路由。

SillyTavern 和 MiniTavern 的隱私派使用者通常需要:

  1. 不經第三方推理 — 角色背景、人設提示、私密 RP 不上傳企業伺服器。
  2. 行動端可用 — MiniTavern 主要是在手機上玩,但手機跑不動 13B+ 模型。
  3. 一套卡庫、多裝置遊玩 — 導入一次,桌面 ST、MiniTavern iOS、網頁酒館都能用,不必把 PNG 卡反覆上傳到雲端。

LM Link 解決第 2 點並強化第 1 點:家裡的 PC 當推理引擎,手機只是聊天前端。配合 MiniTavern 離線卡庫與 SillyTavern 相容的 PNG 導入,就是完整的本地優先酒館棧

架構一覽

[家中 PC — LM Studio]
  ├── 已載入 GGUF 模型(如 Qwen2.5 14B)
  ├── 本地伺服器 :1234
  └── 已啟用 LM Link(Tailscale 網狀網路)

           │  端到端加密

[手機 / 筆電 — 客戶端]
  ├── LM Studio + LM Link(或 iOS 的 Locally 應用程式)
  ├── SillyTavern / MiniTavern → localhost:1234
  └── API 請求路由至家中 GPU

聊天介面和角色卡留在客戶端;只有 token 生成在遠端機器完成。

準備工作

  • 家中主機:Windows、macOS 或 Linux,帶 GPU(8 GB+ 顯示卡記憶體可跑 7B–14B 量化模型;更大模型建議 16 GB+)。
  • 客戶端裝置:另一台 PC、Mac,或已開通 LM Link 的 iPhone/iPad。
  • LM Studio 0.3.4+(LM Link 需要較新版本,請檢視發行說明)。
  • 所有裝置登入同一 LM Link 帳戶
  • SillyTavern 或 MiniTavern 中已備好角色卡(可從 Card Quest 角色卡市場 下載,或用 MiniTavern Chrome 擴充功能導入)。

第一步:在家中 PC 設定 LM Studio

  1. lmstudio.ai 下載 LM Studio。
  2. 開啟 Discover 標籤,搜尋適合角色扮演的模型,例如:
    • Qwen2.5-14B-Instruct(指令跟隨強)
    • Mistral-7B-Instruct-v0.3(中階 GPU 上速度快)
    • Llama-3.1-8B-Instruct(品質與速度均衡)
  3. 下載 Q4_K_MQ5_K_M 量化的 GGUF——顯示卡記憶體佔用合理、品質也不錯。
  4. ChatDeveloper 標籤載入模型,確認能正常回覆。
  1. 開啟 Settings → LM Link
  2. Enable LM Link 設為 ON。
  3. 登入 LM Link 帳戶(底層為 Tailscale)。
  4. 開啟 Allow loading models on this machine,允許遠端客戶端觸發載入。
  5. 保持 LM Studio 執行,模型處於已載入狀態。

無介面 GPU 伺服器可用 CLI:

lms login
lms link enable
lms server start --port 1234

第三步:連接手機或筆電

iPhone / iPad:Locally 應用程式

LM Studio 收購了 Locally iOS 應用程式並接入 LM Link 網路。LM Studio 0.4.16+ 之後:

  1. 從 App Store 安裝 Locally
  2. 用與家中 PC 相同的 LM Link 帳戶登入。
  3. 桌上型電腦上的關聯模型會出現在 Locally 中——外出也能原生聊天。

適合不想手動配 API 位址的快速行動場景。

筆電或第二台 PC:LM Studio 客戶端

  1. 在客戶端安裝 LM Studio。
  2. Settings → LM Link → 啟用 → 同一帳戶登入。
  3. 開啟模型載入器——遠端模型顯示為 Linked
  4. 可選:設定 preferred device(首選裝置),讓 API 請求固定路由到家中 GPU。

第四步:啟動本地 API 伺服器

執行 SillyTavern 或 MiniTavern 的客戶端上:

  1. 在 LM Studio 開啟 Developer 標籤(或 Local Server 面板)。
  2. 點選 Start Server,連接埠 1234
  3. 確認伺服器狀態為執行中。

LM Link 啟用後,對 http://localhost:1234/v1/chat/completions 的請求會由持有已載入模型的關聯裝置處理——通常是家中 PC。

用 curl 測試:

curl http://localhost:1234/v1/models

應能看到遠端模型列表。

第五步:接入 SillyTavern

  1. 開啟 SillyTavern(桌面或自建)。
  2. 點選插頭圖示API Connections
  3. 選擇 Chat Completion(OpenAI 相容)或 Text Completion / KoboldAI(視 ST 版本而定)。
  4. API 位址設為 http://localhost:1234/v1(對話)或 http://localhost:1234(文字補全)。
  5. 點選 Connect,在下拉選單選擇關聯模型。
  6. 導入角色卡,傳送測試訊息。

本地角色扮演調優建議:

  • 精簡冗長的系統提示——本地模型更適合簡潔的角色卡。
  • 顯示卡記憶體允許時,上下文設為 4096–8192 token。
  • 溫度 0.7–0.9 適合角色 RP。
  • 更多細節見本站 本地 LLM 隱私指南

第六步:接入 MiniTavern 手機端

MiniTavern 的多模型中樞支援自訂 OpenAI 相容端點——與 LM Studio 暴露的 API 相同。

在家(同一 Wi-Fi,無需 LM Link):

  1. 檢視 PC 區域網路 IP(如 192.168.1.42)。
  2. MiniTavern → 模型設定 → 新增自訂端點:http://192.168.1.42:1234/v1
  3. 確認 LM Studio 伺服器允許區域網路存取(如有「serve on local network」選項請開啟)。

外出(配合 LM Link):

  1. 在已執行 LM Studio + LM Link + 本地伺服器的筆電上,MiniTavern 可指向 http://localhost:1234/v1(需側載或遠端桌面工作流程)。
  2. iPhone 上 Locally 是原生 LM Link 客戶端;可用 MiniTavern 管理無雲依賴的卡庫,推理切到 Locally——或在已關聯的筆電上用 網頁酒館

推薦工作流程:在 角色卡市場 發現卡片 → 用 Chrome 擴充功能 管理 → 在 iOS/Android 選擇 API 後端開聊。

角色扮演推薦模型

模型體量適用場景
Qwen2.5 14B InstructQ4 約 9 GBRP 表現強,人設跟隨好
Mistral 7B Instruct v0.3Q4 約 5 GB8 GB 顯示卡記憶體上響應快
Llama 3.1 8B InstructQ4 約 5 GB指令跟隨穩定
Gemma 2 9BQ4 約 6 GB對話自然,Google 開源權重

複雜角色卡避免使用 3B 以下小模型——人設一致性和世界書觸發都較弱。

常見問題

問題處理
看不到關聯模型確認兩台裝置同一 LM Link 帳戶;重啟 LM Studio
:1234 連線被拒絕在客戶端啟動本地伺服器;檢查防火牆
首 token 慢廣域網路正常;家中千兆區域網路幾乎無感
模型載入到錯誤裝置在 LM Link 設定 preferred device
SillyTavern 空回覆匹配模型的 chat template;降低 max tokens
設定裡沒有 LM Link功能仍在預覽——更新 LM Studio 或加入等候名單
LM Link + LM StudioOllama(僅區域網路)雲端 API
隱私完全本地硬體完全本地硬體資料離開裝置
外出用手機支援(加密網狀網路)不支援(僅區域網路)支援
圖形化選模型偏 CLI
OpenAI 相容 API有(:1234)有(:11434)
設定難度中等較低最低

Ollama 在同機或同區域網路場景依然優秀。LM Link 的價值是無需手動設 VPN 的安全遠端存取——適合想用家裡 GPU 驅動手機 RP 的酒館使用者。

隱私實務建議

  1. 保持 LM Studio 更新——本地伺服器的安全修補很重要。
  2. 使用可信來源的開源模型(Hugging Face、LM Studio 目錄)。
  3. 在 SillyTavern/MiniTavern 關閉雲端回退,避免誤配把請求發到 OpenAI。
  4. 若儲存私密 lore,加密敏感角色卡檔案
  5. 若關聯多台家庭裝置,檢查 Tailscale ACL

結語

LM Studio LM Link 把家用遊戲 PC 變成 SillyTavern 和 MiniTavern 的私有 AI 推理伺服器——無需雲端 API Key、沒有用量上限,還能從手機端到端加密存取。對注重隱私的酒館社群來說,這是把行動端角色卡扮演本地模型主權結合的最實用方案之一。

準備好搭建私有環境?下載 MiniTavern iOS/Android,瀏覽 角色卡市場,把 API 連接器指向 localhost:1234——剩下的交給家裡的 GPU。

你可能還會喜歡這些文章

2026年SillyTavern角色卡與Google Gemini深度整合指南:從配置到優化

在AI角色扮演領域,SillyTavern憑藉其強大的自訂功能與開放生態,始終佔據核心地位。而Google Gemini模型憑藉多模態理解與長上下文處理能力,正成為2026年最受矚目的角色扮演引擎之一。本文將手把手教你如何將SillyTavern角色卡與Google Gemini完美結合,並分享一套經過驗證的優化策略。

  • sillytavern
  • google gemini
  • character cards
  • setup guide
閱讀全文

SillyTavern 角色卡故障排除指南:修復常見錯誤並優化 AI 回應

在 SillyTavern 的世界裡,角色卡是塑造沉浸式對話體驗的核心。無論是使用 MiniTavern 的 iOS/Android 應用在行動端與角色互動,還是在 Web Tavern 中除錯複雜場景,一張精心設計的角色卡都能讓 AI 回應變得生動自然。然而,即使是經驗豐富的玩家,也難免遇到角色卡載入失敗、…

  • troubleshooting
  • errors
  • fix
  • ai-responses
閱讀全文