關於TokForge
在手機上進行私密AI聊天。無需雲端,無需訂閱。
私密、本地、離線 AI。無廣告,無訂閱
TokForge 可直接在您的 Android 裝置上快速執行大型語言模型。無需雲端,無需訂閱,資料安全無虞。
無論您需要本地 AI 助理來提高工作效率,還是需要一個可以離線聊天的 AI 朋友,TokForge 都能在無需網路連線的情況下提供高效能推理。
TokForge 的功能:
與 AI 角色聊天
💬 您的離線 AI 聊天體驗已全面升級。匯入 TavernAI V2 角色卡(PNG/JSON),自訂角色個性,並透過即時產生功能進行真實對話。 TokForge 是終極離線 AI 朋友,擁有豐富的背景故事、多種問候和世界資訊。推理模型甚至包含可折疊的思考模組,用於深度邏輯推理。
附加文件並提問
📄 將 TokForge 變成強大的本地 AI 研究工具。只需上傳 PDF、DOCX、EPUB 或文字文件,即可像離線應用程式一樣提問。此應用程式利用 RAPTOR 樹索引和 BGE-small 嵌入,能夠即時找到相關段落。得益於增量鍵值快取保留技術,後續問題也能快速回應。
聆聽回覆朗讀
🔊 一款真正的 Android 離線語音助理。內建 Kokoro TTS,提供 11 種語音和兩種音質等級,您的離線助理可以零延遲、零流量地朗讀回應。
推測解碼速度提升 2 倍
⚡ 體驗行動端最快的 LLM 效能。小型草稿模型進行預測,同時主模型批量驗證。憑藉即時 tok/s 指示器和智慧後端路由,它是目前最高效的設備端 AI 解決方案。
三個後端,五條 GPU 路徑
· 基於 OpenCL 和 Vulkan GPU 的 MNN:針對 Mali 和 Adreno 最佳化的核心。 TQ4 TurboQuant 在小型模型上可達到 46–57 tok/s 的吞吐量。
· 透過 llama.cpp 實現的 GGUF:ARM i8mm、Vulkan 協作矩陣、快閃注意力機制和完整的量化範圍。
· 遠端 API:相容於 OpenAI 的串流傳輸,支援 Ollama、vLLM 或 llama.cpp 伺服器。
· SoC 感知自動路由:這款本地 AI 助理會自動為您的特定晶片組選擇最快的路徑。
進階 AI 離線聊天功能:
• 您的 AI 會記住您: 基於字元的持久記憶,支援後台擷取。知識圖譜利用混合關鍵字搜尋和語意搜尋來追蹤實體關係。
• 最佳化您的裝置: ForgeLab 會在您的硬體上對每種 AI 模型和後端組合進行基準測試。 AutoForge 會掃描所有配置,為您的離線 AI 應用程式選擇最快的設定。
• 開發者 API: 提供 120 多個端點,可對 HTTP 進行完全的本機控制。您可以以程式設計方式載入模型、管理記憶體和傳送訊息。
真實硬體測試
- RedMagic 11 Pro:21.0 tok/s — Qwen3-8B
- Galaxy S24 Ultra:13.58 tok/s — Qwen3-4B
- OnePlus Ace 5 Ultra:11.88 tok/s — Qwen3-8B
- Xiaomi Pad 7 Pro:11.81 tok/s — Qwen3-4B
為什麼選擇 TOKFORGE?
►這是一款針對不願在速度或安全性上妥協的用戶的全功能 AI 應用程式。
►零分析、零遙測、零雲依賴。
►免費離線 AI 聊天機器人:所有推理均在設備本地完成——飛行模式完美運行。
►無需註冊,無需帳號。
►17 款精選模型(0.6B–14B):Qwen3、DeepSeek-R1、Llama 3、Phi-4 等,任您選擇。
您的智慧型手機比您想像的更聰明、更強大。透過將 AI 的大腦直接移植到您的晶片上,我們消除了延遲、成本和雲端窺探的困擾。
☑️立即下載這款免費的離線 AI 強大工具,掌控您的資料。
最新版本v3.5.0-RC20.23.81更新日誌
Last updated on 2026年05月27日
Gemma4 omni fixes, supports vision attachments now, RAG Fixes, Samsung + Pixel performance enhancements and game mode enrollment steps, turboquant addition, vulkan fixes, stability and improvement for pixel & exynos & mediatek









