An MCP server that offloads light LLM work from Claude to a model you control, such as a local LLM or any OpenAI-compatible provider, saving frontier-model quota on non-critical tasks.
Claim it to get a verified publisher badge, a free copy of our full audit findings, and direct contact for any high-priority issues we find.
Install from
M8ven verifies MCPs across every public registry — install directly from whichever one you prefer.
process.env. You'll be asked to provide them before it can run.LLM_PROVIDER— e =lmstudio \LLM_MODEL— Apple Silicon では LM Studio の MLX ビルド(例: gemma-4-e2b-it-mlx)を推奨します。同クラスの Qwen・Llama・Phi 系でも同等に動作します。バックエンドが提供する ID を に設定してください。LLM_TIMEOUT— リクエストのタイムアウト(秒)。 300OFFLOAD_MAX_FILES— 上限: (既定 50)と OFFLOAD_MAX_CHARS(既定 100000)。超過時は明確なエラーを返します。OFFLOAD_MAX_CHARS— 上限: OFFLOAD_MAX_FILES(既定 50)と (既定 100000)。超過時は明確なエラーを返します。OFFLOAD_MAP_CONCURRENCYLLM_BASE_URL— / LLM_API_KEY 既定プロバイダ向けの汎用フォールバック。 —LLM_API_KEY— PROVIDER>_API_KEY プロバイダの API キー(例: OPENROUTER_API_KEY)。 慣例の環境変数 /OPENROUTER_REFERER— / OPENROUTER_TITLE OpenRouter のランキング用ヘッダ(任意)。 —OPENROUTER_TITLE— OPENROUTER_REFERER / OpenRouter のランキング用ヘッダ(任意)。 —[](https://m8ven.ai/mcp/seaosinc-mcp-llm-offload-gn7g8e)