Model selector

2026-06-16 14:59:40 +07:00 · 2026-06-16 14:59:40 +07:00 · 6d503c2427
commit 6d503c2427
parent 0fa6fc9db9
7 changed files with 224 additions and 26 deletions
--- a/config.py
+++ b/config.py
@ -6,7 +6,7 @@ from dotenv import load_dotenv
 load_dotenv()
-# ─── YAML Config Loader ────────────────────────────────────────────────────────
+def _yaml_get(*keys, default=None):
    _CONFIG_PATH  = Path(__file__).resolve().parent / "config.yaml"
    _yaml: dict   = {}
@ -14,8 +14,6 @@ if _CONFIG_PATH.is_file():
        with open(_CONFIG_PATH, "r", encoding="utf-8") as f:
            _yaml = yaml.safe_load(f) or {}
 def _yaml_get(*keys, default=None):
    """Navigate nested yaml dict, return default if any key missing."""
    d = _yaml
    for k in keys:
        if isinstance(d, dict) and k in d:
@ -24,26 +22,58 @@ def _yaml_get(*keys, default=None):
            return default
    return d if d is not None else default
 # Credential / Secret (only from .env)
 llm_baseurl  = os.getenv("LLM_BASE_URL",  default="")
 llm_model    = os.getenv("LLM_MODEL",     default="")
 llm_api_key  = os.getenv("LLM_API_KEY",   default="")
-# ─── Credential / Secret (hanya dari .env) ─────────────────────────────────────
+llm_timeout  = int(_yaml_get("llm", "timeout", default=600))
 llm_baseurl  = os.getenv("LLM_BASE_URL",  default="http://localhost:11434/v1")
 llm_model    = os.getenv("LLM_MODEL",     default="granite4.1:8b")
 llm_api_key  = os.getenv("LLM_API_KEY",   default="ollama")
 llm_timeout  = int(os.getenv("LLM_TIMEOUT", default="600"))
 XMPP_USERNAME = os.getenv("XMPP_USERNAME", default="")
 XMPP_PASSWORD = os.getenv("XMPP_PASSWORD", default="")
 MODELS_ITEMS: list[dict] = []
 _models_config = _yaml_get("models", default={})
 _items = _models_config.get("items", [])
 if isinstance(_items, list):
    for entry in _items:
        if not isinstance(entry, dict):
            continue
        model  = entry.get("model", "")
        provider = entry.get("provider", "")
        base_url = entry.get("base_url", "").rstrip("/")
        api_key  = entry.get("key", "") or llm_api_key
        MODELS_ITEMS.append({
            "model": model,
            "provider": provider,
            "base_url": base_url,
            "api_key": api_key,
            "default": entry.get("default", False),
        })
-# ─── Agent Config (YAML, bisa di-override dari .env) ────────────────────────────
+def resolve_provider(base_url: str, model: str) -> str | None:
    """Cari nama provider yg cocok dengan (base_url, model) dari MODELS_ITEMS."""
    base_url = base_url.rstrip("/")
    for item in MODELS_ITEMS:
        if item["base_url"] == base_url and item["model"] == model:
            return item["provider"]
    return None
 _has_match = any(
    item["model"] == llm_model and item["base_url"] == llm_baseurl.rstrip("/")
    for item in MODELS_ITEMS
 )
 if not _has_match:
    for item in MODELS_ITEMS:
        if item.get("default"):
            llm_model = item["model"]
            llm_baseurl = item["base_url"]
            llm_api_key = item["api_key"]
            break
 AGENT_MAX_ITERATIONS  = int(os.getenv("AGENT_MAX_ITERATIONS",  default=_yaml_get("agent", "max_iterations",  default="30")))
 AGENT_MAX_TOOL_OUTPUT = int(os.getenv("AGENT_MAX_TOOL_OUTPUT", default=_yaml_get("agent", "max_tool_output", default="40000")))
 # ─── Persona / Mode (YAML, bisa di-override dari .env) ──────────────────────────
 AGENT_SKILL       = os.getenv("AGENT_SKILL",       default="programmer").strip().lower()
 PERSONA_NAME      = os.getenv("PERSONA_NAME",      default=_yaml_get("persona", "name",      default="Hendrik")).strip() or "Hendrik"
 PERSONA_AGE       = os.getenv("PERSONA_AGE",       default=_yaml_get("persona", "age",       default="")).strip()
--- a/config.yaml
+++ b/config.yaml
@ -1,20 +1,55 @@
 llm:
  timeout: 3000 # second
 agent:
-  max_iterations: 40
+  max_iterations: 40 # step
  max_tool_output: 40000
-  character: lily # Directory name in agent/characters/<character>/
+  character: hendrik # Directory name in agent/characters/<character>/
 xmpp:
-  enabled: true
+  enabled: false
  muc_rooms: "" # comma-separated, e.g. "room1@conference.server,room2@conference.server"
  nickname: "" # custom MUC nickname (empty = use username)
  selective_response: true  # true = only response if mentioned/relevant
 # Humanize Delay (anti-bot detection)
 delay:
-  read_min: 1.0 # per second
+  read_min: 1.0 # second
-  read_max: 2.0 # per second
+  read_max: 2.0 # second
  typing_speed: 15.0 # characters per second
  typing_max: 10.0 # max typing delay limit per second
 models:
  items:
    - model: "granite4.1:8b"
      provider: "Ollama Local"
      base_url: "http://localhost:11434/v1"
      key: "ollama"
    - model: "granite4.1:8b"
      provider: "Transformers API Local"
      base_url: "http://localhost:12345/v1"
      key: "sk-not-needed"
    - model: "ministral-3:14b-cloud"
      provider: "Ollama Cloud"
      base_url: "https://ollama.com/v1"
      key: ""
    - model: "gemma4:31b-cloud"
      provider: "Ollama Cloud"
      base_url: "https://ollama.com/v1"
      key: ""
      default: true
    - model: "openrouter/owl-alpha"
      provider: "OpenRouter"
      base_url: "https://openrouter.ai/api/v1"
      key: ""
    - model: "nex-agi/nex-n2-pro:free"
      provider: "OpenRouter"
      base_url: "https://openrouter.ai/api/v1"
      key: ""
    - model: "z-ai/glm-5"
      provider: "OpenRouter"
      base_url: "https://openrouter.ai/api/v1"
      key: ""
 rag:
  persist_dir: chroma_db # ChromaDB ONNX default (all-MiniLM-L6-v2, local)
--- a/2
+++ b/2
@ -1,5 +1,5 @@
 #!/bin/bash
-# hendrik — wrapper to run the TUI agent from anywhere
+# wrapper to run the TUI agent from anywhere
 # Set HENDRIK_DIR env var to override, or update the default below
 DEFAULT_DIR="/opt/hendrik"
--- a/tui/agent.py
+++ b/tui/agent.py
@ -1,6 +1,7 @@
 import json
 import threading
 from datetime import datetime
 import config
 from scripts import ntro
 WELCOME_ART = """
@ -39,6 +40,12 @@ def submit(app, stdscr):
        return
    log(app, "user", query)
    model_info = (
        config.resolve_provider(app.llm.base_url, app.llm.model),
        app.llm.model
    )
    if app.log:
        app.log[-1]["model_info"] = model_info
    app.input_buffer = [""]
    app.input_line = 0
    app.input_col = 0
--- a/tui/app.py
+++ b/tui/app.py
@ -29,6 +29,11 @@ class HendrikTUI:
        self.agent_thread: threading.Thread | None = None
        self.agent_done = threading.Event()
    def switch_model(self, item: dict):
        self.llm.base_url = item["base_url"]
        self.llm.model = item["model"]
        self.llm.api_key = item["api_key"]
    def run(self):
        try:
            curses.wrapper(self._main)
--- a/tui/input.py
+++ b/tui/input.py
@ -4,6 +4,7 @@
 import curses
 import os
 import config
 from .agent import submit, log
@ -55,6 +56,9 @@ def handle_key(app, stdscr, key):
        workspace_popup(app, stdscr)
    elif key == 12:                   # Ctrl+L → clear chat log
        app.log.clear()
    elif key == 5:                    # Ctrl+E → model selector popup
        if not processing:
            model_selector_popup(app, stdscr)
    # -- Enter: split logical line at cursor position --
    elif key in (curses.KEY_ENTER, 10, 13):
@ -154,3 +158,108 @@ def workspace_popup(app, stdscr):
    stdscr.touchwin()
    stdscr.refresh()
 def model_selector_popup(app, stdscr):
    current_base = app.llm.base_url.rstrip("/")
    current_model = app.llm.model
    # Group by provider
    providers: list[tuple[str, list[dict]]] = []
    seen = {}
    for item in config.MODELS_ITEMS:
        p = item["provider"]
        if p not in seen:
            seen[p] = []
            providers.append((p, seen[p]))
        seen[p].append(item)
    items = []            # (type, data, label)
    selectable = []       # indices into items for model entries
    current_idx = 0
    for pname, plist in providers:
        items.append(("header", None, pname))
        for entry in plist:
            idx = len(items)
            items.append(("model", entry, entry["model"]))
            selectable.append(idx)
            if entry["base_url"] == current_base and entry["model"] == current_model:
                current_idx = len(selectable) - 1
    if not selectable:
        return
    pw = min(50, app.w - 4)
    ph = min(len(items) + 4, app.h - 4)
    px = (app.w - pw) // 2
    py = (app.h - ph) // 2
    if ph < 6:
        return
    win = curses.newwin(ph, pw, py, px)
    win.keypad(True)
    while True:
        win.erase()
        win.box()
        win.addstr(0, 2, " Pilih Model (Ctrl+E) ", curses.A_BOLD)
        visible_h = ph - 2
        total = len(items)
        scroll = max(0, min(selectable[current_idx] - visible_h // 2, total - visible_h))
        for i in range(visible_h):
            idx = scroll + i
            if idx >= total:
                break
            typ, data, label = items[idx]
            y = 1 + i
            if typ == "header":
                win.addstr(y, 2, f"  {label} ", curses.A_BOLD | curses.A_UNDERLINE)
            else:
                is_cur = (idx == selectable[current_idx])
                is_active = (data["base_url"] == current_base and data["model"] == current_model)
                if is_cur:
                    prefix = " \u25b6 " if is_active else " >  "
                elif is_active:
                    prefix = " \u2192 "
                else:
                    prefix = "    "
                display = prefix + label
                if len(display) > pw - 4:
                    display = display[:pw - 4]
                attr = curses.A_REVERSE if is_cur else curses.A_NORMAL
                win.addstr(y, 2, display.ljust(pw - 4), attr)
        footer = "  \u2191\u2193 nav  \u21b5 select  esc/q close  "
        win.addstr(ph - 1, 2, footer[:pw - 4], curses.A_DIM)
        try:
            target_y = selectable[current_idx] - scroll + 1
            if 0 <= target_y < ph - 1:
                win.move(target_y, 4)
        except curses.error:
            pass
        win.refresh()
        key = win.getch()
        if key in (27, ord("q"), ord("Q")):
            break
        elif key in (curses.KEY_ENTER, 10, 13):
            sel_item = items[selectable[current_idx]]
            if sel_item[0] == "model":
                app.switch_model(sel_item[1])
            break
        elif key == curses.KEY_UP:
            if current_idx > 0:
                current_idx -= 1
        elif key == curses.KEY_DOWN:
            if current_idx < len(selectable) - 1:
                current_idx += 1
    del win
    stdscr.touchwin()
    stdscr.refresh()
--- a/tui/render.py
+++ b/tui/render.py
@ -6,6 +6,7 @@ import curses
 import json
 import os
 import textwrap
 import config
 # -- Color pair IDs (id 1-9, id 0 = default curses) --
 C_HEADER = 1       # header bar: biru
@ -126,6 +127,17 @@ def draw_chat(app, stdscr):
            _add_blank()
        if role == "user":
            model_info = item.get("model_info", None)
            if model_info:
                p_name, m_name = model_info
            else:
                p_name = config.resolve_provider(app.llm.base_url, app.llm.model)
                m_name = app.llm.model
            if p_name:
                info_line = f" {p_name} - {m_name} "
            else:
                info_line = f" {m_name} "
            _add_row([(C_SYSTEM, info_line)])
            label = f" You ({item['time']}) "
            _add_row([(C_USER, label)])
            _wrap_render(text, indent=1, color=C_INPUT)
@ -326,7 +338,7 @@ def draw_status(app, stdscr):
    y = h - 9
    ws = os.getcwd()
    mode = " PROCESSING " if app.processing else " READY "
-    hints = " ^D:send  ^W:workspace  ^C:exit "
+    hints = " ^D:send  ^E:model  ^W:workspace  ^C:exit "
    max_ws = w - len(mode) - len(hints) - 4
    if len(ws) > max_ws:
        ws = ".." + ws[-(max_ws - 2):]