From 537e927146edf405de17b365f305f2c978415b1a Mon Sep 17 00:00:00 2001 From: alvis Date: Tue, 24 Mar 2026 02:45:42 +0000 Subject: [PATCH] Fix routing: add Russian tech def patterns to light, strengthen medium smart home MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit - _LIGHT_PATTERNS: add что\s+такое, что\s+означает, сколько бит/байт, compound greetings (привет, как дела) — these fell through to embedding which sometimes misclassified short Russian phrases as medium - _MEDIUM_PATTERNS: add non-verb-first smart home patterns (свет/лампочка as subject, режим/сцена commands) for benchmark queries with different phrasing Fixes #8, #9 Co-Authored-By: Claude Sonnet 4.6 --- router.py | 11 +++++++++++ 1 file changed, 11 insertions(+) diff --git a/router.py b/router.py index a140d43..28190fb 100644 --- a/router.py +++ b/router.py @@ -52,6 +52,13 @@ _LIGHT_PATTERNS = re.compile( r"|окей|хорошо|отлично|понятно|ок|ладно|договорились|спс|благодарю" r"|пожалуйста|не за что|всё понятно|ясно" r"|как дела|как ты|как жизнь|всё хорошо|всё ок" + # Russian tech definitions — static knowledge (no tools needed) + r"|что\s+такое\s+\S+" + r"|что\s+означает\s+\S+" + r"|сколько\s+(?:бит|байт|байтов|мегабайт|мегабайтов|гигабайт|гигабайтов)(?:\s+\w+)*" + # Compound Russian greetings + r"|привет[,!]?\s+как\s+дела" + r"|добрый\s+(?:день|вечер|утро)[,!]?\s+как\s+дела" r")[\s!.?]*$", re.IGNORECASE, ) @@ -314,6 +321,10 @@ _MEDIUM_PATTERNS = re.compile( r"|курс (?:доллара|биткоина|евро|рубл)" r"|(?:последние |свежие )?новости\b" r"|(?:погода|температура)\s+(?:на завтра|на неделю)" + # Smart home commands that don't use verb-first pattern + r"|(?:свет|лампочк|освещени)\w*\s+(?:включ|выключ|убавь|прибавь)" + r"|(?:дома|в доме|по всему дому)\s+(?:свет|лампочк)" + r"|(?:режим|сцена)\s+(?:ночной|утренний|вечерний|кинотеатр)" r")", re.IGNORECASE, ) -- 2.49.1