StavPonte11 · yuvalkh · Jul 1, 2026 · Jun 16, 2026 · Jun 16, 2026 · Jun 16, 2026
diff --git a/.gitignore b/.gitignore
@@ -35,3 +35,13 @@ __pycache__/
 
 # Private keys / Secrets
 deploy_key
+
+# Scratch files
+agent/scratch/*
+fix_agent_langfuse.py
+fix_langfuse.py
+
+# Playwright
+playwright-report/
+test-results/
+junit.xml
diff --git a/agent/.coverage b/agent/.coverage
diff --git a/agent/Dockerfile b/agent/Dockerfile
@@ -23,4 +23,4 @@ RUN --mount=type=secret,id=deploy_key,target=/root/.ssh/id_rsa,mode=0600 \
 # Add virtualenv bin to PATH to run uvicorn
 ENV PATH="/app/agent/.venv/bin:$PATH"
 
-CMD ["uvicorn", "agent.main:app", "--host", "0.0.0.0", "--port", "8001"]
+CMD ["uvicorn", "agent.main:app", "--host", "0.0.0.0", "--port", "8001"]
-# Add virtualenv bin to PATH to run uvicorn
-ENV PATH="/app/agent/.venv/bin:$PATH"
-
-CMD ["uvicorn", "agent.main:app", "--host", "0.0.0.0", "--port", "8001"]
-CMD ["uvicorn", "agent.main:app", "--host", "0.0.0.0", "--port", "8001"]
+# Add virtualenv bin to PATH to run uvicorn
+ENV PATH="/app/agent/.venv/bin:$PATH"
+
+RUN addgroup --system app && adduser --system --ingroup app app && \
+    chown -R app:app /app
+USER app
+
+CMD ["uvicorn", "agent.main:app", "--host", "0.0.0.0", "--port", "8001"]
-# Add virtualenv bin to PATH to run uvicorn
-ENV PATH="/app/agent/.venv/bin:$PATH"
-
-CMD ["uvicorn", "agent.main:app", "--host", "0.0.0.0", "--port", "8001"]
-CMD ["uvicorn", "agent.main:app", "--host", "0.0.0.0", "--port", "8001"]
+# Add virtualenv bin to PATH to run uvicorn
+ENV PATH="/app/agent/.venv/bin:$PATH"
+
+RUN addgroup --system app && adduser --system --ingroup app app && \
+    chown -R app:app /app
+USER app
+
+CMD ["uvicorn", "agent.main:app", "--host", "0.0.0.0", "--port", "8001"]
diff --git a/agent/pyproject.toml b/agent/pyproject.toml
@@ -18,6 +18,7 @@ dependencies = [
     "langchain-openai",
     "greenlet>=3.5.1",
     "mcp>=1.12.4",
+    "networkx>=3.3",
 ]
 
 [tool.uv.sources]
@@ -31,4 +32,25 @@ build-backend = "uv_build"
 [dependency-groups]
 dev = [
     "pytest>=9.0.3",
+    "pytest-asyncio>=1.4.0",
+    "pytest-cov>=7.1.0",
+    "pytest-mock>=3.15.1",
+    "ruff>=0.3.0",
 ]
+
+[tool.ruff]
+target-version = "py312"
+
+[tool.ruff.lint]
+select = ["TID"]
+
+[tool.ruff.lint.flake8-tidy-imports.banned-api]
+"langchain_openai.ChatOpenAI" = { msg = "Use get_llm from agent.llm instead of instantiating ChatOpenAI directly." }
+"esca_sdk.EscaClient" = { msg = "Use get_esca_client from agent.utils.esca instead of instantiating EscaClient directly." }
+
+[tool.ruff.lint.per-file-ignores]
+"src/agent/llm.py" = ["TID251"]
+"src/agent/utils/esca.py" = ["TID251"]
+
+[tool.pytest.ini_options]
+testpaths = ["tests"]
diff --git a/agent/src/agent/config.py b/agent/src/agent/config.py
@@ -1,5 +1,9 @@
 from pydantic import Field
 from pydantic_settings import BaseSettings, SettingsConfigDict
+from typing import Literal
+
+# Reload trigger comment (timeout added)
+
 
 class AgentSettings(BaseSettings):
     model_config = SettingsConfigDict(env_file=".env", extra="ignore")
@@ -14,19 +18,57 @@ class AgentSettings(BaseSettings):
     EMBEDDER_KEY: str = ""
     HYBRID_SEARCH_MAX_TABLES: int = 10
     MAX_PROFILES_TO_FETCH: int = 3
+    PROFILE_FETCH_CONCURRENCY: int = Field(default=4, gt=0)
+    REDIS_URL: str = "redis://localhost:6379"
 
     LANGFUSE_SECRET_KEY: str = Field(min_length=1)
     LANGFUSE_PUBLIC_KEY: str = Field(min_length=1)
     LANGFUSE_BASE_URL: str = Field(min_length=1)
-
+
+    # ── Jeen Integration ──────────────────────────────────────────────────────
+    JEEN_LLM_CORE_URL: str = ""  # If empty, agent gracefully skips fetching
+    JEEN_API_KEY: str = ""       # If empty, agent gracefully skips fetching
+    SKILLS_HOT_RELOAD: bool = False  # If true, bypass Redis cache for skills
+
+    # ── G4: Feature Flags & Execution Modes ──────────────────────────────────
+    BACKEND_URL: str = ""  # Studio backend URL for flag reads (e.g. http://backend:8000)
+                           # If empty, FlagBridge falls back to env-var defaults
+
+
     # Langfuse prompt names
     LANGFUSE_PROMPT_EXTRACTOR: str = "text2sql/extractor"
     LANGFUSE_PROMPT_SCHEMA_EXPLORER: str = "text2sql/schema_explorer"
     LANGFUSE_PROMPT_QUERY_BUILDER: str = "text2sql/query_builder"
     LANGFUSE_PROMPT_REFINER: str = "text2sql/refiner"
     LANGFUSE_PROMPT_FINALIZER_SUMMARY: str = "text2sql/finalizer_summary"
-    LANGFUSE_PROMPT_FINALIZER_SQL_EXPLANATION: str = "text2sql/finalizer_sql_explanation"
+    LANGFUSE_PROMPT_FINALIZER_SQL_EXPLANATION: str = (
+        "text2sql/finalizer_sql_explanation"
+    )
     LANGFUSE_PROMPT_REJECTION_ROUTER: str = "text2sql/rejection_router"
 
+    # ── G2-01: Table Scoping ──────────────────────────────────────────────────
+    TABLE_SCOPING_MODE: Literal["strict", "hybrid"] = "hybrid"
+
+    # ── G2-03: Advanced Schema Explorer phases ────────────────────────────────
+    ENABLE_SEMANTIC_TYPING: bool = True   # single batched LLM call — adds id/timestamp/category labels
+    ENABLE_JOIN_GRAPH: bool = False
+    ENABLE_SCHEMA_SUMMARIZATION: bool = False  # generated once at profile-time, not at runtime
+    ENABLE_AMBIGUITY_DETECT: bool = True
+
+    # ── G2-04: Satisfaction Check ─────────────────────────────────────────────
+    SATISFACTION_CHECK_ENABLED: bool = True
+    SATISFACTION_CHECK_EXECUTION: bool = True
+    SATISFACTION_CHECK_PLAUSIBILITY: bool = True
+    SATISFACTION_CHECK_COLUMNS: bool = True
+    SATISFACTION_CHECK_SEMANTIC: bool = False  # LLM-heavy, off by default
+    SATISFACTION_MIN_ROWS: int = 1
+    SATISFACTION_MAX_ROWS: int = 50_000
+    SATISFACTION_SEMANTIC_THRESHOLD: float = 0.75
+    SATISFACTION_MAX_FAILURES: int = 2  # escalate to HITL after this many check failures
+
+    # ── G2-05: Redis Schema Cache ─────────────────────────────────────────────
+    SCHEMA_CACHE_TTL: int = 600    # seconds — DDL content
+    PROFILE_CACHE_TTL: int = 1800  # seconds — table profile statistics
-    # ── G2-05: Redis Schema Cache ─────────────────────────────────────────────
-    SCHEMA_CACHE_TTL: int = 600    # seconds — DDL content
-    PROFILE_CACHE_TTL: int = 1800  # seconds — table profile statistics
+    # ── G2-05: Redis Schema Cache ─────────────────────────────────────────────
+    SCHEMA_CACHE_TTL: int = Field(default=600, gt=0)    # seconds — DDL content
+    PROFILE_CACHE_TTL: int = Field(default=1800, gt=0)  # seconds — table profile statistics
-    # ── G2-05: Redis Schema Cache ─────────────────────────────────────────────
-    SCHEMA_CACHE_TTL: int = 600    # seconds — DDL content
-    PROFILE_CACHE_TTL: int = 1800  # seconds — table profile statistics
+    # ── G2-05: Redis Schema Cache ─────────────────────────────────────────────
+    SCHEMA_CACHE_TTL: int = Field(default=600, gt=0)    # seconds — DDL content
+    PROFILE_CACHE_TTL: int = Field(default=1800, gt=0)  # seconds — table profile statistics
+
 
 settings = AgentSettings()