From 8987e911f71613e7261c8894237162dc8385f4e7 Mon Sep 17 00:00:00 2001
From: xuyaqist <xuyaqist@gmail.com>
Date: Thu, 14 May 2026 09:58:24 +0800
Subject: [PATCH 01/25] =?UTF-8?q?=E8=A7=A3=E5=86=B3=E5=86=B2=E7=AA=81?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 backend/agents/create_agent_info.py           |   9 +-
 backend/consts/model.py                       |   3 +
 backend/database/db_models.py                 |   2 +
 backend/database/model_management_db.py       |  55 +++++++++
 .../conversation_management_service.py        |   5 +-
 backend/services/file_management_service.py   |   2 +
 backend/services/model_health_service.py      |  13 ++-
 backend/services/model_management_service.py  |  28 ++++-
 backend/services/model_provider_service.py    |   7 +-
 backend/utils/llm_utils.py                    |   3 +
 ..._add_timeout_seconds_to_model_record_t.sql |  10 ++
 .../components/model/ModelAddDialog.tsx       | 106 +++++++++++++++++-
 .../components/model/ModelDeleteDialog.tsx    |  57 +++++++++-
 .../components/model/ModelEditDialog.tsx      |  47 +++++++-
 frontend/public/locales/en/common.json        |   1 +
 frontend/public/locales/zh/common.json        |   1 +
 frontend/services/modelService.ts             |  14 +++
 frontend/types/modelConfig.ts                 |   1 +
 sdk/nexent/core/agents/agent_model.py         |   4 +
 sdk/nexent/core/agents/nexent_agent.py        |   1 +
 sdk/nexent/core/models/openai_llm.py          |  37 ++++--
 21 files changed, 371 insertions(+), 35 deletions(-)
 create mode 100644 docker/sql/v2.0.5_0507_add_timeout_seconds_to_model_record_t.sql

diff --git a/backend/agents/create_agent_info.py b/backend/agents/create_agent_info.py
index 5a11b550b..90509c8f5 100644
--- a/backend/agents/create_agent_info.py
+++ b/backend/agents/create_agent_info.py
@@ -247,7 +247,8 @@ async def create_model_config_list(tenant_id):
                             ),
                         url=record["base_url"],
                         ssl_verify=record.get("ssl_verify", True),
-                        model_factory=record.get("model_factory")))
+                        model_factory=record.get("model_factory"),
+                        timeout_seconds=record.get("timeout_seconds")))
     # fit for old version, main_model and sub_model use default model
     main_model_config = tenant_config_manager.get_model_config(
         key=MODEL_CONFIG_MAPPING["llm"], tenant_id=tenant_id)
@@ -258,7 +259,8 @@ async def create_model_config_list(tenant_id):
                         "model_name") else "",
                     url=main_model_config.get("base_url", ""),
                     ssl_verify=main_model_config.get("ssl_verify", True),
-                    model_factory=main_model_config.get("model_factory")))
+                    model_factory=main_model_config.get("model_factory"),
+                    timeout_seconds=main_model_config.get("timeout_seconds")))
     model_list.append(
         ModelConfig(cite_name="sub_model",
                     api_key=main_model_config.get("api_key", ""),
@@ -266,7 +268,8 @@ async def create_model_config_list(tenant_id):
                         "model_name") else "",
                     url=main_model_config.get("base_url", ""),
                     ssl_verify=main_model_config.get("ssl_verify", True),
-                    model_factory=main_model_config.get("model_factory")))
+                    model_factory=main_model_config.get("model_factory"),
+                    timeout_seconds=main_model_config.get("timeout_seconds")))
 
     return model_list
 
diff --git a/backend/consts/model.py b/backend/consts/model.py
index bcaffcae7..bc32515fe 100644
--- a/backend/consts/model.py
+++ b/backend/consts/model.py
@@ -121,6 +121,7 @@ class ModelRequest(BaseModel):
     # STT specific fields
     model_appid: Optional[str] = None
     access_token: Optional[str] = None
+    timeout_seconds: Optional[int] = None
 
 
 class ProviderModelRequest(BaseModel):
@@ -756,6 +757,7 @@ class ManageTenantModelCreateRequest(BaseModel):
     # STT specific fields
     model_appid: Optional[str] = Field(None, description="Application ID for STT models (e.g., Volcano Engine)")
     access_token: Optional[str] = Field(None, description="Access token for STT models (e.g., Volcano Engine)")
+    timeout_seconds: Optional[int] = Field(None, description="Request timeout in seconds")
 
 
 class ManageTenantModelUpdateRequest(BaseModel):
@@ -776,6 +778,7 @@ class ManageTenantModelUpdateRequest(BaseModel):
     # STT specific fields
     model_appid: Optional[str] = Field(None, description="Application ID for STT models")
     access_token: Optional[str] = Field(None, description="Access token for STT models")
+    timeout_seconds: Optional[int] = Field(None, description="Request timeout in seconds")
 
 
 class ManageTenantModelDeleteRequest(BaseModel):
diff --git a/backend/database/db_models.py b/backend/database/db_models.py
index baa8e903e..94f5be80b 100644
--- a/backend/database/db_models.py
+++ b/backend/database/db_models.py
@@ -182,6 +182,8 @@ class ModelRecord(TableBase):
         String(100), doc="Application ID for model authentication (used by some STT/TTS providers like Volcano Engine)")
     access_token = Column(
         String(100), doc="Access token for model authentication (used by some STT/TTS providers like Volcano Engine)")
+    timeout_seconds = Column(
+        Integer, doc="Request timeout in seconds for this model. Default is 120 seconds.")
 
 
 class ModelMonitoringRecord(SimpleTableBase):
diff --git a/backend/database/model_management_db.py b/backend/database/model_management_db.py
index cb1c6c69f..7838315b8 100644
--- a/backend/database/model_management_db.py
+++ b/backend/database/model_management_db.py
@@ -1,3 +1,4 @@
+import logging
 from typing import Any, Dict, List, Optional
 
 from sqlalchemy import and_, desc, func, insert, select, update
@@ -7,6 +8,8 @@
 from .db_models import ModelRecord
 from .utils import add_creation_tracking, add_update_tracking
 
+logger = logging.getLogger("database.model_management_db")
+
 
 def create_model_record(model_data: Dict[str, Any], user_id: str, tenant_id: str) -> bool:
     """
@@ -84,6 +87,58 @@ def update_model_record(
         return result.rowcount > 0
 
 
+def update_model_record_by_model_name(
+        model_name: str,
+        update_data: Dict[str, Any],
+        user_id: Optional[str] = None,
+        tenant_id: Optional[str] = None,
+        model_repo: Optional[str] = None
+) -> bool:
+    """
+    Update a model record by model_name and tenant_id.
+
+    Args:
+        model_name: Model name (display name, not the primary key)
+        update_data: Dictionary containing update data
+        user_id: Reserved parameter for filling updated_by field
+        tenant_id: Tenant ID for filtering
+        model_repo: Optional model repo for more precise matching
+
+    Returns:
+        bool: Whether the operation was successful
+    """
+    import logging
+    db_logger = logging.getLogger("database.client")
+
+    with get_db_session() as session:
+        # Data cleaning
+        cleaned_data = db_client.clean_string_values(update_data)
+
+        # Add update timestamp
+        cleaned_data["update_time"] = func.current_timestamp()
+        if user_id:
+            cleaned_data = add_update_tracking(cleaned_data, user_id)
+
+        db_logger.info(f"update_model_record_by_model_name: model_name={model_name}, model_repo={model_repo}, tenant_id={tenant_id}, cleaned_data={cleaned_data}")
+
+        # Build conditions list
+        conditions = [
+            ModelRecord.model_name == model_name,
+            ModelRecord.tenant_id == tenant_id
+        ]
+        if model_repo:
+            conditions.append(ModelRecord.model_repo == model_repo)
+
+        # Build the update statement
+        stmt = update(ModelRecord).where(*conditions).values(cleaned_data)
+
+        # Execute the update statement
+        result = session.execute(stmt)
+        db_logger.info(f"update_model_record_by_model_name: rowcount={result.rowcount}")
+
+        return result.rowcount > 0
+
+
 def delete_model_record(model_id: int, user_id: str, tenant_id: str) -> bool:
     """
     Delete a model record (soft delete) and update the update timestamp
diff --git a/backend/services/conversation_management_service.py b/backend/services/conversation_management_service.py
index d5d4a85a4..c3571fcf3 100644
--- a/backend/services/conversation_management_service.py
+++ b/backend/services/conversation_management_service.py
@@ -248,6 +248,8 @@ def call_llm_for_title(question: str, tenant_id: str, language: str = LANGUAGE["
     display_name = model_config.get("display_name", "") if model_config else ""
     set_monitoring_operation("title_generation", display_name=display_name or None)
 
+    timeout_seconds = model_config.get("timeout_seconds") if model_config else None
+
     # Create OpenAIModel instance
     llm = OpenAIModel(
         model_id=get_model_name_from_config(model_config) if model_config.get("model_name") else "",
@@ -256,7 +258,8 @@ def call_llm_for_title(question: str, tenant_id: str, language: str = LANGUAGE["
         temperature=0.7,
         top_p=0.95,
         model_factory=model_config.get("model_factory", None),
-        ssl_verify=model_config.get("ssl_verify", True)
+        ssl_verify=model_config.get("ssl_verify", True),
+        timeout_seconds=timeout_seconds,
     )
 
     # Build messages - use new template variable 'question' instead of 'content'
diff --git a/backend/services/file_management_service.py b/backend/services/file_management_service.py
index b5cd048bf..7dad75a0a 100644
--- a/backend/services/file_management_service.py
+++ b/backend/services/file_management_service.py
@@ -352,6 +352,7 @@ def get_llm_model(tenant_id: str):
     # Get the tenant config
     main_model_config = tenant_config_manager.get_model_config(
         key=MODEL_CONFIG_MAPPING["llm"], tenant_id=tenant_id)
+    timeout_seconds = main_model_config.get("timeout_seconds") if main_model_config else None
     long_text_to_text_model = OpenAILongContextModel(
         observer=MessageObserver(),
         model_id=get_model_name_from_config(main_model_config),
@@ -359,6 +360,7 @@ def get_llm_model(tenant_id: str):
         api_key=main_model_config.get("api_key"),
         max_context_tokens=main_model_config.get("max_tokens"),
         ssl_verify=main_model_config.get("ssl_verify", True),
+        timeout_seconds=timeout_seconds,
     )
     return long_text_to_text_model
 
diff --git a/backend/services/model_health_service.py b/backend/services/model_health_service.py
index a20b2a6ca..b6dac2d04 100644
--- a/backend/services/model_health_service.py
+++ b/backend/services/model_health_service.py
@@ -71,6 +71,7 @@ async def _perform_connectivity_check(
     model_appid: Optional[str] = None,
     access_token: Optional[str] = None,
     display_name: Optional[str] = None,
+    timeout_seconds: Optional[float] = None,
 ) -> bool:
     """
     Perform specific model connectivity check
@@ -80,6 +81,8 @@ async def _perform_connectivity_check(
         model_base_url: Model base URL
         model_api_key: API key
         ssl_verify: Whether to verify SSL certificates (default: True)
+        display_name: Optional display name for monitoring
+        timeout_seconds: Optional request timeout in seconds
     Returns:
         bool: Connectivity check result
     """
@@ -115,7 +118,8 @@ async def _perform_connectivity_check(
             model_id=model_name,
             api_base=model_base_url,
             api_key=model_api_key,
-            ssl_verify=ssl_verify
+            ssl_verify=ssl_verify,
+            timeout_seconds=timeout_seconds,
         ).check_connectivity()
     elif model_type == "rerank":
         rerank_model = OpenAICompatibleRerank(
@@ -192,6 +196,7 @@ async def check_model_connectivity(display_name: str, tenant_id: str) -> dict:
         model_factory = model.get("model_factory")
         model_appid = model.get("model_appid")
         access_token = model.get("access_token")
+        timeout_seconds = model.get("timeout_seconds")
 
         try:
             set_monitoring_context(tenant_id=tenant_id)
@@ -199,6 +204,8 @@ async def check_model_connectivity(display_name: str, tenant_id: str) -> dict:
             connectivity = await _perform_connectivity_check(
                 model_name, model_type, model_base_url, model_api_key, ssl_verify,
                 model_factory, model_appid, access_token,display_name=display_name,
+                display_name=display_name,
+                timeout_seconds=timeout_seconds,
             )
         except Exception as e:
             update_data = {
@@ -245,16 +252,20 @@ async def verify_model_config_connectivity(model_config: dict):
         model_factory = model_config.get("model_factory")
         model_appid = model_config.get("model_appid")
         access_token = model_config.get("access_token")
+        # Get timeout from model config if present
+        timeout_seconds = model_config.get("timeout_seconds")
 
         try:
             connectivity = await _perform_connectivity_check(
                 model_name, model_type, model_base_url, model_api_key, ssl_verify,
                 model_factory, model_appid, access_token
+                timeout_seconds=timeout_seconds,
             )
             if not connectivity and ssl_verify:
                 connectivity = await _perform_connectivity_check(
                     model_name, model_type, model_base_url, model_api_key, False,
                     model_factory, model_appid, access_token
+                    timeout_seconds=timeout_seconds,
                 )
             if not connectivity:
                 error_msg = f"Failed to connect to model '{model_name}' at {model_base_url}. Please verify the URL, API key, and network connection."
diff --git a/backend/services/model_management_service.py b/backend/services/model_management_service.py
index d012803be..64675d047 100644
--- a/backend/services/model_management_service.py
+++ b/backend/services/model_management_service.py
@@ -13,6 +13,7 @@
     get_model_records,
     get_models_by_tenant_factory_type,
     update_model_record,
+    update_model_record_by_model_name,
 )
 from services.model_provider_service import (
     prepare_model_dict,
@@ -276,12 +277,31 @@ async def update_single_model_for_tenant(
 
 
 async def batch_update_models_for_tenant(user_id: str, tenant_id: str, model_list: List[Dict[str, Any]]):
-    """Batch update models for a tenant."""
+    """Batch update models for a tenant by model_id or model_name."""
     try:
         for model in model_list:
-            update_model_record(model["model_id"], model, user_id, tenant_id)
-
-        logging.debug("Batch update models successfully")
+            # Build update data excluding id fields
+            update_data = {k: v for k, v in model.items() if k not in ["model_id", "model_name"]}
+
+            model_id_or_name = model.get("model_id") or model.get("model_name")
+
+            # Check if model_id is a numeric string (primary key)
+            if model_id_or_name and model_id_or_name.isdigit():
+                # Use model_id (primary key) for update
+                logging.info(f"[DEBUG] Updating model by id: model_id={model_id_or_name}, tenant_id={tenant_id}, update_data={update_data}")
+                update_model_record(int(model_id_or_name), update_data, user_id, tenant_id)
+            else:
+                # Parse "model_repo/model_name" format from frontend's model_id field
+                if "/" in model_id_or_name:
+                    model_repo, model_name = model_id_or_name.split("/", 1)
+                else:
+                    model_repo = None
+                    model_name = model_id_or_name
+
+                logging.info(f"[DEBUG] Updating model by name: model_name={model_name}, model_repo={model_repo}, tenant_id={tenant_id}, update_data={update_data}")
+                update_model_record_by_model_name(model_name, update_data, user_id, tenant_id, model_repo)
+
+        logging.info("[DEBUG] Batch update models successfully")
     except Exception as e:
         logging.error(f"Failed to batch update models: {str(e)}")
         raise Exception(f"Failed to batch update models: {str(e)}")
diff --git a/backend/services/model_provider_service.py b/backend/services/model_provider_service.py
index dbff17082..6fc729a39 100644
--- a/backend/services/model_provider_service.py
+++ b/backend/services/model_provider_service.py
@@ -100,11 +100,13 @@ async def prepare_model_dict(provider: str, model: dict, model_url: str, model_a
     # Build the canonical representation using the existing Pydantic schema for
     # consistency of validation and default handling.
     # For embedding/multi_embedding models, max_tokens will be set via connectivity check later,
-    # so use 0 as placeholder if not provided
+    # so use 0 as placeholder if not provided.
+    # Set default timeout_seconds to 120 for LLM models (embedding models don't need it).
     model_type = model["model_type"]
     is_embedding_type = model_type in ["embedding", "multi_embedding"]
     max_tokens_value = model.get(
         "max_tokens", 0) if not is_embedding_type else 0
+    timeout_seconds_value = 120 if not is_embedding_type else None
 
     model_obj = ModelRequest(
         model_factory=provider,
@@ -115,7 +117,8 @@ async def prepare_model_dict(provider: str, model: dict, model_url: str, model_a
         display_name=model_display_name,
         expected_chunk_size=expected_chunk_size,
         maximum_chunk_size=maximum_chunk_size,
-        chunk_batch=chunk_batch
+        chunk_batch=chunk_batch,
+        timeout_seconds=timeout_seconds_value
     )
 
     model_dict = model_obj.model_dump()
diff --git a/backend/utils/llm_utils.py b/backend/utils/llm_utils.py
index e99b9f384..53c23aa7b 100644
--- a/backend/utils/llm_utils.py
+++ b/backend/utils/llm_utils.py
@@ -73,6 +73,8 @@ def call_llm_for_system_prompt(
     set_monitoring_operation("system_prompt_generation",
                              display_name=display_name or None)
 
+    timeout_seconds = llm_model_config.get("timeout_seconds") if llm_model_config else None
+
     llm = OpenAIModel(
         model_id=get_model_name_from_config(llm_model_config) if llm_model_config else "",
         api_base=llm_model_config.get("base_url", "") if llm_model_config else "",
@@ -82,6 +84,7 @@ def call_llm_for_system_prompt(
         model_factory=llm_model_config.get("model_factory") if llm_model_config else None,
         ssl_verify=llm_model_config.get("ssl_verify", True) if llm_model_config else True,
         display_name=display_name or None,
+        timeout_seconds=timeout_seconds,
     )
     messages = [
         {"role": MESSAGE_ROLE["SYSTEM"], "content": system_prompt},
diff --git a/docker/sql/v2.0.5_0507_add_timeout_seconds_to_model_record_t.sql b/docker/sql/v2.0.5_0507_add_timeout_seconds_to_model_record_t.sql
new file mode 100644
index 000000000..6c0ef24db
--- /dev/null
+++ b/docker/sql/v2.0.5_0507_add_timeout_seconds_to_model_record_t.sql
@@ -0,0 +1,10 @@
+-- Migration: Add timeout_seconds column to model_record_t table
+-- Date: 2026-05-07
+-- Description: Add timeout_seconds field to control request timeout per model
+
+-- Add timeout_seconds column to model_record_t table
+ALTER TABLE nexent.model_record_t
+ADD COLUMN IF NOT EXISTS timeout_seconds INTEGER DEFAULT 120;
+
+-- Add comment to the column
+COMMENT ON COLUMN nexent.model_record_t.timeout_seconds IS 'Request timeout in seconds for this model. Default is 120 seconds.';
diff --git a/frontend/app/[locale]/models/components/model/ModelAddDialog.tsx b/frontend/app/[locale]/models/components/model/ModelAddDialog.tsx
index 11391c133..eee1ab277 100644
--- a/frontend/app/[locale]/models/components/model/ModelAddDialog.tsx
+++ b/frontend/app/[locale]/models/components/model/ModelAddDialog.tsx
@@ -50,6 +50,7 @@ const DEFAULT_FORM_STATE = {
   url: "",
   apiKey: "",
   maxTokens: "4096",
+  timeoutSeconds: "120",
   isMultimodal: false,
   isBatchImport: false,
   provider: "modelengine",
@@ -252,6 +253,7 @@ export const ModelAddDialog = ({
   const [selectedModelForSettings, setSelectedModelForSettings] =
     useState<any>(null);
   const [modelMaxTokens, setModelMaxTokens] = useState("4096");
+  const [modelTimeoutSeconds, setModelTimeoutSeconds] = useState("120");
 
   // Use the silicon model list hook
   const siliconHook  = useSiliconModelList({
@@ -639,23 +641,49 @@ export const ModelAddDialog = ({
   const handleSettingsClick = (model: any) => {
     setSelectedModelForSettings(model);
     setModelMaxTokens(model.max_tokens?.toString() || "4096");
+    setModelTimeoutSeconds(model.timeout_seconds?.toString() || "120");
     setSettingsModalVisible(true);
   };
 
   // Handle settings save
-  const handleSettingsSave = () => {
-    if (selectedModelForSettings) {
-      // Update the model in the list with new max_tokens
+  const handleSettingsSave = async () => {
+    if (!selectedModelForSettings) return;
+
+    try {
+      // Use model_name as the identifier (API returns model_name field, id is combined format)
+      const modelName = selectedModelForSettings.model_name || selectedModelForSettings.id;
+
+      // Call API to update model settings
+      await modelService.updateBatchModel(
+        [
+          {
+            model_id: modelName,
+            apiKey: selectedModelForSettings.api_key || "",
+            maxTokens: parseInt(modelMaxTokens) || 4096,
+            timeoutSeconds: parseInt(modelTimeoutSeconds) || 120,
+          },
+        ],
+        selectedModelForSettings.model_factory
+      );
+
+      // Update the model in the list with new max_tokens and timeout_seconds
       setModelList((prev) =>
         prev.map((model) =>
           model.id === selectedModelForSettings.id
-            ? { ...model, max_tokens: parseInt(modelMaxTokens) || 4096 }
+            ? {
+                ...model,
+                max_tokens: parseInt(modelMaxTokens) || 4096,
+                timeout_seconds: parseInt(modelTimeoutSeconds) || 120,
+              }
             : model
         )
       );
+    } catch (error) {
+      console.error("Failed to update model settings:", error);
+    } finally {
+      setSettingsModalVisible(false);
+      setSelectedModelForSettings(null);
     }
-    setSettingsModalVisible(false);
-    setSelectedModelForSettings(null);
   };
 
   // Handle adding a model
@@ -698,6 +726,7 @@ export const ModelAddDialog = ({
           apiKey: form.apiKey.trim() === "" ? "sk-no-api-key" : form.apiKey,
           maxTokens: maxTokensValue,
           displayName: form.displayName || form.name,
+<<<<<<< HEAD
         };
 
         // Add STT specific fields
@@ -717,6 +746,21 @@ export const ModelAddDialog = ({
         }
 
         await modelService.createManageTenantModel(modelParams);
+=======
+          expectedChunkSize: isEmbeddingModel
+            ? form.chunkSizeRange[0]
+            : undefined,
+          maximumChunkSize: isEmbeddingModel
+            ? form.chunkSizeRange[1]
+            : undefined,
+          chunkingBatchSize: isEmbeddingModel
+            ? parseInt(form.chunkingBatchSize) || 10
+            : undefined,
+          timeoutSeconds: !isEmbeddingModel && !isRerankModel
+            ? parseInt(form.timeoutSeconds) || 120
+            : undefined,
+        });
+>>>>>>> a64daaea1 (Feat: support user to configurate model timeout)
       } else {
         const modelParams: any = {
           name: form.name,
@@ -725,6 +769,7 @@ export const ModelAddDialog = ({
           apiKey: form.apiKey.trim() === "" ? "sk-no-api-key" : form.apiKey,
           maxTokens: maxTokensValue,
           displayName: form.displayName || form.name,
+<<<<<<< HEAD
         };
 
         // Add STT specific fields
@@ -744,6 +789,23 @@ export const ModelAddDialog = ({
         }
 
         await modelService.addCustomModel(modelParams);
+=======
+          // Send chunk size range for embedding models
+          ...(isEmbeddingModel
+            ? {
+                expectedChunkSize: form.chunkSizeRange[0],
+                maximumChunkSize: form.chunkSizeRange[1],
+                chunkingBatchSize: parseInt(form.chunkingBatchSize) || 10,
+              }
+            : {}),
+          // Send timeout for non-embedding models
+          ...(!isEmbeddingModel && !isRerankModel
+            ? {
+                timeoutSeconds: parseInt(form.timeoutSeconds) || 120,
+              }
+            : {}),
+        });
+>>>>>>> a64daaea1 (Feat: support user to configurate model timeout)
       }
 
       // Create the model configuration object
@@ -1190,6 +1252,26 @@ export const ModelAddDialog = ({
           </div>
         )}
 
+        {/* Timeout Seconds */}
+        {!isEmbeddingModel && !isRerankModel && !form.isBatchImport && (
+          <div>
+            <label
+              htmlFor="timeoutSeconds"
+              className="block mb-1 text-sm font-medium text-gray-700"
+            >
+              {t("model.dialog.label.timeoutSeconds")}
+            </label>
+            <Input
+              id="timeoutSeconds"
+              type="number"
+              min="1"
+              placeholder={t("model.dialog.placeholder.timeoutSeconds")}
+              value={form.timeoutSeconds}
+              onChange={(e) => handleFormChange("timeoutSeconds", e.target.value)}
+            />
+          </div>
+        )}
+
         {/* Connectivity verification area */}
         {!form.isBatchImport && (
           <div className="p-3 bg-gray-50 border border-gray-200 rounded-md">
@@ -1713,6 +1795,18 @@ export const ModelAddDialog = ({
               placeholder={t("model.dialog.placeholder.maxTokens")}
             />
           </div>
+          <div>
+            <label className="block mb-1 text-sm font-medium text-gray-700">
+              {t("model.dialog.label.timeoutSeconds")}
+            </label>
+            <Input
+              type="number"
+              min="1"
+              value={modelTimeoutSeconds}
+              onChange={(e) => setModelTimeoutSeconds(e.target.value)}
+              placeholder="120"
+            />
+          </div>
         </div>
       </Modal>
     </Modal>
diff --git a/frontend/app/[locale]/models/components/model/ModelDeleteDialog.tsx b/frontend/app/[locale]/models/components/model/ModelDeleteDialog.tsx
index ad3cf0391..f58ca242e 100644
--- a/frontend/app/[locale]/models/components/model/ModelDeleteDialog.tsx
+++ b/frontend/app/[locale]/models/components/model/ModelDeleteDialog.tsx
@@ -57,6 +57,7 @@ export const ModelDeleteDialog = ({
   const [selectedModelForSettings, setSelectedModelForSettings] =
     useState<any>(null);
   const [modelMaxTokens, setModelMaxTokens] = useState("4096");
+  const [modelTimeoutSeconds, setModelTimeoutSeconds] = useState("120");
   const [providerModelSearchTerm, setProviderModelSearchTerm] = useState("");
 
   // Embedding model chunk config modal state
@@ -589,9 +590,11 @@ export const ModelDeleteDialog = ({
   const handleProviderConfigSave = async ({
     apiKey,
     maxTokens,
+    timeoutSeconds,
   }: {
     apiKey: string;
     maxTokens: number;
+    timeoutSeconds?: number;
   }) => {
     setMaxTokens(maxTokens);
     if (
@@ -624,6 +627,7 @@ export const ModelDeleteDialog = ({
             model_id: String(m.id),
             apiKey: apiKey || m.apiKey,
             maxTokens: maxTokens || m.maxTokens,
+            ...(timeoutSeconds !== undefined ? { timeoutSeconds } : {}),
           }));
 
         await modelService.updateBatchModel(
@@ -653,23 +657,52 @@ export const ModelDeleteDialog = ({
   const handleSettingsClick = (model: any) => {
     setSelectedModelForSettings(model);
     setModelMaxTokens(model.max_tokens?.toString() || "4096");
+    setModelTimeoutSeconds(model.timeout_seconds?.toString() || "120");
     setSettingsModalVisible(true);
   };
 
   // Handle settings save
-  const handleSettingsSave = () => {
-    if (selectedModelForSettings) {
-      // Update the model in the list with new max_tokens
+  const handleSettingsSave = async () => {
+    if (!selectedModelForSettings) return;
+
+    try {
+      // Use model_name as the identifier (API returns model_name field, id is combined format)
+      const modelName = selectedModelForSettings.model_name || selectedModelForSettings.id;
+
+      // Call API to update model settings
+      await modelService.updateBatchModel(
+        [
+          {
+            model_id: modelName,
+            apiKey: selectedModelForSettings.api_key || "",
+            maxTokens: parseInt(modelMaxTokens) || 4096,
+            timeoutSeconds: parseInt(modelTimeoutSeconds) || 120,
+          },
+        ],
+        selectedModelForSettings.model_factory
+      );
+
+      // Update the model in the list with new max_tokens and timeout_seconds
       setProviderModels((prev) =>
         prev.map((model) =>
           model.id === selectedModelForSettings.id
-            ? { ...model, max_tokens: parseInt(modelMaxTokens) || 4096 }
+            ? {
+                ...model,
+                max_tokens: parseInt(modelMaxTokens) || 4096,
+                timeout_seconds: parseInt(modelTimeoutSeconds) || 120,
+              }
             : model
         )
       );
+
+      message.success(t("model.message.updateSuccess") || "Update successful");
+    } catch (error) {
+      console.error("Failed to update model settings:", error);
+      message.error(t("model.message.updateFailed") || "Failed to update settings");
+    } finally {
+      setSettingsModalVisible(false);
+      setSelectedModelForSettings(null);
     }
-    setSettingsModalVisible(false);
-    setSelectedModelForSettings(null);
   };
 
   // Handle embedding model click to open config modal
@@ -1542,6 +1575,18 @@ export const ModelDeleteDialog = ({
               placeholder={t("model.dialog.placeholder.maxTokens")}
             />
           </div>
+          <div>
+            <label className="block mb-1 text-sm font-medium text-gray-700">
+              {t("model.dialog.label.timeoutSeconds")}
+            </label>
+            <Input
+              type="number"
+              min="1"
+              value={modelTimeoutSeconds}
+              onChange={(e) => setModelTimeoutSeconds(e.target.value)}
+              placeholder="120"
+            />
+          </div>
         </div>
       </Modal>
 
diff --git a/frontend/app/[locale]/models/components/model/ModelEditDialog.tsx b/frontend/app/[locale]/models/components/model/ModelEditDialog.tsx
index 3114c5535..a784258df 100644
--- a/frontend/app/[locale]/models/components/model/ModelEditDialog.tsx
+++ b/frontend/app/[locale]/models/components/model/ModelEditDialog.tsx
@@ -39,6 +39,7 @@ export const ModelEditDialog = ({
     url: "",
     apiKey: "",
     maxTokens: "4096",
+    timeoutSeconds: "120",
     vectorDimension: "1024",
     chunkSizeRange: [
       DEFAULT_EXPECTED_CHUNK_SIZE,
@@ -65,6 +66,7 @@ export const ModelEditDialog = ({
         url: model.apiUrl || "",
         apiKey: model.apiKey || "",
         maxTokens: model.maxTokens?.toString() || "4096",
+        timeoutSeconds: model.timeoutSeconds?.toString() || "120",
         vectorDimension: model.maxTokens?.toString() || "1024",
         chunkSizeRange: [
           model.expectedChunkSize || DEFAULT_EXPECTED_CHUNK_SIZE,
@@ -78,7 +80,7 @@ export const ModelEditDialog = ({
   const handleFormChange = (field: string, value: string) => {
     setForm((prev) => ({ ...prev, [field]: value }));
     // If the key configuration item changes, clear the verification status
-    if (["url", "apiKey", "maxTokens", "vectorDimension"].includes(field)) {
+    if (["url", "apiKey", "maxTokens", "timeoutSeconds", "vectorDimension"].includes(field)) {
       setConnectivityStatus({ status: null, message: "" });
     }
   };
@@ -176,6 +178,7 @@ export const ModelEditDialog = ({
           expectedChunkSize: isEmbeddingModel ? form.chunkSizeRange[0] : undefined,
           maximumChunkSize: isEmbeddingModel ? form.chunkSizeRange[1] : undefined,
           chunkingBatchSize: isEmbeddingModel ? parseInt(form.chunkingBatchSize) || 10 : undefined,
+          timeoutSeconds: !isEmbeddingModel && !isRerankModel ? parseInt(form.timeoutSeconds) || 120 : undefined,
         });
       } else {
         await modelService.updateSingleModel({
@@ -196,6 +199,12 @@ export const ModelEditDialog = ({
                 chunkingBatchSize: parseInt(form.chunkingBatchSize) || 10,
               }
             : {}),
+          // Send timeout for non-embedding models
+          ...(!isEmbeddingModel && !isRerankModel
+            ? {
+                timeoutSeconds: parseInt(form.timeoutSeconds) || 120,
+              }
+            : {}),
         });
       }
 
@@ -303,6 +312,12 @@ export const ModelEditDialog = ({
               value={form.maxTokens}
               onChange={(e) => handleFormChange("maxTokens", e.target.value)}
             />
+            <Input
+              type="number"
+              min="1"
+              value={form.timeoutSeconds}
+              onChange={(e) => handleFormChange("timeoutSeconds", e.target.value)}
+            />
           </div>
         )}
 
@@ -408,15 +423,17 @@ interface ProviderConfigEditDialogProps {
   isOpen: boolean
   initialApiKey?: string
   initialMaxTokens?: string
+  initialTimeoutSeconds?: string
   modelType?: ModelType
   onClose: () => void
-  onSave: (config: { apiKey: string; maxTokens: number }) => Promise<void> | void
+  onSave: (config: { apiKey: string; maxTokens: number; timeoutSeconds?: number }) => Promise<void> | void
 }
 
 export const ProviderConfigEditDialog = ({
   isOpen,
   initialApiKey = '',
   initialMaxTokens = '4096',
+  initialTimeoutSeconds = '120',
   modelType,
   onClose,
   onSave,
@@ -424,12 +441,14 @@ export const ProviderConfigEditDialog = ({
   const { t } = useTranslation()
   const [apiKey, setApiKey] = useState<string>(initialApiKey)
   const [maxTokens, setMaxTokens] = useState<string>(initialMaxTokens)
+  const [timeoutSeconds, setTimeoutSeconds] = useState<string>(initialTimeoutSeconds)
   const [saving, setSaving] = useState<boolean>(false)
 
   useEffect(() => {
     setApiKey(initialApiKey)
     setMaxTokens(initialMaxTokens)
-  }, [initialApiKey, initialMaxTokens])
+    setTimeoutSeconds(initialTimeoutSeconds)
+  }, [initialApiKey, initialMaxTokens, initialTimeoutSeconds])
 
   const valid = () => {
     const parsed = parseInt(maxTokens)
@@ -440,7 +459,13 @@ export const ProviderConfigEditDialog = ({
     if (!valid()) return
     try {
       setSaving(true)
-      await onSave({ apiKey: apiKey.trim() === '' ? 'sk-no-api-key' : apiKey, maxTokens: parseInt(maxTokens) })
+      const isEmbeddingModel = modelType === MODEL_TYPES.EMBEDDING || modelType === MODEL_TYPES.MULTI_EMBEDDING
+      const isRerankModel = modelType === MODEL_TYPES.RERANK
+      await onSave({
+        apiKey: apiKey.trim() === '' ? 'sk-no-api-key' : apiKey,
+        maxTokens: parseInt(maxTokens),
+        ...(!isEmbeddingModel && !isRerankModel ? { timeoutSeconds: parseInt(timeoutSeconds) || 120 } : {}),
+      })
       onClose()
     } finally {
       setSaving(false)
@@ -448,6 +473,7 @@ export const ProviderConfigEditDialog = ({
   }
 
   const isEmbeddingModel = modelType === MODEL_TYPES.EMBEDDING || modelType === MODEL_TYPES.MULTI_EMBEDDING
+  const isRerankModel = modelType === MODEL_TYPES.RERANK
 
   return (
     <Modal
@@ -472,6 +498,19 @@ export const ProviderConfigEditDialog = ({
             <Input value={maxTokens} onChange={(e) => setMaxTokens(e.target.value)} />
           </div>
         )}
+        {!isEmbeddingModel && !isRerankModel && (
+          <div>
+            <label className="block mb-1 text-sm font-medium text-gray-700">
+              {t("model.dialog.label.timeoutSeconds")}
+            </label>
+            <Input
+              type="number"
+              min="1"
+              value={timeoutSeconds}
+              onChange={(e) => setTimeoutSeconds(e.target.value)}
+            />
+          </div>
+        )}
         <div className="flex justify-end space-x-3">
           <Button onClick={onClose}>{t('common.button.cancel')}</Button>
           <Button type="primary" onClick={handleSave} loading={saving} disabled={!valid()}>
diff --git a/frontend/public/locales/en/common.json b/frontend/public/locales/en/common.json
index 22c17c2ca..22e8b7836 100644
--- a/frontend/public/locales/en/common.json
+++ b/frontend/public/locales/en/common.json
@@ -735,6 +735,7 @@
   "model.dialog.label.modelAppid": "App ID",
   "model.dialog.label.accessToken": "Access Token",
   "model.dialog.label.maxTokens": "Max Tokens",
+  "model.dialog.label.timeoutSeconds": "Timeout (seconds)",
   "model.dialog.label.batchImport": "Batch Add",
   "model.dialog.label.provider": "Model Provider",
   "model.dialog.label.currentlySupported": "Currently supported:",
diff --git a/frontend/public/locales/zh/common.json b/frontend/public/locales/zh/common.json
index 1cc83a802..f4df286c0 100644
--- a/frontend/public/locales/zh/common.json
+++ b/frontend/public/locales/zh/common.json
@@ -736,6 +736,7 @@
   "model.dialog.label.maxTokens": "最大Token数",
   "model.dialog.label.modelAppid": "App ID",
   "model.dialog.label.accessToken": "Access Token",
+  "model.dialog.label.timeoutSeconds": "超时时间(秒)",
   "model.dialog.label.batchImport": "批量添加模型",
   "model.dialog.label.provider": "模型提供商",
   "model.dialog.label.currentlySupported": "当前已支持：",
diff --git a/frontend/services/modelService.ts b/frontend/services/modelService.ts
index e0fefd2db..49a4c9ec7 100644
--- a/frontend/services/modelService.ts
+++ b/frontend/services/modelService.ts
@@ -71,6 +71,7 @@ export const modelService = {
           // STT specific fields
           modelAppid: model.model_appid,
           accessToken: model.access_token,
+          timeoutSeconds: model.timeout_seconds,
         }));
       }
       return [];
@@ -106,6 +107,7 @@ export const modelService = {
     modelFactory?: string;
     modelAppid?: string;
     accessToken?: string;
+    timeoutSeconds?: number;
   }): Promise<void> => {
     try {
       const requestBody: any = {
@@ -119,6 +121,7 @@ export const modelService = {
         expected_chunk_size: model.expectedChunkSize,
         maximum_chunk_size: model.maximumChunkSize,
         chunk_batch: model.chunkingBatchSize,
+        timeout_seconds: model.timeoutSeconds,
       };
 
       // Add STT specific fields
@@ -314,6 +317,7 @@ export const modelService = {
     modelFactory?: string;
     modelAppid?: string;
     accessToken?: string;
+    timeoutSeconds?: number;
   }): Promise<void> => {
     try {
       const response = await fetch(
@@ -349,6 +353,9 @@ export const modelService = {
             ...(model.accessToken !== undefined
               ? { access_token: model.accessToken }
               : {}),
+            ...(model.timeoutSeconds !== undefined
+              ? { timeout_seconds: model.timeoutSeconds }
+              : {}),
           }),
         }
       );
@@ -370,6 +377,7 @@ export const modelService = {
       model_id: string;
       apiKey: string;
       maxTokens?: number;
+      timeoutSeconds?: number;
     }[],
     provider?: string
   ): Promise<any> => {
@@ -382,6 +390,7 @@ export const modelService = {
             model_id: m.model_id,
             api_key: m.apiKey,
             ...(m.maxTokens !== undefined ? { max_tokens: m.maxTokens } : {}),
+            ...(m.timeoutSeconds !== undefined ? { timeout_seconds: m.timeoutSeconds } : {}),
             ...(provider ? { model_factory: provider } : {}),
           }))
         ),
@@ -643,6 +652,7 @@ export const modelService = {
             // STT specific fields
             modelAppid: model.model_appid,
             accessToken: model.access_token,
+            timeoutSeconds: model.timeout_seconds,
           })),
           total: result.data.total || 0,
           page: result.data.page || 1,
@@ -689,6 +699,7 @@ export const modelService = {
     modelFactory?: string;
     modelAppid?: string;
     accessToken?: string;
+    timeoutSeconds?: number;
   }): Promise<void> => {
     try {
       const requestBody: any = {
@@ -703,6 +714,7 @@ export const modelService = {
         expected_chunk_size: params.expectedChunkSize,
         maximum_chunk_size: params.maximumChunkSize,
         chunk_batch: params.chunkingBatchSize,
+        timeout_seconds: params.timeoutSeconds,
       };
 
       // Add STT specific fields
@@ -754,6 +766,7 @@ export const modelService = {
     modelFactory?: string;
     modelAppid?: string;
     accessToken?: string;
+    timeoutSeconds?: number;
   }): Promise<void> => {
     try {
       const response = await fetch(
@@ -777,6 +790,7 @@ export const modelService = {
             ...(params.modelFactory !== undefined ? { model_factory: params.modelFactory } : {}),
             ...(params.modelAppid !== undefined ? { model_appid: params.modelAppid } : {}),
             ...(params.accessToken !== undefined ? { access_token: params.accessToken } : {}),
+            ...(params.timeoutSeconds !== undefined ? { timeout_seconds: params.timeoutSeconds } : {}),
           }),
         }
       );
diff --git a/frontend/types/modelConfig.ts b/frontend/types/modelConfig.ts
index a9f918d71..76519ee38 100644
--- a/frontend/types/modelConfig.ts
+++ b/frontend/types/modelConfig.ts
@@ -50,6 +50,7 @@ export interface ModelOption {
   // STT specific fields
   modelAppid?: string;
   accessToken?: string;
+  timeoutSeconds?: number;
 }
 
 // Application configuration interface
diff --git a/sdk/nexent/core/agents/agent_model.py b/sdk/nexent/core/agents/agent_model.py
index 61257441c..3282dfede 100644
--- a/sdk/nexent/core/agents/agent_model.py
+++ b/sdk/nexent/core/agents/agent_model.py
@@ -30,6 +30,10 @@ class ModelConfig(BaseModel):
         description="Model provider identifier (e.g., openai, modelengine)",
         default=None
     )
+    timeout_seconds: Optional[float] = Field(
+        description="Request timeout in seconds. If None, uses provider default.",
+        default=None
+    )
 
 
 class ToolConfig(BaseModel):
diff --git a/sdk/nexent/core/agents/nexent_agent.py b/sdk/nexent/core/agents/nexent_agent.py
index 023c8348e..9209e6fd6 100644
--- a/sdk/nexent/core/agents/nexent_agent.py
+++ b/sdk/nexent/core/agents/nexent_agent.py
@@ -59,6 +59,7 @@ def create_model(self, model_cite_name: str):
             ssl_verify=model_config.ssl_verify if model_config.ssl_verify is not None else True,
             model_factory=model_config.model_factory,
             display_name=model_config.cite_name,
+            timeout_seconds=model_config.timeout_seconds,
         )
         model.stop_event = self.stop_event
         return model
diff --git a/sdk/nexent/core/models/openai_llm.py b/sdk/nexent/core/models/openai_llm.py
index 7b33512c2..74b163670 100644
--- a/sdk/nexent/core/models/openai_llm.py
+++ b/sdk/nexent/core/models/openai_llm.py
@@ -24,7 +24,8 @@
 class OpenAIModel(OpenAIServerModel):
     def __init__(self, observer: MessageObserver = MessageObserver, temperature=0.2, top_p=0.95,
                  ssl_verify=True, model_factory: Optional[str] = None,
-                 display_name: Optional[str] = None, *args, **kwargs):
+                 display_name: Optional[str] = None, timeout_seconds: Optional[float] = None,
+                 *args, **kwargs):
         """
         Initialize OpenAI Model with observer and SSL verification option.
 
@@ -36,6 +37,7 @@ def __init__(self, observer: MessageObserver = MessageObserver, temperature=0.2,
                        Set to False for local services without SSL support.
             model_factory: Provider identifier (e.g., openai, modelengine)
             display_name: Human-readable display name for monitoring
+            timeout_seconds: Request timeout in seconds. If None, uses httpx default.
             *args: Additional positional arguments for OpenAIServerModel
             **kwargs: Additional keyword arguments for OpenAIServerModel
         """
@@ -46,17 +48,31 @@ def __init__(self, observer: MessageObserver = MessageObserver, temperature=0.2,
         self._monitoring = get_monitoring_manager()
         self.model_factory = (model_factory or "").lower()
         self.display_name = display_name
-
-        # Create http_client based on ssl_verify parameter
-        if not ssl_verify:
-            from openai import DefaultHttpxClient
-            http_client = DefaultHttpxClient(verify=False)
+        self.timeout_seconds = timeout_seconds
+
+        # Create http_client based on ssl_verify parameter and timeout_seconds
+        if not ssl_verify or timeout_seconds is not None:
+            import httpx
+            # Build timeout configuration
+            timeout = httpx.Timeout(timeout_seconds) if timeout_seconds is not None else httpx.Timeout(120.0)
+            http_client = httpx.Client(verify=ssl_verify, timeout=timeout)
             client_kwargs = kwargs.get('client_kwargs', {})
             client_kwargs['http_client'] = http_client
             kwargs['client_kwargs'] = client_kwargs
 
         super().__init__(*args, **kwargs)
 
+        # Apply custom timeout to client if specified (even when ssl_verify is True)
+        if timeout_seconds is not None and hasattr(self, 'client'):
+            import httpx
+            # Update client's timeout
+            new_timeout = httpx.Timeout(timeout_seconds)
+            if hasattr(self.client, '_client'):
+                # httpx client wrapped by openai
+                self.client._client.timeout = new_timeout
+            elif hasattr(self.client, 'timeout'):
+                self.client.timeout = new_timeout
+
         # Wrap the OpenAI client with monitoring interceptor
         model_type = _detect_model_type(self)
         model_id = getattr(self, "model_id", None)
@@ -282,11 +298,16 @@ async def check_connectivity(self) -> bool:
                 max_tokens=5,
             )
 
+            # Use custom timeout if specified
+            request_kwargs = {"stream": False, **completion_kwargs}
+            if self.timeout_seconds is not None:
+                import httpx
+                request_kwargs["timeout"] = httpx.Timeout(self.timeout_seconds)
+
             # Offload the blocking SDK call to a thread pool to avoid blocking the event loop
             await asyncio.to_thread(
                 self.client.chat.completions.create,
-                stream=False,
-                **completion_kwargs,
+                **request_kwargs,
             )
 
             # If no exception is raised, the connection is successful

From 889d9d94c81b1ebe8fb348e95aa612cb4e53f957 Mon Sep 17 00:00:00 2001
From: xuyaqist <xuyaqist@gmail.com>
Date: Thu, 7 May 2026 15:36:05 +0800
Subject: [PATCH 02/25] =?UTF-8?q?=E4=BF=AE=E6=94=B9sql=E8=84=9A=E6=9C=AC?=
 =?UTF-8?q?=E5=90=8D=E7=A7=B0?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 ....sql => v2.1.1_0507_add_timeout_seconds_to_model_record_t.sql} | 0
 1 file changed, 0 insertions(+), 0 deletions(-)
 rename docker/sql/{v2.0.5_0507_add_timeout_seconds_to_model_record_t.sql => v2.1.1_0507_add_timeout_seconds_to_model_record_t.sql} (100%)

diff --git a/docker/sql/v2.0.5_0507_add_timeout_seconds_to_model_record_t.sql b/docker/sql/v2.1.1_0507_add_timeout_seconds_to_model_record_t.sql
similarity index 100%
rename from docker/sql/v2.0.5_0507_add_timeout_seconds_to_model_record_t.sql
rename to docker/sql/v2.1.1_0507_add_timeout_seconds_to_model_record_t.sql

From 033361d4b869ceaf0471da87f20022e22898e95b Mon Sep 17 00:00:00 2001
From: xuyaqist <xuyaqist@gmail.com>
Date: Thu, 7 May 2026 20:05:39 +0800
Subject: [PATCH 03/25] Bugfix: ssl_verify causing different result in check
 embedding model connection

---
 backend/services/model_health_service.py     | 10 ++++++++++
 backend/services/model_management_service.py | 21 +++++++++++++++++---
 2 files changed, 28 insertions(+), 3 deletions(-)

diff --git a/backend/services/model_health_service.py b/backend/services/model_health_service.py
index b6dac2d04..dbaf25568 100644
--- a/backend/services/model_health_service.py
+++ b/backend/services/model_health_service.py
@@ -201,12 +201,20 @@ async def check_model_connectivity(display_name: str, tenant_id: str) -> dict:
         try:
             set_monitoring_context(tenant_id=tenant_id)
 
+            ssl_verify_fallback = False
             connectivity = await _perform_connectivity_check(
                 model_name, model_type, model_base_url, model_api_key, ssl_verify,
                 model_factory, model_appid, access_token,display_name=display_name,
                 display_name=display_name,
                 timeout_seconds=timeout_seconds,
             )
+            if not connectivity and ssl_verify:
+                ssl_verify_fallback = True
+                connectivity = await _perform_connectivity_check(
+                    model_name, model_type, model_base_url, model_api_key, False,
+                    display_name=display_name,
+                    timeout_seconds=timeout_seconds,
+                )
         except Exception as e:
             update_data = {
                 "connect_status": ModelConnectStatusEnum.UNAVAILABLE.value}
@@ -222,6 +230,8 @@ async def check_model_connectivity(display_name: str, tenant_id: str) -> dict:
                 f"UNCONNECTED: {model_name}")
         connect_status = ModelConnectStatusEnum.AVAILABLE.value if connectivity else ModelConnectStatusEnum.UNAVAILABLE.value
         update_data = {"connect_status": connect_status}
+        if ssl_verify_fallback:
+            update_data["ssl_verify"] = False
         update_model_record(model["model_id"], update_data)
         return {
             "connectivity": connectivity,
diff --git a/backend/services/model_management_service.py b/backend/services/model_management_service.py
index 64675d047..99450e23c 100644
--- a/backend/services/model_management_service.py
+++ b/backend/services/model_management_service.py
@@ -46,9 +46,15 @@ async def create_model_for_tenant(user_id: str, tenant_id: str, model_data: Dict
                 model_base_url.replace(LOCALHOST_NAME, DOCKER_INTERNAL_HOST)
                 .replace(LOCALHOST_IP, DOCKER_INTERNAL_HOST)
             )
-        model_data['ssl_verify'] = True
-        if "open/router" in model_base_url:
-            model_data['ssl_verify'] = False
+        # Auto-set ssl_verify based on api_key:
+        # - Empty api_key (local/LAN services) -> ssl_verify=False
+        # - "open/router" URL -> ssl_verify=False
+        # - Otherwise -> ssl_verify=True
+        model_api_key = model_data.get("api_key", "")
+        if not model_api_key or "open/router" in model_base_url:
+            model_data["ssl_verify"] = False
+        else:
+            model_data["ssl_verify"] = True
         # Split model_name into repo and name
         model_repo, model_name = split_repo_name(
             model_data["model_name"]) if model_data.get("model_name") else ("", "")
@@ -252,6 +258,15 @@ async def update_single_model_for_tenant(
             m.get("model_type") == "multi_embedding" for m in existing_models
         )
 
+        # Auto-set ssl_verify based on api_key if provided:
+        # - Empty api_key -> ssl_verify=False
+        # - Otherwise -> ssl_verify=True
+        if "api_key" in model_data:
+            if not model_data["api_key"]:
+                model_data["ssl_verify"] = False
+            else:
+                model_data["ssl_verify"] = True
+
         if has_multi_embedding:
             # Update both embedding and multi_embedding records
             for model in existing_models:

From 64cd64ee46b963e1bbd94eca4211e0859abe5663 Mon Sep 17 00:00:00 2001
From: xuyaqist <xuyaqist@gmail.com>
Date: Thu, 7 May 2026 20:45:14 +0800
Subject: [PATCH 04/25] Feat: support user to configurate model concurrency
 limit

---
 backend/consts/model.py                       |   3 +
 backend/database/db_models.py                 |   2 +
 backend/services/model_management_service.py  |   6 +-
 backend/services/model_provider_service.py    |  41 +++-
 backend/services/prompt_service.py            |  52 +++++-
 ...dd_concurrency_limit_to_model_record_t.sql |  13 ++
 .../components/model/ModelAddDialog.tsx       | 173 +++++++++--------
 .../components/model/ModelDeleteDialog.tsx    | 175 ++++++++----------
 .../components/model/ModelEditDialog.tsx      |  76 +++++++-
 frontend/public/locales/en/common.json        |   4 +
 frontend/public/locales/zh/common.json        |   4 +
 frontend/services/modelService.ts             |  12 ++
 frontend/types/modelConfig.ts                 |   1 +
 sdk/nexent/core/agents/agent_model.py         |   4 +
 sdk/nexent/core/models/openai_llm.py          |  24 ++-
 15 files changed, 377 insertions(+), 213 deletions(-)
 create mode 100644 docker/sql/v2.1.1_0507_add_concurrency_limit_to_model_record_t.sql

diff --git a/backend/consts/model.py b/backend/consts/model.py
index bc32515fe..ae086a625 100644
--- a/backend/consts/model.py
+++ b/backend/consts/model.py
@@ -122,6 +122,7 @@ class ModelRequest(BaseModel):
     model_appid: Optional[str] = None
     access_token: Optional[str] = None
     timeout_seconds: Optional[int] = None
+    concurrency_limit: Optional[int] = None
 
 
 class ProviderModelRequest(BaseModel):
@@ -758,6 +759,7 @@ class ManageTenantModelCreateRequest(BaseModel):
     model_appid: Optional[str] = Field(None, description="Application ID for STT models (e.g., Volcano Engine)")
     access_token: Optional[str] = Field(None, description="Access token for STT models (e.g., Volcano Engine)")
     timeout_seconds: Optional[int] = Field(None, description="Request timeout in seconds")
+    concurrency_limit: Optional[int] = Field(None, description="Maximum concurrent requests for this model")
 
 
 class ManageTenantModelUpdateRequest(BaseModel):
@@ -779,6 +781,7 @@ class ManageTenantModelUpdateRequest(BaseModel):
     model_appid: Optional[str] = Field(None, description="Application ID for STT models")
     access_token: Optional[str] = Field(None, description="Access token for STT models")
     timeout_seconds: Optional[int] = Field(None, description="Request timeout in seconds")
+    concurrency_limit: Optional[int] = Field(None, description="Maximum concurrent requests for this model")
 
 
 class ManageTenantModelDeleteRequest(BaseModel):
diff --git a/backend/database/db_models.py b/backend/database/db_models.py
index 94f5be80b..43e1bd7bc 100644
--- a/backend/database/db_models.py
+++ b/backend/database/db_models.py
@@ -184,6 +184,8 @@ class ModelRecord(TableBase):
         String(100), doc="Access token for model authentication (used by some STT/TTS providers like Volcano Engine)")
     timeout_seconds = Column(
         Integer, doc="Request timeout in seconds for this model. Default is 120 seconds.")
+    concurrency_limit = Column(
+        Integer, doc="Maximum concurrent requests for this model. Default is null (unlimited).")
 
 
 class ModelMonitoringRecord(SimpleTableBase):
diff --git a/backend/services/model_management_service.py b/backend/services/model_management_service.py
index 99450e23c..ab0e52259 100644
--- a/backend/services/model_management_service.py
+++ b/backend/services/model_management_service.py
@@ -17,7 +17,7 @@
 )
 from services.model_provider_service import (
     prepare_model_dict,
-    merge_existing_model_tokens,
+    merge_existing_model_attributes,
     get_provider_models,
 )
 from services.model_health_service import embedding_dimension_check
@@ -121,8 +121,8 @@ async def create_provider_models_for_tenant(tenant_id: str, provider_request: Di
         # Get provider model list
         model_list = await get_provider_models(provider_request)
 
-        # Merge existing model's max_tokens attribute
-        model_list = merge_existing_model_tokens(
+        # Merge existing model's attributes (max_tokens, api_key, timeout_seconds, concurrency_limit)
+        model_list = merge_existing_model_attributes(
             model_list, tenant_id, provider_request["provider"], provider_request["model_type"])
 
         # Sort model list by ID
diff --git a/backend/services/model_provider_service.py b/backend/services/model_provider_service.py
index 6fc729a39..9b9f26bd4 100644
--- a/backend/services/model_provider_service.py
+++ b/backend/services/model_provider_service.py
@@ -158,19 +158,29 @@ async def prepare_model_dict(provider: str, model: dict, model_url: str, model_a
     return model_dict
 
 
-def merge_existing_model_tokens(model_list: List[dict], tenant_id: str, provider: str, model_type: str) -> List[dict]:
+def merge_existing_model_attributes(
+    model_list: List[dict],
+    tenant_id: str,
+    provider: str,
+    model_type: str,
+    fields: List[str] = None
+) -> List[dict]:
     """
-    Merge existing model's max_tokens attribute into the model list.
+    Merge existing model's attributes into the model list.
 
     Args:
         model_list: List of models
         tenant_id: Tenant ID
         provider: Provider
         model_type: Model type
+        fields: List of fields to merge (defaults to max_tokens, api_key, timeout_seconds, concurrency_limit)
 
     Returns:
         List[dict]: Merged model list
     """
+    if fields is None:
+        fields = ["max_tokens", "api_key", "timeout_seconds", "concurrency_limit"]
+
     if model_type == "embedding" or model_type == "multi_embedding":
         return model_list
 
@@ -187,15 +197,35 @@ def merge_existing_model_tokens(model_list: List[dict], tenant_id: str, provider
             "/" + existing_model["model_name"]
         existing_model_map[model_full_name] = existing_model
 
-    # Iterate through the model list, if the model exists in the existing model list, add max_tokens attribute
+    # Iterate through the model list, merge specified fields from existing models
     for model in model_list:
         if model.get("id") in existing_model_map:
-            model["max_tokens"] = existing_model_map[model.get(
-                "id")].get("max_tokens")
+            existing_model = existing_model_map[model.get("id")]
+            for field in fields:
+                if existing_model.get(field) is not None:
+                    model[field] = existing_model.get(field)
 
     return model_list
 
 
+def merge_existing_model_tokens(model_list: List[dict], tenant_id: str, provider: str, model_type: str) -> List[dict]:
+    """
+    Merge existing model's max_tokens attribute into the model list.
+
+    DEPRECATED: Use merge_existing_model_attributes instead.
+
+    Args:
+        model_list: List of models
+        tenant_id: Tenant ID
+        provider: Provider
+        model_type: Model type
+
+    Returns:
+        List[dict]: Merged model list
+    """
+    return merge_existing_model_attributes(model_list, tenant_id, provider, model_type, ["max_tokens"])
+
+
 # Re-export provider classes for backward compatibility
 __all__ = [
     "AbstractModelProvider",
@@ -203,6 +233,7 @@ def merge_existing_model_tokens(model_list: List[dict], tenant_id: str, provider
     "ModelEngineProvider",
     "prepare_model_dict",
     "merge_existing_model_tokens",
+    "merge_existing_model_attributes",
     "get_provider_models",
     "get_model_engine_raw_url",
 ]
diff --git a/backend/services/prompt_service.py b/backend/services/prompt_service.py
index aa4d420d5..e0f5f96a0 100644
--- a/backend/services/prompt_service.py
+++ b/backend/services/prompt_service.py
@@ -259,19 +259,51 @@ def generate_system_prompt(sub_agent_info_list, task_description, tool_info_list
     stop_flags = {"duty": False, "constraint": False, "few_shots": False,
                   "agent_var_name": False, "agent_display_name": False, "agent_description": False}
 
-    # Start all generation threads
+    # Get model concurrency limit to control the number of concurrent LLM calls
+    # If None or >= 6, no limit (all 6 calls run concurrently)
+    # If < 6, use semaphore to limit concurrent calls
+    from database.model_management_db import get_model_by_model_id
+    model_config = get_model_by_model_id(model_id, tenant_id)
+    concurrency_limit = model_config.get("concurrency_limit") if model_config else None
+
+    # Start all generation threads with concurrency control
     threads, error_holder = _start_generation_threads(
-        content, prompt_for_generate, produce_queue, latest, stop_flags, tenant_id, model_id)
+        content, prompt_for_generate, produce_queue, latest, stop_flags, tenant_id, model_id,
+        concurrency_limit=concurrency_limit
+    )
 
     # Stream results
     yield from _stream_results(produce_queue, latest, stop_flags, threads, error_holder)
 
 
-def _start_generation_threads(content, prompt_for_generate, produce_queue, latest, stop_flags, tenant_id, model_id):
-    """Start all prompt generation threads"""
+def _start_generation_threads(content, prompt_for_generate, produce_queue, latest, stop_flags, tenant_id, model_id,
+                                concurrency_limit: Optional[int] = None):
+    """Start all prompt generation threads with optional concurrency control.
+
+    Args:
+        concurrency_limit: Maximum concurrent LLM calls. If None or >= 6, no limit.
+                         If < 6, use semaphore to control concurrency.
+    """
     # Shared error tracking across threads
     error_holder = {"error": None}
 
+    # Total number of generation tasks
+    total_tasks = 6
+
+    # Determine effective concurrency limit
+    # None means unlimited, 0 or negative means unlimited
+    if concurrency_limit is None or concurrency_limit <= 0 or concurrency_limit >= total_tasks:
+        effective_limit = None
+    else:
+        effective_limit = concurrency_limit
+
+    # Use semaphore if concurrency is limited
+    semaphore = threading.Semaphore(effective_limit) if effective_limit else None
+    if semaphore:
+        logger.info(f"Using concurrency limit of {effective_limit} for prompt generation (total tasks: {total_tasks})")
+    else:
+        logger.info("Using unlimited concurrency for prompt generation")
+
     def make_callback(tag):
         def callback_fn(current_text):
             latest[tag] = current_text
@@ -280,8 +312,16 @@ def callback_fn(current_text):
 
     def run_and_flag(tag, sys_prompt):
         try:
-            call_llm_for_system_prompt(
-                model_id, content, sys_prompt, make_callback(tag), tenant_id)
+            # Acquire semaphore before starting (if limited)
+            if semaphore:
+                semaphore.acquire()
+            try:
+                call_llm_for_system_prompt(
+                    model_id, content, sys_prompt, make_callback(tag), tenant_id)
+            finally:
+                # Always release semaphore after completion
+                if semaphore:
+                    semaphore.release()
         except Exception as e:
             logger.error(f"Error in {tag} generation: {e}")
             error_holder["error"] = e
diff --git a/docker/sql/v2.1.1_0507_add_concurrency_limit_to_model_record_t.sql b/docker/sql/v2.1.1_0507_add_concurrency_limit_to_model_record_t.sql
new file mode 100644
index 000000000..59632f8ed
--- /dev/null
+++ b/docker/sql/v2.1.1_0507_add_concurrency_limit_to_model_record_t.sql
@@ -0,0 +1,13 @@
+-- Add concurrency_limit column to model_record_t table
+ALTER TABLE nexent.model_record_t
+ADD COLUMN IF NOT EXISTS concurrency_limit INTEGER DEFAULT NULL;
+
+-- Add comment to the column
+COMMENT ON COLUMN nexent.model_record_t.concurrency_limit IS 'Maximum concurrent requests for this model. Default is NULL (unlimited).';
+
+-- Add timeout_seconds column to model_record_t table
+ALTER TABLE nexent.model_record_t
+ADD COLUMN IF NOT EXISTS timeout_seconds INTEGER DEFAULT 120;
+
+-- Add comment to the column
+COMMENT ON COLUMN nexent.model_record_t.timeout_seconds IS 'Request timeout in seconds for this model. Default is 120 seconds.';
diff --git a/frontend/app/[locale]/models/components/model/ModelAddDialog.tsx b/frontend/app/[locale]/models/components/model/ModelAddDialog.tsx
index eee1ab277..5cbcc6789 100644
--- a/frontend/app/[locale]/models/components/model/ModelAddDialog.tsx
+++ b/frontend/app/[locale]/models/components/model/ModelAddDialog.tsx
@@ -24,6 +24,7 @@ import {
   DEFAULT_EXPECTED_CHUNK_SIZE,
   DEFAULT_MAXIMUM_CHUNK_SIZE,
 } from "./ModelChunkSizeSilder";
+import { ProviderConfigEditDialog } from "./ModelEditDialog";
 
 const { Option } = Select;
 
@@ -51,6 +52,7 @@ const DEFAULT_FORM_STATE = {
   apiKey: "",
   maxTokens: "4096",
   timeoutSeconds: "120",
+  concurrencyLimit: "",
   isMultimodal: false,
   isBatchImport: false,
   provider: "modelengine",
@@ -248,12 +250,9 @@ export const ModelAddDialog = ({
     }
   }, [saveConfig, message, t]);
 
-  // Settings modal state
-  const [settingsModalVisible, setSettingsModalVisible] = useState(false);
-  const [selectedModelForSettings, setSelectedModelForSettings] =
-    useState<any>(null);
-  const [modelMaxTokens, setModelMaxTokens] = useState("4096");
-  const [modelTimeoutSeconds, setModelTimeoutSeconds] = useState("120");
+  // Single model settings modal state
+  const [isSingleModelSettingsOpen, setIsSingleModelSettingsOpen] = useState(false);
+  const [selectedSingleModel, setSelectedSingleModel] = useState<any>(null);
 
   // Use the silicon model list hook
   const siliconHook  = useSiliconModelList({
@@ -637,53 +636,10 @@ export const ModelAddDialog = ({
     }
   };
 
-  // Handle settings button click
-  const handleSettingsClick = (model: any) => {
-    setSelectedModelForSettings(model);
-    setModelMaxTokens(model.max_tokens?.toString() || "4096");
-    setModelTimeoutSeconds(model.timeout_seconds?.toString() || "120");
-    setSettingsModalVisible(true);
-  };
-
-  // Handle settings save
-  const handleSettingsSave = async () => {
-    if (!selectedModelForSettings) return;
-
-    try {
-      // Use model_name as the identifier (API returns model_name field, id is combined format)
-      const modelName = selectedModelForSettings.model_name || selectedModelForSettings.id;
-
-      // Call API to update model settings
-      await modelService.updateBatchModel(
-        [
-          {
-            model_id: modelName,
-            apiKey: selectedModelForSettings.api_key || "",
-            maxTokens: parseInt(modelMaxTokens) || 4096,
-            timeoutSeconds: parseInt(modelTimeoutSeconds) || 120,
-          },
-        ],
-        selectedModelForSettings.model_factory
-      );
-
-      // Update the model in the list with new max_tokens and timeout_seconds
-      setModelList((prev) =>
-        prev.map((model) =>
-          model.id === selectedModelForSettings.id
-            ? {
-                ...model,
-                max_tokens: parseInt(modelMaxTokens) || 4096,
-                timeout_seconds: parseInt(modelTimeoutSeconds) || 120,
-              }
-            : model
-        )
-      );
-    } catch (error) {
-      console.error("Failed to update model settings:", error);
-    } finally {
-      setSettingsModalVisible(false);
-      setSelectedModelForSettings(null);
-    }
+  // Handle single model settings button click
+  const handleSingleModelSettingsClick = (model: any) => {
+    setSelectedSingleModel(model);
+    setIsSingleModelSettingsOpen(true);
   };
 
   // Handle adding a model
@@ -759,6 +715,9 @@ export const ModelAddDialog = ({
           timeoutSeconds: !isEmbeddingModel && !isRerankModel
             ? parseInt(form.timeoutSeconds) || 120
             : undefined,
+          concurrencyLimit: !isEmbeddingModel && !isRerankModel
+            ? form.concurrencyLimit ? parseInt(form.concurrencyLimit) : undefined
+            : undefined,
         });
 >>>>>>> a64daaea1 (Feat: support user to configurate model timeout)
       } else {
@@ -802,6 +761,7 @@ export const ModelAddDialog = ({
           ...(!isEmbeddingModel && !isRerankModel
             ? {
                 timeoutSeconds: parseInt(form.timeoutSeconds) || 120,
+                concurrencyLimit: form.concurrencyLimit ? parseInt(form.concurrencyLimit) : undefined,
               }
             : {}),
         });
@@ -1272,6 +1232,29 @@ export const ModelAddDialog = ({
           </div>
         )}
 
+        {/* Concurrency Limit */}
+        {!isEmbeddingModel && !isRerankModel && !form.isBatchImport && (
+          <div>
+            <label
+              htmlFor="concurrencyLimit"
+              className="block mb-1 text-sm font-medium text-gray-700"
+            >
+              {t("model.dialog.label.concurrencyLimit")}
+            </label>
+            <Input
+              id="concurrencyLimit"
+              type="number"
+              min="1"
+              placeholder={t("model.dialog.placeholder.concurrencyLimit")}
+              value={form.concurrencyLimit}
+              onChange={(e) => handleFormChange("concurrencyLimit", e.target.value)}
+            />
+            <div className="text-xs text-gray-500 mt-1">
+              {t("model.dialog.hint.concurrencyLimit")}
+            </div>
+          </div>
+        )}
+
         {/* Connectivity verification area */}
         {!form.isBatchImport && (
           <div className="p-3 bg-gray-50 border border-gray-200 rounded-md">
@@ -1428,7 +1411,7 @@ export const ModelAddDialog = ({
                                 size="small"
                                 onClick={(e) => {
                                   e.stopPropagation(); // Prevent switch toggle
-                                  handleSettingsClick(model);
+                                  handleSingleModelSettingsClick(model);
                                 }}
                               />
                             </Tooltip>
@@ -1773,42 +1756,52 @@ export const ModelAddDialog = ({
         </div>
       </div>
 
-      {/* Settings Modal */}
-      <Modal
-        title={t("model.dialog.settings.title")}
-        open={settingsModalVisible}
-        onCancel={() => setSettingsModalVisible(false)}
-        onOk={handleSettingsSave}
-        cancelText={t("common.cancel")}
-        okText={t("common.confirm")}
-        destroyOnHidden
-      >
-        <div className="space-y-3">
-          <div>
-            <label className="block mb-1 text-sm font-medium text-gray-700">
-              {t("model.dialog.settings.label.maxTokens")}
-            </label>
-            <Input
-              type="number"
-              value={modelMaxTokens}
-              onChange={(e) => setModelMaxTokens(e.target.value)}
-              placeholder={t("model.dialog.placeholder.maxTokens")}
-            />
-          </div>
-          <div>
-            <label className="block mb-1 text-sm font-medium text-gray-700">
-              {t("model.dialog.label.timeoutSeconds")}
-            </label>
-            <Input
-              type="number"
-              min="1"
-              value={modelTimeoutSeconds}
-              onChange={(e) => setModelTimeoutSeconds(e.target.value)}
-              placeholder="120"
-            />
-          </div>
-        </div>
-      </Modal>
+      {/* Single Model Settings Modal */}
+      <ProviderConfigEditDialog
+        isOpen={isSingleModelSettingsOpen}
+        onClose={() => {
+          setIsSingleModelSettingsOpen(false);
+          setSelectedSingleModel(null);
+        }}
+        initialMaxTokens={selectedSingleModel?.max_tokens?.toString() || "4096"}
+        initialTimeoutSeconds={selectedSingleModel?.timeout_seconds?.toString() || "120"}
+        modelType={form.type}
+        showApiKeyField={false}
+        onSave={async (config) => {
+          if (!selectedSingleModel) return;
+          try {
+            const modelName = selectedSingleModel.model_name || selectedSingleModel.id;
+            await modelService.updateBatchModel(
+              [
+                {
+                  model_id: modelName,
+                  apiKey: config.apiKey,
+                  maxTokens: config.maxTokens,
+                  timeoutSeconds: config.timeoutSeconds,
+                  concurrencyLimit: config.concurrencyLimit,
+                },
+              ],
+              selectedSingleModel.model_factory
+            );
+
+            // Update the model in the list
+            setModelList((prev) =>
+              prev.map((model) =>
+                model.id === selectedSingleModel.id
+                  ? {
+                      ...model,
+                      api_key: config.apiKey,
+                      max_tokens: config.maxTokens,
+                      timeout_seconds: config.timeoutSeconds,
+                    }
+                  : model
+              )
+            );
+          } catch (error) {
+            console.error("Failed to update model settings:", error);
+          }
+        }}
+      />
     </Modal>
   );
 };
diff --git a/frontend/app/[locale]/models/components/model/ModelDeleteDialog.tsx b/frontend/app/[locale]/models/components/model/ModelDeleteDialog.tsx
index f58ca242e..0074a9bb5 100644
--- a/frontend/app/[locale]/models/components/model/ModelDeleteDialog.tsx
+++ b/frontend/app/[locale]/models/components/model/ModelDeleteDialog.tsx
@@ -52,12 +52,9 @@ export const ModelDeleteDialog = ({
   const [isConfirmLoading, setIsConfirmLoading] = useState<boolean>(false);
   const [maxTokens, setMaxTokens] = useState<number>(0);
 
-  // Settings modal state
-  const [settingsModalVisible, setSettingsModalVisible] = useState(false);
-  const [selectedModelForSettings, setSelectedModelForSettings] =
-    useState<any>(null);
-  const [modelMaxTokens, setModelMaxTokens] = useState("4096");
-  const [modelTimeoutSeconds, setModelTimeoutSeconds] = useState("120");
+  // Single model settings modal state
+  const [isSingleModelSettingsOpen, setIsSingleModelSettingsOpen] = useState<boolean>(false);
+  const [selectedSingleModel, setSelectedSingleModel] = useState<any>(null);
   const [providerModelSearchTerm, setProviderModelSearchTerm] = useState("");
 
   // Embedding model chunk config modal state
@@ -591,10 +588,12 @@ export const ModelDeleteDialog = ({
     apiKey,
     maxTokens,
     timeoutSeconds,
+    concurrencyLimit,
   }: {
     apiKey: string;
     maxTokens: number;
     timeoutSeconds?: number;
+    concurrencyLimit?: number;
   }) => {
     setMaxTokens(maxTokens);
     if (
@@ -628,6 +627,7 @@ export const ModelDeleteDialog = ({
             apiKey: apiKey || m.apiKey,
             maxTokens: maxTokens || m.maxTokens,
             ...(timeoutSeconds !== undefined ? { timeoutSeconds } : {}),
+            ...(concurrencyLimit !== undefined ? { concurrencyLimit } : {}),
           }));
 
         await modelService.updateBatchModel(
@@ -643,6 +643,8 @@ export const ModelDeleteDialog = ({
           prev.map((model) => ({
             ...model,
             max_tokens: maxTokens || model.max_tokens || 4096,
+            timeout_seconds: timeoutSeconds || model.timeout_seconds,
+            concurrency_limit: concurrencyLimit !== undefined ? concurrencyLimit : model.concurrency_limit,
           }))
         );
       } catch (e) {
@@ -653,58 +655,6 @@ export const ModelDeleteDialog = ({
     setIsProviderConfigOpen(false);
   };
 
-  // Handle settings button click
-  const handleSettingsClick = (model: any) => {
-    setSelectedModelForSettings(model);
-    setModelMaxTokens(model.max_tokens?.toString() || "4096");
-    setModelTimeoutSeconds(model.timeout_seconds?.toString() || "120");
-    setSettingsModalVisible(true);
-  };
-
-  // Handle settings save
-  const handleSettingsSave = async () => {
-    if (!selectedModelForSettings) return;
-
-    try {
-      // Use model_name as the identifier (API returns model_name field, id is combined format)
-      const modelName = selectedModelForSettings.model_name || selectedModelForSettings.id;
-
-      // Call API to update model settings
-      await modelService.updateBatchModel(
-        [
-          {
-            model_id: modelName,
-            apiKey: selectedModelForSettings.api_key || "",
-            maxTokens: parseInt(modelMaxTokens) || 4096,
-            timeoutSeconds: parseInt(modelTimeoutSeconds) || 120,
-          },
-        ],
-        selectedModelForSettings.model_factory
-      );
-
-      // Update the model in the list with new max_tokens and timeout_seconds
-      setProviderModels((prev) =>
-        prev.map((model) =>
-          model.id === selectedModelForSettings.id
-            ? {
-                ...model,
-                max_tokens: parseInt(modelMaxTokens) || 4096,
-                timeout_seconds: parseInt(modelTimeoutSeconds) || 120,
-              }
-            : model
-        )
-      );
-
-      message.success(t("model.message.updateSuccess") || "Update successful");
-    } catch (error) {
-      console.error("Failed to update model settings:", error);
-      message.error(t("model.message.updateFailed") || "Failed to update settings");
-    } finally {
-      setSettingsModalVisible(false);
-      setSelectedModelForSettings(null);
-    }
-  };
-
   // Handle embedding model click to open config modal
   const handleEmbeddingModelClick = (model: ModelOption | any) => {
     const isEmbeddingModel =
@@ -762,6 +712,12 @@ export const ModelDeleteDialog = ({
     }
   };
 
+  // Handle single model settings button click
+  const handleSingleModelSettingsClick = (model: any) => {
+    setSelectedSingleModel(model);
+    setIsSingleModelSettingsOpen(true);
+  };
+
   // Handle embedding config save
   const handleEmbeddingConfigSave = async () => {
     if (!selectedEmbeddingModel) return;
@@ -1363,7 +1319,7 @@ export const ModelDeleteDialog = ({
                               size="small"
                               onClick={(e) => {
                                 e.stopPropagation(); // Prevent switch toggle
-                                handleSettingsClick(providerModel);
+                                handleSingleModelSettingsClick(providerModel);
                               }}
                             />
                           </Tooltip>
@@ -1549,46 +1505,75 @@ export const ModelDeleteDialog = ({
               m.source === (selectedSource || MODEL_SOURCES.SILICON)
           )?.maxTokens || 4096
         ).toString()}
+        initialTimeoutSeconds={(
+          models.find(
+            (m) =>
+              m.type === deletingModelType &&
+              m.source === (selectedSource || MODEL_SOURCES.SILICON)
+          )?.timeoutSeconds?.toString() || "120"
+        )}
+        initialConcurrencyLimit={(
+          models.find(
+            (m) =>
+              m.type === deletingModelType &&
+              m.source === (selectedSource || MODEL_SOURCES.SILICON)
+          )?.concurrencyLimit?.toString() || ""
+        )}
         modelType={deletingModelType || undefined}
         onSave={handleProviderConfigSave}
       />
 
-      {/* Settings Modal */}
-      <Modal
-        title={t("model.dialog.settings.title")}
-        open={settingsModalVisible}
-        onCancel={() => setSettingsModalVisible(false)}
-        onOk={handleSettingsSave}
-        cancelText={t("common.button.cancel")}
-        okText={t("common.button.save")}
-        destroyOnHidden
-      >
-        <div className="space-y-3">
-          <div>
-            <label className="block mb-1 text-sm font-medium text-gray-700">
-              {t("model.dialog.settings.label.maxTokens")}
-            </label>
-            <Input
-              type="number"
-              value={modelMaxTokens}
-              onChange={(e) => setModelMaxTokens(e.target.value)}
-              placeholder={t("model.dialog.placeholder.maxTokens")}
-            />
-          </div>
-          <div>
-            <label className="block mb-1 text-sm font-medium text-gray-700">
-              {t("model.dialog.label.timeoutSeconds")}
-            </label>
-            <Input
-              type="number"
-              min="1"
-              value={modelTimeoutSeconds}
-              onChange={(e) => setModelTimeoutSeconds(e.target.value)}
-              placeholder="120"
-            />
-          </div>
-        </div>
-      </Modal>
+      {/* Single Model Settings Modal */}
+      <ProviderConfigEditDialog
+        isOpen={isSingleModelSettingsOpen}
+        onClose={() => {
+          setIsSingleModelSettingsOpen(false);
+          setSelectedSingleModel(null);
+        }}
+        initialMaxTokens={selectedSingleModel?.max_tokens?.toString() || "4096"}
+        initialTimeoutSeconds={selectedSingleModel?.timeout_seconds?.toString() || "120"}
+        initialConcurrencyLimit={selectedSingleModel?.concurrency_limit?.toString() || ""}
+        modelType={deletingModelType || undefined}
+        showApiKeyField={false}
+        onSave={async (config) => {
+          if (!selectedSingleModel) return;
+          try {
+            const modelName = selectedSingleModel.model_name || selectedSingleModel.id;
+            await modelService.updateBatchModel(
+              [
+                {
+                  model_id: modelName,
+                  apiKey: config.apiKey,
+                  maxTokens: config.maxTokens,
+                  timeoutSeconds: config.timeoutSeconds,
+                  concurrencyLimit: config.concurrencyLimit,
+                },
+              ],
+              selectedSingleModel.model_factory
+            );
+
+            // Update the model in the list
+            setProviderModels((prev) =>
+              prev.map((model) =>
+                model.id === selectedSingleModel.id
+                  ? {
+                      ...model,
+                      api_key: config.apiKey,
+                      max_tokens: config.maxTokens,
+                      timeout_seconds: config.timeoutSeconds,
+                      concurrency_limit: config.concurrencyLimit,
+                    }
+                  : model
+              )
+            );
+
+            message.success(t("model.message.updateSuccess") || "Update successful");
+          } catch (error) {
+            console.error("Failed to update model settings:", error);
+            message.error(t("model.message.updateFailed") || "Failed to update settings");
+          }
+        }}
+      />
 
       {/* Embedding Model Config Modal */}
       <Modal
diff --git a/frontend/app/[locale]/models/components/model/ModelEditDialog.tsx b/frontend/app/[locale]/models/components/model/ModelEditDialog.tsx
index a784258df..1fa2b4a64 100644
--- a/frontend/app/[locale]/models/components/model/ModelEditDialog.tsx
+++ b/frontend/app/[locale]/models/components/model/ModelEditDialog.tsx
@@ -40,6 +40,7 @@ export const ModelEditDialog = ({
     apiKey: "",
     maxTokens: "4096",
     timeoutSeconds: "120",
+    concurrencyLimit: "",
     vectorDimension: "1024",
     chunkSizeRange: [
       DEFAULT_EXPECTED_CHUNK_SIZE,
@@ -67,6 +68,7 @@ export const ModelEditDialog = ({
         apiKey: model.apiKey || "",
         maxTokens: model.maxTokens?.toString() || "4096",
         timeoutSeconds: model.timeoutSeconds?.toString() || "120",
+        concurrencyLimit: model.concurrencyLimit?.toString() || "",
         vectorDimension: model.maxTokens?.toString() || "1024",
         chunkSizeRange: [
           model.expectedChunkSize || DEFAULT_EXPECTED_CHUNK_SIZE,
@@ -179,6 +181,7 @@ export const ModelEditDialog = ({
           maximumChunkSize: isEmbeddingModel ? form.chunkSizeRange[1] : undefined,
           chunkingBatchSize: isEmbeddingModel ? parseInt(form.chunkingBatchSize) || 10 : undefined,
           timeoutSeconds: !isEmbeddingModel && !isRerankModel ? parseInt(form.timeoutSeconds) || 120 : undefined,
+          concurrencyLimit: !isEmbeddingModel && !isRerankModel ? (form.concurrencyLimit ? parseInt(form.concurrencyLimit) : undefined) : undefined,
         });
       } else {
         await modelService.updateSingleModel({
@@ -203,6 +206,7 @@ export const ModelEditDialog = ({
           ...(!isEmbeddingModel && !isRerankModel
             ? {
                 timeoutSeconds: parseInt(form.timeoutSeconds) || 120,
+                concurrencyLimit: form.concurrencyLimit ? parseInt(form.concurrencyLimit) : undefined,
               }
             : {}),
         });
@@ -312,6 +316,15 @@ export const ModelEditDialog = ({
               value={form.maxTokens}
               onChange={(e) => handleFormChange("maxTokens", e.target.value)}
             />
+          </div>
+        )}
+
+        {/* Timeout Seconds */}
+        {!isEmbeddingModel && !isRerankModel && (
+          <div>
+            <label className="block mb-1 text-sm font-medium text-gray-700">
+              {t("model.dialog.label.timeoutSeconds")}
+            </label>
             <Input
               type="number"
               min="1"
@@ -321,6 +334,25 @@ export const ModelEditDialog = ({
           </div>
         )}
 
+        {/* Concurrency Limit */}
+        {!isEmbeddingModel && !isRerankModel && (
+          <div>
+            <label className="block mb-1 text-sm font-medium text-gray-700">
+              {t("model.dialog.label.concurrencyLimit")}
+            </label>
+            <Input
+              type="number"
+              min="1"
+              value={form.concurrencyLimit}
+              onChange={(e) => handleFormChange("concurrencyLimit", e.target.value)}
+              placeholder={t("model.dialog.placeholder.concurrencyLimit")}
+            />
+            <div className="text-xs text-gray-500 mt-1">
+              {t("model.dialog.hint.concurrencyLimit")}
+            </div>
+          </div>
+        )}
+
         {/* Chunk Size Range for embedding models */}
         {isEmbeddingModel && (
           <div>
@@ -424,9 +456,11 @@ interface ProviderConfigEditDialogProps {
   initialApiKey?: string
   initialMaxTokens?: string
   initialTimeoutSeconds?: string
+  initialConcurrencyLimit?: string
   modelType?: ModelType
+  showApiKeyField?: boolean  // Whether to show API Key field (default: true)
   onClose: () => void
-  onSave: (config: { apiKey: string; maxTokens: number; timeoutSeconds?: number }) => Promise<void> | void
+  onSave: (config: { apiKey: string; maxTokens: number; timeoutSeconds?: number; concurrencyLimit?: number }) => Promise<void> | void
 }
 
 export const ProviderConfigEditDialog = ({
@@ -434,7 +468,9 @@ export const ProviderConfigEditDialog = ({
   initialApiKey = '',
   initialMaxTokens = '4096',
   initialTimeoutSeconds = '120',
+  initialConcurrencyLimit = '',
   modelType,
+  showApiKeyField = true,
   onClose,
   onSave,
 }: ProviderConfigEditDialogProps) => {
@@ -442,13 +478,15 @@ export const ProviderConfigEditDialog = ({
   const [apiKey, setApiKey] = useState<string>(initialApiKey)
   const [maxTokens, setMaxTokens] = useState<string>(initialMaxTokens)
   const [timeoutSeconds, setTimeoutSeconds] = useState<string>(initialTimeoutSeconds)
+  const [concurrencyLimit, setConcurrencyLimit] = useState<string>(initialConcurrencyLimit)
   const [saving, setSaving] = useState<boolean>(false)
 
   useEffect(() => {
     setApiKey(initialApiKey)
     setMaxTokens(initialMaxTokens)
     setTimeoutSeconds(initialTimeoutSeconds)
-  }, [initialApiKey, initialMaxTokens, initialTimeoutSeconds])
+    setConcurrencyLimit(initialConcurrencyLimit)
+  }, [initialApiKey, initialMaxTokens, initialTimeoutSeconds, initialConcurrencyLimit])
 
   const valid = () => {
     const parsed = parseInt(maxTokens)
@@ -462,9 +500,10 @@ export const ProviderConfigEditDialog = ({
       const isEmbeddingModel = modelType === MODEL_TYPES.EMBEDDING || modelType === MODEL_TYPES.MULTI_EMBEDDING
       const isRerankModel = modelType === MODEL_TYPES.RERANK
       await onSave({
-        apiKey: apiKey.trim() === '' ? 'sk-no-api-key' : apiKey,
+        apiKey: showApiKeyField ? (apiKey.trim() === '' ? 'sk-no-api-key' : apiKey) : '',
         maxTokens: parseInt(maxTokens),
         ...(!isEmbeddingModel && !isRerankModel ? { timeoutSeconds: parseInt(timeoutSeconds) || 120 } : {}),
+        ...(!isEmbeddingModel && !isRerankModel ? { concurrencyLimit: concurrencyLimit ? parseInt(concurrencyLimit) : undefined } : {}),
       })
       onClose()
     } finally {
@@ -484,12 +523,14 @@ export const ProviderConfigEditDialog = ({
       destroyOnHidden
     >
       <div className="space-y-4">
-        <div>
-          <label className="block mb-1 text-sm font-medium text-gray-700">
-            {t('model.dialog.label.apiKey')}
-          </label>
-          <Input.Password value={apiKey} onChange={(e) => setApiKey(e.target.value)} visibilityToggle={false} />
-        </div>
+        {showApiKeyField && (
+          <div>
+            <label className="block mb-1 text-sm font-medium text-gray-700">
+              {t('model.dialog.label.apiKey')}
+            </label>
+            <Input.Password value={apiKey} onChange={(e) => setApiKey(e.target.value)} visibilityToggle={false} />
+          </div>
+        )}
         {!isEmbeddingModel && (
           <div>
             <label className="block mb-1 text-sm font-medium text-gray-700">
@@ -511,6 +552,23 @@ export const ProviderConfigEditDialog = ({
             />
           </div>
         )}
+        {!isEmbeddingModel && !isRerankModel && (
+          <div>
+            <label className="block mb-1 text-sm font-medium text-gray-700">
+              {t("model.dialog.label.concurrencyLimit")}
+            </label>
+            <Input
+              type="number"
+              min="1"
+              value={concurrencyLimit}
+              onChange={(e) => setConcurrencyLimit(e.target.value)}
+              placeholder={t("model.dialog.placeholder.concurrencyLimit")}
+            />
+            <div className="text-xs text-gray-500 mt-1">
+              {t("model.dialog.hint.concurrencyLimit")}
+            </div>
+          </div>
+        )}
         <div className="flex justify-end space-x-3">
           <Button onClick={onClose}>{t('common.button.cancel')}</Button>
           <Button type="primary" onClick={handleSave} loading={saving} disabled={!valid()}>
diff --git a/frontend/public/locales/en/common.json b/frontend/public/locales/en/common.json
index 22e8b7836..c36cfc259 100644
--- a/frontend/public/locales/en/common.json
+++ b/frontend/public/locales/en/common.json
@@ -736,6 +736,10 @@
   "model.dialog.label.accessToken": "Access Token",
   "model.dialog.label.maxTokens": "Max Tokens",
   "model.dialog.label.timeoutSeconds": "Timeout (seconds)",
+  "model.dialog.label.concurrencyLimit": "Concurrency Limit",
+  "model.dialog.placeholder.timeoutSeconds": "Default 120",
+  "model.dialog.placeholder.concurrencyLimit": "Leave empty for unlimited",
+  "model.dialog.hint.concurrencyLimit": "Maximum number of concurrent requests for this model. Leave empty for no limit.",
   "model.dialog.label.batchImport": "Batch Add",
   "model.dialog.label.provider": "Model Provider",
   "model.dialog.label.currentlySupported": "Currently supported:",
diff --git a/frontend/public/locales/zh/common.json b/frontend/public/locales/zh/common.json
index f4df286c0..61ba43dad 100644
--- a/frontend/public/locales/zh/common.json
+++ b/frontend/public/locales/zh/common.json
@@ -737,6 +737,10 @@
   "model.dialog.label.modelAppid": "App ID",
   "model.dialog.label.accessToken": "Access Token",
   "model.dialog.label.timeoutSeconds": "超时时间(秒)",
+  "model.dialog.label.concurrencyLimit": "并发限制",
+  "model.dialog.placeholder.timeoutSeconds": "默认120",
+  "model.dialog.placeholder.concurrencyLimit": "不限制则留空",
+  "model.dialog.hint.concurrencyLimit": "限制模型的最大并发请求数，不填则不限制",
   "model.dialog.label.batchImport": "批量添加模型",
   "model.dialog.label.provider": "模型提供商",
   "model.dialog.label.currentlySupported": "当前已支持：",
diff --git a/frontend/services/modelService.ts b/frontend/services/modelService.ts
index 49a4c9ec7..7df855fd4 100644
--- a/frontend/services/modelService.ts
+++ b/frontend/services/modelService.ts
@@ -72,6 +72,7 @@ export const modelService = {
           modelAppid: model.model_appid,
           accessToken: model.access_token,
           timeoutSeconds: model.timeout_seconds,
+          concurrencyLimit: model.concurrency_limit,
         }));
       }
       return [];
@@ -108,6 +109,7 @@ export const modelService = {
     modelAppid?: string;
     accessToken?: string;
     timeoutSeconds?: number;
+    concurrencyLimit?: number;
   }): Promise<void> => {
     try {
       const requestBody: any = {
@@ -318,6 +320,7 @@ export const modelService = {
     modelAppid?: string;
     accessToken?: string;
     timeoutSeconds?: number;
+    concurrencyLimit?: number;
   }): Promise<void> => {
     try {
       const response = await fetch(
@@ -356,6 +359,9 @@ export const modelService = {
             ...(model.timeoutSeconds !== undefined
               ? { timeout_seconds: model.timeoutSeconds }
               : {}),
+            ...(model.concurrencyLimit !== undefined
+              ? { concurrency_limit: model.concurrencyLimit }
+              : {}),
           }),
         }
       );
@@ -378,6 +384,7 @@ export const modelService = {
       apiKey: string;
       maxTokens?: number;
       timeoutSeconds?: number;
+      concurrencyLimit?: number;
     }[],
     provider?: string
   ): Promise<any> => {
@@ -391,6 +398,7 @@ export const modelService = {
             api_key: m.apiKey,
             ...(m.maxTokens !== undefined ? { max_tokens: m.maxTokens } : {}),
             ...(m.timeoutSeconds !== undefined ? { timeout_seconds: m.timeoutSeconds } : {}),
+            ...(m.concurrencyLimit !== undefined ? { concurrency_limit: m.concurrencyLimit } : {}),
             ...(provider ? { model_factory: provider } : {}),
           }))
         ),
@@ -653,6 +661,7 @@ export const modelService = {
             modelAppid: model.model_appid,
             accessToken: model.access_token,
             timeoutSeconds: model.timeout_seconds,
+            concurrencyLimit: model.concurrency_limit,
           })),
           total: result.data.total || 0,
           page: result.data.page || 1,
@@ -700,6 +709,7 @@ export const modelService = {
     modelAppid?: string;
     accessToken?: string;
     timeoutSeconds?: number;
+    concurrencyLimit?: number;
   }): Promise<void> => {
     try {
       const requestBody: any = {
@@ -767,6 +777,7 @@ export const modelService = {
     modelAppid?: string;
     accessToken?: string;
     timeoutSeconds?: number;
+    concurrencyLimit?: number;
   }): Promise<void> => {
     try {
       const response = await fetch(
@@ -791,6 +802,7 @@ export const modelService = {
             ...(params.modelAppid !== undefined ? { model_appid: params.modelAppid } : {}),
             ...(params.accessToken !== undefined ? { access_token: params.accessToken } : {}),
             ...(params.timeoutSeconds !== undefined ? { timeout_seconds: params.timeoutSeconds } : {}),
+            ...(params.concurrencyLimit !== undefined ? { concurrency_limit: params.concurrencyLimit } : {}),
           }),
         }
       );
diff --git a/frontend/types/modelConfig.ts b/frontend/types/modelConfig.ts
index 76519ee38..24c528fa3 100644
--- a/frontend/types/modelConfig.ts
+++ b/frontend/types/modelConfig.ts
@@ -51,6 +51,7 @@ export interface ModelOption {
   modelAppid?: string;
   accessToken?: string;
   timeoutSeconds?: number;
+  concurrencyLimit?: number;
 }
 
 // Application configuration interface
diff --git a/sdk/nexent/core/agents/agent_model.py b/sdk/nexent/core/agents/agent_model.py
index 3282dfede..b48f1a85b 100644
--- a/sdk/nexent/core/agents/agent_model.py
+++ b/sdk/nexent/core/agents/agent_model.py
@@ -34,6 +34,10 @@ class ModelConfig(BaseModel):
         description="Request timeout in seconds. If None, uses provider default.",
         default=None
     )
+    concurrency_limit: Optional[int] = Field(
+        description="Maximum concurrent requests for this model. If None, no limit.",
+        default=None
+    )
 
 
 class ToolConfig(BaseModel):
diff --git a/sdk/nexent/core/models/openai_llm.py b/sdk/nexent/core/models/openai_llm.py
index 74b163670..4c41e0021 100644
--- a/sdk/nexent/core/models/openai_llm.py
+++ b/sdk/nexent/core/models/openai_llm.py
@@ -25,6 +25,7 @@ class OpenAIModel(OpenAIServerModel):
     def __init__(self, observer: MessageObserver = MessageObserver, temperature=0.2, top_p=0.95,
                  ssl_verify=True, model_factory: Optional[str] = None,
                  display_name: Optional[str] = None, timeout_seconds: Optional[float] = None,
+                 concurrency_limit: Optional[int] = None,
                  *args, **kwargs):
         """
         Initialize OpenAI Model with observer and SSL verification option.
@@ -38,6 +39,7 @@ def __init__(self, observer: MessageObserver = MessageObserver, temperature=0.2,
             model_factory: Provider identifier (e.g., openai, modelengine)
             display_name: Human-readable display name for monitoring
             timeout_seconds: Request timeout in seconds. If None, uses httpx default.
+            concurrency_limit: Maximum concurrent requests. If None, no limit.
             *args: Additional positional arguments for OpenAIServerModel
             **kwargs: Additional keyword arguments for OpenAIServerModel
         """
@@ -49,6 +51,10 @@ def __init__(self, observer: MessageObserver = MessageObserver, temperature=0.2,
         self.model_factory = (model_factory or "").lower()
         self.display_name = display_name
         self.timeout_seconds = timeout_seconds
+        self.concurrency_limit = concurrency_limit
+        self._semaphore = None
+        if concurrency_limit is not None and concurrency_limit > 0:
+            self._semaphore = asyncio.Semaphore(concurrency_limit)
 
         # Create http_client based on ssl_verify parameter and timeout_seconds
         if not ssl_verify or timeout_seconds is not None:
@@ -304,11 +310,19 @@ async def check_connectivity(self) -> bool:
                 import httpx
                 request_kwargs["timeout"] = httpx.Timeout(self.timeout_seconds)
 
-            # Offload the blocking SDK call to a thread pool to avoid blocking the event loop
-            await asyncio.to_thread(
-                self.client.chat.completions.create,
-                **request_kwargs,
-            )
+            # Use semaphore for concurrency control if configured
+            async def _make_request():
+                # Offload the blocking SDK call to a thread pool to avoid blocking the event loop
+                await asyncio.to_thread(
+                    self.client.chat.completions.create,
+                    **request_kwargs,
+                )
+
+            if self._semaphore is not None:
+                async with self._semaphore:
+                    await _make_request()
+            else:
+                await _make_request()
 
             # If no exception is raised, the connection is successful
             return True

From 07df8e3309d350bf6b308e97ee052fdf02fc7485 Mon Sep 17 00:00:00 2001
From: xuyaqist <xuyaqist@gmail.com>
Date: Thu, 7 May 2026 20:46:04 +0800
Subject: [PATCH 05/25] =?UTF-8?q?=E4=BF=AE=E6=94=B9sql=E8=84=9A=E6=9C=AC?=
 =?UTF-8?q?=E5=90=8D=E7=A7=B0?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 ..._add_concurrency_and_timeout_to_model_record_t.sql} |  0
 ....1.1_0507_add_timeout_seconds_to_model_record_t.sql | 10 ----------
 2 files changed, 10 deletions(-)
 rename docker/sql/{v2.1.1_0507_add_concurrency_limit_to_model_record_t.sql => v2.1.1_0507_add_concurrency_and_timeout_to_model_record_t.sql} (100%)
 delete mode 100644 docker/sql/v2.1.1_0507_add_timeout_seconds_to_model_record_t.sql

diff --git a/docker/sql/v2.1.1_0507_add_concurrency_limit_to_model_record_t.sql b/docker/sql/v2.1.1_0507_add_concurrency_and_timeout_to_model_record_t.sql
similarity index 100%
rename from docker/sql/v2.1.1_0507_add_concurrency_limit_to_model_record_t.sql
rename to docker/sql/v2.1.1_0507_add_concurrency_and_timeout_to_model_record_t.sql
diff --git a/docker/sql/v2.1.1_0507_add_timeout_seconds_to_model_record_t.sql b/docker/sql/v2.1.1_0507_add_timeout_seconds_to_model_record_t.sql
deleted file mode 100644
index 6c0ef24db..000000000
--- a/docker/sql/v2.1.1_0507_add_timeout_seconds_to_model_record_t.sql
+++ /dev/null
@@ -1,10 +0,0 @@
--- Migration: Add timeout_seconds column to model_record_t table
--- Date: 2026-05-07
--- Description: Add timeout_seconds field to control request timeout per model
-
--- Add timeout_seconds column to model_record_t table
-ALTER TABLE nexent.model_record_t
-ADD COLUMN IF NOT EXISTS timeout_seconds INTEGER DEFAULT 120;
-
--- Add comment to the column
-COMMENT ON COLUMN nexent.model_record_t.timeout_seconds IS 'Request timeout in seconds for this model. Default is 120 seconds.';

From 78e2d42ed5179f50b687509c2f8b20db26db545e Mon Sep 17 00:00:00 2001
From: xuyaqist <xuyaqist@gmail.com>
Date: Fri, 8 May 2026 09:21:07 +0800
Subject: [PATCH 06/25] =?UTF-8?q?=E4=BC=98=E5=8C=96=E5=90=8D=E7=A7=B0/?=
 =?UTF-8?q?=E5=8F=98=E9=87=8F=E5=90=8D=E7=A7=B0=E9=87=8D=E5=A4=8D=E6=8F=90?=
 =?UTF-8?q?=E7=A4=BA?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 frontend/public/locales/en/common.json | 4 ++--
 frontend/public/locales/zh/common.json | 4 ++--
 2 files changed, 4 insertions(+), 4 deletions(-)

diff --git a/frontend/public/locales/en/common.json b/frontend/public/locales/en/common.json
index c36cfc259..73c3979a7 100644
--- a/frontend/public/locales/en/common.json
+++ b/frontend/public/locales/en/common.json
@@ -427,8 +427,8 @@
   "subAgentPool.tooltip.exitCreateMode": "Click to exit create mode",
   "subAgentPool.tooltip.exitEditMode": "Click to exit edit mode",
   "subAgentPool.tooltip.editAgent": "Click to edit",
-  "subAgentPool.tooltip.duplicateNameDisabled": "Agent name already exists",
-  "subAgentPool.message.duplicateNameDisabled": "This Agent is disabled due to duplicate name with other Agents. Please change the name to use it",
+  "subAgentPool.tooltip.duplicateNameDisabled": "Agent name (or display name) already exists",
+  "subAgentPool.message.duplicateNameDisabled": "This Agent is disabled due to duplicate name (or display name) with other Agents. Please change the name to use it",
 
   "toolConfig.title.paramConfig": "Parameter Configuration",
   "toolConfig.message.loadError": "Failed to load tool configuration",
diff --git a/frontend/public/locales/zh/common.json b/frontend/public/locales/zh/common.json
index 61ba43dad..e01866faf 100644
--- a/frontend/public/locales/zh/common.json
+++ b/frontend/public/locales/zh/common.json
@@ -429,8 +429,8 @@
   "subAgentPool.tooltip.exitCreateMode": "点击退出创建模式",
   "subAgentPool.tooltip.exitEditMode": "点击退出编辑模式",
   "subAgentPool.tooltip.editAgent": "点击编辑",
-  "subAgentPool.tooltip.duplicateNameDisabled": "该智能体因与其他智能体同名而被禁用，请修改名称后使用",
-  "subAgentPool.message.duplicateNameDisabled": "该智能体因与其他智能体同名而被禁用，请修改名称后使用",
+  "subAgentPool.tooltip.duplicateNameDisabled": "该智能体因与其他智能体名称（或变量名）相同而被禁用，请修改名称后使用",
+  "subAgentPool.message.duplicateNameDisabled": "该智能体因与其他智能体名称（或变量名）相同而被禁用，请修改名称后使用",
 
   "toolConfig.title.paramConfig": "配置参数",
   "toolConfig.message.loadError": "加载工具配置失败",

From 1bc29d5d1eb4c5ae5d6bd4f9b3eb72bc3cbee97d Mon Sep 17 00:00:00 2001
From: xuyaqist <xuyaqist@gmail.com>
Date: Fri, 8 May 2026 16:21:20 +0800
Subject: [PATCH 07/25] Bugfix: when creating an embedding modal,
 embedding_dimension_check lack fallback casuing dimension=0

---
 backend/agents/create_agent_info.py           |   9 +-
 backend/database/model_management_db.py       |   2 +-
 backend/services/model_health_service.py      |  19 ++-
 .../components/model/ModelDeleteDialog.tsx    |  23 +--
 sdk/nexent/core/agents/nexent_agent.py        |   1 +
 .../services/test_model_health_service.py     | 142 ++++++++++++++++--
 6 files changed, 166 insertions(+), 30 deletions(-)

diff --git a/backend/agents/create_agent_info.py b/backend/agents/create_agent_info.py
index 90509c8f5..8a3fbc807 100644
--- a/backend/agents/create_agent_info.py
+++ b/backend/agents/create_agent_info.py
@@ -248,7 +248,8 @@ async def create_model_config_list(tenant_id):
                         url=record["base_url"],
                         ssl_verify=record.get("ssl_verify", True),
                         model_factory=record.get("model_factory"),
-                        timeout_seconds=record.get("timeout_seconds")))
+                        timeout_seconds=record.get("timeout_seconds"),
+                        concurrency_limit=record.get("concurrency_limit")))
     # fit for old version, main_model and sub_model use default model
     main_model_config = tenant_config_manager.get_model_config(
         key=MODEL_CONFIG_MAPPING["llm"], tenant_id=tenant_id)
@@ -260,7 +261,8 @@ async def create_model_config_list(tenant_id):
                     url=main_model_config.get("base_url", ""),
                     ssl_verify=main_model_config.get("ssl_verify", True),
                     model_factory=main_model_config.get("model_factory"),
-                    timeout_seconds=main_model_config.get("timeout_seconds")))
+                    timeout_seconds=main_model_config.get("timeout_seconds"),
+                    concurrency_limit=main_model_config.get("concurrency_limit")))
     model_list.append(
         ModelConfig(cite_name="sub_model",
                     api_key=main_model_config.get("api_key", ""),
@@ -269,7 +271,8 @@ async def create_model_config_list(tenant_id):
                     url=main_model_config.get("base_url", ""),
                     ssl_verify=main_model_config.get("ssl_verify", True),
                     model_factory=main_model_config.get("model_factory"),
-                    timeout_seconds=main_model_config.get("timeout_seconds")))
+                    timeout_seconds=main_model_config.get("timeout_seconds"),
+                    concurrency_limit=main_model_config.get("concurrency_limit")))
 
     return model_list
 
diff --git a/backend/database/model_management_db.py b/backend/database/model_management_db.py
index 7838315b8..d501fd52f 100644
--- a/backend/database/model_management_db.py
+++ b/backend/database/model_management_db.py
@@ -119,7 +119,7 @@ def update_model_record_by_model_name(
         if user_id:
             cleaned_data = add_update_tracking(cleaned_data, user_id)
 
-        db_logger.info(f"update_model_record_by_model_name: model_name={model_name}, model_repo={model_repo}, tenant_id={tenant_id}, cleaned_data={cleaned_data}")
+        db_logger.debug(f"update_model_record_by_model_name: model_name={model_name}, model_repo={model_repo}, tenant_id={tenant_id}, cleaned_data={cleaned_data}")
 
         # Build conditions list
         conditions = [
diff --git a/backend/services/model_health_service.py b/backend/services/model_health_service.py
index dbaf25568..067aca1db 100644
--- a/backend/services/model_health_service.py
+++ b/backend/services/model_health_service.py
@@ -29,6 +29,7 @@ async def _embedding_dimension_check(
     model_base_url: str,
     model_api_key: str,
     ssl_verify: bool = True,
+    timeout_seconds: Optional[float] = None,
 ):
     # Test connectivity based on different model types
     if model_type == "embedding":
@@ -38,6 +39,7 @@ async def _embedding_dimension_check(
             api_key=model_api_key,
             embedding_dim=0,
             ssl_verify=ssl_verify,
+            timeout_seconds=timeout_seconds,
         ).dimension_check()
         if len(embedding) > 0:
             return len(embedding[0])
@@ -51,6 +53,7 @@ async def _embedding_dimension_check(
             api_key=model_api_key,
             embedding_dim=0,
             ssl_verify=ssl_verify,
+            timeout_seconds=timeout_seconds,
         ).dimension_check()
         if len(embedding) > 0:
             return len(embedding[0])
@@ -99,7 +102,8 @@ async def _perform_connectivity_check(
             base_url=model_base_url,
             api_key=model_api_key,
             embedding_dim=0,
-            ssl_verify=ssl_verify
+            ssl_verify=ssl_verify,
+            timeout_seconds=timeout_seconds,
         ).dimension_check()) > 0
     elif model_type == "multi_embedding":
         connectivity = len(await JinaEmbedding(
@@ -107,7 +111,8 @@ async def _perform_connectivity_check(
             base_url=model_base_url,
             api_key=model_api_key,
             embedding_dim=0,
-            ssl_verify=ssl_verify
+            ssl_verify=ssl_verify,
+            timeout_seconds=timeout_seconds,
         ).dimension_check()) > 0
     elif model_type == "llm":
         observer = MessageObserver()
@@ -317,9 +322,17 @@ async def embedding_dimension_check(model_config: dict):
 
     try:
         ssl_verify = model_config.get("ssl_verify", True)
+        timeout_seconds = model_config.get("timeout_seconds")
         dimension = await _embedding_dimension_check(
-            model_name, model_type, model_base_url, model_api_key, ssl_verify
+            model_name, model_type, model_base_url, model_api_key, ssl_verify,
+            timeout_seconds=timeout_seconds
         )
+        # Fallback to ssl_verify=False if initial check fails
+        if dimension == 0 and ssl_verify:
+            dimension = await _embedding_dimension_check(
+                model_name, model_type, model_base_url, model_api_key, False,
+                timeout_seconds=timeout_seconds
+            )
         return dimension
     except ValueError as e:
         logger.error(f"Error checking embedding dimension: {str(e)}")
diff --git a/frontend/app/[locale]/models/components/model/ModelDeleteDialog.tsx b/frontend/app/[locale]/models/components/model/ModelDeleteDialog.tsx
index 0074a9bb5..894f50907 100644
--- a/frontend/app/[locale]/models/components/model/ModelDeleteDialog.tsx
+++ b/frontend/app/[locale]/models/components/model/ModelDeleteDialog.tsx
@@ -1539,16 +1539,20 @@ export const ModelDeleteDialog = ({
           if (!selectedSingleModel) return;
           try {
             const modelName = selectedSingleModel.model_name || selectedSingleModel.id;
+
+            const updatePayload: any = {
+              model_id: modelName,
+              maxTokens: config.maxTokens,
+              timeoutSeconds: config.timeoutSeconds,
+              concurrencyLimit: config.concurrencyLimit,
+            };
+
+            if (config.apiKey) {
+              updatePayload.apiKey = config.apiKey;
+            }
+
             await modelService.updateBatchModel(
-              [
-                {
-                  model_id: modelName,
-                  apiKey: config.apiKey,
-                  maxTokens: config.maxTokens,
-                  timeoutSeconds: config.timeoutSeconds,
-                  concurrencyLimit: config.concurrencyLimit,
-                },
-              ],
+              [updatePayload],
               selectedSingleModel.model_factory
             );
 
@@ -1558,7 +1562,6 @@ export const ModelDeleteDialog = ({
                 model.id === selectedSingleModel.id
                   ? {
                       ...model,
-                      api_key: config.apiKey,
                       max_tokens: config.maxTokens,
                       timeout_seconds: config.timeoutSeconds,
                       concurrency_limit: config.concurrencyLimit,
diff --git a/sdk/nexent/core/agents/nexent_agent.py b/sdk/nexent/core/agents/nexent_agent.py
index 9209e6fd6..656c353bc 100644
--- a/sdk/nexent/core/agents/nexent_agent.py
+++ b/sdk/nexent/core/agents/nexent_agent.py
@@ -60,6 +60,7 @@ def create_model(self, model_cite_name: str):
             model_factory=model_config.model_factory,
             display_name=model_config.cite_name,
             timeout_seconds=model_config.timeout_seconds,
+            concurrency_limit=model_config.concurrency_limit,
         )
         model.stop_event = self.stop_event
         return model
diff --git a/test/backend/services/test_model_health_service.py b/test/backend/services/test_model_health_service.py
index f5de78c08..4cb527603 100644
--- a/test/backend/services/test_model_health_service.py
+++ b/test/backend/services/test_model_health_service.py
@@ -168,7 +168,8 @@ async def test_perform_connectivity_check_embedding():
             base_url="https://api.openai.com",
             api_key="test-key",
             embedding_dim=0,
-            ssl_verify=True
+            ssl_verify=True,
+            timeout_seconds=None,
         )
         mock_embedding_instance.dimension_check.assert_called_once()
 
@@ -197,7 +198,8 @@ async def test_perform_connectivity_check_multi_embedding():
             base_url="https://api.jina.ai",
             api_key="test-key",
             embedding_dim=0,
-            ssl_verify=True
+            ssl_verify=True,
+            timeout_seconds=None,
         )
         mock_embedding_instance.dimension_check.assert_called_once()
 
@@ -230,7 +232,8 @@ async def test_perform_connectivity_check_llm():
             model_id="gpt-4",
             api_base="https://api.openai.com",
             api_key="test-key",
-            ssl_verify=True
+            ssl_verify=True,
+            timeout_seconds=None,
         )
         mock_model_instance.check_connectivity.assert_called_once()
 
@@ -356,7 +359,8 @@ async def test_perform_connectivity_check_base_url_normalization_localhost():
             model_id="gpt-4",
             api_base="http://host.docker.internal:8080",
             api_key="test-key",
-            ssl_verify=True
+            ssl_verify=True,
+            timeout_seconds=None,
         )
 
 
@@ -389,7 +393,8 @@ async def test_perform_connectivity_check_base_url_normalization_127001():
             model_id="gpt-4",
             api_base="http://host.docker.internal:8000",
             api_key="test-key",
-            ssl_verify=True
+            ssl_verify=True,
+            timeout_seconds=None,
         )
 
 
@@ -444,7 +449,8 @@ async def test_check_model_connectivity_success():
         mock_connectivity_check.assert_called_once_with(
             "openai/gpt-4", "llm", "https://api.openai.com", "test-key", True,
             None, None, None,
-            display_name="GPT-4"
+            display_name="GPT-4",
+            timeout_seconds=None,
         )
 
 
@@ -477,7 +483,8 @@ async def test_check_model_connectivity_failure():
             "model_name": "gpt-4",
             "model_type": "llm",
             "base_url": "https://api.openai.com",
-            "api_key": "test-key"
+            "api_key": "test-key",
+            "ssl_verify": False,  # Explicitly set to False to avoid fallback
         }
         mock_connectivity_check.return_value = False
 
@@ -570,7 +577,8 @@ async def test_verify_model_config_connectivity_success():
 
         mock_connectivity_check.assert_called_once_with(
             "gpt-4", "llm", "https://api.openai.com", "test-key", True,
-            None, None, None
+            None, None, None, "GPT-4"
+            timeout_seconds=None,
         )
 
 
@@ -674,7 +682,8 @@ async def test_embedding_dimension_check_embedding_success():
             base_url="http://test.com",
             api_key="test-key",
             embedding_dim=0,
-            ssl_verify=True
+            ssl_verify=True,
+            timeout_seconds=None,
         )
 
 
@@ -695,7 +704,8 @@ async def test_embedding_dimension_check_multi_embedding_success():
             base_url="http://test.com",
             api_key="test-key",
             embedding_dim=0,
-            ssl_verify=True
+            ssl_verify=True,
+            timeout_seconds=None,
         )
 
 
@@ -738,7 +748,7 @@ async def test_embedding_dimension_check_wrapper_success():
         assert dimension == 1536
         mock_get_name.assert_called_once_with(model_config)
         mock_internal_check.assert_called_once_with(
-            "openai/text-embedding-ada-002", "embedding", "https://api.openai.com", "test-key", True
+            "openai/text-embedding-ada-002", "embedding", "https://api.openai.com", "test-key", True, timeout_seconds=None
         )
 
 
@@ -782,7 +792,8 @@ async def test_embedding_dimension_check_multi_embedding_empty_response():
             base_url="http://test.com",
             api_key="test-key",
             embedding_dim=0,
-            ssl_verify=True
+            ssl_verify=True,
+            timeout_seconds=None,
         )
         # Verify warning was logged
         mock_logging.warning.assert_called_once_with(
@@ -811,7 +822,7 @@ async def test_embedding_dimension_check_wrapper_value_error():
         assert dimension == 0
         mock_get_name.assert_called_once_with(model_config)
         mock_internal_check.assert_called_once_with(
-            "test-model", "unsupported", "https://api.test.com", "test-key", True
+            "test-model", "unsupported", "https://api.test.com", "test-key", True, timeout_seconds=None
         )
         # Verify error was logged with the specific ValueError message
         mock_logger.error.assert_called_once_with(
@@ -819,6 +830,111 @@ async def test_embedding_dimension_check_wrapper_value_error():
         )
 
 
+@pytest.mark.asyncio
+async def test_embedding_dimension_check_ssl_verify_fallback():
+    """Test that embedding_dimension_check falls back to ssl_verify=False when first check returns 0"""
+    with mock.patch("backend.services.model_health_service._embedding_dimension_check") as mock_internal_check, \
+            mock.patch("backend.services.model_health_service.get_model_name_from_config") as mock_get_name:
+        mock_internal_check.side_effect = [0, 1536]  # First call returns 0, second returns valid dimension
+        mock_get_name.return_value = "openai/text-embedding-ada-002"
+        model_config = {
+            "model_repo": "openai",
+            "model_name": "text-embedding-ada-002",
+            "model_type": "embedding",
+            "base_url": "https://api.openai.com",
+            "api_key": "test-key",
+            "ssl_verify": True,
+        }
+        dimension = await embedding_dimension_check(model_config)
+
+        assert dimension == 1536
+        mock_get_name.assert_called_once_with(model_config)
+        # Should call twice: first with ssl_verify=True, then with ssl_verify=False
+        assert mock_internal_check.call_count == 2
+        mock_internal_check.assert_any_call(
+            "openai/text-embedding-ada-002", "embedding", "https://api.openai.com", "test-key", True, timeout_seconds=None
+        )
+        mock_internal_check.assert_any_call(
+            "openai/text-embedding-ada-002", "embedding", "https://api.openai.com", "test-key", False, timeout_seconds=None
+        )
+
+
+@pytest.mark.asyncio
+async def test_embedding_dimension_check_ssl_verify_fallback_with_timeout():
+    """Test that embedding_dimension_check passes timeout_seconds to fallback check"""
+    with mock.patch("backend.services.model_health_service._embedding_dimension_check") as mock_internal_check, \
+            mock.patch("backend.services.model_health_service.get_model_name_from_config") as mock_get_name:
+        mock_internal_check.side_effect = [0, 768]  # First call fails, second returns valid dimension
+        mock_get_name.return_value = "jina/jina-embeddings-v2-base-en"
+        model_config = {
+            "model_repo": "jina",
+            "model_name": "jina-embeddings-v2-base-en",
+            "model_type": "embedding",
+            "base_url": "https://api.jina.ai",
+            "api_key": "test-key",
+            "ssl_verify": True,
+            "timeout_seconds": 30.0,
+        }
+        dimension = await embedding_dimension_check(model_config)
+
+        assert dimension == 768
+        # Should call twice with timeout_seconds passed to both
+        assert mock_internal_check.call_count == 2
+        mock_internal_check.assert_any_call(
+            "jina/jina-embeddings-v2-base-en", "embedding", "https://api.jina.ai", "test-key", True, timeout_seconds=30.0
+        )
+        mock_internal_check.assert_any_call(
+            "jina/jina-embeddings-v2-base-en", "embedding", "https://api.jina.ai", "test-key", False, timeout_seconds=30.0
+        )
+
+
+@pytest.mark.asyncio
+async def test_embedding_dimension_check_no_fallback_when_ssl_verify_false():
+    """Test that no fallback occurs when ssl_verify is already False"""
+    with mock.patch("backend.services.model_health_service._embedding_dimension_check") as mock_internal_check, \
+            mock.patch("backend.services.model_health_service.get_model_name_from_config") as mock_get_name:
+        mock_internal_check.return_value = 1024  # Returns valid dimension directly
+        mock_get_name.return_value = "local/embedding-model"
+        model_config = {
+            "model_repo": "local",
+            "model_name": "embedding-model",
+            "model_type": "embedding",
+            "base_url": "http://localhost:8080",
+            "api_key": "",
+            "ssl_verify": False,
+        }
+        dimension = await embedding_dimension_check(model_config)
+
+        assert dimension == 1024
+        # Should only call once since ssl_verify is already False
+        assert mock_internal_check.call_count == 1
+        mock_internal_check.assert_called_once_with(
+            "local/embedding-model", "embedding", "http://localhost:8080", "", False, timeout_seconds=None
+        )
+
+
+@pytest.mark.asyncio
+async def test_embedding_dimension_check_fallback_still_fails():
+    """Test that dimension returns 0 when both ssl_verify=True and ssl_verify=False fail"""
+    with mock.patch("backend.services.model_health_service._embedding_dimension_check") as mock_internal_check, \
+            mock.patch("backend.services.model_health_service.get_model_name_from_config") as mock_get_name:
+        mock_internal_check.return_value = 0  # Both calls return 0
+        mock_get_name.return_value = "unreachable/embedding-model"
+        model_config = {
+            "model_repo": "unreachable",
+            "model_name": "embedding-model",
+            "model_type": "embedding",
+            "base_url": "https://unreachable.example.com",
+            "api_key": "test-key",
+            "ssl_verify": True,
+        }
+        dimension = await embedding_dimension_check(model_config)
+
+        assert dimension == 0
+        # Should call twice (fallback) but still return 0
+        assert mock_internal_check.call_count == 2
+
+
 @pytest.mark.asyncio
 async def test_perform_connectivity_check_llm_sets_monitoring_operation():
     with mock.patch("backend.services.model_health_service.MessageObserver") as mock_observer, \

From d409a0dfe030586c0ab1e75d7e993c7d5eefbbcc Mon Sep 17 00:00:00 2001
From: xuyaqist <xuyaqist@gmail.com>
Date: Fri, 8 May 2026 16:33:38 +0800
Subject: [PATCH 08/25] Bugfix: fix the published agent version need at least
 one tool

---
 backend/services/agent_version_service.py           | 7 ++-----
 test/backend/services/test_agent_version_service.py | 7 ++++---
 2 files changed, 6 insertions(+), 8 deletions(-)

diff --git a/backend/services/agent_version_service.py b/backend/services/agent_version_service.py
index 69163dbc6..24bdfccfa 100644
--- a/backend/services/agent_version_service.py
+++ b/backend/services/agent_version_service.py
@@ -344,11 +344,8 @@ def _check_version_snapshot_availability(
     if model_id is None or model_id == 0:
         unavailable_reasons.append("model_not_configured")
 
-    # Check tools availability
-    if not tool_instances:
-        unavailable_reasons.append("no_tools")
-    else:
-        # Check if at least one tool is enabled
+    # Check tools availability (only when tools are configured)
+    if tool_instances:
         has_enabled_tool = any(t.get('enabled', True) for t in tool_instances)
         if not has_enabled_tool:
             unavailable_reasons.append("all_tools_disabled")
diff --git a/test/backend/services/test_agent_version_service.py b/test/backend/services/test_agent_version_service.py
index 4d0123f14..e4ecf5c23 100644
--- a/test/backend/services/test_agent_version_service.py
+++ b/test/backend/services/test_agent_version_service.py
@@ -1142,7 +1142,7 @@ def test_check_version_snapshot_availability_model_id_zero():
 
 
 def test_check_version_snapshot_availability_no_tools():
-    """Test checking availability when no tools exist"""
+    """Test checking availability when no tools exist (should be available)"""
     agent_info = {"model_id": 1}
 
     is_available, reasons = _check_version_snapshot_availability(
@@ -1152,8 +1152,9 @@ def test_check_version_snapshot_availability_no_tools():
         tool_instances=[],
     )
 
-    assert is_available is False
-    assert "no_tools" in reasons
+    # Having no tools configured is valid - availability should not be affected
+    assert is_available is True
+    assert "no_tools" not in reasons
 
 
 def test_check_version_snapshot_availability_all_tools_disabled():

From b564ec5a2c6d083e017c303e4c17deb5c80aae50 Mon Sep 17 00:00:00 2001
From: xuyaqist <xuyaqist@gmail.com>
Date: Sat, 9 May 2026 09:33:09 +0800
Subject: [PATCH 09/25] Bugfix: unify agent unavaliable reason

---
 backend/consts/agent_unavailable_reasons.py   | 43 +++++++++++++++++++
 backend/services/agent_service.py             | 11 ++---
 backend/services/agent_version_service.py     |  7 +--
 .../components/agentManage/AgentList.tsx      | 15 ++-----
 .../chat/components/chatAgentSelector.tsx     |  7 ++-
 .../components/resources/AgentList.tsx        | 18 +-------
 frontend/lib/agentLabelMapper.ts              | 40 +++++++++++++++++
 frontend/public/locales/en/common.json        |  3 ++
 frontend/public/locales/zh/common.json        |  3 ++
 9 files changed, 110 insertions(+), 37 deletions(-)
 create mode 100644 backend/consts/agent_unavailable_reasons.py

diff --git a/backend/consts/agent_unavailable_reasons.py b/backend/consts/agent_unavailable_reasons.py
new file mode 100644
index 000000000..4e710ee7d
--- /dev/null
+++ b/backend/consts/agent_unavailable_reasons.py
@@ -0,0 +1,43 @@
+"""
+Agent Unavailable Reason Constants
+
+Centralized definition of all possible reasons why an agent may be unavailable.
+These values are returned to the frontend via the 'unavailable_reasons' field.
+"""
+
+
+class AgentUnavailableReason:
+    """Reason codes for agent unavailability."""
+
+    # Identity conflicts
+    DUPLICATE_NAME = "duplicate_name"
+    DUPLICATE_DISPLAY_NAME = "duplicate_display_name"
+
+    # Model issues
+    MODEL_NOT_CONFIGURED = "model_not_configured"
+    MODEL_UNAVAILABLE = "model_unavailable"
+
+    # Tool issues
+    TOOL_UNAVAILABLE = "tool_unavailable"
+    ALL_TOOLS_DISABLED = "all_tools_disabled"
+
+    # Agent issues
+    AGENT_NOT_FOUND = "agent_not_found"
+
+    @classmethod
+    def all_reasons(cls) -> list[str]:
+        """Return all defined unavailable reason codes."""
+        return [
+            cls.DUPLICATE_NAME,
+            cls.DUPLICATE_DISPLAY_NAME,
+            cls.MODEL_NOT_CONFIGURED,
+            cls.MODEL_UNAVAILABLE,
+            cls.TOOL_UNAVAILABLE,
+            cls.ALL_TOOLS_DISABLED,
+            cls.AGENT_NOT_FOUND,
+        ]
+
+    @classmethod
+    def is_valid_reason(cls, reason: str) -> bool:
+        """Check if a reason string is a valid reason code."""
+        return reason in cls.all_reasons()
diff --git a/backend/services/agent_service.py b/backend/services/agent_service.py
index 02fa7d8c6..ae0274f34 100644
--- a/backend/services/agent_service.py
+++ b/backend/services/agent_service.py
@@ -19,6 +19,7 @@
 from consts.const import MEMORY_SEARCH_START_MSG, MEMORY_SEARCH_DONE_MSG, MEMORY_SEARCH_FAIL_MSG, TOOL_TYPE_MAPPING, \
     LANGUAGE, MESSAGE_ROLE, MODEL_CONFIG_MAPPING, CAN_EDIT_ALL_USER_ROLES, PERMISSION_EDIT, PERMISSION_READ, PERMISSION_PRIVATE
 from consts.exceptions import MemoryPreparationException
+from consts.agent_unavailable_reasons import AgentUnavailableReason
 from consts.model import (
     AgentInfoRequest,
     AgentRequest,
@@ -1533,8 +1534,8 @@ def _mark_duplicates(groups: dict[str, list[dict]], reason_key: str) -> None:
             for duplicate_entry in sorted_entries[1:]:
                 duplicate_entry["unavailable_reasons"].append(reason_key)
 
-    _mark_duplicates(name_groups, "duplicate_name")
-    _mark_duplicates(display_name_groups, "duplicate_display_name")
+    _mark_duplicates(name_groups, AgentUnavailableReason.DUPLICATE_NAME)
+    _mark_duplicates(display_name_groups, AgentUnavailableReason.DUPLICATE_DISPLAY_NAME)
 
 
 def _collect_model_availability_reasons(agent: dict, tenant_id: str, model_cache: Dict[int, Optional[dict]]) -> list[str]:
@@ -1546,7 +1547,7 @@ def _collect_model_availability_reasons(agent: dict, tenant_id: str, model_cache
         model_id=agent.get("model_id"),
         tenant_id=tenant_id,
         model_cache=model_cache,
-        reason_key="model_unavailable"
+        reason_key=AgentUnavailableReason.MODEL_UNAVAILABLE
     ))
 
     return reasons
@@ -1604,7 +1605,7 @@ def check_agent_availability(
         agent_info = search_agent_info_by_agent_id(agent_id, tenant_id)
 
     if not agent_info:
-        return False, ["agent_not_found"]
+        return False, [AgentUnavailableReason.AGENT_NOT_FOUND]
 
     # Check tool availability
     tool_info = search_tools_for_sub_agent(agent_id=agent_id, tenant_id=tenant_id)
@@ -1612,7 +1613,7 @@ def check_agent_availability(
     if tool_id_list:
         tool_statuses = check_tool_is_available(tool_id_list)
         if not all(tool_statuses):
-            unavailable_reasons.append("tool_unavailable")
+            unavailable_reasons.append(AgentUnavailableReason.TOOL_UNAVAILABLE)
 
     # Check model availability
     model_reasons = _collect_model_availability_reasons(
diff --git a/backend/services/agent_version_service.py b/backend/services/agent_version_service.py
index 24bdfccfa..397361059 100644
--- a/backend/services/agent_version_service.py
+++ b/backend/services/agent_version_service.py
@@ -33,6 +33,7 @@
 )
 from database.model_management_db import get_model_by_model_id
 from utils.str_utils import convert_string_to_list
+from consts.agent_unavailable_reasons import AgentUnavailableReason
 
 logger = logging.getLogger("agent_version_service")
 
@@ -337,18 +338,18 @@ def _check_version_snapshot_availability(
 
     # Check if agent info exists
     if not agent_info:
-        return False, ["agent_not_found"]
+        return False, [AgentUnavailableReason.AGENT_NOT_FOUND]
 
     # Check model availability
     model_id = agent_info.get('model_id')
     if model_id is None or model_id == 0:
-        unavailable_reasons.append("model_not_configured")
+        unavailable_reasons.append(AgentUnavailableReason.MODEL_NOT_CONFIGURED)
 
     # Check tools availability (only when tools are configured)
     if tool_instances:
         has_enabled_tool = any(t.get('enabled', True) for t in tool_instances)
         if not has_enabled_tool:
-            unavailable_reasons.append("all_tools_disabled")
+            unavailable_reasons.append(AgentUnavailableReason.ALL_TOOLS_DISABLED)
 
     return len(unavailable_reasons) == 0, unavailable_reasons
 
diff --git a/frontend/app/[locale]/agents/components/agentManage/AgentList.tsx b/frontend/app/[locale]/agents/components/agentManage/AgentList.tsx
index edfeff559..4a4046c9b 100644
--- a/frontend/app/[locale]/agents/components/agentManage/AgentList.tsx
+++ b/frontend/app/[locale]/agents/components/agentManage/AgentList.tsx
@@ -24,6 +24,7 @@ import { clearAgentNewMark } from "@/services/agentConfigService";
 import { a2aClientService } from "@/services/a2aService";
 import A2AServerSettingsPanel from "../a2a/A2AServerSettingsPanel";
 import log from "@/lib/logger";
+import { getUnavailableReasonLabels } from "@/lib/agentLabelMapper";
 
 interface AgentListProps {
   agentList: Agent[];
@@ -429,18 +430,8 @@ export default function AgentList({
                             <Tooltip
                               title={(() => {
                                 const reasons = agent.unavailable_reasons || [];
-                                if (reasons.includes('agent_not_found')) {
-                                  return t('subAgentPool.tooltip.unavailableAgent');
-                                } else if (reasons.includes('tool_unavailable')) {
-                                  return t('toolPool.tooltip.unavailableTool');
-                                } else if (reasons.includes('duplicate_name')) {
-                                  return t('agent.error.nameExists', { name });
-                                } else if (reasons.includes('duplicate_display_name')) {
-                                  return t('agent.error.displayNameExists', { displayName });
-                                } else if (reasons.includes('model_unavailable')) {
-                                  return t('agent.error.modelUnavailable');
-                                }
-                                return t('subAgentPool.tooltip.unavailableAgent'); // fallback
+                                const labels = getUnavailableReasonLabels(reasons, t);
+                                return labels.join(", ") || t('subAgentPool.tooltip.unavailableAgent');
                               })()}
                             >
                               <ExclamationCircleOutlined className="text-amber-500 text-sm flex-shrink-0 cursor-pointer" />
diff --git a/frontend/app/[locale]/chat/components/chatAgentSelector.tsx b/frontend/app/[locale]/chat/components/chatAgentSelector.tsx
index b67aa491e..f7a540172 100644
--- a/frontend/app/[locale]/chat/components/chatAgentSelector.tsx
+++ b/frontend/app/[locale]/chat/components/chatAgentSelector.tsx
@@ -11,6 +11,7 @@ import { ChatAgentSelectorProps } from "@/types/chat";
 import { Agent } from "@/types/agentConfig";
 import { clearAgentNewMark } from "@/services/agentConfigService";
 import { usePublishedAgentList } from "@/hooks/agent/usePublishedAgentList";
+import { getUnavailableReasonLabels } from "@/lib/agentLabelMapper";
 
 export function ChatAgentSelector({
   selectedAgentId,
@@ -355,7 +356,11 @@ export function ChatAgentSelector({
                       if (isDuplicateDisabled) {
                         unavailableReason = t("subAgentPool.tooltip.duplicateNameDisabled");
                       } else if (!isAvailableTool) {
-                        unavailableReason = t("subAgentPool.tooltip.hasUnavailableTools");
+                        const reasons = agent.unavailable_reasons || [];
+                        const labels = getUnavailableReasonLabels(reasons, t);
+                        unavailableReason = labels.length > 0
+                          ? labels.join(", ")
+                          : t("agentSelector.agentUnavailable");
                       }
                     }
 
diff --git a/frontend/app/[locale]/tenant-resources/components/resources/AgentList.tsx b/frontend/app/[locale]/tenant-resources/components/resources/AgentList.tsx
index f6b52aa19..41fbf4c93 100644
--- a/frontend/app/[locale]/tenant-resources/components/resources/AgentList.tsx
+++ b/frontend/app/[locale]/tenant-resources/components/resources/AgentList.tsx
@@ -33,6 +33,7 @@ import { fetchAgentVersionList } from "@/services/agentVersionService";
 import { Agent } from "@/types/agentConfig";
 import ExpandEditModal from "@/app/agents/components/agentInfo/ExpandEditModal";
 import type { AgentVersion } from "@/services/agentVersionService";
+import { getUnavailableReasonLabels } from "@/lib/agentLabelMapper";
 
 const { Text } = Typography;
 const { TextArea } = Input;
@@ -62,21 +63,6 @@ export default function AgentList({ tenantId }: { tenantId: string | null }) {
   const [form] = Form.useForm();
   const queryClient = useQueryClient();
 
-  const getUnavailableReasonLabel = (reason: string) => {
-    switch (reason) {
-      case "duplicate_name":
-        return t("agent.unavailableReasons.duplicate_name");
-      case "duplicate_display_name":
-        return t("agent.unavailableReasons.duplicate_display_name");
-      case "tool_unavailable":
-        return t("agent.unavailableReasons.tool_unavailable");
-      case "model_unavailable":
-        return t("agent.unavailableReasons.model_unavailable");
-      default:
-        return reason;
-    }
-  };
-
   // View modal state
   const [editModalVisible, setEditModalVisible] = useState(false);
   const [editingAgent, setEditingAgent] = useState<AgentListRow | null>(null);
@@ -357,7 +343,7 @@ export default function AgentList({ tenantId }: { tenantId: string | null }) {
         const reasons = Array.isArray(record.unavailable_reasons)
           ? record.unavailable_reasons.filter((r) => Boolean(r))
           : [];
-        const reasonLabels = reasons.map((r) => getUnavailableReasonLabel(String(r)));
+        const reasonLabels = getUnavailableReasonLabels(reasons, t);
 
         return (
           <div className="flex items-center gap-2 min-w-0">
diff --git a/frontend/lib/agentLabelMapper.ts b/frontend/lib/agentLabelMapper.ts
index a95e9df08..ff49658e2 100644
--- a/frontend/lib/agentLabelMapper.ts
+++ b/frontend/lib/agentLabelMapper.ts
@@ -6,6 +6,46 @@
 
 import { TFunction } from "i18next";
 
+/**
+ * Mapping of unavailable reason keys to i18n translation keys
+ */
+export const UNAVAILABLE_REASON_I18N_MAP: Record<string, string> = {
+  duplicate_name: "agent.unavailableReasons.duplicate_name",
+  duplicate_display_name: "agent.unavailableReasons.duplicate_display_name",
+  tool_unavailable: "agent.unavailableReasons.tool_unavailable",
+  model_unavailable: "agent.unavailableReasons.model_unavailable",
+  all_tools_disabled: "agent.unavailableReasons.all_tools_disabled",
+  model_not_configured: "agent.unavailableReasons.model_not_configured",
+  agent_not_found: "agent.unavailableReasons.agent_not_found",
+};
+
+/**
+ * Get localized label for an unavailable reason
+ * @param reason - The unavailable reason key from backend
+ * @param t - Translation function from i18next
+ * @returns Localized reason label
+ */
+export function getUnavailableReasonLabel(reason: string, t: TFunction): string {
+  const i18nKey = UNAVAILABLE_REASON_I18N_MAP[reason];
+  if (i18nKey) {
+    return t(i18nKey);
+  }
+  return reason;
+}
+
+/**
+ * Get localized labels for multiple unavailable reasons
+ * @param reasons - Array of unavailable reason keys
+ * @param t - Translation function from i18next
+ * @returns Array of localized reason labels
+ */
+export function getUnavailableReasonLabels(
+  reasons: string[],
+  t: TFunction
+): string[] {
+  return (reasons || []).map((r) => getUnavailableReasonLabel(r, t));
+}
+
 /**
  * Map tool source to localized label
  * @param source - Tool source (local, mcp, langchain, etc.)
diff --git a/frontend/public/locales/en/common.json b/frontend/public/locales/en/common.json
index 73c3979a7..29659b7a6 100644
--- a/frontend/public/locales/en/common.json
+++ b/frontend/public/locales/en/common.json
@@ -341,6 +341,9 @@
   "agent.unavailableReasons.duplicate_display_name": "Duplicate Agent Name",
   "agent.unavailableReasons.tool_unavailable": "Tool Unavailable",
   "agent.unavailableReasons.model_unavailable": "Model Unavailable",
+  "agent.unavailableReasons.all_tools_disabled": "All Tools Disabled",
+  "agent.unavailableReasons.model_not_configured": "Model Not Configured",
+  "agent.unavailableReasons.agent_not_found": "Agent Not Found",
   "agent.detailContent.title": "Agent Detail Content",
   "agent.generating.title": "Generating Agent",
   "agent.generating.subtitle": "Please wait, the system is generating intelligent agent for you...",
diff --git a/frontend/public/locales/zh/common.json b/frontend/public/locales/zh/common.json
index e01866faf..6c977a816 100644
--- a/frontend/public/locales/zh/common.json
+++ b/frontend/public/locales/zh/common.json
@@ -342,6 +342,9 @@
   "agent.unavailableReasons.duplicate_display_name": "智能体名称重复",
   "agent.unavailableReasons.tool_unavailable": "工具不可用",
   "agent.unavailableReasons.model_unavailable": "模型不可用",
+  "agent.unavailableReasons.all_tools_disabled": "所有工具均已禁用",
+  "agent.unavailableReasons.model_not_configured": "模型未配置",
+  "agent.unavailableReasons.agent_not_found": "智能体不存在",
   "agent.descriptionPlaceholder": "请输入智能体描述",
   "agent.detailContent.title": "智能体详细内容",
   "agent.generating.title": "正在生成智能体",

From 4f04d7748002b6a3eeb54ed4b178109ce0773371 Mon Sep 17 00:00:00 2001
From: xuyaqist <xuyaqist@gmail.com>
Date: Sat, 9 May 2026 14:53:58 +0800
Subject: [PATCH 10/25] Bugfix: use STARTTLS (TLS upgrade) when using port 587
 to send email

---
 backend/services/model_health_service.py | 13 ++++---------
 frontend/services/modelService.ts        |  2 +-
 sdk/nexent/core/tools/send_email_tool.py | 19 +++++++++++--------
 3 files changed, 16 insertions(+), 18 deletions(-)

diff --git a/backend/services/model_health_service.py b/backend/services/model_health_service.py
index 067aca1db..e22f6c642 100644
--- a/backend/services/model_health_service.py
+++ b/backend/services/model_health_service.py
@@ -209,16 +209,13 @@ async def check_model_connectivity(display_name: str, tenant_id: str) -> dict:
             ssl_verify_fallback = False
             connectivity = await _perform_connectivity_check(
                 model_name, model_type, model_base_url, model_api_key, ssl_verify,
-                model_factory, model_appid, access_token,display_name=display_name,
-                display_name=display_name,
-                timeout_seconds=timeout_seconds,
+                model_factory, model_appid, access_token, display_name, timeout_seconds,
             )
             if not connectivity and ssl_verify:
                 ssl_verify_fallback = True
                 connectivity = await _perform_connectivity_check(
                     model_name, model_type, model_base_url, model_api_key, False,
-                    display_name=display_name,
-                    timeout_seconds=timeout_seconds,
+                    model_factory, model_appid, access_token, display_name, timeout_seconds,
                 )
         except Exception as e:
             update_data = {
@@ -273,14 +270,12 @@ async def verify_model_config_connectivity(model_config: dict):
         try:
             connectivity = await _perform_connectivity_check(
                 model_name, model_type, model_base_url, model_api_key, ssl_verify,
-                model_factory, model_appid, access_token
-                timeout_seconds=timeout_seconds,
+                model_factory, model_appid, access_token, None, timeout_seconds,
             )
             if not connectivity and ssl_verify:
                 connectivity = await _perform_connectivity_check(
                     model_name, model_type, model_base_url, model_api_key, False,
-                    model_factory, model_appid, access_token
-                    timeout_seconds=timeout_seconds,
+                    model_factory, model_appid, access_token, None, timeout_seconds,
                 )
             if not connectivity:
                 error_msg = f"Failed to connect to model '{model_name}' at {model_base_url}. Please verify the URL, API key, and network connection."
diff --git a/frontend/services/modelService.ts b/frontend/services/modelService.ts
index 7df855fd4..3538b34f4 100644
--- a/frontend/services/modelService.ts
+++ b/frontend/services/modelService.ts
@@ -361,7 +361,7 @@ export const modelService = {
               : {}),
             ...(model.concurrencyLimit !== undefined
               ? { concurrency_limit: model.concurrencyLimit }
-              : {}),
+              : {})
           }),
         }
       );
diff --git a/sdk/nexent/core/tools/send_email_tool.py b/sdk/nexent/core/tools/send_email_tool.py
index cc3cfaab5..2451020ea 100644
--- a/sdk/nexent/core/tools/send_email_tool.py
+++ b/sdk/nexent/core/tools/send_email_tool.py
@@ -115,14 +115,17 @@ def forward(self, to: str, subject: str, content: str, cc: str = "", bcc: str =
 
             logger.info(f"Connecting to SMTP server {self.smtp_server}:{self.smtp_port}...")
 
-            # Create SSL context
-            context = ssl.create_default_context()
-            context.check_hostname = True
-            context.verify_mode = ssl.CERT_REQUIRED
-
-            # Connect to SMTP server using SSL
-            logger.info("Using SSL connection...")
-            server = smtplib.SMTP_SSL(self.smtp_server, self.smtp_port, context=context, timeout=self.timeout)
+            # Connect to SMTP server
+            if self.smtp_port == 465:
+                # Port 465 uses implicit SSL
+                logger.info("Using implicit SSL connection (port 465)...")
+                context = ssl.create_default_context()
+                server = smtplib.SMTP_SSL(self.smtp_server, self.smtp_port, context=context, timeout=self.timeout)
+            else:
+                # Port 587 (and others) use STARTTLS
+                logger.info("Using STARTTLS connection...")
+                server = smtplib.SMTP(self.smtp_server, self.smtp_port, timeout=self.timeout)
+                server.starttls(context=ssl.create_default_context())
 
             logger.info("Logging in...")
             # Login

From a71197f8578aaafb42b3df72fbc361856cca7313 Mon Sep 17 00:00:00 2001
From: xuyaqist <xuyaqist@gmail.com>
Date: Sat, 9 May 2026 15:56:03 +0800
Subject: [PATCH 11/25] =?UTF-8?q?=E6=96=B0=E5=A2=9Ehaotian=E7=9F=A5?=
 =?UTF-8?q?=E8=AF=86=E5=BA=93=E8=B7=AF=E7=94=B1?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 backend/apps/config_app.py                    |   2 +
 .../components/model/ModelAddDialog.tsx       | 191 +++++-------------
 2 files changed, 54 insertions(+), 139 deletions(-)

diff --git a/backend/apps/config_app.py b/backend/apps/config_app.py
index 0cfc962ea..22710c1e2 100644
--- a/backend/apps/config_app.py
+++ b/backend/apps/config_app.py
@@ -29,6 +29,7 @@
 from apps.a2a_client_app import router as a2a_client_router
 from apps.monitoring_app import router as monitoring_router
 from apps.a2a_server_app import router as a2a_server_router
+from apps.haotian_app import router as haotian_router
 from consts.const import IS_SPEED_MODE
 
 # Create logger instance
@@ -71,3 +72,4 @@
 app.include_router(invitation_router)
 app.include_router(a2a_client_router)
 app.include_router(a2a_server_router)
+app.include_router(haotian_router)
diff --git a/frontend/app/[locale]/models/components/model/ModelAddDialog.tsx b/frontend/app/[locale]/models/components/model/ModelAddDialog.tsx
index 5cbcc6789..471963439 100644
--- a/frontend/app/[locale]/models/components/model/ModelAddDialog.tsx
+++ b/frontend/app/[locale]/models/components/model/ModelAddDialog.tsx
@@ -24,7 +24,6 @@ import {
   DEFAULT_EXPECTED_CHUNK_SIZE,
   DEFAULT_MAXIMUM_CHUNK_SIZE,
 } from "./ModelChunkSizeSilder";
-import { ProviderConfigEditDialog } from "./ModelEditDialog";
 
 const { Option } = Select;
 
@@ -51,8 +50,6 @@ const DEFAULT_FORM_STATE = {
   url: "",
   apiKey: "",
   maxTokens: "4096",
-  timeoutSeconds: "120",
-  concurrencyLimit: "",
   isMultimodal: false,
   isBatchImport: false,
   provider: "modelengine",
@@ -250,9 +247,11 @@ export const ModelAddDialog = ({
     }
   }, [saveConfig, message, t]);
 
-  // Single model settings modal state
-  const [isSingleModelSettingsOpen, setIsSingleModelSettingsOpen] = useState(false);
-  const [selectedSingleModel, setSelectedSingleModel] = useState<any>(null);
+  // Settings modal state
+  const [settingsModalVisible, setSettingsModalVisible] = useState(false);
+  const [selectedModelForSettings, setSelectedModelForSettings] =
+    useState<any>(null);
+  const [modelMaxTokens, setModelMaxTokens] = useState("4096");
 
   // Use the silicon model list hook
   const siliconHook  = useSiliconModelList({
@@ -636,10 +635,27 @@ export const ModelAddDialog = ({
     }
   };
 
-  // Handle single model settings button click
-  const handleSingleModelSettingsClick = (model: any) => {
-    setSelectedSingleModel(model);
-    setIsSingleModelSettingsOpen(true);
+  // Handle settings button click
+  const handleSettingsClick = (model: any) => {
+    setSelectedModelForSettings(model);
+    setModelMaxTokens(model.max_tokens?.toString() || "4096");
+    setSettingsModalVisible(true);
+  };
+
+  // Handle settings save
+  const handleSettingsSave = () => {
+    if (selectedModelForSettings) {
+      // Update the model in the list with new max_tokens
+      setModelList((prev) =>
+        prev.map((model) =>
+          model.id === selectedModelForSettings.id
+            ? { ...model, max_tokens: parseInt(modelMaxTokens) || 4096 }
+            : model
+        )
+      );
+    }
+    setSettingsModalVisible(false);
+    setSelectedModelForSettings(null);
   };
 
   // Handle adding a model
@@ -682,7 +698,6 @@ export const ModelAddDialog = ({
           apiKey: form.apiKey.trim() === "" ? "sk-no-api-key" : form.apiKey,
           maxTokens: maxTokensValue,
           displayName: form.displayName || form.name,
-<<<<<<< HEAD
         };
 
         // Add STT specific fields
@@ -702,24 +717,6 @@ export const ModelAddDialog = ({
         }
 
         await modelService.createManageTenantModel(modelParams);
-=======
-          expectedChunkSize: isEmbeddingModel
-            ? form.chunkSizeRange[0]
-            : undefined,
-          maximumChunkSize: isEmbeddingModel
-            ? form.chunkSizeRange[1]
-            : undefined,
-          chunkingBatchSize: isEmbeddingModel
-            ? parseInt(form.chunkingBatchSize) || 10
-            : undefined,
-          timeoutSeconds: !isEmbeddingModel && !isRerankModel
-            ? parseInt(form.timeoutSeconds) || 120
-            : undefined,
-          concurrencyLimit: !isEmbeddingModel && !isRerankModel
-            ? form.concurrencyLimit ? parseInt(form.concurrencyLimit) : undefined
-            : undefined,
-        });
->>>>>>> a64daaea1 (Feat: support user to configurate model timeout)
       } else {
         const modelParams: any = {
           name: form.name,
@@ -728,7 +725,6 @@ export const ModelAddDialog = ({
           apiKey: form.apiKey.trim() === "" ? "sk-no-api-key" : form.apiKey,
           maxTokens: maxTokensValue,
           displayName: form.displayName || form.name,
-<<<<<<< HEAD
         };
 
         // Add STT specific fields
@@ -748,24 +744,6 @@ export const ModelAddDialog = ({
         }
 
         await modelService.addCustomModel(modelParams);
-=======
-          // Send chunk size range for embedding models
-          ...(isEmbeddingModel
-            ? {
-                expectedChunkSize: form.chunkSizeRange[0],
-                maximumChunkSize: form.chunkSizeRange[1],
-                chunkingBatchSize: parseInt(form.chunkingBatchSize) || 10,
-              }
-            : {}),
-          // Send timeout for non-embedding models
-          ...(!isEmbeddingModel && !isRerankModel
-            ? {
-                timeoutSeconds: parseInt(form.timeoutSeconds) || 120,
-                concurrencyLimit: form.concurrencyLimit ? parseInt(form.concurrencyLimit) : undefined,
-              }
-            : {}),
-        });
->>>>>>> a64daaea1 (Feat: support user to configurate model timeout)
       }
 
       // Create the model configuration object
@@ -1212,49 +1190,6 @@ export const ModelAddDialog = ({
           </div>
         )}
 
-        {/* Timeout Seconds */}
-        {!isEmbeddingModel && !isRerankModel && !form.isBatchImport && (
-          <div>
-            <label
-              htmlFor="timeoutSeconds"
-              className="block mb-1 text-sm font-medium text-gray-700"
-            >
-              {t("model.dialog.label.timeoutSeconds")}
-            </label>
-            <Input
-              id="timeoutSeconds"
-              type="number"
-              min="1"
-              placeholder={t("model.dialog.placeholder.timeoutSeconds")}
-              value={form.timeoutSeconds}
-              onChange={(e) => handleFormChange("timeoutSeconds", e.target.value)}
-            />
-          </div>
-        )}
-
-        {/* Concurrency Limit */}
-        {!isEmbeddingModel && !isRerankModel && !form.isBatchImport && (
-          <div>
-            <label
-              htmlFor="concurrencyLimit"
-              className="block mb-1 text-sm font-medium text-gray-700"
-            >
-              {t("model.dialog.label.concurrencyLimit")}
-            </label>
-            <Input
-              id="concurrencyLimit"
-              type="number"
-              min="1"
-              placeholder={t("model.dialog.placeholder.concurrencyLimit")}
-              value={form.concurrencyLimit}
-              onChange={(e) => handleFormChange("concurrencyLimit", e.target.value)}
-            />
-            <div className="text-xs text-gray-500 mt-1">
-              {t("model.dialog.hint.concurrencyLimit")}
-            </div>
-          </div>
-        )}
-
         {/* Connectivity verification area */}
         {!form.isBatchImport && (
           <div className="p-3 bg-gray-50 border border-gray-200 rounded-md">
@@ -1411,7 +1346,7 @@ export const ModelAddDialog = ({
                                 size="small"
                                 onClick={(e) => {
                                   e.stopPropagation(); // Prevent switch toggle
-                                  handleSingleModelSettingsClick(model);
+                                  handleSettingsClick(model);
                                 }}
                               />
                             </Tooltip>
@@ -1756,52 +1691,30 @@ export const ModelAddDialog = ({
         </div>
       </div>
 
-      {/* Single Model Settings Modal */}
-      <ProviderConfigEditDialog
-        isOpen={isSingleModelSettingsOpen}
-        onClose={() => {
-          setIsSingleModelSettingsOpen(false);
-          setSelectedSingleModel(null);
-        }}
-        initialMaxTokens={selectedSingleModel?.max_tokens?.toString() || "4096"}
-        initialTimeoutSeconds={selectedSingleModel?.timeout_seconds?.toString() || "120"}
-        modelType={form.type}
-        showApiKeyField={false}
-        onSave={async (config) => {
-          if (!selectedSingleModel) return;
-          try {
-            const modelName = selectedSingleModel.model_name || selectedSingleModel.id;
-            await modelService.updateBatchModel(
-              [
-                {
-                  model_id: modelName,
-                  apiKey: config.apiKey,
-                  maxTokens: config.maxTokens,
-                  timeoutSeconds: config.timeoutSeconds,
-                  concurrencyLimit: config.concurrencyLimit,
-                },
-              ],
-              selectedSingleModel.model_factory
-            );
-
-            // Update the model in the list
-            setModelList((prev) =>
-              prev.map((model) =>
-                model.id === selectedSingleModel.id
-                  ? {
-                      ...model,
-                      api_key: config.apiKey,
-                      max_tokens: config.maxTokens,
-                      timeout_seconds: config.timeoutSeconds,
-                    }
-                  : model
-              )
-            );
-          } catch (error) {
-            console.error("Failed to update model settings:", error);
-          }
-        }}
-      />
+      {/* Settings Modal */}
+      <Modal
+        title={t("model.dialog.settings.title")}
+        open={settingsModalVisible}
+        onCancel={() => setSettingsModalVisible(false)}
+        onOk={handleSettingsSave}
+        cancelText={t("common.cancel")}
+        okText={t("common.confirm")}
+        destroyOnHidden
+      >
+        <div className="space-y-3">
+          <div>
+            <label className="block mb-1 text-sm font-medium text-gray-700">
+              {t("model.dialog.settings.label.maxTokens")}
+            </label>
+            <Input
+              type="number"
+              value={modelMaxTokens}
+              onChange={(e) => setModelMaxTokens(e.target.value)}
+              placeholder={t("model.dialog.placeholder.maxTokens")}
+            />
+          </div>
+        </div>
+      </Modal>
     </Modal>
   );
-};
+};
\ No newline at end of file

From 59810bbf7ada8e829caedd49c494a7b28436e9ab Mon Sep 17 00:00:00 2001
From: xuyaqist <xuyaqist@gmail.com>
Date: Sat, 9 May 2026 17:18:23 +0800
Subject: [PATCH 12/25] =?UTF-8?q?=E4=BF=AE=E5=A4=8D=E5=89=8D=E7=AB=AF?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../app/[locale]/models/components/model/ModelAddDialog.tsx     | 1 +
 frontend/services/modelService.ts                               | 2 ++
 2 files changed, 3 insertions(+)

diff --git a/frontend/app/[locale]/models/components/model/ModelAddDialog.tsx b/frontend/app/[locale]/models/components/model/ModelAddDialog.tsx
index 471963439..94a869301 100644
--- a/frontend/app/[locale]/models/components/model/ModelAddDialog.tsx
+++ b/frontend/app/[locale]/models/components/model/ModelAddDialog.tsx
@@ -829,6 +829,7 @@ export const ModelAddDialog = ({
   };
 
   const isEmbeddingModel = form.type === MODEL_TYPES.EMBEDDING;
+  const isRerankModel = form.type === MODEL_TYPES.RERANK;
   const isSTTModel = form.type === MODEL_TYPES.STT;
 
   return (
diff --git a/frontend/services/modelService.ts b/frontend/services/modelService.ts
index 3538b34f4..07796d2c4 100644
--- a/frontend/services/modelService.ts
+++ b/frontend/services/modelService.ts
@@ -124,6 +124,7 @@ export const modelService = {
         maximum_chunk_size: model.maximumChunkSize,
         chunk_batch: model.chunkingBatchSize,
         timeout_seconds: model.timeoutSeconds,
+        concurrency_limit: model.concurrencyLimit,
       };
 
       // Add STT specific fields
@@ -721,6 +722,7 @@ export const modelService = {
         api_key: params.apiKey,
         max_tokens: params.maxTokens || 4096,
         display_name: params.displayName || params.name,
+        model_factory: params.modelFactory || "OpenAI-API-Compatible",
         expected_chunk_size: params.expectedChunkSize,
         maximum_chunk_size: params.maximumChunkSize,
         chunk_batch: params.chunkingBatchSize,

From 055b5a294ce16f8cdf42c58d0df46284802cb020 Mon Sep 17 00:00:00 2001
From: xuyaqist <xuyaqist@gmail.com>
Date: Mon, 11 May 2026 14:25:51 +0800
Subject: [PATCH 13/25] =?UTF-8?q?=E4=B8=BAnexent-config=E6=8C=82=E8=BD=BD?=
 =?UTF-8?q?=E8=AF=81=E4=B9=A6=EF=BC=8C=E4=BB=A4=E5=AE=B9=E5=99=A8=E5=86=85?=
 =?UTF-8?q?=E7=9A=84=20Python=20=E5=BA=94=E7=94=A8=E4=BD=BF=E7=94=A8?=
 =?UTF-8?q?=E5=AE=BF=E4=B8=BB=E6=9C=BA=E7=9A=84=20CA=20=E8=AF=81=E4=B9=A6?=
 =?UTF-8?q?=E6=9D=A5=E9=AA=8C=E8=AF=81=E5=A4=96=E9=83=A8=20SMTP=20?=
 =?UTF-8?q?=E6=9C=8D=E5=8A=A1=E5=99=A8=E7=9A=84=20SSL=20=E8=AF=81=E4=B9=A6?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 docker/docker-compose.prod.yml | 2 ++
 docker/docker-compose.yml      | 2 ++
 2 files changed, 4 insertions(+)

diff --git a/docker/docker-compose.prod.yml b/docker/docker-compose.prod.yml
index 934fe8b2f..3cc7ac59a 100644
--- a/docker/docker-compose.prod.yml
+++ b/docker/docker-compose.prod.yml
@@ -78,6 +78,8 @@ services:
       - ${ROOT_DIR}/openssh-server/ssh-keys:/opt/ssh-keys:ro
       - ${ROOT_DIR}/scripts/sync_user_supabase2pg.py:/opt/sync_user_supabase2pg.py:ro
       - /var/run/docker.sock:/var/run/docker.sock:ro # Docker socket for MCP container management
+      # CA certificates for external service SSL verification (e.g., SMTP)
+      - /etc/ssl/certs:/etc/ssl/certs:ro
     environment:
       <<: [*minio-vars, *es-vars]
       skip_proxy: "true"
diff --git a/docker/docker-compose.yml b/docker/docker-compose.yml
index 89088f2c3..4056683dc 100644
--- a/docker/docker-compose.yml
+++ b/docker/docker-compose.yml
@@ -89,6 +89,8 @@ services:
       - ${ROOT_DIR}/openssh-server/ssh-keys:/opt/ssh-keys:ro
       - ${ROOT_DIR}/scripts/sync_user_supabase2pg.py:/opt/sync_user_supabase2pg.py:ro
       - /var/run/docker.sock:/var/run/docker.sock:ro # Docker socket for MCP container management
+      # CA certificates for external service SSL verification (e.g., SMTP)
+      - /etc/ssl/certs:/etc/ssl/certs:ro
     environment:
       <<: [*minio-vars, *es-vars]
       skip_proxy: "true"

From 4a8ccb2af515d17a2b77f49793ab57e64b6daa21 Mon Sep 17 00:00:00 2001
From: xuyaqist <xuyaqist@gmail.com>
Date: Mon, 11 May 2026 14:36:38 +0800
Subject: [PATCH 14/25] =?UTF-8?q?=E4=BF=AE=E5=A4=8D=E6=A8=A1=E5=9E=8B?=
 =?UTF-8?q?=E5=81=A5=E5=BA=B7=E6=A3=80=E6=9F=A5=E6=8A=A5=E9=94=99?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 backend/services/model_health_service.py | 12 ++++++------
 1 file changed, 6 insertions(+), 6 deletions(-)

diff --git a/backend/services/model_health_service.py b/backend/services/model_health_service.py
index e22f6c642..73adacc00 100644
--- a/backend/services/model_health_service.py
+++ b/backend/services/model_health_service.py
@@ -97,23 +97,23 @@ async def _perform_connectivity_check(
 
     # Test connectivity based on different model types
     if model_type == "embedding":
-        connectivity = len(await OpenAICompatibleEmbedding(
+        embedding = OpenAICompatibleEmbedding(
             model_name=model_name,
             base_url=model_base_url,
             api_key=model_api_key,
             embedding_dim=0,
             ssl_verify=ssl_verify,
-            timeout_seconds=timeout_seconds,
-        ).dimension_check()) > 0
+        )
+        connectivity = len(await embedding.dimension_check(timeout=timeout_seconds if timeout_seconds else 5.0)) > 0
     elif model_type == "multi_embedding":
-        connectivity = len(await JinaEmbedding(
+        embedding = JinaEmbedding(
             model_name=model_name,
             base_url=model_base_url,
             api_key=model_api_key,
             embedding_dim=0,
             ssl_verify=ssl_verify,
-            timeout_seconds=timeout_seconds,
-        ).dimension_check()) > 0
+        )
+        connectivity = len(await embedding.dimension_check(timeout=timeout_seconds if timeout_seconds else 5.0)) > 0
     elif model_type == "llm":
         observer = MessageObserver()
         set_monitoring_operation("connectivity_check",

From ff787b07ea3351c3e840cde718768066b963d467 Mon Sep 17 00:00:00 2001
From: xuyaqist <xuyaqist@gmail.com>
Date: Mon, 11 May 2026 15:13:59 +0800
Subject: [PATCH 15/25] =?UTF-8?q?=E5=8C=BA=E5=88=86send=20email=E9=92=88?=
 =?UTF-8?q?=E5=AF=B9=E6=98=AF=E5=90=A6=E8=B7=B3=E8=BF=87=E8=AF=81=E4=B9=A6?=
 =?UTF-8?q?=E6=A0=A1=E9=AA=8C=E7=9A=84=E9=80=BB=E8=BE=91?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 sdk/nexent/core/tools/send_email_tool.py    |  49 ++++++--
 test/sdk/core/tools/test_send_email_tool.py | 122 +++++++++++++-------
 2 files changed, 120 insertions(+), 51 deletions(-)

diff --git a/sdk/nexent/core/tools/send_email_tool.py b/sdk/nexent/core/tools/send_email_tool.py
index 2451020ea..097ad838c 100644
--- a/sdk/nexent/core/tools/send_email_tool.py
+++ b/sdk/nexent/core/tools/send_email_tool.py
@@ -65,8 +65,8 @@ class SendEmailTool(Tool):
             "description_zh": "SMTP 服务器密码"
         },
         "use_ssl": {
-            "description": "Use SSL",
-            "description_zh": "使用 SSL"
+            "description": "Use SSL/TLS encryption (set to False for plain text)",
+            "description_zh": "使用 SSL/TLS 加密（设为 False 使用明文）"
         },
         "sender_name": {
             "description": "Sender name",
@@ -80,13 +80,13 @@ class SendEmailTool(Tool):
     output_type = "string"
     category = ToolCategory.EMAIL.value
 
-    def __init__(self, smtp_server: str=Field(description="SMTP Server Address"),
-                 smtp_port: int=Field(description="SMTP server port"), 
-                 username: str=Field(description="SMTP server username"), 
-                 password: str=Field(description="SMTP server password"), 
-                 use_ssl: bool=Field(description="Use SSL", default=True),
-                 sender_name: Optional[str] = Field(description="Sender name", default=None),
-                 timeout: int = Field(description="Timeout", default=30)):
+    def __init__(self, smtp_server: str = "",
+                 smtp_port: int = 587, 
+                 username: str = "", 
+                 password: str = "", 
+                 use_ssl: bool = True,
+                 sender_name: Optional[str] = None,
+                 timeout: int = 30):
         super().__init__()
         self.smtp_server = smtp_server
         self.smtp_port = smtp_port
@@ -96,6 +96,18 @@ def __init__(self, smtp_server: str=Field(description="SMTP Server Address"),
         self.sender_name = sender_name
         self.timeout = timeout
 
+    def _create_ssl_context(self, skip_verify: bool = False) -> ssl.SSLContext:
+        """Create SSL context with optional verification disabled for self-signed certs."""
+        context = ssl.create_default_context()
+        if skip_verify:
+            logger.warning("SSL verification disabled - use only for internal/local SMTP servers")
+            context.check_hostname = False
+            context.verify_mode = ssl.CERT_NONE
+        else:
+            context.check_hostname = True
+            context.verify_mode = ssl.CERT_REQUIRED
+        return context
+
     def forward(self, to: str, subject: str, content: str, cc: str = "", bcc: str = "") -> str:
         try:
             logger.info("Creating email message...")
@@ -119,13 +131,26 @@ def forward(self, to: str, subject: str, content: str, cc: str = "", bcc: str =
             if self.smtp_port == 465:
                 # Port 465 uses implicit SSL
                 logger.info("Using implicit SSL connection (port 465)...")
-                context = ssl.create_default_context()
+                context = self._create_ssl_context(skip_verify=False)
                 server = smtplib.SMTP_SSL(self.smtp_server, self.smtp_port, context=context, timeout=self.timeout)
-            else:
+            elif self.use_ssl:
                 # Port 587 (and others) use STARTTLS
                 logger.info("Using STARTTLS connection...")
                 server = smtplib.SMTP(self.smtp_server, self.smtp_port, timeout=self.timeout)
-                server.starttls(context=ssl.create_default_context())
+                server.starttls(context=self._create_ssl_context(skip_verify=False))
+            else:
+                # Port 25 - plain connection (may have self-signed certs)
+                logger.info("Using plain text connection (port 25)...")
+                server = smtplib.SMTP(self.smtp_server, self.smtp_port, timeout=self.timeout)
+                # Some servers force TLS handshake even on plain connections
+                # Skip cert verification for port 25 to handle self-signed certs
+                try:
+                    server.starttls(context=self._create_ssl_context(skip_verify=True))
+                    logger.info("Server upgraded to TLS connection")
+                except smtplib.SMTPNotSupportedError:
+                    logger.info("Server does not support STARTTLS, using plain connection")
+                except Exception as tls_err:
+                    logger.warning(f"TLS upgrade failed: {tls_err}, continuing with plain connection")
 
             logger.info("Logging in...")
             # Login
diff --git a/test/sdk/core/tools/test_send_email_tool.py b/test/sdk/core/tools/test_send_email_tool.py
index 1287a4f53..88b279eb2 100644
--- a/test/sdk/core/tools/test_send_email_tool.py
+++ b/test/sdk/core/tools/test_send_email_tool.py
@@ -60,6 +60,17 @@ def test_init_with_custom_values(self):
         assert tool.sender_name == "Custom Sender"
         assert tool.timeout == 60
 
+    def test_init_use_ssl_default(self):
+        """Test that use_ssl defaults to True"""
+        tool = SendEmailTool(
+            smtp_server="smtp.example.com",
+            smtp_port=587,
+            username="user@example.com",
+            password="password123"
+        )
+        assert tool.use_ssl is True
+        assert tool.timeout == 30
+
     def test_tool_attributes(self, send_email_tool):
         """Test tool class attributes"""
         assert send_email_tool.name == "send_email"
@@ -91,9 +102,9 @@ def test_tool_inputs_schema(self, send_email_tool):
         assert inputs["bcc"]["type"] == "string"
         assert inputs["bcc"]["nullable"] is True
 
-    @patch('smtplib.SMTP_SSL')
+    @patch('smtplib.SMTP')
     @patch('ssl.create_default_context')
-    def test_forward_success_basic_email(self, mock_ssl_context, mock_smtp_ssl, send_email_tool):
+    def test_forward_success_basic_email(self, mock_ssl_context, mock_smtp, send_email_tool):
         """Test successful basic email sending"""
         # Mock SSL context
         mock_context = Mock()
@@ -101,7 +112,7 @@ def test_forward_success_basic_email(self, mock_ssl_context, mock_smtp_ssl, send
 
         # Mock SMTP server
         mock_server = Mock()
-        mock_smtp_ssl.return_value = mock_server
+        mock_smtp.return_value = mock_server
 
         result = send_email_tool.forward(
             to="recipient@example.com",
@@ -119,17 +130,16 @@ def test_forward_success_basic_email(self, mock_ssl_context, mock_smtp_ssl, send
         assert result_data["subject"] == "Test Subject"
 
         # Verify SMTP operations
-        mock_smtp_ssl.assert_called_once_with(
-            "smtp.test.com", 587, context=mock_context, timeout=30
-        )
+        mock_smtp.assert_called_once_with("smtp.test.com", 587, timeout=30)
+        mock_server.starttls.assert_called_once_with(context=mock_context)
         mock_server.login.assert_called_once_with(
             "test@test.com", "test_password")
         mock_server.send_message.assert_called_once()
         mock_server.quit.assert_called_once()
 
-    @patch('smtplib.SMTP_SSL')
+    @patch('smtplib.SMTP')
     @patch('ssl.create_default_context')
-    def test_forward_success_with_cc_and_bcc(self, mock_ssl_context, mock_smtp_ssl, send_email_tool):
+    def test_forward_success_with_cc_and_bcc(self, mock_ssl_context, mock_smtp, send_email_tool):
         """Test successful email sending with CC and BCC"""
         # Mock SSL context
         mock_context = Mock()
@@ -137,7 +147,7 @@ def test_forward_success_with_cc_and_bcc(self, mock_ssl_context, mock_smtp_ssl,
 
         # Mock SMTP server
         mock_server = Mock()
-        mock_smtp_ssl.return_value = mock_server
+        mock_smtp.return_value = mock_server
 
         result = send_email_tool.forward(
             to="recipient@example.com",
@@ -164,9 +174,9 @@ def test_forward_success_with_cc_and_bcc(self, mock_ssl_context, mock_smtp_ssl,
         assert call_args['Cc'] == "cc1@example.com,cc2@example.com"
         assert call_args['Bcc'] == "bcc@example.com"
 
-    @patch('smtplib.SMTP_SSL')
+    @patch('smtplib.SMTP')
     @patch('ssl.create_default_context')
-    def test_forward_success_multiple_recipients(self, mock_ssl_context, mock_smtp_ssl, send_email_tool):
+    def test_forward_success_multiple_recipients(self, mock_ssl_context, mock_smtp, send_email_tool):
         """Test successful email sending with multiple recipients"""
         # Mock SSL context
         mock_context = Mock()
@@ -174,7 +184,7 @@ def test_forward_success_multiple_recipients(self, mock_ssl_context, mock_smtp_s
 
         # Mock SMTP server
         mock_server = Mock()
-        mock_smtp_ssl.return_value = mock_server
+        mock_smtp.return_value = mock_server
 
         result = send_email_tool.forward(
             to="recipient1@example.com,recipient2@example.com",
@@ -191,9 +201,9 @@ def test_forward_success_multiple_recipients(self, mock_ssl_context, mock_smtp_s
         assert result_data["status"] == "success"
         assert result_data["to"] == "recipient1@example.com,recipient2@example.com"
 
-    @patch('smtplib.SMTP_SSL')
+    @patch('smtplib.SMTP')
     @patch('ssl.create_default_context')
-    def test_forward_smtp_send_error(self, mock_ssl_context, mock_smtp_ssl, send_email_tool):
+    def test_forward_smtp_send_error(self, mock_ssl_context, mock_smtp, send_email_tool):
         """Test email sending with SMTP send error"""
         # Mock SSL context
         mock_context = Mock()
@@ -204,7 +214,7 @@ def test_forward_smtp_send_error(self, mock_ssl_context, mock_smtp_ssl, send_ema
         mock_server.send_message.side_effect = smtplib.SMTPRecipientsRefused(
             "Recipients refused"
         )
-        mock_smtp_ssl.return_value = mock_server
+        mock_smtp.return_value = mock_server
 
         result = send_email_tool.forward(
             to="recipient@example.com",
@@ -219,9 +229,9 @@ def test_forward_smtp_send_error(self, mock_ssl_context, mock_smtp_ssl, send_ema
         assert result_data["status"] == "error"
         assert "Failed to send email" in result_data["message"]
 
-    @patch('smtplib.SMTP_SSL')
+    @patch('smtplib.SMTP')
     @patch('ssl.create_default_context')
-    def test_forward_unexpected_exception(self, mock_ssl_context, mock_smtp_ssl, send_email_tool):
+    def test_forward_unexpected_exception(self, mock_ssl_context, mock_smtp, send_email_tool):
         """Test email sending with unexpected exception"""
         # Mock SSL context
         mock_context = Mock()
@@ -230,7 +240,7 @@ def test_forward_unexpected_exception(self, mock_ssl_context, mock_smtp_ssl, sen
         # Mock SMTP server with unexpected error
         mock_server = Mock()
         mock_server.login.side_effect = RuntimeError("Unexpected error")
-        mock_smtp_ssl.return_value = mock_server
+        mock_smtp.return_value = mock_server
 
         result = send_email_tool.forward(
             to="recipient@example.com",
@@ -246,9 +256,9 @@ def test_forward_unexpected_exception(self, mock_ssl_context, mock_smtp_ssl, sen
         assert "An unexpected error occurred" in result_data["message"]
         assert "Unexpected error" in result_data["message"]
 
-    @patch('smtplib.SMTP_SSL')
+    @patch('smtplib.SMTP')
     @patch('ssl.create_default_context')
-    def test_forward_empty_cc_and_bcc(self, mock_ssl_context, mock_smtp_ssl, send_email_tool):
+    def test_forward_empty_cc_and_bcc(self, mock_ssl_context, mock_smtp, send_email_tool):
         """Test email sending with empty CC and BCC"""
         # Mock SSL context
         mock_context = Mock()
@@ -256,7 +266,7 @@ def test_forward_empty_cc_and_bcc(self, mock_ssl_context, mock_smtp_ssl, send_em
 
         # Mock SMTP server
         mock_server = Mock()
-        mock_smtp_ssl.return_value = mock_server
+        mock_smtp.return_value = mock_server
 
         result = send_email_tool.forward(
             to="recipient@example.com",
@@ -277,9 +287,9 @@ def test_forward_empty_cc_and_bcc(self, mock_ssl_context, mock_smtp_ssl, send_em
         assert 'Cc' not in call_args
         assert 'Bcc' not in call_args
 
-    @patch('smtplib.SMTP_SSL')
+    @patch('smtplib.SMTP')
     @patch('ssl.create_default_context')
-    def test_forward_html_content_attachment(self, mock_ssl_context, mock_smtp_ssl, send_email_tool):
+    def test_forward_html_content_attachment(self, mock_ssl_context, mock_smtp, send_email_tool):
         """Test that HTML content is properly attached to email"""
         # Mock SSL context
         mock_context = Mock()
@@ -287,7 +297,7 @@ def test_forward_html_content_attachment(self, mock_ssl_context, mock_smtp_ssl,
 
         # Mock SMTP server
         mock_server = Mock()
-        mock_smtp_ssl.return_value = mock_server
+        mock_smtp.return_value = mock_server
 
         html_content = "<h1>Test Header</h1><p>This is <strong>bold</strong> text.</p>"
 
@@ -314,17 +324,19 @@ def test_forward_html_content_attachment(self, mock_ssl_context, mock_smtp_ssl,
         assert attachments[0].get_content_type() == "text/html"
         assert attachments[0].get_payload() == html_content
 
-    @patch('smtplib.SMTP_SSL')
+    @patch('smtplib.SMTP')
     @patch('ssl.create_default_context')
-    def test_forward_ssl_context_configuration(self, mock_ssl_context, mock_smtp_ssl, send_email_tool):
-        """Test SSL context is properly configured"""
+    def test_forward_ssl_context_configuration(self, mock_ssl_context, mock_smtp, send_email_tool):
+        """Test SSL context is properly configured for STARTTLS"""
         # Mock SSL context
         mock_context = Mock()
+        mock_context.check_hostname = True
+        mock_context.verify_mode = ssl.CERT_REQUIRED
         mock_ssl_context.return_value = mock_context
 
         # Mock SMTP server
         mock_server = Mock()
-        mock_smtp_ssl.return_value = mock_server
+        mock_smtp.return_value = mock_server
 
         send_email_tool.forward(
             to="recipient@example.com",
@@ -332,16 +344,48 @@ def test_forward_ssl_context_configuration(self, mock_ssl_context, mock_smtp_ssl
             content="<p>Test content</p>"
         )
 
-        # Verify SSL context configuration
+        # Verify SSL context is created (default settings preserved)
         mock_ssl_context.assert_called_once()
-        assert mock_context.check_hostname is True
-        assert mock_context.verify_mode == ssl.CERT_REQUIRED
 
-        # Verify SMTP_SSL is called with context
-        mock_smtp_ssl.assert_called_once_with(
-            "smtp.test.com", 587, context=mock_context, timeout=30
+        # Verify STARTTLS is called with context
+        mock_server.starttls.assert_called_once_with(context=mock_context)
+
+    @patch('smtplib.SMTP')
+    @patch('ssl.create_default_context')
+    def test_forward_port_25_skips_ssl_verification(self, mock_ssl_context, mock_smtp):
+        """Test that port 25 skips SSL certificate verification for self-signed certs"""
+        # Create tool with port 25
+        tool = SendEmailTool(
+            smtp_server="smtp.local.com",
+            smtp_port=25,
+            username="user@example.com",
+            password="password123",
+            use_ssl=False
+        )
+
+        # Mock SSL context
+        mock_context = Mock()
+        mock_context.check_hostname = False
+        mock_context.verify_mode = ssl.CERT_NONE
+        mock_ssl_context.return_value = mock_context
+
+        # Mock SMTP server
+        mock_server = Mock()
+        mock_smtp.return_value = mock_server
+
+        result = tool.forward(
+            to="recipient@example.com",
+            subject="Test Subject",
+            content="<p>Test content</p>"
         )
 
+        # Parse result
+        result_data = json.loads(result)
+        assert result_data["status"] == "success"
+
+        # Verify STARTTLS is called with context for self-signed certs
+        mock_server.starttls.assert_called_once_with(context=mock_context)
+
     @patch('smtplib.SMTP_SSL')
     @patch('ssl.create_default_context')
     def test_forward_timeout_configuration(self, mock_ssl_context, mock_smtp_ssl):
@@ -374,9 +418,9 @@ def test_forward_timeout_configuration(self, mock_ssl_context, mock_smtp_ssl):
             "smtp.example.com", 465, context=mock_context, timeout=60
         )
 
-    @patch('smtplib.SMTP_SSL')
+    @patch('smtplib.SMTP')
     @patch('ssl.create_default_context')
-    def test_forward_server_quit_called_on_success(self, mock_ssl_context, mock_smtp_ssl, send_email_tool):
+    def test_forward_server_quit_called_on_success(self, mock_ssl_context, mock_smtp, send_email_tool):
         """Test that server.quit() is called on successful send"""
         # Mock SSL context
         mock_context = Mock()
@@ -384,7 +428,7 @@ def test_forward_server_quit_called_on_success(self, mock_ssl_context, mock_smtp
 
         # Mock SMTP server
         mock_server = Mock()
-        mock_smtp_ssl.return_value = mock_server
+        mock_smtp.return_value = mock_server
 
         send_email_tool.forward(
             to="recipient@example.com",
@@ -397,7 +441,7 @@ def test_forward_server_quit_called_on_success(self, mock_ssl_context, mock_smtp
 
     def test_forward_empty_parameters(self, send_email_tool):
         """Test forward method with empty parameters"""
-        with patch('smtplib.SMTP_SSL') as mock_smtp_ssl, \
+        with patch('smtplib.SMTP') as mock_smtp, \
                 patch('ssl.create_default_context') as mock_ssl_context:
 
             # Mock SSL context
@@ -406,7 +450,7 @@ def test_forward_empty_parameters(self, send_email_tool):
 
             # Mock SMTP server
             mock_server = Mock()
-            mock_smtp_ssl.return_value = mock_server
+            mock_smtp.return_value = mock_server
 
             result = send_email_tool.forward(
                 to="",

From ef58bda35b91d966943899c5dc9fbec6c0152fc9 Mon Sep 17 00:00:00 2001
From: xuyaqist <xuyaqist@gmail.com>
Date: Mon, 11 May 2026 17:08:37 +0800
Subject: [PATCH 16/25] =?UTF-8?q?=E5=8C=BA=E5=88=86sender=5Femail=E5=92=8C?=
 =?UTF-8?q?=E5=92=8Csender=5Fname?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../services/tool_configuration_service.py    | 26 +++++++++---
 backend/utils/tool_utils.py                   |  3 +-
 sdk/nexent/core/tools/send_email_tool.py      | 34 ++++++++++++----
 test/sdk/core/tools/test_send_email_tool.py   | 40 ++++++++++++++++++-
 4 files changed, 87 insertions(+), 16 deletions(-)

diff --git a/backend/services/tool_configuration_service.py b/backend/services/tool_configuration_service.py
index 5e5229ff6..0f779cb98 100644
--- a/backend/services/tool_configuration_service.py
+++ b/backend/services/tool_configuration_service.py
@@ -130,11 +130,15 @@ def get_local_tools() -> List[ToolInfo]:
                 if hasattr(param.default, 'exclude') and param.default.exclude:
                     continue
 
+            # Check if default is a Pydantic FieldInfo (has .default attribute)
+            is_pydantic_field = hasattr(param.default, 'default')
+
             # Get description in both languages
-            param_description = param.default.description if hasattr(param.default, 'description') else ""
+            param_description = param.default.description if is_pydantic_field else ""
 
             # First try to get from param.default.description_zh (FieldInfo)
-            param_description_zh = param.default.description_zh if hasattr(param.default, 'description_zh') else None
+            # Note: Pydantic Field doesn't have description_zh attribute, so use getattr with default
+            param_description_zh = getattr(param.default, 'description_zh', None) if is_pydantic_field else None
 
             # Fallback to init_param_descriptions if not found
             if param_description_zh is None and param_name in init_param_descriptions:
@@ -146,11 +150,21 @@ def get_local_tools() -> List[ToolInfo]:
                 "description": param_description,
                 "description_zh": param_description_zh
             }
-            if param.default.default is PydanticUndefined:
-                param_info["optional"] = False
+
+            # Handle both Pydantic FieldInfo and simple defaults
+            if is_pydantic_field:
+                if param.default.default is PydanticUndefined:
+                    param_info["optional"] = False
+                else:
+                    param_info["default"] = param.default.default
+                    param_info["optional"] = True
             else:
-                param_info["default"] = param.default.default
-                param_info["optional"] = True
+                # Simple default value (not a FieldInfo)
+                if param.default == inspect.Parameter.empty:
+                    param_info["optional"] = False
+                else:
+                    param_info["default"] = param.default
+                    param_info["optional"] = True
 
             init_params_list.append(param_info)
 
diff --git a/backend/utils/tool_utils.py b/backend/utils/tool_utils.py
index f06f36bc3..f1d9147e3 100644
--- a/backend/utils/tool_utils.py
+++ b/backend/utils/tool_utils.py
@@ -46,7 +46,8 @@ def get_local_tools_description_zh() -> Dict[str, Dict]:
                 if hasattr(param.default, 'exclude') and param.default.exclude:
                     continue
 
-            param_description_zh = param.default.description_zh if hasattr(param.default, 'description_zh') else None
+            # Note: Pydantic Field doesn't have description_zh attribute
+            param_description_zh = getattr(param.default, 'description_zh', None) if hasattr(param.default, 'description_zh') else None
 
             if param_description_zh is None and param_name in init_param_descriptions:
                 param_description_zh = init_param_descriptions[param_name].get('description_zh')
diff --git a/sdk/nexent/core/tools/send_email_tool.py b/sdk/nexent/core/tools/send_email_tool.py
index 097ad838c..42453e16b 100644
--- a/sdk/nexent/core/tools/send_email_tool.py
+++ b/sdk/nexent/core/tools/send_email_tool.py
@@ -44,6 +44,12 @@ class SendEmailTool(Tool):
             "description": "BCC email address, multiple BCCs separated by commas, optional",
             "description_zh": "密送邮箱地址，多个密送用逗号分隔，可选",
             "nullable": True
+        },
+        "sender_email": {
+            "type": "string",
+            "description": "Actual sender email address (From address), optional - defaults to username",
+            "description_zh": "实际发件人邮箱地址（From字段），可选，默认为username",
+            "nullable": True
         }
     }
 
@@ -68,6 +74,10 @@ class SendEmailTool(Tool):
             "description": "Use SSL/TLS encryption (set to False for plain text)",
             "description_zh": "使用 SSL/TLS 加密（设为 False 使用明文）"
         },
+        "sender_email": {
+            "description": "Actual sender email address (From address), defaults to username",
+            "description_zh": "实际发件人邮箱地址，默认为 username"
+        },
         "sender_name": {
             "description": "Sender name",
             "description_zh": "发件人名称"
@@ -81,10 +91,11 @@ class SendEmailTool(Tool):
     category = ToolCategory.EMAIL.value
 
     def __init__(self, smtp_server: str = "",
-                 smtp_port: int = 587, 
-                 username: str = "", 
-                 password: str = "", 
+                 smtp_port: int = 587,
+                 username: str = "",
+                 password: str = "",
                  use_ssl: bool = True,
+                 sender_email: Optional[str] = None,
                  sender_name: Optional[str] = None,
                  timeout: int = 30):
         super().__init__()
@@ -93,6 +104,7 @@ def __init__(self, smtp_server: str = "",
         self.username = username
         self.password = password
         self.use_ssl = use_ssl
+        self.sender_email = sender_email or username
         self.sender_name = sender_name
         self.timeout = timeout
 
@@ -108,12 +120,18 @@ def _create_ssl_context(self, skip_verify: bool = False) -> ssl.SSLContext:
             context.verify_mode = ssl.CERT_REQUIRED
         return context
 
-    def forward(self, to: str, subject: str, content: str, cc: str = "", bcc: str = "") -> str:
+    def forward(self, to: str, subject: str, content: str, cc: str = "", bcc: str = "",
+                sender_email: Optional[str] = None) -> str:
         try:
             logger.info("Creating email message...")
-            # Create email object
             msg = MIMEMultipart()
-            msg['From'] = f"{self.sender_name} <{self.username}>" if self.sender_name else self.username
+
+            sender = sender_email or self.sender_email
+            if self.sender_name:
+                msg['From'] = f"{self.sender_name} <{sender}>"
+            else:
+                msg['From'] = sender
+
             msg['To'] = to
             msg['Subject'] = subject
 
@@ -131,13 +149,13 @@ def forward(self, to: str, subject: str, content: str, cc: str = "", bcc: str =
             if self.smtp_port == 465:
                 # Port 465 uses implicit SSL
                 logger.info("Using implicit SSL connection (port 465)...")
-                context = self._create_ssl_context(skip_verify=False)
+                context = self._create_ssl_context(skip_verify=True)
                 server = smtplib.SMTP_SSL(self.smtp_server, self.smtp_port, context=context, timeout=self.timeout)
             elif self.use_ssl:
                 # Port 587 (and others) use STARTTLS
                 logger.info("Using STARTTLS connection...")
                 server = smtplib.SMTP(self.smtp_server, self.smtp_port, timeout=self.timeout)
-                server.starttls(context=self._create_ssl_context(skip_verify=False))
+                server.starttls(context=self._create_ssl_context(skip_verify=True))
             else:
                 # Port 25 - plain connection (may have self-signed certs)
                 logger.info("Using plain text connection (port 25)...")
diff --git a/test/sdk/core/tools/test_send_email_tool.py b/test/sdk/core/tools/test_send_email_tool.py
index 88b279eb2..d3bc9f946 100644
--- a/test/sdk/core/tools/test_send_email_tool.py
+++ b/test/sdk/core/tools/test_send_email_tool.py
@@ -19,6 +19,7 @@ def send_email_tool():
         username="test@test.com",
         password="test_password",
         use_ssl=True,
+        sender_email="actual@test.com",
         sender_name="Test Sender",
         timeout=30
     )
@@ -102,6 +103,10 @@ def test_tool_inputs_schema(self, send_email_tool):
         assert inputs["bcc"]["type"] == "string"
         assert inputs["bcc"]["nullable"] is True
 
+        assert "sender_email" in inputs
+        assert inputs["sender_email"]["type"] == "string"
+        assert inputs["sender_email"]["nullable"] is True
+
     @patch('smtplib.SMTP')
     @patch('ssl.create_default_context')
     def test_forward_success_basic_email(self, mock_ssl_context, mock_smtp, send_email_tool):
@@ -168,7 +173,7 @@ def test_forward_success_with_cc_and_bcc(self, mock_ssl_context, mock_smtp, send
         call_args = mock_server.send_message.call_args[0][0]
 
         # Verify email headers
-        assert call_args['From'] == "Test Sender <test@test.com>"
+        assert call_args['From'] == "Test Sender <actual@test.com>"
         assert call_args['To'] == "recipient@example.com"
         assert call_args['Subject'] == "Test Subject"
         assert call_args['Cc'] == "cc1@example.com,cc2@example.com"
@@ -466,6 +471,39 @@ def test_forward_empty_parameters(self, send_email_tool):
             assert result_data["to"] == ""
             assert result_data["subject"] == ""
 
+    @patch('smtplib.SMTP')
+    @patch('ssl.create_default_context')
+    def test_forward_sender_email_override(self, mock_ssl_context, mock_smtp):
+        """Test that sender_email parameter in forward overrides instance sender_email"""
+        tool = SendEmailTool(
+            smtp_server="smtp.test.com",
+            smtp_port=587,
+            username="auth@test.com",
+            password="password",
+            use_ssl=True,
+            sender_email="instance@test.com",
+            sender_name="Instance Sender"
+        )
+
+        mock_context = Mock()
+        mock_ssl_context.return_value = mock_context
+
+        mock_server = Mock()
+        mock_smtp.return_value = mock_server
+
+        result = tool.forward(
+            to="recipient@example.com",
+            subject="Test Subject",
+            content="<p>Test content</p>",
+            sender_email="override@test.com"
+        )
+
+        result_data = json.loads(result)
+        assert result_data["status"] == "success"
+
+        call_args = mock_server.send_message.call_args[0][0]
+        assert call_args['From'] == "Instance Sender <override@test.com>"
+
 
 if __name__ == '__main__':
     pytest.main([__file__])

From 777502aba656c2704fdb2c6acff4e37b1f61308a Mon Sep 17 00:00:00 2001
From: xuyaqist <xuyaqist@gmail.com>
Date: Mon, 11 May 2026 20:28:51 +0800
Subject: [PATCH 17/25] =?UTF-8?q?=E4=BF=AE=E5=A4=8D=E6=97=A0=E6=B3=95?=
 =?UTF-8?q?=E8=8E=B7=E5=8F=96=E6=98=8A=E5=A4=A9=E7=9F=A5=E8=AF=86=E5=BA=93?=
 =?UTF-8?q?=E5=88=97=E8=A1=A8=E7=9A=84=E9=97=AE=E9=A2=98?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 backend/services/haotian_service.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/backend/services/haotian_service.py b/backend/services/haotian_service.py
index a49079ec7..97c5db564 100644
--- a/backend/services/haotian_service.py
+++ b/backend/services/haotian_service.py
@@ -77,7 +77,7 @@ async def fetch_haotian_knowledge_sets_impl(
         )
 
     headers = {"Authorization": external_authorization}
-    async with httpx.AsyncClient(timeout=timeout_s, follow_redirects=True) as client:
+    async with httpx.AsyncClient(timeout=timeout_s, follow_redirects=True, trust_env=False) as client:
         resp = await client.get(list_url, headers=headers)
         if resp.status_code >= 400:
             raise RuntimeError(

From 9917c8f1cf1055e2fb2171103f1413634a2b4950 Mon Sep 17 00:00:00 2001
From: xuyaqist <xuyaqist@gmail.com>
Date: Tue, 12 May 2026 16:18:30 +0800
Subject: [PATCH 18/25] Create a session with trust_env=False to ignore proxy
 environment variables

---
 sdk/nexent/core/models/embedding_model.py | 12 ++++++++++--
 sdk/nexent/core/models/openai_llm.py      | 16 +++++++---------
 2 files changed, 17 insertions(+), 11 deletions(-)

diff --git a/sdk/nexent/core/models/embedding_model.py b/sdk/nexent/core/models/embedding_model.py
index 092877941..a7379efcb 100644
--- a/sdk/nexent/core/models/embedding_model.py
+++ b/sdk/nexent/core/models/embedding_model.py
@@ -171,6 +171,10 @@ def __init__(
         self.model = model_name
         self.embedding_dim = embedding_dim
         self.ssl_verify = ssl_verify
+        
+        # Create a session with trust_env=False to ignore proxy environment variables
+        self.session = requests.Session()
+        self.session.trust_env = False
 
         self.headers = {"Content-Type": "application/json", "Authorization": f"Bearer {self.api_key}"}
 
@@ -189,7 +193,7 @@ def _make_request(self, data: Dict[str, Any], timeout: Optional[float] = None) -
         Returns:
             Dict[str, Any]: API response
         """
-        response = requests.post(self.api_url, headers=self.headers, json=data, timeout=timeout, verify=self.ssl_verify)
+        response = self.session.post(self.api_url, headers=self.headers, json=data, timeout=timeout, verify=self.ssl_verify)
         response.raise_for_status()
         return response.json()
 
@@ -332,6 +336,10 @@ def __init__(self, model_name: str, base_url: str, api_key: str, embedding_dim:
 
         self.headers = {"Content-Type": "application/json", "Authorization": f"Bearer {self.api_key}"}
 
+        # Create a session with trust_env=False to ignore proxy environment variables
+        self.session = requests.Session()
+        self.session.trust_env = False
+
     def _prepare_input(self, inputs: Union[str, List[str]]) -> Dict[str, Any]:
         """Prepare the input data for the API request."""
         if isinstance(inputs, str):
@@ -349,7 +357,7 @@ def _make_request(self, data: Dict[str, Any], timeout: Optional[float] = None) -
         Returns:
             Dict[str, Any]: API response
         """
-        response = requests.post(self.api_url, headers=self.headers, json=data, timeout=timeout, verify=self.ssl_verify)
+        response = self.session.post(self.api_url, headers=self.headers, json=data, timeout=timeout, verify=self.ssl_verify)
         response.raise_for_status()
         return response.json()
 
diff --git a/sdk/nexent/core/models/openai_llm.py b/sdk/nexent/core/models/openai_llm.py
index 4c41e0021..02c4f74bd 100644
--- a/sdk/nexent/core/models/openai_llm.py
+++ b/sdk/nexent/core/models/openai_llm.py
@@ -56,15 +56,13 @@ def __init__(self, observer: MessageObserver = MessageObserver, temperature=0.2,
         if concurrency_limit is not None and concurrency_limit > 0:
             self._semaphore = asyncio.Semaphore(concurrency_limit)
 
-        # Create http_client based on ssl_verify parameter and timeout_seconds
-        if not ssl_verify or timeout_seconds is not None:
-            import httpx
-            # Build timeout configuration
-            timeout = httpx.Timeout(timeout_seconds) if timeout_seconds is not None else httpx.Timeout(120.0)
-            http_client = httpx.Client(verify=ssl_verify, timeout=timeout)
-            client_kwargs = kwargs.get('client_kwargs', {})
-            client_kwargs['http_client'] = http_client
-            kwargs['client_kwargs'] = client_kwargs
+        # Create http_client with trust_env=False to ignore proxy env vars
+        import httpx
+        timeout = httpx.Timeout(timeout_seconds) if timeout_seconds is not None else httpx.Timeout(120.0)
+        http_client = httpx.Client(verify=ssl_verify, timeout=timeout, trust_env=False)
+        client_kwargs = kwargs.get('client_kwargs', {})
+        client_kwargs['http_client'] = http_client
+        kwargs['client_kwargs'] = client_kwargs
 
         super().__init__(*args, **kwargs)
 

From 4b922a98a9d784ff94ed1ebbff04679ee07bffc9 Mon Sep 17 00:00:00 2001
From: xuyaqist <xuyaqist@gmail.com>
Date: Tue, 12 May 2026 19:26:57 +0800
Subject: [PATCH 19/25] =?UTF-8?q?=E8=AE=BE=E7=BD=AEgenerate=5Ftitle?=
 =?UTF-8?q?=E4=B8=BA=E9=9D=9E=E6=B5=81=E5=BC=8F=E6=8E=A5=E5=8F=A3?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 backend/services/conversation_management_service.py | 4 ++--
 sdk/nexent/core/models/openai_llm.py                | 2 +-
 2 files changed, 3 insertions(+), 3 deletions(-)

diff --git a/backend/services/conversation_management_service.py b/backend/services/conversation_management_service.py
index c3571fcf3..f03c32512 100644
--- a/backend/services/conversation_management_service.py
+++ b/backend/services/conversation_management_service.py
@@ -275,8 +275,8 @@ def call_llm_for_title(question: str, tenant_id: str, language: str = LANGUAGE["
     if model_config.get("model_factory", "").lower() == "modelengine":
         messages = [{"role": msg["role"], "content": str(msg.get("content", ""))} for msg in messages]
 
-    # Call the model
-    response = llm.generate(messages)
+    # Call the model with stream=False to get a single response
+    response = llm.generate(messages, stream=False)
     if not response or not response.content or not response.content.strip():
         return DEFAULT_EN_TITLE if language == LANGUAGE["EN"] else DEFAULT_ZH_TITLE
     return remove_think_blocks(response.content.strip())
diff --git a/sdk/nexent/core/models/openai_llm.py b/sdk/nexent/core/models/openai_llm.py
index 02c4f74bd..918e362a3 100644
--- a/sdk/nexent/core/models/openai_llm.py
+++ b/sdk/nexent/core/models/openai_llm.py
@@ -142,7 +142,7 @@ def __call__(self, messages: List[Dict[str, Any]], stop_sequences: Optional[List
         completion_kwargs["stream_options"] = {"include_usage": True}
 
         current_request = self.client.chat.completions.create(
-            stream=True, **completion_kwargs)
+            stream=kwargs.get("stream", True), **completion_kwargs)
 
         # Validate response type: ensure we got a proper iterator, not error strings or dicts
         # Some APIs return error strings like "error: rate limit" or JSON dicts on failure

From 09258eef2e1464c355f1611e7422e20fb7424b4b Mon Sep 17 00:00:00 2001
From: xuyaqist <xuyaqist@gmail.com>
Date: Tue, 12 May 2026 20:01:49 +0800
Subject: [PATCH 20/25] =?UTF-8?q?Revert=20"=E8=AE=BE=E7=BD=AEgenerate=5Fti?=
 =?UTF-8?q?tle=E4=B8=BA=E9=9D=9E=E6=B5=81=E5=BC=8F=E6=8E=A5=E5=8F=A3"?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

This reverts commit d1cffeb589b3ea2cb735d42d4d1ab7f61e125b39.
---
 backend/services/conversation_management_service.py | 4 ++--
 sdk/nexent/core/models/openai_llm.py                | 2 +-
 2 files changed, 3 insertions(+), 3 deletions(-)

diff --git a/backend/services/conversation_management_service.py b/backend/services/conversation_management_service.py
index f03c32512..c3571fcf3 100644
--- a/backend/services/conversation_management_service.py
+++ b/backend/services/conversation_management_service.py
@@ -275,8 +275,8 @@ def call_llm_for_title(question: str, tenant_id: str, language: str = LANGUAGE["
     if model_config.get("model_factory", "").lower() == "modelengine":
         messages = [{"role": msg["role"], "content": str(msg.get("content", ""))} for msg in messages]
 
-    # Call the model with stream=False to get a single response
-    response = llm.generate(messages, stream=False)
+    # Call the model
+    response = llm.generate(messages)
     if not response or not response.content or not response.content.strip():
         return DEFAULT_EN_TITLE if language == LANGUAGE["EN"] else DEFAULT_ZH_TITLE
     return remove_think_blocks(response.content.strip())
diff --git a/sdk/nexent/core/models/openai_llm.py b/sdk/nexent/core/models/openai_llm.py
index 918e362a3..02c4f74bd 100644
--- a/sdk/nexent/core/models/openai_llm.py
+++ b/sdk/nexent/core/models/openai_llm.py
@@ -142,7 +142,7 @@ def __call__(self, messages: List[Dict[str, Any]], stop_sequences: Optional[List
         completion_kwargs["stream_options"] = {"include_usage": True}
 
         current_request = self.client.chat.completions.create(
-            stream=kwargs.get("stream", True), **completion_kwargs)
+            stream=True, **completion_kwargs)
 
         # Validate response type: ensure we got a proper iterator, not error strings or dicts
         # Some APIs return error strings like "error: rate limit" or JSON dicts on failure

From 59fed2fe7c4584cdd5d3ca2f013d112918a23e4f Mon Sep 17 00:00:00 2001
From: xuyaqist <xuyaqist@gmail.com>
Date: Tue, 12 May 2026 20:25:32 +0800
Subject: [PATCH 21/25] =?UTF-8?q?"=E8=AE=BE=E7=BD=AEgenerate=5Ftitle?=
 =?UTF-8?q?=E4=B8=BA=E9=9D=9E=E6=B5=81=E5=BC=8F=E6=8E=A5=E5=8F=A3"?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 backend/services/conversation_management_service.py | 1 +
 1 file changed, 1 insertion(+)

diff --git a/backend/services/conversation_management_service.py b/backend/services/conversation_management_service.py
index c3571fcf3..302ec63a8 100644
--- a/backend/services/conversation_management_service.py
+++ b/backend/services/conversation_management_service.py
@@ -260,6 +260,7 @@ def call_llm_for_title(question: str, tenant_id: str, language: str = LANGUAGE["
         model_factory=model_config.get("model_factory", None),
         ssl_verify=model_config.get("ssl_verify", True),
         timeout_seconds=timeout_seconds,
+        stream=False,
     )
 
     # Build messages - use new template variable 'question' instead of 'content'

From 10a89e8a9ac0138d0a78671296edefe107bd63f0 Mon Sep 17 00:00:00 2001
From: xuyaqist <xuyaqist@gmail.com>
Date: Wed, 13 May 2026 14:19:10 +0800
Subject: [PATCH 22/25] =?UTF-8?q?=E8=AE=BE=E7=BD=AEauthorization=E5=AD=97?=
 =?UTF-8?q?=E6=AE=B5=E4=B9=9F=E4=B8=BA=E5=AF=86=E7=A0=81=E5=B1=95=E7=A4=BA?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../agentConfig/tool/ToolConfigModal.tsx        | 17 ++++++++++++++---
 1 file changed, 14 insertions(+), 3 deletions(-)

diff --git a/frontend/app/[locale]/agents/components/agentConfig/tool/ToolConfigModal.tsx b/frontend/app/[locale]/agents/components/agentConfig/tool/ToolConfigModal.tsx
index 53c6d3f03..39c3bbce2 100644
--- a/frontend/app/[locale]/agents/components/agentConfig/tool/ToolConfigModal.tsx
+++ b/frontend/app/[locale]/agents/components/agentConfig/tool/ToolConfigModal.tsx
@@ -1474,10 +1474,21 @@ export default function ToolConfigModal({
         case TOOL_PARAM_TYPES.ARRAY:
         case TOOL_PARAM_TYPES.OBJECT:
         default:
-          // Check if parameter name contains "password" for secure input
-          const isPasswordType = param.name.toLowerCase().includes("password");
+          // Check if parameter name indicates a secure/sensitive field
+          const sensitivePatterns = [
+            "password",
+            "authorization",
+            "api_key",
+            "apikey",
+            "api-key",
+            "secret",
+            "token",
+          ];
+          const isSecureField = sensitivePatterns.some((pattern) =>
+            param.name.toLowerCase().includes(pattern)
+          );
 
-          if (isPasswordType) {
+          if (isSecureField) {
             return (
               <Input.Password
                 placeholder={t("toolConfig.input.string.placeholder", {

From 13b88242195acf9dbbfedd8485436a1f1c4edbea Mon Sep 17 00:00:00 2001
From: xuyaqist <xuyaqist@gmail.com>
Date: Wed, 13 May 2026 18:18:25 +0800
Subject: [PATCH 23/25] =?UTF-8?q?=E5=A6=82=E6=9E=9C=E6=98=AF=E5=85=AC?=
 =?UTF-8?q?=E5=85=B1=E7=9F=A5=E8=AF=86=E5=BA=93=EF=BC=8C=E8=AE=BE=E7=BD=AE?=
 =?UTF-8?q?=E9=BB=98=E8=AE=A4id?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 backend/services/haotian_service.py | 17 +++++++++++------
 1 file changed, 11 insertions(+), 6 deletions(-)

diff --git a/backend/services/haotian_service.py b/backend/services/haotian_service.py
index 97c5db564..e7f762244 100644
--- a/backend/services/haotian_service.py
+++ b/backend/services/haotian_service.py
@@ -11,6 +11,8 @@
 
 logger = logging.getLogger("haotian_service")
 
+_DEFAULT_KNOWLEDGE_BASE_ID = "abcdefg"
+
 
 def _normalize_list_payload(raw: Dict[str, Any]) -> Dict[str, Any]:
     """
@@ -24,7 +26,7 @@ def _normalize_list_payload(raw: Dict[str, Any]) -> Dict[str, Any]:
       ]
     }
 
-    This function also filters out knowledge sets with name == "Public".
+    When dify_dataset_id is "null", it is replaced with the default ID.
     """
     knowledge_sets = raw.get("knowledge_sets", [])
     if not isinstance(knowledge_sets, list):
@@ -35,7 +37,7 @@ def _normalize_list_payload(raw: Dict[str, Any]) -> Dict[str, Any]:
         if not isinstance(ks, dict):
             continue
         set_name = str(ks.get("name", "") or "").strip()
-        if not set_name or set_name == "Public":
+        if not set_name:
             continue
 
         bases = ks.get("knowledge_bases", [])
@@ -48,15 +50,18 @@ def _normalize_list_payload(raw: Dict[str, Any]) -> Dict[str, Any]:
                 continue
             dataset_id = str(kb.get("dify_dataset_id", "") or "").strip()
             kb_name = str(kb.get("name", "") or "").strip()
-            if not dataset_id or not kb_name:
+            if not kb_name:
                 continue
+            if dataset_id == "null" or not dataset_id:
+                dataset_id = _DEFAULT_KNOWLEDGE_BASE_ID
             normalized_bases.append(
                 {"dify_dataset_id": dataset_id, "name": kb_name}
             )
 
-        normalized_sets.append(
-            {"name": set_name, "knowledge_bases": normalized_bases}
-        )
+        if normalized_bases:
+            normalized_sets.append(
+                {"name": set_name, "knowledge_bases": normalized_bases}
+            )
 
     return {"knowledge_sets": normalized_sets}
 

From 0eb02b09236c36420f488f11c951c8af6d6deef5 Mon Sep 17 00:00:00 2001
From: xuyaqist <xuyaqist@gmail.com>
Date: Thu, 14 May 2026 14:58:37 +0800
Subject: [PATCH 24/25] =?UTF-8?q?=E6=96=B0=E5=A2=9E=E5=B9=B6=E5=8F=91?=
 =?UTF-8?q?=E6=95=B0=E9=87=8F=E7=9A=84=E9=99=90=E5=88=B6?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 frontend/services/modelService.ts | 1 +
 1 file changed, 1 insertion(+)

diff --git a/frontend/services/modelService.ts b/frontend/services/modelService.ts
index 07796d2c4..58e9b9887 100644
--- a/frontend/services/modelService.ts
+++ b/frontend/services/modelService.ts
@@ -727,6 +727,7 @@ export const modelService = {
         maximum_chunk_size: params.maximumChunkSize,
         chunk_batch: params.chunkingBatchSize,
         timeout_seconds: params.timeoutSeconds,
+        concurrency_limit: params.concurrencyLimit,
       };
 
       // Add STT specific fields

From 00e574977bb4173a70200b4e73fd4fa4fde941c0 Mon Sep 17 00:00:00 2001
From: xuyaqist <xuyaqist@gmail.com>
Date: Fri, 15 May 2026 19:09:33 +0800
Subject: [PATCH 25/25] Bugfix: Resolve frontend cache issue when only one
 model is available

---
 backend/utils/llm_utils.py                    |  9 +++++++
 .../agentInfo/AgentGenerateDetail.tsx         | 27 ++++++++++++++++---
 frontend/types/agentConfig.ts                 |  2 +-
 3 files changed, 34 insertions(+), 4 deletions(-)

diff --git a/backend/utils/llm_utils.py b/backend/utils/llm_utils.py
index 53c23aa7b..7d6b0dc17 100644
--- a/backend/utils/llm_utils.py
+++ b/backend/utils/llm_utils.py
@@ -103,6 +103,15 @@ def call_llm_for_system_prompt(
         reasoning_content_seen = False
         content_tokens_seen = 0
         for chunk in current_request:
+            # Safety check: skip non-standard chunks that lack expected attributes
+            if not hasattr(chunk, 'choices'):
+                if hasattr(chunk, '__str__'):
+                    logger.warning(f"Received non-standard chunk (no 'choices'): {str(chunk)[:200]}")
+                continue
+
+            if not chunk.choices:
+                continue
+
             delta = chunk.choices[0].delta
             reasoning_content = getattr(delta, "reasoning_content", None)
             new_token = delta.content
diff --git a/frontend/app/[locale]/agents/components/agentInfo/AgentGenerateDetail.tsx b/frontend/app/[locale]/agents/components/agentInfo/AgentGenerateDetail.tsx
index c7c238a83..ad49c0516 100644
--- a/frontend/app/[locale]/agents/components/agentInfo/AgentGenerateDetail.tsx
+++ b/frontend/app/[locale]/agents/components/agentInfo/AgentGenerateDetail.tsx
@@ -278,6 +278,21 @@ export default function AgentGenerateDetail({
       delete initialAgentInfo.group_ids;
     }
 
+    // Check if the agent's model is still available
+    const agentModelAvailable = availableLlmModels.some(
+      (m) => m.name === editedAgent.model || m.displayName === editedAgent.model
+    );
+    let effectiveMainAgentModel = initialAgentInfo.mainAgentModel;
+    let effectiveMainAgentModelId = editedAgent.model_id || 0;
+
+    if (!agentModelAvailable && defaultLlmModel) {
+      // Agent's original model is no longer available, switch to default model
+      effectiveMainAgentModel = defaultLlmModel.displayName || "";
+      effectiveMainAgentModelId = defaultLlmModel.id || 0;
+      // Update the initialAgentInfo with the new model
+      initialAgentInfo.mainAgentModel = effectiveMainAgentModel;
+    }
+
     const initialBusinessInfo = {
       businessDescription: editedAgent.business_description || "",
       businessLogicModelName:
@@ -291,12 +306,18 @@ export default function AgentGenerateDetail({
     setBusinessInfo(initialBusinessInfo);
 
     form.setFieldsValue(initialAgentInfo);
-    // Sync model to store if not already set (e.g., in create mode with default model)
+    // Sync model to store (use default model if original is unavailable)
     if (isCreatingMode && defaultLlmModel) {
       updateProfileInfo({
         model: defaultLlmModel.displayName || "",
         model_id: defaultLlmModel.id || 0,
       });
+    } else if (!agentModelAvailable && defaultLlmModel) {
+      // Update model in store when original model is no longer available
+      updateProfileInfo({
+        model: effectiveMainAgentModel,
+        model_id: effectiveMainAgentModelId,
+      });
     }
     // Sync max_step to store in create mode (default to 5)
     if (isCreatingMode && !editedAgent.max_step) {
@@ -310,7 +331,7 @@ export default function AgentGenerateDetail({
       });
     }
 
-  }, [currentAgentId, defaultLlmModel?.id, isCreatingMode, forceRefreshKey]);
+  }, [currentAgentId, defaultLlmModel, isCreatingMode, forceRefreshKey, availableLlmModels]);
 
   // Default to selecting all groups when creating a new agent.
   // Only applies when groups are loaded and no group is selected yet.
@@ -609,7 +630,7 @@ export default function AgentGenerateDetail({
         {
           agent_id: effectiveAgentId,
           task_description: businessInfo.businessDescription,
-          model_id: businessInfo.businessLogicModelId.toString(),
+          model_id: businessInfo.businessLogicModelId,
           sub_agent_ids: editedAgent.sub_agent_id_list,
           tool_ids: Array.isArray(editedAgent.tools)
             ? editedAgent.tools.map((tool: any) =>
diff --git a/frontend/types/agentConfig.ts b/frontend/types/agentConfig.ts
index e6d36daaf..c0fd007fc 100644
--- a/frontend/types/agentConfig.ts
+++ b/frontend/types/agentConfig.ts
@@ -407,7 +407,7 @@ export interface McpContainer {
 export interface GeneratePromptParams {
   agent_id: number;
   task_description: string;
-  model_id: string;
+  model_id: number;
   tool_ids?: number[]; // Optional: tool IDs selected in frontend (takes precedence over database query)
   sub_agent_ids?: number[]; // Optional: sub-agent IDs selected in frontend (takes precedence over database query)
   /**