litxaohu
diff --git a/‎README.md‎
Lines changed: 38 additions & 42 deletions b/‎README.md‎
Lines changed: 38 additions & 42 deletions
diff --git a/‎src/rk3576/README.md‎
Lines changed: 14 additions & 22 deletions b/‎src/rk3576/README.md‎
Lines changed: 14 additions & 22 deletions
diff --git a/‎src/rk3576/model/yolo11m.rknn‎
25.8 MB b/‎src/rk3576/model/yolo11m.rknn‎
25.8 MB
diff --git a/‎src/rk3576/model/yolo11s.rknn‎
13.8 MB b/‎src/rk3576/model/yolo11s.rknn‎
13.8 MB
diff --git a/‎src/rk3576/web_detection.py‎
Lines changed: 42 additions & 1 deletion b/‎src/rk3576/web_detection.py‎
Lines changed: 42 additions & 1 deletion
diff --git a/‎src/rk3588/README.md‎
Lines changed: 14 additions & 22 deletions b/‎src/rk3588/README.md‎
Lines changed: 14 additions & 22 deletions
@@ -60,70 +60,46 @@ sudo docker pull ghcr.io/litxaohu/recomputer-rk-cv/rk3576-yolo:latest
 
 **针对 RK3588:**
 ```bash
-sudo docker run --rm --privileged --net=host --env DISPLAY=$DISPLAY \
-    -v /tmp/.X11-unix:/tmp/.X11-unix \
-    -v /dev/bus/usb:/dev/bus/usb \
+sudo docker run --rm --privileged --net=host \
+    -e PYTHONUNBUFFERED=1 \
+    -e RKNN_LOG_LEVEL=0 \
     --device /dev/video1:/dev/video1 \
     --device /dev/dri/renderD129:/dev/dri/renderD129 \
     -v /proc/device-tree/compatible:/proc/device-tree/compatible \
-    ghcr.io/litxaohu/recomputer-rk-cv/rk3588-yolo:latest
-    python realtime_detection.py --model_path model/yolo11n.rknn --camera_id 1
+    ghcr.io/litxaohu/recomputer-rk-cv/rk3588-yolo:latest \
+    python web_detection.py --model_path model/yolo11n.rknn --camera_id 1
 ```
 
 **针对 RK3576:**
 ```bash
-sudo docker run --rm --privileged --net=host --env DISPLAY=$DISPLAY \
-    -v /tmp/.X11-unix:/tmp/.X11-unix \
-    -v /dev/bus/usb:/dev/bus/usb \
+sudo docker run --rm --privileged --net=host \
+    -e PYTHONUNBUFFERED=1 \
+    -e RKNN_LOG_LEVEL=0 \
     --device /dev/video0:/dev/video0 \
     --device /dev/dri/renderD128:/dev/dri/renderD128 \
     -v /proc/device-tree/compatible:/proc/device-tree/compatible \
-    ghcr.io/litxaohu/recomputer-rk-cv/rk3576-yolo:latest
-    python realtime_detection.py --model_path model/yolo11n.rknn --camera_id 0
+    ghcr.io/litxaohu/recomputer-rk-cv/rk3576-yolo:latest \
+    python web_detection.py --model_path model/yolo11n.rknn --camera_id 0
 ```
 
-#### 如何预览：
-1.  **本地显示器**：自动弹出实时检测窗口（需连接显示器并执行了 xhost）。
-2.  **Web 浏览器**：在局域网内访问 `http://<开发板IP>:8000` 即可实时预览。
-
-#### 常见问题排查：
-**问题：SSH 远程无屏幕运行报错 `qt.qpa.xcb: could not connect to display`**
-解决方案：在运行命令末尾添加 `--no_gui` 参数，强制关闭本地窗口初始化。
-```bash
-# 示例 (在原有命令末尾追加):
-... python realtime_detection.py --model_path model/yolo11n.rknn --camera_id 0 --no_gui
-```
+访问方式：`http://<开发板IP>:8000`
 
-### 3. 独立 Web 预览模式 (仅浏览器查看)
+> **注意**: 如果需要自定义类别，可以增加 `-v $(pwd)/class_config.txt:/app/class_config.txt \` 挂载和 `--class_path` 参数，程序默认使用 COCO 80 类。
 
-如果您只需要通过 Web 浏览器查看预览画面（例如在远程服务器或无显示器环境下运行），可以使用专用的 Web 预览脚本：
+例如：
 
-**针对 RK3588:**
 ```bash
 sudo docker run --rm --privileged --net=host \
     -e PYTHONUNBUFFERED=1 \
     -e RKNN_LOG_LEVEL=0 \
+    -v $(pwd)/class_config.txt:/app/class_config.txt \
     --device /dev/video1:/dev/video1 \
     --device /dev/dri/renderD129:/dev/dri/renderD129 \
     -v /proc/device-tree/compatible:/proc/device-tree/compatible \
     ghcr.io/litxaohu/recomputer-rk-cv/rk3588-yolo:latest \
-    python web_detection.py --model_path model/yolo11n.rknn --camera_id 1
-```
-
-**针对 RK3576:**
-```bash
-sudo docker run --rm --privileged --net=host \
-    -e PYTHONUNBUFFERED=1 \
-    -e RKNN_LOG_LEVEL=0 \
-    --device /dev/video0:/dev/video0 \
-    --device /dev/dri/renderD128:/dev/dri/renderD128 \
-    -v /proc/device-tree/compatible:/proc/device-tree/compatible \
-    ghcr.io/litxaohu/recomputer-rk-cv/rk3576-yolo:latest \
-    python web_detection.py --model_path model/yolo11n.rknn --camera_id 0
+    python web_detection.py --model_path model/yolo11n.rknn --camera_id 1 --class_path class_config.txt
 ```
 
-访问方式：`http://<开发板IP>:8000`
-
 ---
 
 ## 🔌 API 接口文档
@@ -190,7 +166,26 @@ curl -X POST "http://127.0.0.1:8000/api/models/yolo11/predict"
 - **请求体 (JSON):** `{"obj_thresh": 0.3, "nms_thresh": 0.5}`
 - **响应:** `{"status": "success"}`
 
-### 3. 实时视频流接口 (Video Feed)
+### 3. 命令行参数说明
+
+运行 `web_detection.py` 时支持以下参数：
+
+| 参数 | 说明 | 默认值 |
+| :--- | :--- | :--- |
+| `--model_path` | RKNN 模型文件路径 | (必填) |
+| `--camera_id` | 摄像头设备 ID (如 `/dev/video1` 则填 1) | 1 |
+| `--video_path` | 视频文件路径 (若提供则忽略 camera_id) | None |
+| `--class_path` | 自定义类别配置文件路径 (class_config.txt) | None (默认 COCO 80类) |
+| `--host` | Web 服务器监听地址 | `0.0.0.0` |
+| `--port` | Web 服务器端口 | 8000 |
+
+#### 自定义类别配置 (class_config.txt) 格式：
+使用双引号命名分类，不同分类之间使用逗号隔开，例如：
+`"person", "bicycle", "car", "motorbike"`
+
+---
+
+## 实时视频流接口 (Video Feed)
 
 获取带有检测框绘制的实时 MJPEG 视频流，可直接嵌入 HTML `<img>` 标签。
 
@@ -211,12 +206,13 @@ curl -X POST "http://127.0.0.1:8000/api/models/yolo11/predict"
 
 ---
 
-## �️ 开发者指南 (量产建议)
+## 🛠️ 开发者指南 (量产建议)
 ### 代码说明
-- `realtime_detection.py`:
+- `web_detection.py`:
     - **双模支持**: 集成 FastAPI，同时支持本地渲染和 MJPEG 流式输出。
     - **环境自适应**: 自动检测 `DISPLAY` 环境变量，无环境时静默跳过 GUI 初始化。
     - **RKNN 推理**: 封装了 RKNN 初始化、加载模型、多核推理逻辑。
+    - **动态加载**: 支持通过 `--class_path` 动态加载类别配置。
     - **后处理**: YOLOv11 专用的 Box 解码与 NMS 逻辑。
 
 ### 修改模型
 
@@ -10,7 +10,7 @@
 ## 目录结构
 - `lib/`：包含 RK3576 版 `librknnrt.so`。
 - `model/`：存放针对 RK3576 转换的 `.rknn` 模型。
-- `realtime_detection.py`：主程序。
+- `web_detection.py`：主程序（支持 Web 预览与 API）。
 
 ## 快速开始
 
@@ -26,43 +26,34 @@ xhost +local:docker
 
 #### 步骤 B：一键运行
 ```bash
-sudo docker run --rm --privileged --net=host --env DISPLAY=$DISPLAY \
-    -v /tmp/.X11-unix:/tmp/.X11-unix \
-    -v /dev/bus/usb:/dev/bus/usb \
+sudo docker run --rm --privileged --net=host \
+    -e PYTHONUNBUFFERED=1 \
+    -e RKNN_LOG_LEVEL=0 \
     --device /dev/video0:/dev/video0 \
     --device /dev/dri/renderD128:/dev/dri/renderD128 \
     -v /proc/device-tree/compatible:/proc/device-tree/compatible \
     ghcr.io/litxaohu/recomputer-rk-cv/rk3576-yolo:latest \
-    python realtime_detection.py --model_path model/yolo11n.rknn --camera_id 0
+    python web_detection.py --model_path model/yolo11n.rknn --camera_id 0
 ```
+访问方式：`http://<开发板IP>:8000`
 
-#### 如何预览：
-1.  **本地显示器**：自动弹出实时检测窗口（需连接显示器并执行了 xhost）。
-2.  **Web 浏览器**：在局域网内访问 `http://<开发板IP>:8000` 即可实时预览。
 
-#### 常见问题排查：
-**问题：SSH 远程无屏幕运行报错 `qt.qpa.xcb: could not connect to display`**
-解决方案：在运行命令末尾添加 `--no_gui` 参数，强制关闭本地窗口初始化。
-```bash
-# 示例 (在原有命令末尾追加):
-... python realtime_detection.py --model_path model/yolo11n.rknn --camera_id 0 --no_gui
-```
-
-### 2. 独立 Web 预览模式 (仅浏览器查看)
+> **注意**: 如果需要自定义类别，可以增加 `-v $(pwd)/class_config.txt:/app/class_config.txt \` 挂载和 `--class_path` 参数，程序默认使用 COCO 80 类。
 
-如果您只需要通过 Web 浏览器查看预览画面（例如在远程服务器或无显示器环境下运行），可以使用专用的 Web 预览脚本：
+例如：
 
 ```bash
 sudo docker run --rm --privileged --net=host \
     -e PYTHONUNBUFFERED=1 \
     -e RKNN_LOG_LEVEL=0 \
+    -v $(pwd)/class_config.txt:/app/class_config.txt \
     --device /dev/video0:/dev/video0 \
     --device /dev/dri/renderD128:/dev/dri/renderD128 \
     -v /proc/device-tree/compatible:/proc/device-tree/compatible \
     ghcr.io/litxaohu/recomputer-rk-cv/rk3576-yolo:latest \
-    python web_detection.py --model_path model/yolo11n.rknn --camera_id 0
+    python web_detection.py --model_path model/yolo11n.rknn --camera_id 0 --class_path class_config.txt
 ```
-访问方式：`http://<开发板IP>:8000`
+
 
 ---
 
@@ -139,12 +130,13 @@ curl -X POST "http://127.0.0.1:8000/api/models/yolo11/predict"
 
 ---
 
-## ️ 开发者指南 (量产建议)
+## 🛠️ 开发者指南 (量产建议)
 ### 代码说明
-- `realtime_detection.py`:
+- `web_detection.py`:
     - **双模支持**: 集成 FastAPI，同时支持本地渲染和 MJPEG 流式输出。
     - **环境自适应**: 自动检测 `DISPLAY` 环境变量，无环境时静默跳过 GUI 初始化。
     - **RKNN 推理**: 封装了 RKNN 初始化、加载模型、多核推理逻辑。
+    - **动态加载**: 支持通过 `--class_path` 动态加载类别配置。
     - **后处理**: YOLOv11 专用的 Box 解码与 NMS 逻辑。
 
 ### 修改模型
 
@@ -26,14 +26,50 @@
 NMS_THRESH = 0.45
 IMG_SIZE = (640, 640)  # (width, height)
 
-CLASSES = ("person", "bicycle", "car","motorbike ","aeroplane ","bus ","train","truck ","boat","traffic light",
+# 默认类别定义 (COCO 80类)
+DEFAULT_CLASSES = ("person", "bicycle", "car","motorbike ","aeroplane ","bus ","train","truck ","boat","traffic light",
            "fire hydrant","stop sign ","parking meter","bench","bird","cat","dog ","horse ","sheep","cow","elephant",
            "bear","zebra ","giraffe","backpack","umbrella","handbag","tie","suitcase","frisbee","skis","snowboard","sports ball","kite",
            "baseball bat","baseball glove","skateboard","surfboard","tennis racket","bottle","wine glass","cup","fork","knife ",
            "spoon","bowl","banana","apple","sandwich","orange","broccoli","carrot","hot dog","pizza ","donut","cake","chair","sofa",
            "pottedplant","bed","diningtable","toilet ","tvmonitor","laptop	","mouse	","remote ","keyboard ","cell phone","microwave ",
            "oven ","toaster","sink","refrigerator ","book","clock","vase","scissors ","teddy bear ","hair drier", "toothbrush ")
 
+CLASSES = DEFAULT_CLASSES
+
+def load_classes(path):
+    """
+    从文件加载类别，支持双引号和逗号分隔的格式
+    例如: "person", "bicycle", "car"
+    """
+    global CLASSES
+    if not path or not os.path.exists(path):
+        CLASSES = DEFAULT_CLASSES
+        return
+
+    try:
+        with open(path, 'r', encoding='utf-8') as f:
+            content = f.read().strip()
+            # 简单的解析逻辑：移除换行，按逗号分割，去除空格和双引号
+            import re
+            # 匹配双引号内的内容
+            items = re.findall(r'"([^"]*)"', content)
+            if items:
+                CLASSES = tuple(items)
+                print(f"Successfully loaded {len(CLASSES)} classes from {path}")
+            else:
+                # 备选方案：如果没匹配到双引号，尝试按逗号分割
+                items = [item.strip().strip('"') for item in content.split(',') if item.strip()]
+                if items:
+                    CLASSES = tuple(items)
+                    print(f"Loaded {len(CLASSES)} classes from {path} (fallback parsing)")
+                else:
+                    print(f"Warning: No classes found in {path}, using default COCO classes")
+                    CLASSES = DEFAULT_CLASSES
+    except Exception as e:
+        print(f"Error loading classes from {path}: {e}. Using default COCO classes")
+        CLASSES = DEFAULT_CLASSES
+
 # 动态配置参数
 class DetectionConfig:
     def __init__(self):
@@ -481,6 +517,7 @@ def main():
     parser.add_argument('--model_path', type=str, required=True, help='RKNN model path')
     parser.add_argument('--camera_id', type=int, default=1, help='Camera device ID (default: 1 for /dev/video1)')
     parser.add_argument('--video_path', type=str, help='Path to video file (overrides camera_id)')
+    parser.add_argument('--class_path', type=str, help='Path to class_config.txt file for dynamic category loading')
     parser.add_argument('--host', type=str, default='0.0.0.0', help='Web server host')
     parser.add_argument('--port', type=int, default=8000, help='Web server port')
     args = parser.parse_args()
@@ -489,6 +526,10 @@ def main():
         print("Error: RKNN-Toolkit-Lite2 is not available.")
         return
 
+    # 加载自定义类别
+    if args.class_path:
+        load_classes(args.class_path)
+
     # 启动 Web 服务器线程
     web_thread = threading.Thread(target=run_fastapi, args=(args.host, args.port), daemon=True)
     web_thread.start()
 
@@ -10,7 +10,7 @@
 ## 目录结构
 - `lib/`：包含 RK3588 版 `librknnrt.so`。
 - `model/`：存放针对 RK3588 转换的 `.rknn` 模型。
-- `realtime_detection.py`：主程序。
+- `web_detection.py`：主程序（支持 Web 预览与 API）。
 
 ## 快速开始
 
@@ -25,44 +25,35 @@ xhost +local:docker
 ```
 
 #### 步骤 B：一键运行
+
 ```bash
-sudo docker run --rm --privileged --net=host --env DISPLAY=$DISPLAY \
-    -v /tmp/.X11-unix:/tmp/.X11-unix \
-    -v /dev/bus/usb:/dev/bus/usb \
+sudo docker run --rm --privileged --net=host \
+    -e PYTHONUNBUFFERED=1 \
+    -e RKNN_LOG_LEVEL=0 \
     --device /dev/video1:/dev/video1 \
     --device /dev/dri/renderD129:/dev/dri/renderD129 \
     -v /proc/device-tree/compatible:/proc/device-tree/compatible \
     ghcr.io/litxaohu/recomputer-rk-cv/rk3588-yolo:latest \
-    python realtime_detection.py --model_path model/yolo11n.rknn --camera_id 1
+    python web_detection.py --model_path model/yolo11n.rknn --camera_id 1
 ```
+访问方式：`http://<开发板IP>:8000`
 
-#### 如何预览：
-1.  **本地显示器**：自动弹出实时检测窗口（需连接显示器并执行了 xhost）。
-2.  **Web 浏览器**：在局域网内访问 `http://<开发板IP>:8000` 即可实时预览。
-
-#### 常见问题排查：
-**问题：SSH 远程无屏幕运行报错 `qt.qpa.xcb: could not connect to display`**
-解决方案：在运行命令末尾添加 `--no_gui` 参数，强制关闭本地窗口初始化。
-```bash
-# 示例 (在原有命令末尾追加):
-... python realtime_detection.py --model_path model/yolo11n.rknn --camera_id 1 --no_gui
-```
 
-### 2. 独立 Web 预览模式 (仅浏览器查看)
+> **注意**: 如果需要自定义类别，可以增加 `-v $(pwd)/class_config.txt:/app/class_config.txt \` 挂载和 `--class_path` 参数，程序默认使用 COCO 80 类。
 
-如果您只需要通过 Web 浏览器查看预览画面（例如在远程服务器或无显示器环境下运行），可以使用专用的 Web 预览脚本：
+例如：
 
 ```bash
 sudo docker run --rm --privileged --net=host \
     -e PYTHONUNBUFFERED=1 \
     -e RKNN_LOG_LEVEL=0 \
+    -v $(pwd)/class_config.txt:/app/class_config.txt \
     --device /dev/video1:/dev/video1 \
     --device /dev/dri/renderD129:/dev/dri/renderD129 \
     -v /proc/device-tree/compatible:/proc/device-tree/compatible \
     ghcr.io/litxaohu/recomputer-rk-cv/rk3588-yolo:latest \
-    python web_detection.py --model_path model/yolo11n.rknn --camera_id 1
+    python web_detection.py --model_path model/yolo11n.rknn --camera_id 1 --class_path class_config.txt
 ```
-访问方式：`http://<开发板IP>:8000`
 
 ---
 
@@ -139,12 +130,13 @@ curl -X POST "http://127.0.0.1:8000/api/models/yolo11/predict"
 
 ---
 
-## ️ 开发者指南 (量产建议)
+## 🛠️ 开发者指南 (量产建议)
 ### 代码说明
-- `realtime_detection.py`:
+- `web_detection.py`:
     - **双模支持**: 集成 FastAPI，同时支持本地渲染和 MJPEG 流式输出。
     - **环境自适应**: 自动检测 `DISPLAY` 环境变量，无环境时静默跳过 GUI 初始化。
     - **RKNN 推理**: 封装了 RKNN 初始化、加载模型、多核推理逻辑。
+    - **动态加载**: 支持通过 `--class_path` 动态加载类别配置。
     - **后处理**: YOLOv11 专用的 Box 解码与 NMS 逻辑。
 
 ### 修改模型