chore: fix unit tests

sangjanai · sangjanai · commit 282aae3fbc1d · 2025-03-20T06:02:28.000+07:00
diff --git a/engine/extensions/local-engine/local_engine.h b/engine/extensions/local-engine/local_engine.h
@@ -22,6 +22,7 @@ struct ServerAddress {
   std::string ai_prompt;
   std::string system_prompt;
 };
+
 class LocalEngine : public EngineI {
  public:
   LocalEngine(EngineService& engine_service, TaskQueue& q)
diff --git a/engine/services/engine_service.h b/engine/services/engine_service.h
@@ -45,7 +45,6 @@ class EngineService : public EngineServiceI {
   using EngineVariant = github_release_utils::GitHubAsset;
 
   struct EngineInfo {
-    std::unique_ptr<cortex_cpp::dylib> dl;
     EngineV engine;
   };
 
diff --git a/engine/test/components/test_engine_matcher_utils.cc b/engine/test/components/test_engine_matcher_utils.cc
@@ -6,134 +6,74 @@
 class EngineMatcherUtilsTestSuite : public ::testing::Test {
  protected:
   const std::vector<std::string> cortex_llamacpp_variants{
-      "cortex.llamacpp-0.1.25-25.08.24-linux-amd64-avx-cuda-11-7.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-linux-amd64-avx-cuda-12-0.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-linux-amd64-avx.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-linux-amd64-avx2-cuda-11-7.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-linux-amd64-avx2-cuda-12-0.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-linux-amd64-avx2.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-linux-amd64-avx512-cuda-11-7.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-linux-amd64-avx512-cuda-12-0.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-linux-amd64-avx512.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-linux-amd64-noavx-cuda-11-7.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-linux-amd64-noavx-cuda-12-0.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-linux-amd64-noavx.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-linux-amd64-vulkan.tar.gz",
-      "cortex.llamacpp-0.1.43-linux-arm64.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-mac-amd64.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-mac-arm64.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-windows-amd64-avx-cuda-11-7.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-windows-amd64-avx-cuda-12-0.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-windows-amd64-avx.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-windows-amd64-avx2-cuda-11-7.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-windows-amd64-avx2-cuda-12-0.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-windows-amd64-avx2.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-windows-amd64-avx512-cuda-11-7.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-windows-amd64-avx512-cuda-12-0.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-windows-amd64-avx512.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-windows-amd64-noavx-cuda-11-7.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-windows-amd64-noavx-cuda-12-0.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-windows-amd64-noavx.tar.gz",
-      "cortex.llamacpp-0.1.25-25.08.24-windows-amd64-vulkan.tar.gz",
+      "llama-b4920-bin-ubuntu-arm64.zip",
+      "llama-b4920-bin-linux-avx-cuda-cu11.7-x64.tar.gz",
+      "llama-b4920-bin-linux-avx-cuda-cu12.0-x64.tar.gz",
+      "llama-b4920-bin-linux-avx-x64.tar.gz",
+      "llama-b4920-bin-linux-avx2-cuda-cu11.7-x64.tar.gz",
+      "llama-b4920-bin-linux-avx2-cuda-cu12.0-x64.tar.gz",
+      "llama-b4920-bin-ubuntu-x64.tar.gz",
+      "llama-b4920-bin-linux-avx512-cuda-cu11.7-x64.tar.gz",
+      "llama-b4920-bin-linux-avx512-cuda-cu12.0-x64.tar.gz",
+      "llama-b4920-bin-linux-avx512-x64.tar.gz",
+      "llama-b4920-bin-linux-noavx-cuda-cu11.7-x64.tar.gz",
+      "llama-b4920-bin-linux-noavx-cuda-cu12.0-x64.tar.gz",
+      "llama-b4920-bin-linux-noavx-x64.tar.gz",
+      "llama-b4920-bin-ubuntu-vulkan-x64.tar.gz",
+      "llama-b4920-bin-macos-arm64.zip",
+      "llama-b4920-bin-macos-x64.zip",
+      "llama-b4920-bin-windows-amd64-avx-cuda-11-7.tar.gz",
+      "llama-b4920-bin-windows-amd64-avx-cuda-12-0.tar.gz",
+      "llama-b4920-bin-win-avx-x64.zip",
+      "llama-b4920-bin-windows-amd64-avx2-cuda-11-7.tar.gz",
+      "llama-b4920-bin-windows-amd64-avx2-cuda-12-0.tar.gz",
+      "llama-b4920-bin-win-avx2-x64.zip",
+      "llama-b4920-bin-windows-amd64-avx512-cuda-11-7.tar.gz",
+      "llama-b4920-bin-windows-amd64-avx512-cuda-12-0.tar.gz",
+      "llama-b4920-bin-win-avx512-x64.zip",
+      "llama-b4920-bin-windows-amd64-noavx-cuda-11-7.tar.gz",
+      "llama-b4920-bin-windows-amd64-noavx-cuda-12-0.tar.gz",
+      "llama-b4920-bin-win-noavx-x64.zip",
+      "llama-b4920-bin-win-vulkan-x64.zip",
   };
-
-  const std::vector<std::string> cortex_tensorrt_variants{
-      "cortex.tensorrt-llm-0.0.9-linux-cuda-12-4.tar.gz",
-      "cortex.tensorrt-llm-0.0.9-windows-cuda-12-4.tar.gz"};
-
-  const std::vector<std::string> cortex_onnx_variants{
-      "cortex.onnx-0.1.7-windows-amd64.tar.gz"};
 };
 
-TEST_F(EngineMatcherUtilsTestSuite, TestValidateOnnx) {
-
-  {
-    auto expect_matched_variant = cortex_onnx_variants[0];
-    auto result = engine_matcher_utils::ValidateOnnx(cortex_onnx_variants,
-                                                     "windows", "amd64");
-
-    EXPECT_EQ(result, expect_matched_variant);
-  }
-
-  {
-    // should return an empty variant because no variant matched
-    auto expect_matched_variant{""};
-    auto windows_arm_result = engine_matcher_utils::ValidateOnnx(
-        cortex_onnx_variants, "windows", "arm");
-    auto mac_arm64_result = engine_matcher_utils::ValidateOnnx(
-        cortex_onnx_variants, "mac", "arm64");
-
-    EXPECT_EQ(windows_arm_result, expect_matched_variant);
-    EXPECT_EQ(mac_arm64_result, expect_matched_variant);
-  }
-}
-
-TEST_F(EngineMatcherUtilsTestSuite, TestValidateTensorrt) {
-
-  {
-    auto windows_expect_matched_variant{cortex_tensorrt_variants[1]};
-    auto linux_expect_matched_variant{cortex_tensorrt_variants[0]};
-    auto windows{"windows"};
-    auto linux{"linux"};
-    auto cuda_version{"12.4"};
-    auto windows_result = engine_matcher_utils::ValidateTensorrtLlm(
-        cortex_tensorrt_variants, windows, cuda_version);
-    auto linux_result = engine_matcher_utils::ValidateTensorrtLlm(
-        cortex_tensorrt_variants, linux, cuda_version);
-
-    EXPECT_EQ(windows_result, windows_expect_matched_variant);
-    EXPECT_EQ(linux_result, linux_expect_matched_variant);
-  }
-
-  {  // macos is not supported
-    auto os = "mac";
-    auto cuda_version{"12.4"};
-
-    auto result = engine_matcher_utils::ValidateTensorrtLlm(
-        cortex_tensorrt_variants, os, cuda_version);
-    EXPECT_EQ(result, "");
-  }
-}
-
 TEST_F(EngineMatcherUtilsTestSuite, TestValidate) {
   {
-    auto os{"windows"};
+    auto os{"win"};
     auto cpu_arch{"amd64"};
     auto suitable_avx{"avx2"};
     auto cuda_version{"12.4"};
 
     auto variant = engine_matcher_utils::Validate(
         cortex_llamacpp_variants, os, cpu_arch, suitable_avx, cuda_version);
 
-    EXPECT_EQ(
-        variant,
-        "cortex.llamacpp-0.1.25-25.08.24-windows-amd64-avx2-cuda-12-0.tar.gz");
+    EXPECT_EQ(variant, "llama-b4920-bin-windows-amd64-avx2-cuda-12-0.tar.gz");
   }
 
   {
     auto os{"mac"};
-    auto cpu_arch{"amd64"};
+    auto cpu_arch{"x64"};
     auto suitable_avx{""};
     auto cuda_version{""};
 
     auto variant = engine_matcher_utils::Validate(
         cortex_llamacpp_variants, os, cpu_arch, suitable_avx, cuda_version);
 
-    EXPECT_EQ(variant, "cortex.llamacpp-0.1.25-25.08.24-mac-amd64.tar.gz");
+    EXPECT_EQ(variant, "llama-b4920-bin-macos-x64.zip");
   }
 
   {
-    auto os{"windows"};
-    auto cpu_arch{"amd64"};
+    auto os{"win"};
+    auto cpu_arch{"x64"};
     auto suitable_avx{"avx2"};
     auto cuda_version{"10"};
 
     auto variant = engine_matcher_utils::Validate(
         cortex_llamacpp_variants, os, cpu_arch, suitable_avx, cuda_version);
 
     // fallback to no cuda version
-    EXPECT_EQ(variant,
-              "cortex.llamacpp-0.1.25-25.08.24-windows-amd64-avx2.tar.gz");
+    EXPECT_EQ(variant, "llama-b4920-bin-win-avx2-x64.zip");
   }
 
   {
@@ -145,30 +85,36 @@ TEST_F(EngineMatcherUtilsTestSuite, TestValidate) {
     auto variant = engine_matcher_utils::Validate(
         cortex_llamacpp_variants, os, cpu_arch, suitable_avx, cuda_version);
 
-    EXPECT_EQ(variant, "cortex.llamacpp-0.1.43-linux-arm64.tar.gz");
+    EXPECT_EQ(variant, "llama-b4920-bin-ubuntu-arm64.zip");
   }
 }
 
 TEST_F(EngineMatcherUtilsTestSuite, TestGetVersionAndArch) {
   {
-    std::string variant =
-        "cortex.llamacpp-0.1.25-25.08.24-linux-amd64-avx-cuda-11-7.tar.gz";
+    std::string variant = "llama-b4920-bin-linux-avx-cuda-cu11.7-x64.tar.gz";
+    auto [version, arch] = engine_matcher_utils::GetVersionAndArch(variant);
+    EXPECT_EQ(version, "b4920");
+    EXPECT_EQ(arch, "linux-avx-cuda-cu11.7-x64");
+  }
+
+  {
+    std::string variant = "llama-b4920-bin-ubuntu-arm64.zip";
     auto [version, arch] = engine_matcher_utils::GetVersionAndArch(variant);
-    EXPECT_EQ(version, "v0.1.25-25.08.24");
-    EXPECT_EQ(arch, "linux-amd64-avx-cuda-11-7");
+    EXPECT_EQ(version, "b4920");
+    EXPECT_EQ(arch, "ubuntu-arm64");
   }
 
   {
-    std::string variant = "cortex.llamacpp-0.1.25-windows-amd64-avx2.tar.gz";
+    std::string variant = "llama-b4920-bin-win-avx2-x64.zip";
     auto [version, arch] = engine_matcher_utils::GetVersionAndArch(variant);
-    EXPECT_EQ(version, "v0.1.25");
-    EXPECT_EQ(arch, "windows-amd64-avx2");
+    EXPECT_EQ(version, "b4920");
+    EXPECT_EQ(arch, "win-avx2-x64");
   }
 
   {
-    std::string variant = "cortex.llamacpp-0.1.25-25.08.24-mac-amd64.tar.gz";
+    std::string variant = "llama-b4920-bin-macos-x64.tar.gz";
     auto [version, arch] = engine_matcher_utils::GetVersionAndArch(variant);
-    EXPECT_EQ(version, "v0.1.25-25.08.24");
-    EXPECT_EQ(arch, "mac-amd64");
+    EXPECT_EQ(version, "b4920");
+    EXPECT_EQ(arch, "macos-x64");
   }
 }
diff --git a/engine/utils/engine_matcher_utils.h b/engine/utils/engine_matcher_utils.h
@@ -206,15 +206,18 @@ inline std::string Validate(const std::vector<std::string>& variants,
 inline std::pair<std::string, std::string> GetVersionAndArch(
     const std::string& file_name) {
   // Remove the file extension
-  std::string base = file_name.substr(0, file_name.find("tar") - 1);
+  std::string b = string_utils::RemoveSubstring(file_name, ".tar.gz");
+  std::string base = string_utils::RemoveSubstring(b, ".zip");
 
   size_t arch_pos = 0;
-  if (base.find("windows") != std::string::npos) {
-    arch_pos = base.find("-windows");
+  if (base.find("win") != std::string::npos) {
+    arch_pos = base.find("-bin-win");
   } else if (base.find("linux") != std::string::npos) {
-    arch_pos = base.find("-linux");
+    arch_pos = base.find("-bin-linux");
+  } else if (base.find("ubuntu") != std::string::npos) {
+    arch_pos = base.find("-bin-ubuntu");
   } else {
-    arch_pos = base.find("-mac");
+    arch_pos = base.find("-bin-macos");
   }
 
   // Extract architecture part
@@ -223,6 +226,6 @@ inline std::pair<std::string, std::string> GetVersionAndArch(
   // Extract version part
   size_t v_pos = base.find_first_of('-');
   auto version = base.substr(v_pos + 1, arch_pos - v_pos - 1);
-  return std::pair("v" + version, arch);
+  return std::pair(version, string_utils::RemoveSubstring(arch, "bin-"));
 }
 }  // namespace engine_matcher_utils