From e3bd4f2ded4a9fecbdad59bb8d4b290702152288 Mon Sep 17 00:00:00 2001
From: Trevor McKay <tmgithub1@gmail.com>
Date: Tue, 27 Jan 2026 11:46:50 -0500
Subject: [PATCH 01/22] Add memory-model handling for LP/MIP solutions

Update data_model views and solver solutions to support the new
memory model, and add stub remote solve entrypoints that return
unsupported errors in this branch.

Signed-off-by: Trevor McKay <tmgithub1@gmail.com>
---
 .../linear_programming/data_model_view.hpp    |   58 +
 .../mip/solver_solution.hpp                   |  130 +-
 .../pdlp/solver_solution.hpp                  |  226 +++-
 .../cuopt/linear_programming/solve.hpp        |   72 ++
 .../utilities/callbacks_implems.hpp           |   14 +-
 .../utilities/cython_solve.hpp                |   19 +-
 .../utilities/internals.hpp                   |   12 +-
 .../utilities/remote_solve.hpp                |   93 ++
 cpp/libmps_parser/CMakeLists.txt              |   19 +-
 .../include/mps_parser/data_model_view.hpp    |   18 +-
 cpp/libmps_parser/src/data_model_view.cpp     |    7 +-
 cpp/libmps_parser/src/mps_data_model.cpp      |    6 +-
 cpp/src/linear_programming/cuopt_c.cpp        | 1152 +++++++++++++----
 cpp/src/linear_programming/solve.cu           |  478 ++++++-
 cpp/src/linear_programming/solver_solution.cu |  456 ++++++-
 cpp/src/mip/diversity/population.cu           |   11 +-
 cpp/src/mip/solve.cu                          |  272 +++-
 cpp/src/mip/solver_solution.cu                |  218 +++-
 18 files changed, 2866 insertions(+), 395 deletions(-)
 create mode 100644 cpp/include/cuopt/linear_programming/data_model_view.hpp
 create mode 100644 cpp/include/cuopt/linear_programming/utilities/remote_solve.hpp
diff --git a/cpp/include/cuopt/linear_programming/data_model_view.hpp b/cpp/include/cuopt/linear_programming/data_model_view.hpp
new file mode 100644
index 000000000..296097d8b
--- /dev/null
+++ b/cpp/include/cuopt/linear_programming/data_model_view.hpp
@@ -0,0 +1,58 @@
+/* clang-format off */
+/*
+ * SPDX-FileCopyrightText: Copyright (c) 2025-2026, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+ * SPDX-License-Identifier: Apache-2.0
+ */
+/* clang-format on */
+
+#pragma once
+
+/**
+ * @file data_model_view.hpp
+ * @brief Provides data_model_view_t in the cuopt::linear_programming namespace.
+ *
+ * This header provides access to the data_model_view_t class, a non-owning view
+ * over LP/MIP problem data. The view uses span<T> to hold pointers that can
+ * reference either host or device memory, making it suitable for both local
+ * GPU-based solves and remote CPU-based solves.
+ *
+ * The canonical implementation lives in cuopt::mps_parser for historical reasons
+ * and to maintain mps_parser as a standalone library. This header provides
+ * convenient aliases in the cuopt::linear_programming namespace.
+ */
+
+#include <mps_parser/data_model_view.hpp>
+#include <mps_parser/utilities/span.hpp>
+
+namespace cuopt::linear_programming {
+
+/**
+ * @brief Non-owning span type that can point to either host or device memory.
+ *
+ * This is an alias to the span type defined in mps_parser. The span holds
+ * a pointer and size, but does not own the underlying memory.
+ *
+ * @tparam T Element type
+ */
+template <typename T>
+using span = cuopt::mps_parser::span<T>;
+
+/**
+ * @brief Non-owning view of LP/MIP problem data.
+ *
+ * This is an alias to the data_model_view_t defined in mps_parser.
+ * The view stores problem data (constraint matrix, bounds, objective, etc.)
+ * as span<T> members, which can point to either host or device memory.
+ *
+ * Key features for remote solve support:
+ * - Non-owning: does not allocate or free memory
+ * - Memory-agnostic: spans can point to host OR device memory
+ * - Serializable: host data can be directly serialized for remote solve
+ *
+ * @tparam i_t Integer type for indices (typically int)
+ * @tparam f_t Floating point type for values (typically float or double)
+ */
+template <typename i_t, typename f_t>
+using data_model_view_t = cuopt::mps_parser::data_model_view_t<i_t, f_t>;
+
+}  // namespace cuopt::linear_programming
diff --git a/cpp/include/cuopt/linear_programming/mip/solver_solution.hpp b/cpp/include/cuopt/linear_programming/mip/solver_solution.hpp
index 6ff8d324b..4d896cf7d 100644
--- a/cpp/include/cuopt/linear_programming/mip/solver_solution.hpp
+++ b/cpp/include/cuopt/linear_programming/mip/solver_solution.hpp
@@ -1,6 +1,6 @@
 /* clang-format off */
 /*
- * SPDX-FileCopyrightText: Copyright (c) 2022-2025, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+ * SPDX-FileCopyrightText: Copyright (c) 2022-2026, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
  * SPDX-License-Identifier: Apache-2.0
  */
 /* clang-format on */
@@ -18,6 +18,7 @@
 #include <raft/core/handle.hpp>
 
 #include <fstream>
+#include <memory>
 #include <string>
 #include <vector>
 
@@ -51,10 +52,38 @@ class mip_solution_t : public base_solution_t {
                  rmm::cuda_stream_view stream_view);
   mip_solution_t(const cuopt::logic_error& error_status, rmm::cuda_stream_view stream_view);
 
+  // CPU-only constructors for remote solve
+  mip_solution_t(std::vector<f_t> solution,
+                 std::vector<std::string> var_names,
+                 f_t objective,
+                 f_t mip_gap,
+                 mip_termination_status_t termination_status,
+                 f_t max_constraint_violation,
+                 f_t max_int_violation,
+                 f_t max_variable_bound_violation,
+                 solver_stats_t<i_t, f_t> stats);
+
+  mip_solution_t(mip_termination_status_t termination_status, solver_stats_t<i_t, f_t> stats);
+  mip_solution_t(const cuopt::logic_error& error_status);
+
   bool is_mip() const override { return true; }
+
+  /**
+   * @brief Check if solution data is stored in device (GPU) memory
+   * @return true if data is in GPU memory, false if in CPU memory
+   */
+  bool is_device_memory() const;
+
   const rmm::device_uvector<f_t>& get_solution() const;
   rmm::device_uvector<f_t>& get_solution();
 
+  /**
+   * @brief Returns the solution in host (CPU) memory.
+   * Only valid when is_device_memory() returns false.
+   */
+  std::vector<f_t>& get_solution_host();
+  const std::vector<f_t>& get_solution_host() const;
+
   f_t get_objective_value() const;
   f_t get_mip_gap() const;
   f_t get_solution_bound() const;
@@ -75,8 +104,105 @@ class mip_solution_t : public base_solution_t {
   void write_to_sol_file(std::string_view filename, rmm::cuda_stream_view stream_view) const;
   void log_summary() const;
 
+  //============================================================================
+  // Setters for remote solve deserialization
+  //============================================================================
+
+  /**
+   * @brief Set the solution in host memory
+   * @param solution The solution vector
+   */
+  void set_solution_host(std::vector<f_t> solution);
+
+  /**
+   * @brief Set the objective value
+   */
+  void set_objective(f_t value);
+
+  /**
+   * @brief Set the MIP gap
+   */
+  void set_mip_gap(f_t value);
+
+  /**
+   * @brief Set the solution bound
+   */
+  void set_solution_bound(f_t value);
+
+  /**
+   * @brief Set total solve time
+   */
+  void set_total_solve_time(double value);
+
+  /**
+   * @brief Set presolve time
+   */
+  void set_presolve_time(double value);
+
+  /**
+   * @brief Set max constraint violation
+   */
+  void set_max_constraint_violation(f_t value);
+
+  /**
+   * @brief Set max integer violation
+   */
+  void set_max_int_violation(f_t value);
+
+  /**
+   * @brief Set max variable bound violation
+   */
+  void set_max_variable_bound_violation(f_t value);
+
+  /**
+   * @brief Set number of nodes
+   */
+  void set_nodes(i_t value);
+
+  /**
+   * @brief Set number of simplex iterations
+   */
+  void set_simplex_iterations(i_t value);
+
+  /**
+   * @brief Get error string
+   */
+  std::string get_error_string() const;
+
+  /**
+   * @brief Get number of nodes
+   */
+  i_t get_nodes() const;
+
+  /**
+   * @brief Get number of simplex iterations
+   */
+  i_t get_simplex_iterations() const;
+
+  /**
+   * @brief Copy solution data from GPU to CPU memory.
+   *
+   * After calling this method, is_device_memory() will return false and
+   * the solution can be accessed via get_solution_host().
+   * This is useful for remote solve scenarios where serialization requires
+   * CPU-accessible data.
+   *
+   * If the solution is already in CPU memory, this is a no-op.
+   *
+   * @param stream_view The CUDA stream to use for the copy
+   */
+  void to_host(rmm::cuda_stream_view stream_view);
+
  private:
-  rmm::device_uvector<f_t> solution_;
+  // GPU (device) storage - populated for local GPU solves
+  std::unique_ptr<rmm::device_uvector<f_t>> solution_;
+
+  // CPU (host) storage - populated for remote solves
+  std::unique_ptr<std::vector<f_t>> solution_host_;
+
+  // Flag indicating where solution data is stored
+  bool is_device_memory_ = true;
+
   std::vector<std::string> var_names_;
   f_t objective_;
   f_t mip_gap_;
diff --git a/cpp/include/cuopt/linear_programming/pdlp/solver_solution.hpp b/cpp/include/cuopt/linear_programming/pdlp/solver_solution.hpp
index 45a47e740..09a1378cc 100644
--- a/cpp/include/cuopt/linear_programming/pdlp/solver_solution.hpp
+++ b/cpp/include/cuopt/linear_programming/pdlp/solver_solution.hpp
@@ -18,6 +18,7 @@
 #include <raft/core/handle.hpp>
 
 #include <fstream>
+#include <memory>
 #include <string>
 #include <vector>
 
@@ -170,6 +171,42 @@ class optimization_problem_solution_t : public base_solution_t {
                                   const raft::handle_t* handler_ptr,
                                   bool deep_copy);
 
+  /**
+   * @brief Construct an optimization problem solution with CPU (host) memory storage.
+   * Used for remote solve scenarios where no GPU is available.
+   *
+   * @param[in] primal_solution The primal solution in host memory
+   * @param[in] dual_solution The dual solution in host memory
+   * @param[in] reduced_cost The reduced cost in host memory
+   * @param[in] objective_name The objective name
+   * @param[in] var_names The variables names
+   * @param[in] row_names The rows name
+   * @param[in] termination_stats The termination statistics
+   * @param[in] termination_status The termination reason
+   */
+  optimization_problem_solution_t(std::vector<f_t> primal_solution,
+                                  std::vector<f_t> dual_solution,
+                                  std::vector<f_t> reduced_cost,
+                                  const std::string objective_name,
+                                  const std::vector<std::string>& var_names,
+                                  const std::vector<std::string>& row_names,
+                                  additional_termination_information_t& termination_stats,
+                                  pdlp_termination_status_t termination_status);
+
+  /**
+   * @brief Construct an empty solution for CPU-only scenarios (e.g., remote solve error)
+   *
+   * @param[in] termination_status Reason for termination
+   */
+  optimization_problem_solution_t(pdlp_termination_status_t termination_status);
+
+  /**
+   * @brief Construct an error solution for CPU-only scenarios
+   *
+   * @param[in] error_status The error object
+   */
+  optimization_problem_solution_t(cuopt::logic_error error_status);
+
   /**
    * @brief Set the solve time in seconds
    *
@@ -236,6 +273,40 @@ class optimization_problem_solution_t : public base_solution_t {
    */
   rmm::device_uvector<f_t>& get_reduced_cost();
 
+  /**
+   * @brief Check if solution data is stored in device (GPU) memory
+   *
+   * @return true if data is in GPU memory, false if in CPU memory
+   */
+  bool is_device_memory() const;
+
+  /**
+   * @brief Returns the primal solution in host (CPU) memory.
+   * Only valid when is_device_memory() returns false.
+   *
+   * @return std::vector<f_t>& The host memory container for the primal solution.
+   */
+  std::vector<f_t>& get_primal_solution_host();
+  const std::vector<f_t>& get_primal_solution_host() const;
+
+  /**
+   * @brief Returns the dual solution in host (CPU) memory.
+   * Only valid when is_device_memory() returns false.
+   *
+   * @return std::vector<f_t>& The host memory container for the dual solution.
+   */
+  std::vector<f_t>& get_dual_solution_host();
+  const std::vector<f_t>& get_dual_solution_host() const;
+
+  /**
+   * @brief Returns the reduced cost in host (CPU) memory.
+   * Only valid when is_device_memory() returns false.
+   *
+   * @return std::vector<f_t>& The host memory container for the reduced cost.
+   */
+  std::vector<f_t>& get_reduced_cost_host();
+  const std::vector<f_t>& get_reduced_cost_host() const;
+
   /**
    * @brief Get termination reason
    * @return Termination reason
@@ -260,6 +331,128 @@ class optimization_problem_solution_t : public base_solution_t {
 
   pdlp_warm_start_data_t<i_t, f_t>& get_pdlp_warm_start_data();
 
+  //============================================================================
+  // Setters for host solution data (used by remote solve deserialization)
+  //============================================================================
+
+  /**
+   * @brief Set the primal solution in host memory
+   * @param solution The primal solution vector
+   */
+  void set_primal_solution_host(std::vector<f_t> solution);
+
+  /**
+   * @brief Set the dual solution in host memory
+   * @param solution The dual solution vector
+   */
+  void set_dual_solution_host(std::vector<f_t> solution);
+
+  /**
+   * @brief Set the reduced cost in host memory
+   * @param reduced_cost The reduced cost vector
+   */
+  void set_reduced_cost_host(std::vector<f_t> reduced_cost);
+
+  /**
+   * @brief Set the termination statistics
+   * @param stats The termination statistics
+   */
+  void set_termination_stats(const additional_termination_information_t& stats);
+
+  //============================================================================
+  // Getters for termination statistics
+  //============================================================================
+
+  /**
+   * @brief Get the L2 primal residual
+   * @return L2 primal residual
+   */
+  f_t get_l2_primal_residual() const;
+
+  /**
+   * @brief Get the L2 dual residual
+   * @return L2 dual residual
+   */
+  f_t get_l2_dual_residual() const;
+
+  /**
+   * @brief Get the primal objective value
+   * @return Primal objective
+   */
+  f_t get_primal_objective() const;
+
+  /**
+   * @brief Get the dual objective value
+   * @return Dual objective
+   */
+  f_t get_dual_objective() const;
+
+  /**
+   * @brief Get the duality gap
+   * @return Gap
+   */
+  f_t get_gap() const;
+
+  /**
+   * @brief Get number of iterations
+   * @return Number of iterations
+   */
+  i_t get_nb_iterations() const;
+
+  /**
+   * @brief Check if solved by PDLP
+   * @return true if solved by PDLP
+   */
+  bool get_solved_by_pdlp() const;
+
+  /**
+   * @brief Set L2 primal residual
+   * @param value The value
+   */
+  void set_l2_primal_residual(f_t value);
+
+  /**
+   * @brief Set L2 dual residual
+   * @param value The value
+   */
+  void set_l2_dual_residual(f_t value);
+
+  /**
+   * @brief Set primal objective
+   * @param value The value
+   */
+  void set_primal_objective(f_t value);
+
+  /**
+   * @brief Set dual objective
+   * @param value The value
+   */
+  void set_dual_objective(f_t value);
+
+  /**
+   * @brief Set gap
+   * @param value The value
+   */
+  void set_gap(f_t value);
+
+  /**
+   * @brief Set number of iterations
+   * @param value The value
+   */
+  void set_nb_iterations(i_t value);
+
+  /**
+   * @brief Set solved by PDLP flag
+   * @param value The value
+   */
+  void set_solved_by_pdlp(bool value);
+
+  /**
+   * @brief Get error string
+   * @return Error message string
+   */
+  std::string get_error_string() const;
+
   /**
    * @brief Writes the solver_solution object as a JSON object to the 'filename' file using
    * 'stream_view' to transfer the data from device to host before it is written to the file.
@@ -287,12 +480,39 @@ class optimization_problem_solution_t : public base_solution_t {
   void copy_from(const raft::handle_t* handle_ptr,
                  const optimization_problem_solution_t<i_t, f_t>& other);
 
+  /**
+   * @brief Copy solution data from GPU to CPU memory.
+   *
+   * After calling this method, is_device_memory() will return false and
+   * the solution can be accessed via get_primal_solution_host(), etc.
+   * This is useful for remote solve scenarios where serialization requires
+   * CPU-accessible data.
+   *
+   * If the solution is already in CPU memory, this is a no-op.
+   *
+   * @param stream_view The CUDA stream to use for the copy
+   */
+  void to_host(rmm::cuda_stream_view stream_view);
+
  private:
   void write_additional_termination_statistics_to_file(std::ofstream& myfile);
 
-  rmm::device_uvector<f_t> primal_solution_;
-  rmm::device_uvector<f_t> dual_solution_;
-  rmm::device_uvector<f_t> reduced_cost_;
+  // GPU (device) storage - populated for local GPU solves
+  std::unique_ptr<rmm::device_uvector<f_t>> primal_solution_;
+  std::unique_ptr<rmm::device_uvector<f_t>> dual_solution_;
+  std::unique_ptr<rmm::device_uvector<f_t>> reduced_cost_;
+
+  // CPU (host) storage - populated for remote solves
+  std::unique_ptr<std::vector<f_t>> primal_solution_host_;
+  std::unique_ptr<std::vector<f_t>> dual_solution_host_;
+  std::unique_ptr<std::vector<f_t>> reduced_cost_host_;
+
+  // Flag indicating where solution data is stored
+  bool is_device_memory_ = true;
+
+  // Flag indicating if solved by PDLP (vs dual simplex)
+  bool solved_by_pdlp_ = true;
+
   pdlp_warm_start_data_t<i_t, f_t> pdlp_warm_start_data_;
 
   std::vector<pdlp_termination_status_t> termination_status_{1};
diff --git a/cpp/include/cuopt/linear_programming/solve.hpp b/cpp/include/cuopt/linear_programming/solve.hpp
index b30a3908f..5e8007020 100644
--- a/cpp/include/cuopt/linear_programming/solve.hpp
+++ b/cpp/include/cuopt/linear_programming/solve.hpp
@@ -7,6 +7,7 @@
 
 #pragma once
 
+#include <cuopt/linear_programming/data_model_view.hpp>
 #include <cuopt/linear_programming/mip/solver_settings.hpp>
 #include <cuopt/linear_programming/mip/solver_solution.hpp>
 #include <cuopt/linear_programming/optimization_problem.hpp>
@@ -14,6 +15,7 @@
 #include <cuopt/linear_programming/pdlp/solver_solution.hpp>
 #include <cuopt/linear_programming/solver_settings.hpp>
 #include <cuopt/linear_programming/utilities/internals.hpp>
+#include <cuopt/linear_programming/utilities/remote_solve.hpp>
 
 #include <mps_parser/mps_data_model.hpp>
 #include <string>
@@ -144,4 +146,74 @@ optimization_problem_t<i_t, f_t> mps_data_model_to_optimization_problem(
   raft::handle_t const* handle_ptr,
   const cuopt::mps_parser::mps_data_model_t<i_t, f_t>& data_model);
 
+/**
+ * @brief Convert a data_model_view_t to an optimization_problem_t.
+ *
+ * This function copies data from the view (which points to GPU memory)
+ * into an owning optimization_problem_t.
+ *
+ * @tparam i_t Data type of indexes
+ * @tparam f_t Data type of the variables and their weights in the equations
+ *
+ * @param[in] handle_ptr  A raft::handle_t object with its corresponding CUDA stream.
+ * @param[in] view  A data_model_view_t<i_t, f_t> object with spans pointing to GPU memory
+ * @return optimization_problem_t<i_t, f_t> owning container for the problem
+ */
+template <typename i_t, typename f_t>
+optimization_problem_t<i_t, f_t> data_model_view_to_optimization_problem(
+  raft::handle_t const* handle_ptr, const data_model_view_t<i_t, f_t>& view);
+
+/**
+ * @brief Linear programming solve function using data_model_view_t.
+ *
+ * This overload accepts a non-owning data_model_view_t which can point to either
+ * GPU memory (for local solves) or CPU memory (for remote solves).
+ * The solve path is automatically determined by checking the CUOPT_REMOTE_HOST
+ * and CUOPT_REMOTE_PORT environment variables.
+ *
+ * @note Both primal and dual solutions are zero-initialized.
+ *
+ * @tparam i_t Data type of indexes
+ * @tparam f_t Data type of the variables and their weights in the equations
+ *
+ * @param[in] handle_ptr  A raft::handle_t object with its corresponding CUDA stream.
+ * @param[in] view  A data_model_view_t<i_t, f_t> with spans pointing to problem data
+ * @param[in] settings  A pdlp_solver_settings_t<i_t, f_t> object with the settings for the PDLP
+ * solver.
+ * @param[in] problem_checking  If true, the problem is checked for consistency.
+ * @param[in] use_pdlp_solver_mode  If true, the PDLP hyperparameters coming from the
+ * pdlp_solver_mode are used.
+ * @return optimization_problem_solution_t<i_t, f_t> owning container for the solver solution
+ */
+template <typename i_t, typename f_t>
+optimization_problem_solution_t<i_t, f_t> solve_lp(
+  raft::handle_t const* handle_ptr,
+  const data_model_view_t<i_t, f_t>& view,
+  pdlp_solver_settings_t<i_t, f_t> const& settings = pdlp_solver_settings_t<i_t, f_t>{},
+  bool problem_checking                            = true,
+  bool use_pdlp_solver_mode                        = true);
+
+/**
+ * @brief Mixed integer programming solve function using data_model_view_t.
+ *
+ * This overload accepts a non-owning data_model_view_t which can point to either
+ * GPU memory (for local solves) or CPU memory (for remote solves).
+ * The solve path is automatically determined by checking the CUOPT_REMOTE_HOST
+ * and CUOPT_REMOTE_PORT environment variables.
+ *
+ * @tparam i_t Data type of indexes
+ * @tparam f_t Data type of the variables and their weights in the equations
+ *
+ * @param[in] handle_ptr  A raft::handle_t object with its corresponding CUDA stream.
+ * @param[in] view  A data_model_view_t<i_t, f_t> with spans pointing to problem data
+ * @param[in] settings  A mip_solver_settings_t<i_t, f_t> object with the settings for the MIP
+ * solver.
+ * @return mip_solution_t<i_t, f_t> owning container for the solver solution
+ */
+template <typename i_t, typename f_t>
+mip_solution_t<i_t, f_t> solve_mip(
+  raft::handle_t const* handle_ptr,
+  const data_model_view_t<i_t, f_t>& view,
+  mip_solver_settings_t<i_t, f_t> const& settings = mip_solver_settings_t<i_t, f_t>{});
+
 }  // namespace cuopt::linear_programming
diff --git a/cpp/include/cuopt/linear_programming/utilities/callbacks_implems.hpp b/cpp/include/cuopt/linear_programming/utilities/callbacks_implems.hpp
index f0cd74c24..d73bb34bc 100644
--- a/cpp/include/cuopt/linear_programming/utilities/callbacks_implems.hpp
+++ b/cpp/include/cuopt/linear_programming/utilities/callbacks_implems.hpp
@@ -1,6 +1,6 @@
 /* clang-format off */
 /*
- * SPDX-FileCopyrightText: Copyright (c) 2025, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+ * SPDX-FileCopyrightText: Copyright (c) 2025-2026, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
  * SPDX-License-Identifier: Apache-2.0
  */
 /* clang-format on */
@@ -40,8 +40,10 @@ class default_get_solution_callback_t : public get_solution_callback_t {
 
   void get_solution(void* data, void* objective_value) override
   {
-    PyObject* numba_matrix = get_numba_matrix(data, n_variables);
-    PyObject* numpy_array  = get_numba_matrix(objective_value, 1);
+    PyObject* numba_matrix =
+      data_on_device() ? get_numba_matrix(data, n_variables) : get_numpy_array(data, n_variables);
+    PyObject* numpy_array =
+      data_on_device() ? get_numba_matrix(objective_value, 1) : get_numpy_array(objective_value, 1);
     PyObject* res =
       PyObject_CallMethod(this->pyCallbackClass, "get_solution", "(OO)", numba_matrix, numpy_array);
     Py_DECREF(numba_matrix);
@@ -77,8 +79,10 @@ class default_set_solution_callback_t : public set_solution_callback_t {
 
   void set_solution(void* data, void* objective_value) override
   {
-    PyObject* numba_matrix = get_numba_matrix(data, n_variables);
-    PyObject* numpy_array  = get_numba_matrix(objective_value, 1);
+    PyObject* numba_matrix =
+      data_on_device() ? get_numba_matrix(data, n_variables) : get_numpy_array(data, n_variables);
+    PyObject* numpy_array =
+      data_on_device() ? get_numba_matrix(objective_value, 1) : get_numpy_array(objective_value, 1);
     PyObject* res =
       PyObject_CallMethod(this->pyCallbackClass, "set_solution", "(OO)", numba_matrix, numpy_array);
     Py_DECREF(numba_matrix);
diff --git a/cpp/include/cuopt/linear_programming/utilities/cython_solve.hpp b/cpp/include/cuopt/linear_programming/utilities/cython_solve.hpp
index e1a75747d..abe49a2be 100644
--- a/cpp/include/cuopt/linear_programming/utilities/cython_solve.hpp
+++ b/cpp/include/cuopt/linear_programming/utilities/cython_solve.hpp
@@ -1,6 +1,6 @@
 /* clang-format off */
 /*
- * SPDX-FileCopyrightText: Copyright (c) 2023-2025, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+ * SPDX-FileCopyrightText: Copyright (c) 2023-2026, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
  * SPDX-License-Identifier: Apache-2.0
  */
 /* clang-format on */
@@ -25,9 +25,19 @@ namespace cython {
 // aggregate for call_solve() return type
 // to be exposed to cython:
 struct linear_programming_ret_t {
+  // GPU (device) storage - populated for local GPU solves
   std::unique_ptr<rmm::device_buffer> primal_solution_;
   std::unique_ptr<rmm::device_buffer> dual_solution_;
   std::unique_ptr<rmm::device_buffer> reduced_cost_;
+
+  // CPU (host) storage - populated for remote solves
+  std::vector<double> primal_solution_host_;
+  std::vector<double> dual_solution_host_;
+  std::vector<double> reduced_cost_host_;
+
+  // Flag indicating where solution data is stored
+  bool is_device_memory_ = true;
+
   /* -- PDLP Warm Start Data -- */
   std::unique_ptr<rmm::device_buffer> current_primal_solution_;
   std::unique_ptr<rmm::device_buffer> current_dual_solution_;
@@ -64,8 +74,15 @@ struct linear_programming_ret_t {
 };
 
 struct mip_ret_t {
+  // GPU (device) storage - populated for local GPU solves
   std::unique_ptr<rmm::device_buffer> solution_;
 
+  // CPU (host) storage - populated for remote solves
+  std::vector<double> solution_host_;
+
+  // Flag indicating where solution data is stored
+  bool is_device_memory_ = true;
+
   linear_programming::mip_termination_status_t termination_status_;
   error_type_t error_status_;
   std::string error_message_;
diff --git a/cpp/include/cuopt/linear_programming/utilities/internals.hpp b/cpp/include/cuopt/linear_programming/utilities/internals.hpp
index 90d856b23..ef8e0bea8 100644
--- a/cpp/include/cuopt/linear_programming/utilities/internals.hpp
+++ b/cpp/include/cuopt/linear_programming/utilities/internals.hpp
@@ -21,6 +21,7 @@ class Callback {
 };
 
 enum class base_solution_callback_type { GET_SOLUTION, SET_SOLUTION };
+enum class callback_memory_location { DEVICE, HOST };
 
 class base_solution_callback_t : public Callback {
  public:
@@ -31,11 +32,18 @@ class base_solution_callback_t : public Callback {
     this->n_variables = n_variables_;
   }
 
+  void set_memory_location(callback_memory_location location) { memory_location = location; }
+
+  callback_memory_location get_memory_location() const { return memory_location; }
+
+  bool data_on_device() const { return memory_location == callback_memory_location::DEVICE; }
+
   virtual base_solution_callback_type get_type() const = 0;
 
  protected:
-  bool isFloat       = true;
-  size_t n_variables = 0;
+  bool isFloat                             = true;
+  size_t n_variables                       = 0;
+  callback_memory_location memory_location = callback_memory_location::DEVICE;
 };
 
 class get_solution_callback_t : public base_solution_callback_t {
diff --git a/cpp/include/cuopt/linear_programming/utilities/remote_solve.hpp b/cpp/include/cuopt/linear_programming/utilities/remote_solve.hpp
new file mode 100644
index 000000000..afa1810dc
--- /dev/null
+++ b/cpp/include/cuopt/linear_programming/utilities/remote_solve.hpp
@@ -0,0 +1,93 @@
+/* clang-format off */
+/*
+ * SPDX-FileCopyrightText: Copyright (c) 2026, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+ * SPDX-License-Identifier: Apache-2.0
+ */
+/* clang-format on */
+
+#pragma once
+
+#include <cuopt/error.hpp>
+#include <cuopt/linear_programming/mip/solver_settings.hpp>
+#include <cuopt/linear_programming/mip/solver_solution.hpp>
+#include <cuopt/linear_programming/pdlp/solver_settings.hpp>
+#include <cuopt/linear_programming/pdlp/solver_solution.hpp>
+#include <mps_parser/data_model_view.hpp>
+
+#include <cstdlib>
+#include <optional>
+#include <string>
+
+namespace cuopt::linear_programming {
+
+/**
+ * @brief Configuration for remote solve connection
+ */
+struct remote_solve_config_t {
+  std::string host;
+  int port;
+};
+
+/**
+ * @brief Check if remote solve is enabled via environment variables.
+ *
+ * Remote solve is enabled when both CUOPT_REMOTE_HOST and CUOPT_REMOTE_PORT
+ * environment variables are set.
+ *
+ * @return std::optional<remote_solve_config_t> containing the remote config if
+ *         remote solve is enabled, std::nullopt otherwise
+ */
+inline std::optional<remote_solve_config_t> get_remote_solve_config()
+{
+  const char* host = std::getenv("CUOPT_REMOTE_HOST");
+  const char* port = std::getenv("CUOPT_REMOTE_PORT");
+
+  if (host != nullptr && port != nullptr && host[0] != '\0' && port[0] != '\0') {
+    try {
+      int port_num = std::stoi(port);
+      return remote_solve_config_t{std::string(host), port_num};
+    } catch (...) {
+      // Invalid port number, fall back to local solve
+      return std::nullopt;
+    }
+  }
+  return std::nullopt;
+}
+
+/**
+ * @brief Check if remote solve is enabled.
+ *
+ * @return true if CUOPT_REMOTE_HOST and CUOPT_REMOTE_PORT are both set
+ */
+inline bool is_remote_solve_enabled() { return get_remote_solve_config().has_value(); }
+
+/**
+ * @brief Solve an LP problem on a remote server.
+ *
+ * Stub implementation for the memory-model-only branch.
+ */
+template <typename i_t, typename f_t>
+optimization_problem_solution_t<i_t, f_t> solve_lp_remote(
+  const remote_solve_config_t&,
+  const cuopt::mps_parser::data_model_view_t<i_t, f_t>&,
+  const pdlp_solver_settings_t<i_t, f_t>&)
+{
+  return optimization_problem_solution_t<i_t, f_t>(cuopt::logic_error(
+    "Remote solve is not enabled in this build", cuopt::error_type_t::RuntimeError));
+}
+
+/**
+ * @brief Solve a MIP problem on a remote server.
+ *
+ * Stub implementation for the memory-model-only branch.
+ */
+template <typename i_t, typename f_t>
+mip_solution_t<i_t, f_t> solve_mip_remote(const remote_solve_config_t&,
+                                          const cuopt::mps_parser::data_model_view_t<i_t, f_t>&,
+                                          const mip_solver_settings_t<i_t, f_t>&)
+{
+  return mip_solution_t<i_t, f_t>(cuopt::logic_error("Remote solve is not enabled in this build",
+                                                     cuopt::error_type_t::RuntimeError));
+}
+
+}  // namespace cuopt::linear_programming
diff --git a/cpp/libmps_parser/CMakeLists.txt b/cpp/libmps_parser/CMakeLists.txt
index 4fe497157..3018d9c31 100644
--- a/cpp/libmps_parser/CMakeLists.txt
+++ b/cpp/libmps_parser/CMakeLists.txt
@@ -67,7 +67,8 @@ if(BUILD_TESTS)
   include(cmake/thirdparty/get_gtest.cmake)
 endif()
 
-add_library(mps_parser SHARED
+# Source files for mps_parser
+set(MPS_PARSER_SOURCES
   src/data_model_view.cpp
   src/mps_data_model.cpp
   src/mps_parser.cpp
@@ -77,6 +78,12 @@ add_library(mps_parser SHARED
   src/utilities/cython_mps_parser.cpp
 )
 
+# Shared library for standalone use
+add_library(mps_parser SHARED ${MPS_PARSER_SOURCES})
+
+# Static library for linking into libcuopt
+add_library(mps_parser_static STATIC ${MPS_PARSER_SOURCES})
+
 set_target_properties(mps_parser
   PROPERTIES BUILD_RPATH "\$ORIGIN"
   INSTALL_RPATH "\$ORIGIN"
@@ -105,6 +112,7 @@ if(WRITE_FATBIN)
 endif()
 
 add_library(cuopt::mps_parser ALIAS mps_parser)
+add_library(cuopt::mps_parser_static ALIAS mps_parser_static)
 
 # ##################################################################################################
 # - include paths ---------------------------------------------------------------------------------
@@ -117,6 +125,15 @@ target_include_directories(mps_parser
   "$<INSTALL_INTERFACE:include>"
 )
 
+target_include_directories(mps_parser_static
+  PRIVATE
+  "${CMAKE_CURRENT_SOURCE_DIR}/../thirdparty"
+  "${CMAKE_CURRENT_SOURCE_DIR}/src"
+  PUBLIC
+  "$<BUILD_INTERFACE:${CMAKE_CURRENT_SOURCE_DIR}/include>"
+  "$<INSTALL_INTERFACE:include>"
+)
+
 if(MPS_PARSER_WITH_BZIP2)
     target_include_directories(mps_parser PRIVATE BZip2::BZip2)
 endif(MPS_PARSER_WITH_BZIP2)
diff --git a/cpp/libmps_parser/include/mps_parser/data_model_view.hpp b/cpp/libmps_parser/include/mps_parser/data_model_view.hpp
index eb34682ce..d92357179 100644
--- a/cpp/libmps_parser/include/mps_parser/data_model_view.hpp
+++ b/cpp/libmps_parser/include/mps_parser/data_model_view.hpp
@@ -1,6 +1,6 @@
 /* clang-format off */
 /*
- * SPDX-FileCopyrightText: Copyright (c) 2023-2025, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+ * SPDX-FileCopyrightText: Copyright (c) 2023-2026, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
  * SPDX-License-Identifier: Apache-2.0
  */
 /* clang-format on */
@@ -406,8 +406,24 @@ class data_model_view_t {
    */
   bool has_quadratic_objective() const noexcept;
 
+  /**
+   * @brief Set whether the data pointed to by this view is in device (GPU) memory.
+   * @note Default is false (CPU memory). Set to true when view points to GPU buffers.
+   *
+   * @param is_device true if data is in GPU memory, false if in CPU memory
+   */
+  void set_is_device_memory(bool is_device) noexcept { is_device_memory_ = is_device; }
+
+  /**
+   * @brief Check if the data pointed to by this view is in device (GPU) memory.
+   *
+   * @return true if data is in GPU memory, false if in CPU memory
+   */
+  bool is_device_memory() const noexcept { return is_device_memory_; }
+
  private:
   bool maximize_{false};
+  bool is_device_memory_{false};  // true if spans point to GPU memory, false for CPU
   span<f_t const> A_;
   span<i_t const> A_indices_;
   span<i_t const> A_offsets_;
diff --git a/cpp/libmps_parser/src/data_model_view.cpp b/cpp/libmps_parser/src/data_model_view.cpp
index 7db2b390c..8be1b899a 100644
--- a/cpp/libmps_parser/src/data_model_view.cpp
+++ b/cpp/libmps_parser/src/data_model_view.cpp
@@ -1,6 +1,6 @@
 /* clang-format off */
 /*
- * SPDX-FileCopyrightText: Copyright (c) 2023-2025, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+ * SPDX-FileCopyrightText: Copyright (c) 2023-2026, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
  * SPDX-License-Identifier: Apache-2.0
  */
 /* clang-format on */
@@ -9,6 +9,8 @@
 #include <mps_parser/utilities/span.hpp>
 #include <utilities/error.hpp>
 
+#include <cstdint>
+
 namespace cuopt::mps_parser {
 
 template <typename i_t, typename f_t>
@@ -348,7 +350,8 @@ bool data_model_view_t<i_t, f_t>::has_quadratic_objective() const noexcept
 
 // NOTE: Explicitly instantiate all types here in order to avoid linker error
 template class data_model_view_t<int, float>;
-
 template class data_model_view_t<int, double>;
+template class data_model_view_t<int64_t, float>;
+template class data_model_view_t<int64_t, double>;
 
 }  // namespace cuopt::mps_parser
diff --git a/cpp/libmps_parser/src/mps_data_model.cpp b/cpp/libmps_parser/src/mps_data_model.cpp
index 7d0d44a03..605d5cef6 100644
--- a/cpp/libmps_parser/src/mps_data_model.cpp
+++ b/cpp/libmps_parser/src/mps_data_model.cpp
@@ -1,6 +1,6 @@
 /* clang-format off */
 /*
- * SPDX-FileCopyrightText: Copyright (c) 2022-2025, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+ * SPDX-FileCopyrightText: Copyright (c) 2022-2026, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
  * SPDX-License-Identifier: Apache-2.0
  */
 /* clang-format on */
@@ -9,6 +9,7 @@
 #include <utilities/error.hpp>
 
 #include <algorithm>
+#include <cstdint>
 
 namespace cuopt::mps_parser {
 
@@ -462,8 +463,9 @@ bool mps_data_model_t<i_t, f_t>::has_quadratic_objective() const noexcept
 
 // NOTE: Explicitly instantiate all types here in order to avoid linker error
 template class mps_data_model_t<int, float>;
-
 template class mps_data_model_t<int, double>;
+template class mps_data_model_t<int64_t, float>;
+template class mps_data_model_t<int64_t, double>;
 //  TODO current raft to cusparse wrappers only support int64_t
 //  can be CUSPARSE_INDEX_16U, CUSPARSE_INDEX_32I, CUSPARSE_INDEX_64I
 
diff --git a/cpp/src/linear_programming/cuopt_c.cpp b/cpp/src/linear_programming/cuopt_c.cpp
index 0772dd14b..717752e70 100644
--- a/cpp/src/linear_programming/cuopt_c.cpp
+++ b/cpp/src/linear_programming/cuopt_c.cpp
@@ -1,15 +1,17 @@
 /* clang-format off */
 /*
- * SPDX-FileCopyrightText: Copyright (c) 2025, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+ * SPDX-FileCopyrightText: Copyright (c) 2025-2026, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
  * SPDX-License-Identifier: Apache-2.0
  */
 /* clang-format on */
 
 #include <cuopt/linear_programming/cuopt_c.h>
 
+#include <cuopt/linear_programming/data_model_view.hpp>
 #include <cuopt/linear_programming/optimization_problem.hpp>
 #include <cuopt/linear_programming/solve.hpp>
 #include <cuopt/linear_programming/solver_settings.hpp>
+#include <cuopt/linear_programming/utilities/remote_solve.hpp>
 #include <cuopt/utilities/timestamp_utils.hpp>
 #include <utilities/logger.hpp>
 
@@ -17,36 +19,263 @@
 
 #include <cuopt/version_config.hpp>
 
+#include <raft/core/copy.hpp>
+
 #include <cstdlib>
 #include <memory>
+#include <optional>
 #include <string>
+#include <vector>
 
 using namespace cuopt::mps_parser;
 using namespace cuopt::linear_programming;
 
+/**
+ * @brief CPU-side storage for problem data.
+ *
+ * This struct stores all problem data in CPU memory. At solve time, a data_model_view_t
+ * is created pointing to this data, and the solve_lp/solve_mip routines handle
+ * local vs remote solve automatically.
+ */
+struct problem_cpu_data_t {
+  // Problem dimensions
+  cuopt_int_t num_constraints = 0;
+  cuopt_int_t num_variables   = 0;
+
+  // Objective
+  bool maximize                  = false;
+  cuopt_float_t objective_offset = 0.0;
+  std::vector<cuopt_float_t> objective_coefficients;
+
+  // Quadratic objective (optional)
+  std::vector<cuopt_float_t> Q_values;
+  std::vector<cuopt_int_t> Q_indices;
+  std::vector<cuopt_int_t> Q_offsets;
+
+  // Constraint matrix (CSR format)
+  std::vector<cuopt_float_t> A_values;
+  std::vector<cuopt_int_t> A_indices;
+  std::vector<cuopt_int_t> A_offsets;
+
+  // Constraint bounds (two representations)
+  std::vector<char> row_types;                         // '<', '>', '=' style
+  std::vector<cuopt_float_t> constraint_bounds;        // single RHS for row_types style
+  std::vector<cuopt_float_t> constraint_lower_bounds;  // ranged style
+  std::vector<cuopt_float_t> constraint_upper_bounds;  // ranged style
+  bool uses_ranged_constraints = false;
+
+  // Variable bounds
+  std::vector<cuopt_float_t> variable_lower_bounds;
+  std::vector<cuopt_float_t> variable_upper_bounds;
+
+  // Variable types
+  std::vector<char> variable_types;  // 'C' for continuous, 'I' for integer
+
+  /**
+   * @brief Create a data_model_view_t pointing to this CPU data.
+   */
+  cuopt::linear_programming::data_model_view_t<cuopt_int_t, cuopt_float_t> create_view() const
+  {
+    cuopt::linear_programming::data_model_view_t<cuopt_int_t, cuopt_float_t> view;
+
+    view.set_maximize(maximize);
+    view.set_objective_offset(objective_offset);
+
+    if (!objective_coefficients.empty()) {
+      view.set_objective_coefficients(objective_coefficients.data(), objective_coefficients.size());
+    }
+
+    if (!Q_values.empty()) {
+      view.set_quadratic_objective_matrix(Q_values.data(),
+                                          Q_values.size(),
+                                          Q_indices.data(),
+                                          Q_indices.size(),
+                                          Q_offsets.data(),
+                                          Q_offsets.size());
+    }
+
+    if (!A_values.empty()) {
+      view.set_csr_constraint_matrix(A_values.data(),
+                                     A_values.size(),
+                                     A_indices.data(),
+                                     A_indices.size(),
+                                     A_offsets.data(),
+                                     A_offsets.size());
+    }
+
+    if (uses_ranged_constraints) {
+      if (!constraint_lower_bounds.empty()) {
+        view.set_constraint_lower_bounds(constraint_lower_bounds.data(),
+                                         constraint_lower_bounds.size());
+      }
+      if (!constraint_upper_bounds.empty()) {
+        view.set_constraint_upper_bounds(constraint_upper_bounds.data(),
+                                         constraint_upper_bounds.size());
+      }
+    } else {
+      if (!row_types.empty()) { view.set_row_types(row_types.data(), row_types.size()); }
+      if (!constraint_bounds.empty()) {
+        view.set_constraint_bounds(constraint_bounds.data(), constraint_bounds.size());
+      }
+    }
+
+    if (!variable_lower_bounds.empty()) {
+      view.set_variable_lower_bounds(variable_lower_bounds.data(), variable_lower_bounds.size());
+    }
+
+    if (!variable_upper_bounds.empty()) {
+      view.set_variable_upper_bounds(variable_upper_bounds.data(), variable_upper_bounds.size());
+    }
+
+    if (!variable_types.empty()) {
+      view.set_variable_types(variable_types.data(), variable_types.size());
+    }
+
+    return view;
+  }
+
+  /**
+   * @brief Check if this is a MIP (has integer variables).
+   */
+  bool is_mip() const
+  {
+    for (char vt : variable_types) {
+      if (vt == CUOPT_INTEGER) { return true; }
+    }
+    return false;
+  }
+};
+
 struct problem_and_stream_view_t {
-  problem_and_stream_view_t()
-    : op_problem(nullptr), stream_view(rmm::cuda_stream_per_thread), handle(stream_view)
+  problem_and_stream_view_t() : cpu_data(nullptr), gpu_problem(nullptr), handle(nullptr) {}
+
+  /**
+   * @brief Ensure CUDA resources are initialized (lazy initialization).
+   * Only call this when local solve is needed.
+   */
+  void ensure_cuda_initialized()
+  {
+    if (!handle) { handle = std::make_unique<raft::handle_t>(); }
+  }
+
+  raft::handle_t* get_handle_ptr()
   {
+    ensure_cuda_initialized();
+    return handle.get();
+  }
+
+  /**
+   * @brief Check if this is a MIP problem.
+   */
+  bool is_mip() const
+  {
+    if (view.is_device_memory()) {
+      // GPU path: check gpu_problem's problem category
+      if (!gpu_problem) return false;
+      auto cat = gpu_problem->get_problem_category();
+      return (cat == problem_category_t::MIP) || (cat == problem_category_t::IP);
+    } else {
+      // CPU path: check variable types in cpu_data
+      if (!cpu_data) return false;
+      return cpu_data->is_mip();
+    }
+  }
+
+  // Only ONE of these is allocated (optimized memory usage):
+  std::unique_ptr<problem_cpu_data_t> cpu_data;  // for remote solve (CPU memory)
+  std::unique_ptr<optimization_problem_t<cuopt_int_t, cuopt_float_t>>
+    gpu_problem;  // for local solve (GPU memory)
+
+  // Non-owning view pointing to whichever storage is active
+  // Use view.is_device_memory() to check if data is on GPU or CPU
+  cuopt::linear_programming::data_model_view_t<cuopt_int_t, cuopt_float_t> view;
+  std::vector<char> gpu_variable_types;  // host copy for view when GPU data is used
+
+  // Lazy-initialized CUDA handle (only created for local solve)
+  std::unique_ptr<raft::handle_t> handle;
+
+  /**
+   * @brief Create a view pointing to GPU data from the gpu_problem.
+   * Call this after gpu_problem is fully populated.
+   */
+  void create_view_from_gpu_problem()
+  {
+    if (!gpu_problem) return;
+    auto& gpu = *gpu_problem;
+
+    view.set_maximize(gpu.get_sense());
+    view.set_objective_offset(gpu.get_objective_offset());
+    view.set_objective_coefficients(gpu.get_objective_coefficients().data(), gpu.get_n_variables());
+    view.set_csr_constraint_matrix(gpu.get_constraint_matrix_values().data(),
+                                   gpu.get_constraint_matrix_values().size(),
+                                   gpu.get_constraint_matrix_indices().data(),
+                                   gpu.get_constraint_matrix_indices().size(),
+                                   gpu.get_constraint_matrix_offsets().data(),
+                                   gpu.get_constraint_matrix_offsets().size());
+
+    if (!gpu.get_constraint_lower_bounds().is_empty()) {
+      view.set_constraint_lower_bounds(gpu.get_constraint_lower_bounds().data(),
+                                       gpu.get_n_constraints());
+      view.set_constraint_upper_bounds(gpu.get_constraint_upper_bounds().data(),
+                                       gpu.get_n_constraints());
+    } else if (!gpu.get_row_types().is_empty()) {
+      view.set_row_types(gpu.get_row_types().data(), gpu.get_n_constraints());
+      view.set_constraint_bounds(gpu.get_constraint_bounds().data(), gpu.get_n_constraints());
+    }
+
+    view.set_variable_lower_bounds(gpu.get_variable_lower_bounds().data(), gpu.get_n_variables());
+    view.set_variable_upper_bounds(gpu.get_variable_upper_bounds().data(), gpu.get_n_variables());
+
+    if (gpu.get_n_variables() > 0) {
+      std::vector<var_t> gpu_var_types(gpu.get_n_variables());
+      raft::copy(gpu_var_types.data(),
+                 gpu.get_variable_types().data(),
+                 gpu.get_n_variables(),
+                 gpu.get_handle_ptr()->get_stream());
+      gpu.get_handle_ptr()->sync_stream();
+
+      gpu_variable_types.resize(gpu.get_n_variables());
+      for (cuopt_int_t i = 0; i < gpu.get_n_variables(); ++i) {
+        gpu_variable_types[i] = (gpu_var_types[i] == var_t::INTEGER) ? 'I' : 'C';
+      }
+      view.set_variable_types(gpu_variable_types.data(), gpu.get_n_variables());
+    }
+
+    if (gpu.has_quadratic_objective()) {
+      view.set_quadratic_objective_matrix(gpu.get_quadratic_objective_values().data(),
+                                          gpu.get_quadratic_objective_values().size(),
+                                          gpu.get_quadratic_objective_indices().data(),
+                                          gpu.get_quadratic_objective_indices().size(),
+                                          gpu.get_quadratic_objective_offsets().data(),
+                                          gpu.get_quadratic_objective_offsets().size());
+    }
+
+    view.set_is_device_memory(true);
+  }
+
+  /**
+   * @brief Create a view pointing to CPU data from cpu_data.
+   * Call this after cpu_data is fully populated.
+   */
+  void create_view_from_cpu_data()
+  {
+    if (!cpu_data) return;
+    view = cpu_data->create_view();
+    view.set_is_device_memory(false);
   }
-  raft::handle_t* get_handle_ptr() { return &handle; }
-  cuopt::linear_programming::optimization_problem_t<cuopt_int_t, cuopt_float_t>* op_problem;
-  rmm::cuda_stream_view stream_view;
-  raft::handle_t handle;
 };
 
 struct solution_and_stream_view_t {
-  solution_and_stream_view_t(bool solution_for_mip, rmm::cuda_stream_view stream_view)
-    : is_mip(solution_for_mip),
-      mip_solution_ptr(nullptr),
-      lp_solution_ptr(nullptr),
-      stream_view(stream_view)
+  solution_and_stream_view_t(bool solution_for_mip, raft::handle_t* handle_ptr = nullptr)
+    : is_mip(solution_for_mip), mip_solution_ptr(nullptr), lp_solution_ptr(nullptr)
   {
+    // Store stream only if we have a handle (local solve)
+    if (handle_ptr) { stream_view = handle_ptr->get_stream(); }
   }
   bool is_mip;
   mip_solution_t<cuopt_int_t, cuopt_float_t>* mip_solution_ptr;
   optimization_problem_solution_t<cuopt_int_t, cuopt_float_t>* lp_solution_ptr;
-  rmm::cuda_stream_view stream_view;
+  std::optional<rmm::cuda_stream_view> stream_view;  // Only present for local solve
 };
 
 int8_t cuOptGetFloatSize() { return sizeof(cuopt_float_t); }
@@ -77,6 +306,7 @@ cuopt_int_t cuOptReadProblem(const char* filename, cuOptOptimizationProblem* pro
       parse_mps<cuopt_int_t, cuopt_float_t>(filename_str, input_mps_strict));
   } catch (const std::exception& e) {
     CUOPT_LOG_INFO("Error parsing MPS file: %s", e.what());
+    delete problem_and_stream;
     *problem_ptr = nullptr;
     if (std::string(e.what()).find("Error opening MPS file") != std::string::npos) {
       return CUOPT_MPS_FILE_ERROR;
@@ -84,11 +314,64 @@ cuopt_int_t cuOptReadProblem(const char* filename, cuOptOptimizationProblem* pro
       return CUOPT_MPS_PARSE_ERROR;
     }
   }
-  optimization_problem_t<cuopt_int_t, cuopt_float_t>* op_problem =
-    new optimization_problem_t<cuopt_int_t, cuopt_float_t>(mps_data_model_to_optimization_problem(
-      problem_and_stream->get_handle_ptr(), *mps_data_model_ptr));
-  problem_and_stream->op_problem = op_problem;
-  *problem_ptr                   = static_cast<cuOptOptimizationProblem>(problem_and_stream);
+
+  // Check remote solve configuration at creation time
+  bool is_remote = is_remote_solve_enabled();
+
+  if (is_remote) {
+    // Remote: store in CPU memory
+    problem_and_stream->cpu_data = std::make_unique<problem_cpu_data_t>();
+    auto& cpu_data               = *problem_and_stream->cpu_data;
+    const auto& mps              = *mps_data_model_ptr;
+
+    cpu_data.num_constraints =
+      static_cast<cuopt_int_t>(mps.get_constraint_matrix_offsets().size() - 1);
+    cpu_data.num_variables    = static_cast<cuopt_int_t>(mps.get_objective_coefficients().size());
+    cpu_data.maximize         = mps.get_sense();
+    cpu_data.objective_offset = mps.get_objective_offset();
+
+    cpu_data.objective_coefficients = mps.get_objective_coefficients();
+    cpu_data.A_values               = mps.get_constraint_matrix_values();
+    cpu_data.A_indices              = mps.get_constraint_matrix_indices();
+    cpu_data.A_offsets              = mps.get_constraint_matrix_offsets();
+
+    if (!mps.get_constraint_lower_bounds().empty() || !mps.get_constraint_upper_bounds().empty()) {
+      cpu_data.uses_ranged_constraints = true;
+      cpu_data.constraint_lower_bounds = mps.get_constraint_lower_bounds();
+      cpu_data.constraint_upper_bounds = mps.get_constraint_upper_bounds();
+    } else {
+      cpu_data.uses_ranged_constraints = false;
+      cpu_data.constraint_bounds       = mps.get_constraint_bounds();
+      const auto& mps_row_types        = mps.get_row_types();
+      cpu_data.row_types.resize(mps_row_types.size());
+      for (size_t i = 0; i < mps_row_types.size(); ++i) {
+        cpu_data.row_types[i] = mps_row_types[i];
+      }
+    }
+
+    cpu_data.variable_lower_bounds = mps.get_variable_lower_bounds();
+    cpu_data.variable_upper_bounds = mps.get_variable_upper_bounds();
+
+    const auto& mps_var_types = mps.get_variable_types();
+    cpu_data.variable_types.resize(mps_var_types.size());
+    for (size_t i = 0; i < mps_var_types.size(); ++i) {
+      cpu_data.variable_types[i] =
+        (mps_var_types[i] == 'I' || mps_var_types[i] == 'B') ? CUOPT_INTEGER : CUOPT_CONTINUOUS;
+    }
+
+    // Create view pointing to CPU data
+    problem_and_stream->create_view_from_cpu_data();
+  } else {
+    // Local: store in GPU memory using existing mps_data_model_to_optimization_problem
+    problem_and_stream->gpu_problem =
+      std::make_unique<optimization_problem_t<cuopt_int_t, cuopt_float_t>>(
+        mps_data_model_to_optimization_problem(problem_and_stream->get_handle_ptr(),
+                                               *mps_data_model_ptr));
+    // Create view pointing to GPU data
+    problem_and_stream->create_view_from_gpu_problem();
+  }
+
+  *problem_ptr = static_cast<cuOptOptimizationProblem>(problem_and_stream);
   return CUOPT_SUCCESS;
 }
 
@@ -118,32 +401,76 @@ cuopt_int_t cuOptCreateProblem(cuopt_int_t num_constraints,
   }
 
   problem_and_stream_view_t* problem_and_stream = new problem_and_stream_view_t();
-  problem_and_stream->op_problem =
-    new optimization_problem_t<cuopt_int_t, cuopt_float_t>(problem_and_stream->get_handle_ptr());
+  bool is_remote                                = is_remote_solve_enabled();
+
   try {
-    problem_and_stream->op_problem->set_maximize(objective_sense == CUOPT_MAXIMIZE);
-    problem_and_stream->op_problem->set_objective_offset(objective_offset);
-    problem_and_stream->op_problem->set_objective_coefficients(objective_coefficients,
-                                                               num_variables);
     cuopt_int_t nnz = constraint_matrix_row_offsets[num_constraints];
-    problem_and_stream->op_problem->set_csr_constraint_matrix(constraint_matrix_coefficent_values,
-                                                              nnz,
-                                                              constraint_matrix_column_indices,
-                                                              nnz,
-                                                              constraint_matrix_row_offsets,
-                                                              num_constraints + 1);
-    problem_and_stream->op_problem->set_row_types(constraint_sense, num_constraints);
-    problem_and_stream->op_problem->set_constraint_bounds(rhs, num_constraints);
-    problem_and_stream->op_problem->set_variable_lower_bounds(lower_bounds, num_variables);
-    problem_and_stream->op_problem->set_variable_upper_bounds(upper_bounds, num_variables);
-    std::vector<var_t> variable_types_host(num_variables);
-    for (int j = 0; j < num_variables; j++) {
-      variable_types_host[j] =
-        variable_types[j] == CUOPT_CONTINUOUS ? var_t::CONTINUOUS : var_t::INTEGER;
+
+    if (is_remote) {
+      // Remote: store in CPU memory
+      problem_and_stream->cpu_data = std::make_unique<problem_cpu_data_t>();
+      auto& cpu_data               = *problem_and_stream->cpu_data;
+
+      cpu_data.num_constraints  = num_constraints;
+      cpu_data.num_variables    = num_variables;
+      cpu_data.maximize         = (objective_sense == CUOPT_MAXIMIZE);
+      cpu_data.objective_offset = objective_offset;
+
+      cpu_data.objective_coefficients.assign(objective_coefficients,
+                                             objective_coefficients + num_variables);
+      cpu_data.A_values.assign(constraint_matrix_coefficent_values,
+                               constraint_matrix_coefficent_values + nnz);
+      cpu_data.A_indices.assign(constraint_matrix_column_indices,
+                                constraint_matrix_column_indices + nnz);
+      cpu_data.A_offsets.assign(constraint_matrix_row_offsets,
+                                constraint_matrix_row_offsets + num_constraints + 1);
+
+      cpu_data.uses_ranged_constraints = false;
+      cpu_data.row_types.assign(constraint_sense, constraint_sense + num_constraints);
+      cpu_data.constraint_bounds.assign(rhs, rhs + num_constraints);
+
+      cpu_data.variable_lower_bounds.assign(lower_bounds, lower_bounds + num_variables);
+      cpu_data.variable_upper_bounds.assign(upper_bounds, upper_bounds + num_variables);
+      cpu_data.variable_types.assign(variable_types, variable_types + num_variables);
+
+      // Create view pointing to CPU data
+      problem_and_stream->create_view_from_cpu_data();
+    } else {
+      // Local: store in GPU memory
+      problem_and_stream->gpu_problem =
+        std::make_unique<optimization_problem_t<cuopt_int_t, cuopt_float_t>>(
+          problem_and_stream->get_handle_ptr());
+      auto& gpu_problem = *problem_and_stream->gpu_problem;
+
+      gpu_problem.set_maximize(objective_sense == CUOPT_MAXIMIZE);
+      gpu_problem.set_objective_offset(objective_offset);
+      gpu_problem.set_objective_coefficients(objective_coefficients, num_variables);
+      gpu_problem.set_csr_constraint_matrix(constraint_matrix_coefficent_values,
+                                            nnz,
+                                            constraint_matrix_column_indices,
+                                            nnz,
+                                            constraint_matrix_row_offsets,
+                                            num_constraints + 1);
+      gpu_problem.set_row_types(constraint_sense, num_constraints);
+      gpu_problem.set_constraint_bounds(rhs, num_constraints);
+      gpu_problem.set_variable_lower_bounds(lower_bounds, num_variables);
+      gpu_problem.set_variable_upper_bounds(upper_bounds, num_variables);
+
+      // Convert variable types to enum
+      std::vector<var_t> variable_types_host(num_variables);
+      for (cuopt_int_t j = 0; j < num_variables; j++) {
+        variable_types_host[j] =
+          variable_types[j] == CUOPT_CONTINUOUS ? var_t::CONTINUOUS : var_t::INTEGER;
+      }
+      gpu_problem.set_variable_types(variable_types_host.data(), num_variables);
+
+      // Create view pointing to GPU data
+      problem_and_stream->create_view_from_gpu_problem();
     }
-    problem_and_stream->op_problem->set_variable_types(variable_types_host.data(), num_variables);
+
     *problem_ptr = static_cast<cuOptOptimizationProblem>(problem_and_stream);
-  } catch (const raft::exception& e) {
+  } catch (const std::exception& e) {
+    delete problem_and_stream;
     return CUOPT_INVALID_ARGUMENT;
   }
   return CUOPT_SUCCESS;
@@ -175,34 +502,79 @@ cuopt_int_t cuOptCreateRangedProblem(cuopt_int_t num_constraints,
   }
 
   problem_and_stream_view_t* problem_and_stream = new problem_and_stream_view_t();
-  problem_and_stream->op_problem =
-    new optimization_problem_t<cuopt_int_t, cuopt_float_t>(problem_and_stream->get_handle_ptr());
+  bool is_remote                                = is_remote_solve_enabled();
+
   try {
-    problem_and_stream->op_problem->set_maximize(objective_sense == CUOPT_MAXIMIZE);
-    problem_and_stream->op_problem->set_objective_offset(objective_offset);
-    problem_and_stream->op_problem->set_objective_coefficients(objective_coefficients,
-                                                               num_variables);
     cuopt_int_t nnz = constraint_matrix_row_offsets[num_constraints];
-    problem_and_stream->op_problem->set_csr_constraint_matrix(constraint_matrix_coefficent_values,
-                                                              nnz,
-                                                              constraint_matrix_column_indices,
-                                                              nnz,
-                                                              constraint_matrix_row_offsets,
-                                                              num_constraints + 1);
-    problem_and_stream->op_problem->set_constraint_lower_bounds(constraint_lower_bounds,
-                                                                num_constraints);
-    problem_and_stream->op_problem->set_constraint_upper_bounds(constraint_upper_bounds,
-                                                                num_constraints);
-    problem_and_stream->op_problem->set_variable_lower_bounds(variable_lower_bounds, num_variables);
-    problem_and_stream->op_problem->set_variable_upper_bounds(variable_upper_bounds, num_variables);
-    std::vector<var_t> variable_types_host(num_variables);
-    for (int j = 0; j < num_variables; j++) {
-      variable_types_host[j] =
-        variable_types[j] == CUOPT_CONTINUOUS ? var_t::CONTINUOUS : var_t::INTEGER;
+
+    if (is_remote) {
+      // Remote: store in CPU memory
+      problem_and_stream->cpu_data = std::make_unique<problem_cpu_data_t>();
+      auto& cpu_data               = *problem_and_stream->cpu_data;
+
+      cpu_data.num_constraints  = num_constraints;
+      cpu_data.num_variables    = num_variables;
+      cpu_data.maximize         = (objective_sense == CUOPT_MAXIMIZE);
+      cpu_data.objective_offset = objective_offset;
+
+      cpu_data.objective_coefficients.assign(objective_coefficients,
+                                             objective_coefficients + num_variables);
+      cpu_data.A_values.assign(constraint_matrix_coefficent_values,
+                               constraint_matrix_coefficent_values + nnz);
+      cpu_data.A_indices.assign(constraint_matrix_column_indices,
+                                constraint_matrix_column_indices + nnz);
+      cpu_data.A_offsets.assign(constraint_matrix_row_offsets,
+                                constraint_matrix_row_offsets + num_constraints + 1);
+
+      cpu_data.uses_ranged_constraints = true;
+      cpu_data.constraint_lower_bounds.assign(constraint_lower_bounds,
+                                              constraint_lower_bounds + num_constraints);
+      cpu_data.constraint_upper_bounds.assign(constraint_upper_bounds,
+                                              constraint_upper_bounds + num_constraints);
+
+      cpu_data.variable_lower_bounds.assign(variable_lower_bounds,
+                                            variable_lower_bounds + num_variables);
+      cpu_data.variable_upper_bounds.assign(variable_upper_bounds,
+                                            variable_upper_bounds + num_variables);
+      cpu_data.variable_types.assign(variable_types, variable_types + num_variables);
+
+      // Create view pointing to CPU data
+      problem_and_stream->create_view_from_cpu_data();
+    } else {
+      // Local: store in GPU memory
+      problem_and_stream->gpu_problem =
+        std::make_unique<optimization_problem_t<cuopt_int_t, cuopt_float_t>>(
+          problem_and_stream->get_handle_ptr());
+      auto& gpu_problem = *problem_and_stream->gpu_problem;
+
+      gpu_problem.set_maximize(objective_sense == CUOPT_MAXIMIZE);
+      gpu_problem.set_objective_offset(objective_offset);
+      gpu_problem.set_objective_coefficients(objective_coefficients, num_variables);
+      gpu_problem.set_csr_constraint_matrix(constraint_matrix_coefficent_values,
+                                            nnz,
+                                            constraint_matrix_column_indices,
+                                            nnz,
+                                            constraint_matrix_row_offsets,
+                                            num_constraints + 1);
+      gpu_problem.set_constraint_lower_bounds(constraint_lower_bounds, num_constraints);
+      gpu_problem.set_constraint_upper_bounds(constraint_upper_bounds, num_constraints);
+      gpu_problem.set_variable_lower_bounds(variable_lower_bounds, num_variables);
+      gpu_problem.set_variable_upper_bounds(variable_upper_bounds, num_variables);
+
+      std::vector<var_t> variable_types_host(num_variables);
+      for (cuopt_int_t j = 0; j < num_variables; j++) {
+        variable_types_host[j] =
+          variable_types[j] == CUOPT_CONTINUOUS ? var_t::CONTINUOUS : var_t::INTEGER;
+      }
+      gpu_problem.set_variable_types(variable_types_host.data(), num_variables);
+
+      // Create view pointing to GPU data
+      problem_and_stream->create_view_from_gpu_problem();
     }
-    problem_and_stream->op_problem->set_variable_types(variable_types_host.data(), num_variables);
+
     *problem_ptr = static_cast<cuOptOptimizationProblem>(problem_and_stream);
-  } catch (const raft::exception& e) {
+  } catch (const std::exception& e) {
+    delete problem_and_stream;
     return CUOPT_INVALID_ARGUMENT;
   }
   return CUOPT_SUCCESS;
@@ -239,34 +611,83 @@ cuopt_int_t cuOptCreateQuadraticProblem(
   }
 
   problem_and_stream_view_t* problem_and_stream = new problem_and_stream_view_t();
-  problem_and_stream->op_problem =
-    new optimization_problem_t<cuopt_int_t, cuopt_float_t>(problem_and_stream->get_handle_ptr());
+  bool is_remote                                = is_remote_solve_enabled();
+
   try {
-    problem_and_stream->op_problem->set_maximize(objective_sense == CUOPT_MAXIMIZE);
-    problem_and_stream->op_problem->set_objective_offset(objective_offset);
-    problem_and_stream->op_problem->set_objective_coefficients(objective_coefficients,
-                                                               num_variables);
     cuopt_int_t Q_nnz = quadratic_objective_matrix_row_offsets[num_variables];
-    problem_and_stream->op_problem->set_quadratic_objective_matrix(
-      quadratic_objective_matrix_coefficent_values,
-      Q_nnz,
-      quadratic_objective_matrix_column_indices,
-      Q_nnz,
-      quadratic_objective_matrix_row_offsets,
-      num_variables + 1);
-    cuopt_int_t nnz = constraint_matrix_row_offsets[num_constraints];
-    problem_and_stream->op_problem->set_csr_constraint_matrix(constraint_matrix_coefficent_values,
-                                                              nnz,
-                                                              constraint_matrix_column_indices,
-                                                              nnz,
-                                                              constraint_matrix_row_offsets,
-                                                              num_constraints + 1);
-    problem_and_stream->op_problem->set_row_types(constraint_sense, num_constraints);
-    problem_and_stream->op_problem->set_constraint_bounds(rhs, num_constraints);
-    problem_and_stream->op_problem->set_variable_lower_bounds(lower_bounds, num_variables);
-    problem_and_stream->op_problem->set_variable_upper_bounds(upper_bounds, num_variables);
+    cuopt_int_t nnz   = constraint_matrix_row_offsets[num_constraints];
+
+    if (is_remote) {
+      // Remote: store in CPU memory
+      problem_and_stream->cpu_data = std::make_unique<problem_cpu_data_t>();
+      auto& cpu_data               = *problem_and_stream->cpu_data;
+
+      cpu_data.num_constraints  = num_constraints;
+      cpu_data.num_variables    = num_variables;
+      cpu_data.maximize         = (objective_sense == CUOPT_MAXIMIZE);
+      cpu_data.objective_offset = objective_offset;
+
+      cpu_data.objective_coefficients.assign(objective_coefficients,
+                                             objective_coefficients + num_variables);
+
+      cpu_data.Q_values.assign(quadratic_objective_matrix_coefficent_values,
+                               quadratic_objective_matrix_coefficent_values + Q_nnz);
+      cpu_data.Q_indices.assign(quadratic_objective_matrix_column_indices,
+                                quadratic_objective_matrix_column_indices + Q_nnz);
+      cpu_data.Q_offsets.assign(quadratic_objective_matrix_row_offsets,
+                                quadratic_objective_matrix_row_offsets + num_variables + 1);
+
+      cpu_data.A_values.assign(constraint_matrix_coefficent_values,
+                               constraint_matrix_coefficent_values + nnz);
+      cpu_data.A_indices.assign(constraint_matrix_column_indices,
+                                constraint_matrix_column_indices + nnz);
+      cpu_data.A_offsets.assign(constraint_matrix_row_offsets,
+                                constraint_matrix_row_offsets + num_constraints + 1);
+
+      cpu_data.uses_ranged_constraints = false;
+      cpu_data.row_types.assign(constraint_sense, constraint_sense + num_constraints);
+      cpu_data.constraint_bounds.assign(rhs, rhs + num_constraints);
+
+      cpu_data.variable_lower_bounds.assign(lower_bounds, lower_bounds + num_variables);
+      cpu_data.variable_upper_bounds.assign(upper_bounds, upper_bounds + num_variables);
+      cpu_data.variable_types.assign(num_variables, CUOPT_CONTINUOUS);
+
+      // Create view pointing to CPU data
+      problem_and_stream->create_view_from_cpu_data();
+    } else {
+      // Local: store in GPU memory
+      problem_and_stream->gpu_problem =
+        std::make_unique<optimization_problem_t<cuopt_int_t, cuopt_float_t>>(
+          problem_and_stream->get_handle_ptr());
+      auto& gpu_problem = *problem_and_stream->gpu_problem;
+
+      gpu_problem.set_maximize(objective_sense == CUOPT_MAXIMIZE);
+      gpu_problem.set_objective_offset(objective_offset);
+      gpu_problem.set_objective_coefficients(objective_coefficients, num_variables);
+      gpu_problem.set_quadratic_objective_matrix(quadratic_objective_matrix_coefficent_values,
+                                                 Q_nnz,
+                                                 quadratic_objective_matrix_column_indices,
+                                                 Q_nnz,
+                                                 quadratic_objective_matrix_row_offsets,
+                                                 num_variables + 1);
+      gpu_problem.set_csr_constraint_matrix(constraint_matrix_coefficent_values,
+                                            nnz,
+                                            constraint_matrix_column_indices,
+                                            nnz,
+                                            constraint_matrix_row_offsets,
+                                            num_constraints + 1);
+      gpu_problem.set_row_types(constraint_sense, num_constraints);
+      gpu_problem.set_constraint_bounds(rhs, num_constraints);
+      gpu_problem.set_variable_lower_bounds(lower_bounds, num_variables);
+      gpu_problem.set_variable_upper_bounds(upper_bounds, num_variables);
+
+      // Create view pointing to GPU data
+      problem_and_stream->create_view_from_gpu_problem();
+    }
+
     *problem_ptr = static_cast<cuOptOptimizationProblem>(problem_and_stream);
-  } catch (const raft::exception& e) {
+  } catch (const std::exception& e) {
+    delete problem_and_stream;
     return CUOPT_INVALID_ARGUMENT;
   }
   return CUOPT_SUCCESS;
@@ -304,36 +725,87 @@ cuopt_int_t cuOptCreateQuadraticRangedProblem(
   }
 
   problem_and_stream_view_t* problem_and_stream = new problem_and_stream_view_t();
-  problem_and_stream->op_problem =
-    new optimization_problem_t<cuopt_int_t, cuopt_float_t>(problem_and_stream->get_handle_ptr());
+  bool is_remote                                = is_remote_solve_enabled();
+
   try {
-    problem_and_stream->op_problem->set_maximize(objective_sense == CUOPT_MAXIMIZE);
-    problem_and_stream->op_problem->set_objective_offset(objective_offset);
-    problem_and_stream->op_problem->set_objective_coefficients(objective_coefficients,
-                                                               num_variables);
     cuopt_int_t Q_nnz = quadratic_objective_matrix_row_offsets[num_variables];
-    problem_and_stream->op_problem->set_quadratic_objective_matrix(
-      quadratic_objective_matrix_coefficent_values,
-      Q_nnz,
-      quadratic_objective_matrix_column_indices,
-      Q_nnz,
-      quadratic_objective_matrix_row_offsets,
-      num_variables + 1);
-    cuopt_int_t nnz = constraint_matrix_row_offsets[num_constraints];
-    problem_and_stream->op_problem->set_csr_constraint_matrix(constraint_matrix_coefficent_values,
-                                                              nnz,
-                                                              constraint_matrix_column_indices,
-                                                              nnz,
-                                                              constraint_matrix_row_offsets,
-                                                              num_constraints + 1);
-    problem_and_stream->op_problem->set_constraint_lower_bounds(constraint_lower_bounds,
-                                                                num_constraints);
-    problem_and_stream->op_problem->set_constraint_upper_bounds(constraint_upper_bounds,
-                                                                num_constraints);
-    problem_and_stream->op_problem->set_variable_lower_bounds(variable_lower_bounds, num_variables);
-    problem_and_stream->op_problem->set_variable_upper_bounds(variable_upper_bounds, num_variables);
+    cuopt_int_t nnz   = constraint_matrix_row_offsets[num_constraints];
+
+    if (is_remote) {
+      // Remote: store in CPU memory
+      problem_and_stream->cpu_data = std::make_unique<problem_cpu_data_t>();
+      auto& cpu_data               = *problem_and_stream->cpu_data;
+
+      cpu_data.num_constraints  = num_constraints;
+      cpu_data.num_variables    = num_variables;
+      cpu_data.maximize         = (objective_sense == CUOPT_MAXIMIZE);
+      cpu_data.objective_offset = objective_offset;
+
+      cpu_data.objective_coefficients.assign(objective_coefficients,
+                                             objective_coefficients + num_variables);
+
+      cpu_data.Q_values.assign(quadratic_objective_matrix_coefficent_values,
+                               quadratic_objective_matrix_coefficent_values + Q_nnz);
+      cpu_data.Q_indices.assign(quadratic_objective_matrix_column_indices,
+                                quadratic_objective_matrix_column_indices + Q_nnz);
+      cpu_data.Q_offsets.assign(quadratic_objective_matrix_row_offsets,
+                                quadratic_objective_matrix_row_offsets + num_variables + 1);
+
+      cpu_data.A_values.assign(constraint_matrix_coefficent_values,
+                               constraint_matrix_coefficent_values + nnz);
+      cpu_data.A_indices.assign(constraint_matrix_column_indices,
+                                constraint_matrix_column_indices + nnz);
+      cpu_data.A_offsets.assign(constraint_matrix_row_offsets,
+                                constraint_matrix_row_offsets + num_constraints + 1);
+
+      cpu_data.uses_ranged_constraints = true;
+      cpu_data.constraint_lower_bounds.assign(constraint_lower_bounds,
+                                              constraint_lower_bounds + num_constraints);
+      cpu_data.constraint_upper_bounds.assign(constraint_upper_bounds,
+                                              constraint_upper_bounds + num_constraints);
+
+      cpu_data.variable_lower_bounds.assign(variable_lower_bounds,
+                                            variable_lower_bounds + num_variables);
+      cpu_data.variable_upper_bounds.assign(variable_upper_bounds,
+                                            variable_upper_bounds + num_variables);
+      cpu_data.variable_types.assign(num_variables, CUOPT_CONTINUOUS);
+
+      // Create view pointing to CPU data
+      problem_and_stream->create_view_from_cpu_data();
+    } else {
+      // Local: store in GPU memory
+      problem_and_stream->gpu_problem =
+        std::make_unique<optimization_problem_t<cuopt_int_t, cuopt_float_t>>(
+          problem_and_stream->get_handle_ptr());
+      auto& gpu_problem = *problem_and_stream->gpu_problem;
+
+      gpu_problem.set_maximize(objective_sense == CUOPT_MAXIMIZE);
+      gpu_problem.set_objective_offset(objective_offset);
+      gpu_problem.set_objective_coefficients(objective_coefficients, num_variables);
+      gpu_problem.set_quadratic_objective_matrix(quadratic_objective_matrix_coefficent_values,
+                                                 Q_nnz,
+                                                 quadratic_objective_matrix_column_indices,
+                                                 Q_nnz,
+                                                 quadratic_objective_matrix_row_offsets,
+                                                 num_variables + 1);
+      gpu_problem.set_csr_constraint_matrix(constraint_matrix_coefficent_values,
+                                            nnz,
+                                            constraint_matrix_column_indices,
+                                            nnz,
+                                            constraint_matrix_row_offsets,
+                                            num_constraints + 1);
+      gpu_problem.set_constraint_lower_bounds(constraint_lower_bounds, num_constraints);
+      gpu_problem.set_constraint_upper_bounds(constraint_upper_bounds, num_constraints);
+      gpu_problem.set_variable_lower_bounds(variable_lower_bounds, num_variables);
+      gpu_problem.set_variable_upper_bounds(variable_upper_bounds, num_variables);
+
+      // Create view pointing to GPU data
+      problem_and_stream->create_view_from_gpu_problem();
+    }
+
     *problem_ptr = static_cast<cuOptOptimizationProblem>(problem_and_stream);
-  } catch (const raft::exception& e) {
+  } catch (const std::exception& e) {
+    delete problem_and_stream;
     return CUOPT_INVALID_ARGUMENT;
   }
   return CUOPT_SUCCESS;
@@ -343,7 +815,9 @@ void cuOptDestroyProblem(cuOptOptimizationProblem* problem_ptr)
 {
   if (problem_ptr == nullptr) { return; }
   if (*problem_ptr == nullptr) { return; }
-  delete static_cast<problem_and_stream_view_t*>(*problem_ptr);
+  problem_and_stream_view_t* problem_and_stream =
+    static_cast<problem_and_stream_view_t*>(*problem_ptr);
+  delete problem_and_stream;
   *problem_ptr = nullptr;
 }
 
@@ -354,7 +828,11 @@ cuopt_int_t cuOptGetNumConstraints(cuOptOptimizationProblem problem,
   if (num_constraints_ptr == nullptr) { return CUOPT_INVALID_ARGUMENT; }
   problem_and_stream_view_t* problem_and_stream_view =
     static_cast<problem_and_stream_view_t*>(problem);
-  *num_constraints_ptr = problem_and_stream_view->op_problem->get_n_constraints();
+  if (!problem_and_stream_view->view.is_device_memory()) {
+    *num_constraints_ptr = problem_and_stream_view->cpu_data->num_constraints;
+  } else {
+    *num_constraints_ptr = problem_and_stream_view->gpu_problem->get_n_constraints();
+  }
   return CUOPT_SUCCESS;
 }
 
@@ -364,7 +842,11 @@ cuopt_int_t cuOptGetNumVariables(cuOptOptimizationProblem problem, cuopt_int_t*
   if (num_variables_ptr == nullptr) { return CUOPT_INVALID_ARGUMENT; }
   problem_and_stream_view_t* problem_and_stream_view =
     static_cast<problem_and_stream_view_t*>(problem);
-  *num_variables_ptr = problem_and_stream_view->op_problem->get_n_variables();
+  if (!problem_and_stream_view->view.is_device_memory()) {
+    *num_variables_ptr = problem_and_stream_view->cpu_data->num_variables;
+  } else {
+    *num_variables_ptr = problem_and_stream_view->gpu_problem->get_n_variables();
+  }
   return CUOPT_SUCCESS;
 }
 
@@ -375,8 +857,13 @@ cuopt_int_t cuOptGetObjectiveSense(cuOptOptimizationProblem problem,
   if (objective_sense_ptr == nullptr) { return CUOPT_INVALID_ARGUMENT; }
   problem_and_stream_view_t* problem_and_stream_view =
     static_cast<problem_and_stream_view_t*>(problem);
-  *objective_sense_ptr =
-    problem_and_stream_view->op_problem->get_sense() ? CUOPT_MAXIMIZE : CUOPT_MINIMIZE;
+  if (!problem_and_stream_view->view.is_device_memory()) {
+    *objective_sense_ptr =
+      problem_and_stream_view->cpu_data->maximize ? CUOPT_MAXIMIZE : CUOPT_MINIMIZE;
+  } else {
+    *objective_sense_ptr =
+      problem_and_stream_view->gpu_problem->get_sense() ? CUOPT_MAXIMIZE : CUOPT_MINIMIZE;
+  }
   return CUOPT_SUCCESS;
 }
 
@@ -387,7 +874,11 @@ cuopt_int_t cuOptGetObjectiveOffset(cuOptOptimizationProblem problem,
   if (objective_offset_ptr == nullptr) { return CUOPT_INVALID_ARGUMENT; }
   problem_and_stream_view_t* problem_and_stream_view =
     static_cast<problem_and_stream_view_t*>(problem);
-  *objective_offset_ptr = problem_and_stream_view->op_problem->get_objective_offset();
+  if (!problem_and_stream_view->view.is_device_memory()) {
+    *objective_offset_ptr = problem_and_stream_view->cpu_data->objective_offset;
+  } else {
+    *objective_offset_ptr = problem_and_stream_view->gpu_problem->get_objective_offset();
+  }
   return CUOPT_SUCCESS;
 }
 
@@ -398,13 +889,17 @@ cuopt_int_t cuOptGetObjectiveCoefficients(cuOptOptimizationProblem problem,
   if (objective_coefficients_ptr == nullptr) { return CUOPT_INVALID_ARGUMENT; }
   problem_and_stream_view_t* problem_and_stream_view =
     static_cast<problem_and_stream_view_t*>(problem);
-  const rmm::device_uvector<cuopt_float_t>& objective_coefficients =
-    problem_and_stream_view->op_problem->get_objective_coefficients();
-  raft::copy(objective_coefficients_ptr,
-             objective_coefficients.data(),
-             objective_coefficients.size(),
-             problem_and_stream_view->stream_view);
-  problem_and_stream_view->stream_view.synchronize();
+  if (!problem_and_stream_view->view.is_device_memory()) {
+    const auto& coeffs = problem_and_stream_view->cpu_data->objective_coefficients;
+    std::copy(coeffs.begin(), coeffs.end(), objective_coefficients_ptr);
+  } else {
+    const auto& gpu_problem = *problem_and_stream_view->gpu_problem;
+    raft::copy(objective_coefficients_ptr,
+               gpu_problem.get_objective_coefficients().data(),
+               gpu_problem.get_n_variables(),
+               gpu_problem.get_handle_ptr()->get_stream());
+    gpu_problem.get_handle_ptr()->sync_stream();
+  }
   return CUOPT_SUCCESS;
 }
 
@@ -415,7 +910,13 @@ cuopt_int_t cuOptGetNumNonZeros(cuOptOptimizationProblem problem,
   if (num_non_zero_elements_ptr == nullptr) { return CUOPT_INVALID_ARGUMENT; }
   problem_and_stream_view_t* problem_and_stream_view =
     static_cast<problem_and_stream_view_t*>(problem);
-  *num_non_zero_elements_ptr = problem_and_stream_view->op_problem->get_nnz();
+  if (!problem_and_stream_view->view.is_device_memory()) {
+    *num_non_zero_elements_ptr =
+      static_cast<cuopt_int_t>(problem_and_stream_view->cpu_data->A_values.size());
+  } else {
+    *num_non_zero_elements_ptr = static_cast<cuopt_int_t>(
+      problem_and_stream_view->gpu_problem->get_constraint_matrix_values().size());
+  }
   return CUOPT_SUCCESS;
 }
 
@@ -430,25 +931,32 @@ cuopt_int_t cuOptGetConstraintMatrix(cuOptOptimizationProblem problem,
   if (constraint_matrix_coefficients_ptr == nullptr) { return CUOPT_INVALID_ARGUMENT; }
   problem_and_stream_view_t* problem_and_stream_view =
     static_cast<problem_and_stream_view_t*>(problem);
-  const rmm::device_uvector<cuopt_float_t>& constraint_matrix_coefficients =
-    problem_and_stream_view->op_problem->get_constraint_matrix_values();
-  const rmm::device_uvector<cuopt_int_t>& constraint_matrix_column_indices =
-    problem_and_stream_view->op_problem->get_constraint_matrix_indices();
-  const rmm::device_uvector<cuopt_int_t>& constraint_matrix_row_offsets =
-    problem_and_stream_view->op_problem->get_constraint_matrix_offsets();
-  raft::copy(constraint_matrix_coefficients_ptr,
-             constraint_matrix_coefficients.data(),
-             constraint_matrix_coefficients.size(),
-             problem_and_stream_view->stream_view);
-  raft::copy(constraint_matrix_column_indices_ptr,
-             constraint_matrix_column_indices.data(),
-             constraint_matrix_column_indices.size(),
-             problem_and_stream_view->stream_view);
-  raft::copy(constraint_matrix_row_offsets_ptr,
-             constraint_matrix_row_offsets.data(),
-             constraint_matrix_row_offsets.size(),
-             problem_and_stream_view->stream_view);
-  problem_and_stream_view->stream_view.synchronize();
+
+  if (!problem_and_stream_view->view.is_device_memory()) {
+    const auto& cpu_data = *problem_and_stream_view->cpu_data;
+    std::copy(
+      cpu_data.A_values.begin(), cpu_data.A_values.end(), constraint_matrix_coefficients_ptr);
+    std::copy(
+      cpu_data.A_indices.begin(), cpu_data.A_indices.end(), constraint_matrix_column_indices_ptr);
+    std::copy(
+      cpu_data.A_offsets.begin(), cpu_data.A_offsets.end(), constraint_matrix_row_offsets_ptr);
+  } else {
+    const auto& gpu_problem = *problem_and_stream_view->gpu_problem;
+    auto stream             = gpu_problem.get_handle_ptr()->get_stream();
+    raft::copy(constraint_matrix_coefficients_ptr,
+               gpu_problem.get_constraint_matrix_values().data(),
+               gpu_problem.get_constraint_matrix_values().size(),
+               stream);
+    raft::copy(constraint_matrix_column_indices_ptr,
+               gpu_problem.get_constraint_matrix_indices().data(),
+               gpu_problem.get_constraint_matrix_indices().size(),
+               stream);
+    raft::copy(constraint_matrix_row_offsets_ptr,
+               gpu_problem.get_constraint_matrix_offsets().data(),
+               gpu_problem.get_constraint_matrix_offsets().size(),
+               stream);
+    gpu_problem.get_handle_ptr()->sync_stream();
+  }
   return CUOPT_SUCCESS;
 }
 
@@ -458,13 +966,18 @@ cuopt_int_t cuOptGetConstraintSense(cuOptOptimizationProblem problem, char* cons
   if (constraint_sense_ptr == nullptr) { return CUOPT_INVALID_ARGUMENT; }
   problem_and_stream_view_t* problem_and_stream_view =
     static_cast<problem_and_stream_view_t*>(problem);
-  const rmm::device_uvector<char>& constraint_sense =
-    problem_and_stream_view->op_problem->get_row_types();
-  raft::copy(constraint_sense_ptr,
-             constraint_sense.data(),
-             constraint_sense.size(),
-             problem_and_stream_view->stream_view);
-  problem_and_stream_view->stream_view.synchronize();
+
+  if (!problem_and_stream_view->view.is_device_memory()) {
+    const auto& row_types = problem_and_stream_view->cpu_data->row_types;
+    std::copy(row_types.begin(), row_types.end(), constraint_sense_ptr);
+  } else {
+    const auto& gpu_problem = *problem_and_stream_view->gpu_problem;
+    raft::copy(constraint_sense_ptr,
+               gpu_problem.get_row_types().data(),
+               gpu_problem.get_row_types().size(),
+               gpu_problem.get_handle_ptr()->get_stream());
+    gpu_problem.get_handle_ptr()->sync_stream();
+  }
   return CUOPT_SUCCESS;
 }
 
@@ -475,10 +988,18 @@ cuopt_int_t cuOptGetConstraintRightHandSide(cuOptOptimizationProblem problem,
   if (rhs_ptr == nullptr) { return CUOPT_INVALID_ARGUMENT; }
   problem_and_stream_view_t* problem_and_stream_view =
     static_cast<problem_and_stream_view_t*>(problem);
-  const rmm::device_uvector<cuopt_float_t>& rhs =
-    problem_and_stream_view->op_problem->get_constraint_bounds();
-  raft::copy(rhs_ptr, rhs.data(), rhs.size(), problem_and_stream_view->stream_view);
-  problem_and_stream_view->stream_view.synchronize();
+
+  if (!problem_and_stream_view->view.is_device_memory()) {
+    const auto& bounds = problem_and_stream_view->cpu_data->constraint_bounds;
+    std::copy(bounds.begin(), bounds.end(), rhs_ptr);
+  } else {
+    const auto& gpu_problem = *problem_and_stream_view->gpu_problem;
+    raft::copy(rhs_ptr,
+               gpu_problem.get_constraint_bounds().data(),
+               gpu_problem.get_constraint_bounds().size(),
+               gpu_problem.get_handle_ptr()->get_stream());
+    gpu_problem.get_handle_ptr()->sync_stream();
+  }
   return CUOPT_SUCCESS;
 }
 
@@ -489,13 +1010,18 @@ cuopt_int_t cuOptGetConstraintLowerBounds(cuOptOptimizationProblem problem,
   if (lower_bounds_ptr == nullptr) { return CUOPT_INVALID_ARGUMENT; }
   problem_and_stream_view_t* problem_and_stream_view =
     static_cast<problem_and_stream_view_t*>(problem);
-  const rmm::device_uvector<cuopt_float_t>& lower_bounds =
-    problem_and_stream_view->op_problem->get_constraint_lower_bounds();
-  raft::copy(lower_bounds_ptr,
-             lower_bounds.data(),
-             lower_bounds.size(),
-             problem_and_stream_view->stream_view);
-  problem_and_stream_view->stream_view.synchronize();
+
+  if (!problem_and_stream_view->view.is_device_memory()) {
+    const auto& bounds = problem_and_stream_view->cpu_data->constraint_lower_bounds;
+    std::copy(bounds.begin(), bounds.end(), lower_bounds_ptr);
+  } else {
+    const auto& gpu_problem = *problem_and_stream_view->gpu_problem;
+    raft::copy(lower_bounds_ptr,
+               gpu_problem.get_constraint_lower_bounds().data(),
+               gpu_problem.get_constraint_lower_bounds().size(),
+               gpu_problem.get_handle_ptr()->get_stream());
+    gpu_problem.get_handle_ptr()->sync_stream();
+  }
   return CUOPT_SUCCESS;
 }
 
@@ -506,13 +1032,18 @@ cuopt_int_t cuOptGetConstraintUpperBounds(cuOptOptimizationProblem problem,
   if (upper_bounds_ptr == nullptr) { return CUOPT_INVALID_ARGUMENT; }
   problem_and_stream_view_t* problem_and_stream_view =
     static_cast<problem_and_stream_view_t*>(problem);
-  const rmm::device_uvector<cuopt_float_t>& upper_bounds =
-    problem_and_stream_view->op_problem->get_constraint_upper_bounds();
-  raft::copy(upper_bounds_ptr,
-             upper_bounds.data(),
-             upper_bounds.size(),
-             problem_and_stream_view->stream_view);
-  problem_and_stream_view->stream_view.synchronize();
+
+  if (!problem_and_stream_view->view.is_device_memory()) {
+    const auto& bounds = problem_and_stream_view->cpu_data->constraint_upper_bounds;
+    std::copy(bounds.begin(), bounds.end(), upper_bounds_ptr);
+  } else {
+    const auto& gpu_problem = *problem_and_stream_view->gpu_problem;
+    raft::copy(upper_bounds_ptr,
+               gpu_problem.get_constraint_upper_bounds().data(),
+               gpu_problem.get_constraint_upper_bounds().size(),
+               gpu_problem.get_handle_ptr()->get_stream());
+    gpu_problem.get_handle_ptr()->sync_stream();
+  }
   return CUOPT_SUCCESS;
 }
 
@@ -523,13 +1054,18 @@ cuopt_int_t cuOptGetVariableLowerBounds(cuOptOptimizationProblem problem,
   if (lower_bounds_ptr == nullptr) { return CUOPT_INVALID_ARGUMENT; }
   problem_and_stream_view_t* problem_and_stream_view =
     static_cast<problem_and_stream_view_t*>(problem);
-  const rmm::device_uvector<cuopt_float_t>& lower_bounds =
-    problem_and_stream_view->op_problem->get_variable_lower_bounds();
-  raft::copy(lower_bounds_ptr,
-             lower_bounds.data(),
-             lower_bounds.size(),
-             problem_and_stream_view->stream_view);
-  problem_and_stream_view->stream_view.synchronize();
+
+  if (!problem_and_stream_view->view.is_device_memory()) {
+    const auto& bounds = problem_and_stream_view->cpu_data->variable_lower_bounds;
+    std::copy(bounds.begin(), bounds.end(), lower_bounds_ptr);
+  } else {
+    const auto& gpu_problem = *problem_and_stream_view->gpu_problem;
+    raft::copy(lower_bounds_ptr,
+               gpu_problem.get_variable_lower_bounds().data(),
+               gpu_problem.get_variable_lower_bounds().size(),
+               gpu_problem.get_handle_ptr()->get_stream());
+    gpu_problem.get_handle_ptr()->sync_stream();
+  }
   return CUOPT_SUCCESS;
 }
 
@@ -540,13 +1076,18 @@ cuopt_int_t cuOptGetVariableUpperBounds(cuOptOptimizationProblem problem,
   if (upper_bounds_ptr == nullptr) { return CUOPT_INVALID_ARGUMENT; }
   problem_and_stream_view_t* problem_and_stream_view =
     static_cast<problem_and_stream_view_t*>(problem);
-  const rmm::device_uvector<cuopt_float_t>& upper_bounds =
-    problem_and_stream_view->op_problem->get_variable_upper_bounds();
-  raft::copy(upper_bounds_ptr,
-             upper_bounds.data(),
-             upper_bounds.size(),
-             problem_and_stream_view->stream_view);
-  problem_and_stream_view->stream_view.synchronize();
+
+  if (!problem_and_stream_view->view.is_device_memory()) {
+    const auto& bounds = problem_and_stream_view->cpu_data->variable_upper_bounds;
+    std::copy(bounds.begin(), bounds.end(), upper_bounds_ptr);
+  } else {
+    const auto& gpu_problem = *problem_and_stream_view->gpu_problem;
+    raft::copy(upper_bounds_ptr,
+               gpu_problem.get_variable_upper_bounds().data(),
+               gpu_problem.get_variable_upper_bounds().size(),
+               gpu_problem.get_handle_ptr()->get_stream());
+    gpu_problem.get_handle_ptr()->sync_stream();
+  }
   return CUOPT_SUCCESS;
 }
 
@@ -556,17 +1097,24 @@ cuopt_int_t cuOptGetVariableTypes(cuOptOptimizationProblem problem, char* variab
   if (variable_types_ptr == nullptr) { return CUOPT_INVALID_ARGUMENT; }
   problem_and_stream_view_t* problem_and_stream_view =
     static_cast<problem_and_stream_view_t*>(problem);
-  const rmm::device_uvector<var_t>& variable_types =
-    problem_and_stream_view->op_problem->get_variable_types();
-  std::vector<cuopt::linear_programming::var_t> variable_types_host(variable_types.size());
-  raft::copy(variable_types_host.data(),
-             variable_types.data(),
-             variable_types.size(),
-             problem_and_stream_view->stream_view);
-  problem_and_stream_view->stream_view.synchronize();
-  for (size_t j = 0; j < variable_types_host.size(); j++) {
-    variable_types_ptr[j] =
-      variable_types_host[j] == var_t::INTEGER ? CUOPT_INTEGER : CUOPT_CONTINUOUS;
+
+  if (!problem_and_stream_view->view.is_device_memory()) {
+    const auto& var_types = problem_and_stream_view->cpu_data->variable_types;
+    std::copy(var_types.begin(), var_types.end(), variable_types_ptr);
+  } else {
+    const auto& gpu_problem = *problem_and_stream_view->gpu_problem;
+    auto num_vars           = gpu_problem.get_n_variables();
+    std::vector<var_t> gpu_var_types(num_vars);
+    raft::copy(gpu_var_types.data(),
+               gpu_problem.get_variable_types().data(),
+               num_vars,
+               gpu_problem.get_handle_ptr()->get_stream());
+    gpu_problem.get_handle_ptr()->sync_stream();
+    // Convert from var_t enum to char
+    for (cuopt_int_t i = 0; i < num_vars; ++i) {
+      variable_types_ptr[i] =
+        (gpu_var_types[i] == var_t::CONTINUOUS) ? CUOPT_CONTINUOUS : CUOPT_INTEGER;
+    }
   }
   return CUOPT_SUCCESS;
 }
@@ -712,10 +1260,7 @@ cuopt_int_t cuOptIsMIP(cuOptOptimizationProblem problem, cuopt_int_t* is_mip_ptr
   if (is_mip_ptr == nullptr) { return CUOPT_INVALID_ARGUMENT; }
   problem_and_stream_view_t* problem_and_stream_view =
     static_cast<problem_and_stream_view_t*>(problem);
-  bool is_mip =
-    (problem_and_stream_view->op_problem->get_problem_category() == problem_category_t::MIP) ||
-    (problem_and_stream_view->op_problem->get_problem_category() == problem_category_t::IP);
-  *is_mip_ptr = static_cast<cuopt_int_t>(is_mip);
+  *is_mip_ptr = static_cast<cuopt_int_t>(problem_and_stream_view->is_mip());
   return CUOPT_SUCCESS;
 }
 
@@ -728,44 +1273,97 @@ cuopt_int_t cuOptSolve(cuOptOptimizationProblem problem,
   if (problem == nullptr) { return CUOPT_INVALID_ARGUMENT; }
   if (settings == nullptr) { return CUOPT_INVALID_ARGUMENT; }
   if (solution_ptr == nullptr) { return CUOPT_INVALID_ARGUMENT; }
+
   problem_and_stream_view_t* problem_and_stream_view =
     static_cast<problem_and_stream_view_t*>(problem);
-  if (problem_and_stream_view->op_problem->get_problem_category() == problem_category_t::MIP ||
-      problem_and_stream_view->op_problem->get_problem_category() == problem_category_t::IP) {
-    solver_settings_t<cuopt_int_t, cuopt_float_t>* solver_settings =
-      static_cast<solver_settings_t<cuopt_int_t, cuopt_float_t>*>(settings);
-    mip_solver_settings_t<cuopt_int_t, cuopt_float_t>& mip_settings =
-      solver_settings->get_mip_settings();
-    optimization_problem_t<cuopt_int_t, cuopt_float_t>* op_problem =
-      problem_and_stream_view->op_problem;
-    solution_and_stream_view_t* solution_and_stream_view =
-      new solution_and_stream_view_t(true, problem_and_stream_view->stream_view);
-    solution_and_stream_view->mip_solution_ptr = new mip_solution_t<cuopt_int_t, cuopt_float_t>(
-      solve_mip<cuopt_int_t, cuopt_float_t>(*op_problem, mip_settings));
-    *solution_ptr = static_cast<cuOptSolution>(solution_and_stream_view);
-
-    cuopt::utilities::printTimestamp("CUOPT_SOLVE_RETURN");
-
-    return static_cast<cuopt_int_t>(
-      solution_and_stream_view->mip_solution_ptr->get_error_status().get_error_type());
+  solver_settings_t<cuopt_int_t, cuopt_float_t>* solver_settings =
+    static_cast<solver_settings_t<cuopt_int_t, cuopt_float_t>*>(settings);
+
+  bool is_mip = problem_and_stream_view->is_mip();
+
+  // Use the view - solve_lp/solve_mip will check is_device_memory() to determine path
+  const auto& view = problem_and_stream_view->view;
+
+  if (view.is_device_memory()) {
+    // Local path: data is already on GPU
+    // Use gpu_problem directly for optimal performance (no extra copy)
+    auto& gpu_problem = *problem_and_stream_view->gpu_problem;
+
+    if (is_mip) {
+      mip_solver_settings_t<cuopt_int_t, cuopt_float_t>& mip_settings =
+        solver_settings->get_mip_settings();
+
+      solution_and_stream_view_t* solution_and_stream_view =
+        new solution_and_stream_view_t(true, problem_and_stream_view->handle.get());
+
+      solution_and_stream_view->mip_solution_ptr = new mip_solution_t<cuopt_int_t, cuopt_float_t>(
+        solve_mip<cuopt_int_t, cuopt_float_t>(gpu_problem, mip_settings));
+
+      *solution_ptr = static_cast<cuOptSolution>(solution_and_stream_view);
+
+      cuopt::utilities::printTimestamp("CUOPT_SOLVE_RETURN");
+
+      return static_cast<cuopt_int_t>(
+        solution_and_stream_view->mip_solution_ptr->get_error_status().get_error_type());
+    } else {
+      pdlp_solver_settings_t<cuopt_int_t, cuopt_float_t>& pdlp_settings =
+        solver_settings->get_pdlp_settings();
+
+      solution_and_stream_view_t* solution_and_stream_view =
+        new solution_and_stream_view_t(false, problem_and_stream_view->handle.get());
+
+      solution_and_stream_view->lp_solution_ptr =
+        new optimization_problem_solution_t<cuopt_int_t, cuopt_float_t>(
+          solve_lp<cuopt_int_t, cuopt_float_t>(gpu_problem, pdlp_settings));
+
+      *solution_ptr = static_cast<cuOptSolution>(solution_and_stream_view);
+
+      cuopt::utilities::printTimestamp("CUOPT_SOLVE_RETURN");
+
+      return static_cast<cuopt_int_t>(
+        solution_and_stream_view->lp_solution_ptr->get_error_status().get_error_type());
+    }
   } else {
-    solver_settings_t<cuopt_int_t, cuopt_float_t>* solver_settings =
-      static_cast<solver_settings_t<cuopt_int_t, cuopt_float_t>*>(settings);
-    pdlp_solver_settings_t<cuopt_int_t, cuopt_float_t>& pdlp_settings =
-      solver_settings->get_pdlp_settings();
-    optimization_problem_t<cuopt_int_t, cuopt_float_t>* op_problem =
-      problem_and_stream_view->op_problem;
-    solution_and_stream_view_t* solution_and_stream_view =
-      new solution_and_stream_view_t(false, problem_and_stream_view->stream_view);
-    solution_and_stream_view->lp_solution_ptr =
-      new optimization_problem_solution_t<cuopt_int_t, cuopt_float_t>(
-        solve_lp<cuopt_int_t, cuopt_float_t>(*op_problem, pdlp_settings));
-    *solution_ptr = static_cast<cuOptSolution>(solution_and_stream_view);
-
-    cuopt::utilities::printTimestamp("CUOPT_SOLVE_RETURN");
-
-    return static_cast<cuopt_int_t>(
-      solution_and_stream_view->lp_solution_ptr->get_error_status().get_error_type());
+    // CPU path: use view directly - solve_lp/solve_mip handle remote vs local conversion
+    // For remote solve, handle may be nullptr (no CUDA)
+    // For local solve with CPU data, handle will be created lazily
+    raft::handle_t* handle_ptr =
+      is_remote_solve_enabled() ? nullptr : problem_and_stream_view->get_handle_ptr();
+
+    if (is_mip) {
+      mip_solver_settings_t<cuopt_int_t, cuopt_float_t>& mip_settings =
+        solver_settings->get_mip_settings();
+
+      solution_and_stream_view_t* solution_and_stream_view =
+        new solution_and_stream_view_t(true, handle_ptr);
+
+      solution_and_stream_view->mip_solution_ptr = new mip_solution_t<cuopt_int_t, cuopt_float_t>(
+        solve_mip<cuopt_int_t, cuopt_float_t>(handle_ptr, view, mip_settings));
+
+      *solution_ptr = static_cast<cuOptSolution>(solution_and_stream_view);
+
+      cuopt::utilities::printTimestamp("CUOPT_SOLVE_RETURN");
+
+      return static_cast<cuopt_int_t>(
+        solution_and_stream_view->mip_solution_ptr->get_error_status().get_error_type());
+    } else {
+      pdlp_solver_settings_t<cuopt_int_t, cuopt_float_t>& pdlp_settings =
+        solver_settings->get_pdlp_settings();
+
+      solution_and_stream_view_t* solution_and_stream_view =
+        new solution_and_stream_view_t(false, handle_ptr);
+
+      solution_and_stream_view->lp_solution_ptr =
+        new optimization_problem_solution_t<cuopt_int_t, cuopt_float_t>(
+          solve_lp<cuopt_int_t, cuopt_float_t>(handle_ptr, view, pdlp_settings));
+
+      *solution_ptr = static_cast<cuOptSolution>(solution_and_stream_view);
+
+      cuopt::utilities::printTimestamp("CUOPT_SOLVE_RETURN");
+
+      return static_cast<cuopt_int_t>(
+        solution_and_stream_view->lp_solution_ptr->get_error_status().get_error_type());
+    }
   }
 }
 
@@ -856,24 +1454,34 @@ cuopt_int_t cuOptGetPrimalSolution(cuOptSolution solution, cuopt_float_t* soluti
     mip_solution_t<cuopt_int_t, cuopt_float_t>* mip_solution =
       static_cast<mip_solution_t<cuopt_int_t, cuopt_float_t>*>(
         solution_and_stream_view->mip_solution_ptr);
-    const rmm::device_uvector<cuopt_float_t>& solution_values = mip_solution->get_solution();
-    rmm::cuda_stream_view stream_view{};
-    raft::copy(solution_values_ptr,
-               solution_values.data(),
-               solution_values.size(),
-               solution_and_stream_view->stream_view);
-    solution_and_stream_view->stream_view.synchronize();
+    if (mip_solution->is_device_memory()) {
+      const rmm::device_uvector<cuopt_float_t>& solution_values = mip_solution->get_solution();
+      raft::copy(solution_values_ptr,
+                 solution_values.data(),
+                 solution_values.size(),
+                 solution_and_stream_view->stream_view.value());
+      solution_and_stream_view->stream_view->synchronize();
+    } else {
+      const std::vector<cuopt_float_t>& solution_values = mip_solution->get_solution_host();
+      std::copy(solution_values.begin(), solution_values.end(), solution_values_ptr);
+    }
   } else {
     optimization_problem_solution_t<cuopt_int_t, cuopt_float_t>* optimization_problem_solution =
       static_cast<optimization_problem_solution_t<cuopt_int_t, cuopt_float_t>*>(
         solution_and_stream_view->lp_solution_ptr);
-    const rmm::device_uvector<cuopt_float_t>& solution_values =
-      optimization_problem_solution->get_primal_solution();
-    raft::copy(solution_values_ptr,
-               solution_values.data(),
-               solution_values.size(),
-               solution_and_stream_view->stream_view);
-    solution_and_stream_view->stream_view.synchronize();
+    if (optimization_problem_solution->is_device_memory()) {
+      const rmm::device_uvector<cuopt_float_t>& solution_values =
+        optimization_problem_solution->get_primal_solution();
+      raft::copy(solution_values_ptr,
+                 solution_values.data(),
+                 solution_values.size(),
+                 solution_and_stream_view->stream_view.value());
+      solution_and_stream_view->stream_view->synchronize();
+    } else {
+      const std::vector<cuopt_float_t>& solution_values =
+        optimization_problem_solution->get_primal_solution_host();
+      std::copy(solution_values.begin(), solution_values.end(), solution_values_ptr);
+    }
   }
   return CUOPT_SUCCESS;
 }
@@ -964,13 +1572,19 @@ cuopt_int_t cuOptGetDualSolution(cuOptSolution solution, cuopt_float_t* dual_sol
     optimization_problem_solution_t<cuopt_int_t, cuopt_float_t>* optimization_problem_solution =
       static_cast<optimization_problem_solution_t<cuopt_int_t, cuopt_float_t>*>(
         solution_and_stream_view->lp_solution_ptr);
-    const rmm::device_uvector<cuopt_float_t>& dual_solution =
-      optimization_problem_solution->get_dual_solution();
-    raft::copy(dual_solution_ptr,
-               dual_solution.data(),
-               dual_solution.size(),
-               solution_and_stream_view->stream_view);
-    solution_and_stream_view->stream_view.synchronize();
+    if (optimization_problem_solution->is_device_memory()) {
+      const rmm::device_uvector<cuopt_float_t>& dual_solution =
+        optimization_problem_solution->get_dual_solution();
+      raft::copy(dual_solution_ptr,
+                 dual_solution.data(),
+                 dual_solution.size(),
+                 solution_and_stream_view->stream_view.value());
+      solution_and_stream_view->stream_view->synchronize();
+    } else {
+      const std::vector<cuopt_float_t>& dual_solution =
+        optimization_problem_solution->get_dual_solution_host();
+      std::copy(dual_solution.begin(), dual_solution.end(), dual_solution_ptr);
+    }
     return CUOPT_SUCCESS;
   }
 }
@@ -1005,13 +1619,19 @@ cuopt_int_t cuOptGetReducedCosts(cuOptSolution solution, cuopt_float_t* reduced_
     optimization_problem_solution_t<cuopt_int_t, cuopt_float_t>* optimization_problem_solution =
       static_cast<optimization_problem_solution_t<cuopt_int_t, cuopt_float_t>*>(
         solution_and_stream_view->lp_solution_ptr);
-    const rmm::device_uvector<cuopt_float_t>& reduced_cost =
-      optimization_problem_solution->get_reduced_cost();
-    raft::copy(reduced_cost_ptr,
-               reduced_cost.data(),
-               reduced_cost.size(),
-               solution_and_stream_view->stream_view);
-    solution_and_stream_view->stream_view.synchronize();
+    if (optimization_problem_solution->is_device_memory()) {
+      const rmm::device_uvector<cuopt_float_t>& reduced_cost =
+        optimization_problem_solution->get_reduced_cost();
+      raft::copy(reduced_cost_ptr,
+                 reduced_cost.data(),
+                 reduced_cost.size(),
+                 solution_and_stream_view->stream_view.value());
+      solution_and_stream_view->stream_view->synchronize();
+    } else {
+      const std::vector<cuopt_float_t>& reduced_cost =
+        optimization_problem_solution->get_reduced_cost_host();
+      std::copy(reduced_cost.begin(), reduced_cost.end(), reduced_cost_ptr);
+    }
     return CUOPT_SUCCESS;
   }
 }
diff --git a/cpp/src/linear_programming/solve.cu b/cpp/src/linear_programming/solve.cu
index db15eed82..1c21739c9 100644
--- a/cpp/src/linear_programming/solve.cu
+++ b/cpp/src/linear_programming/solve.cu
@@ -27,6 +27,7 @@
 #include <cuopt/linear_programming/pdlp/pdlp_hyper_params.cuh>
 #include <cuopt/linear_programming/pdlp/solver_settings.hpp>
 #include <cuopt/linear_programming/solve.hpp>
+#include <cuopt/linear_programming/utilities/remote_solve.hpp>
 
 #include <mps_parser/mps_data_model.hpp>
 #include <utilities/copy_helpers.hpp>
@@ -44,7 +45,8 @@
 #include <raft/core/device_setter.hpp>
 #include <raft/core/handle.hpp>
 
-#include <thread>  // For std::thread
+#include <cstring>  // For std::memcpy
+#include <thread>   // For std::thread
 
 #define CUOPT_LOG_CONDITIONAL_INFO(condition, ...) \
   if ((condition)) { CUOPT_LOG_INFO(__VA_ARGS__); }
@@ -1308,6 +1310,100 @@ cuopt::linear_programming::optimization_problem_t<i_t, f_t> mps_data_model_to_op
   return op_problem;
 }
 
+// Helper to create a data_model_view_t from mps_data_model_t (for remote solve path)
+template <typename i_t, typename f_t>
+static data_model_view_t<i_t, f_t> create_view_from_mps_data_model(
+  const cuopt::mps_parser::mps_data_model_t<i_t, f_t>& mps_data_model)
+{
+  data_model_view_t<i_t, f_t> view;
+
+  view.set_maximize(mps_data_model.get_sense());
+
+  if (!mps_data_model.get_constraint_matrix_values().empty()) {
+    view.set_csr_constraint_matrix(mps_data_model.get_constraint_matrix_values().data(),
+                                   mps_data_model.get_constraint_matrix_values().size(),
+                                   mps_data_model.get_constraint_matrix_indices().data(),
+                                   mps_data_model.get_constraint_matrix_indices().size(),
+                                   mps_data_model.get_constraint_matrix_offsets().data(),
+                                   mps_data_model.get_constraint_matrix_offsets().size());
+  }
+
+  if (!mps_data_model.get_constraint_bounds().empty()) {
+    view.set_constraint_bounds(mps_data_model.get_constraint_bounds().data(),
+                               mps_data_model.get_constraint_bounds().size());
+  }
+
+  if (!mps_data_model.get_objective_coefficients().empty()) {
+    view.set_objective_coefficients(mps_data_model.get_objective_coefficients().data(),
+                                    mps_data_model.get_objective_coefficients().size());
+  }
+
+  if (mps_data_model.has_quadratic_objective()) {
+    view.set_quadratic_objective_matrix(mps_data_model.get_quadratic_objective_values().data(),
+                                        mps_data_model.get_quadratic_objective_values().size(),
+                                        mps_data_model.get_quadratic_objective_indices().data(),
+                                        mps_data_model.get_quadratic_objective_indices().size(),
+                                        mps_data_model.get_quadratic_objective_offsets().data(),
+                                        mps_data_model.get_quadratic_objective_offsets().size());
+  }
+
+  view.set_objective_scaling_factor(mps_data_model.get_objective_scaling_factor());
+  view.set_objective_offset(mps_data_model.get_objective_offset());
+
+  if (!mps_data_model.get_variable_lower_bounds().empty()) {
+    view.set_variable_lower_bounds(mps_data_model.get_variable_lower_bounds().data(),
+                                   mps_data_model.get_variable_lower_bounds().size());
+  }
+
+  if (!mps_data_model.get_variable_upper_bounds().empty()) {
+    view.set_variable_upper_bounds(mps_data_model.get_variable_upper_bounds().data(),
+                                   mps_data_model.get_variable_upper_bounds().size());
+  }
+
+  if (!mps_data_model.get_variable_types().empty()) {
+    view.set_variable_types(mps_data_model.get_variable_types().data(),
+                            mps_data_model.get_variable_types().size());
+  }
+
+  if (!mps_data_model.get_row_types().empty()) {
+    view.set_row_types(mps_data_model.get_row_types().data(),
+                       mps_data_model.get_row_types().size());
+  }
+
+  if (!mps_data_model.get_constraint_lower_bounds().empty()) {
+    view.set_constraint_lower_bounds(mps_data_model.get_constraint_lower_bounds().data(),
+                                     mps_data_model.get_constraint_lower_bounds().size());
+  }
+
+  if (!mps_data_model.get_constraint_upper_bounds().empty()) {
+    view.set_constraint_upper_bounds(mps_data_model.get_constraint_upper_bounds().data(),
+                                     mps_data_model.get_constraint_upper_bounds().size());
+  }
+
+  view.set_objective_name(mps_data_model.get_objective_name());
+  view.set_problem_name(mps_data_model.get_problem_name());
+
+  if (!mps_data_model.get_variable_names().empty()) {
+    view.set_variable_names(mps_data_model.get_variable_names());
+  }
+
+  if (!mps_data_model.get_row_names().empty()) {
+    view.set_row_names(mps_data_model.get_row_names());
+  }
+
+  if (!mps_data_model.get_initial_primal_solution().empty()) {
+    view.set_initial_primal_solution(mps_data_model.get_initial_primal_solution().data(),
+                                     mps_data_model.get_initial_primal_solution().size());
+  }
+
+  if (!mps_data_model.get_initial_dual_solution().empty()) {
+    view.set_initial_dual_solution(mps_data_model.get_initial_dual_solution().data(),
+                                   mps_data_model.get_initial_dual_solution().size());
+  }
+
+  return view;
+}
+
 template <typename i_t, typename f_t>
 optimization_problem_solution_t<i_t, f_t> solve_lp(
   raft::handle_t const* handle_ptr,
@@ -1316,42 +1412,356 @@ optimization_problem_solution_t<i_t, f_t> solve_lp(
   bool problem_checking,
   bool use_pdlp_solver_mode)
 {
-  auto op_problem = mps_data_model_to_optimization_problem(handle_ptr, mps_data_model);
+  // Create a view pointing to CPU data and delegate to the view-based overload.
+  // The view overload handles local vs remote solve automatically.
+  auto view = create_view_from_mps_data_model(mps_data_model);
+  view.set_is_device_memory(false);  // MPS data is always in CPU memory
+  return solve_lp(handle_ptr, view, settings, problem_checking, use_pdlp_solver_mode);
+}
+
+template <typename i_t, typename f_t>
+optimization_problem_t<i_t, f_t> data_model_view_to_optimization_problem(
+  raft::handle_t const* handle_ptr, const data_model_view_t<i_t, f_t>& view)
+{
+  optimization_problem_t<i_t, f_t> op_problem(handle_ptr);
+  op_problem.set_maximize(view.get_sense());
+
+  op_problem.set_csr_constraint_matrix(view.get_constraint_matrix_values().data(),
+                                       view.get_constraint_matrix_values().size(),
+                                       view.get_constraint_matrix_indices().data(),
+                                       view.get_constraint_matrix_indices().size(),
+                                       view.get_constraint_matrix_offsets().data(),
+                                       view.get_constraint_matrix_offsets().size());
+
+  if (view.get_constraint_bounds().size() != 0) {
+    op_problem.set_constraint_bounds(view.get_constraint_bounds().data(),
+                                     view.get_constraint_bounds().size());
+  }
+  if (view.get_objective_coefficients().size() != 0) {
+    op_problem.set_objective_coefficients(view.get_objective_coefficients().data(),
+                                          view.get_objective_coefficients().size());
+  }
+  op_problem.set_objective_scaling_factor(view.get_objective_scaling_factor());
+  op_problem.set_objective_offset(view.get_objective_offset());
+  if (view.get_variable_lower_bounds().size() != 0) {
+    op_problem.set_variable_lower_bounds(view.get_variable_lower_bounds().data(),
+                                         view.get_variable_lower_bounds().size());
+  }
+  if (view.get_variable_upper_bounds().size() != 0) {
+    op_problem.set_variable_upper_bounds(view.get_variable_upper_bounds().data(),
+                                         view.get_variable_upper_bounds().size());
+  }
+  if (view.get_variable_types().size() != 0) {
+    auto var_types = view.get_variable_types();
+
+    // Check if the pointer is on host or device
+    cudaPointerAttributes attrs;
+    cudaError_t err = cudaPointerGetAttributes(&attrs, var_types.data());
+
+    std::vector<char> host_var_types(var_types.size());
+    if (err == cudaSuccess && attrs.type == cudaMemoryTypeDevice) {
+      // Source is on GPU - copy to host
+      cudaMemcpy(host_var_types.data(),
+                 var_types.data(),
+                 var_types.size() * sizeof(char),
+                 cudaMemcpyDeviceToHost);
+    } else {
+      // Source is on host (or unregistered) - direct copy
+      cudaGetLastError();  // Clear any error from cudaPointerGetAttributes
+      std::memcpy(host_var_types.data(), var_types.data(), var_types.size() * sizeof(char));
+    }
+
+    std::vector<var_t> enum_variable_types(var_types.size());
+    for (std::size_t i = 0; i < var_types.size(); ++i) {
+      enum_variable_types[i] = host_var_types[i] == 'I' ? var_t::INTEGER : var_t::CONTINUOUS;
+    }
+    op_problem.set_variable_types(enum_variable_types.data(), enum_variable_types.size());
+  }
+
+  if (view.get_row_types().size() != 0) {
+    op_problem.set_row_types(view.get_row_types().data(), view.get_row_types().size());
+  }
+  if (view.get_constraint_lower_bounds().size() != 0) {
+    op_problem.set_constraint_lower_bounds(view.get_constraint_lower_bounds().data(),
+                                           view.get_constraint_lower_bounds().size());
+  }
+  if (view.get_constraint_upper_bounds().size() != 0) {
+    op_problem.set_constraint_upper_bounds(view.get_constraint_upper_bounds().data(),
+                                           view.get_constraint_upper_bounds().size());
+  }
+
+  if (view.get_objective_name().size() != 0) {
+    op_problem.set_objective_name(view.get_objective_name());
+  }
+  if (view.get_problem_name().size() != 0) {
+    op_problem.set_problem_name(view.get_problem_name().data());
+  }
+  if (view.get_variable_names().size() != 0) {
+    op_problem.set_variable_names(view.get_variable_names());
+  }
+  if (view.get_row_names().size() != 0) { op_problem.set_row_names(view.get_row_names()); }
+
+  if (view.has_quadratic_objective()) {
+    // Copy quadratic objective from view to vectors first since we need host data
+    std::vector<f_t> Q_values(view.get_quadratic_objective_values().size());
+    std::vector<i_t> Q_indices(view.get_quadratic_objective_indices().size());
+    std::vector<i_t> Q_offsets(view.get_quadratic_objective_offsets().size());
+
+    // Check if the pointer is on host or device
+    cudaPointerAttributes attrs;
+    cudaError_t err =
+      cudaPointerGetAttributes(&attrs, view.get_quadratic_objective_values().data());
+
+    if (err == cudaSuccess && attrs.type == cudaMemoryTypeDevice) {
+      // Source is on GPU - copy to host
+      cudaMemcpy(Q_values.data(),
+                 view.get_quadratic_objective_values().data(),
+                 Q_values.size() * sizeof(f_t),
+                 cudaMemcpyDeviceToHost);
+      cudaMemcpy(Q_indices.data(),
+                 view.get_quadratic_objective_indices().data(),
+                 Q_indices.size() * sizeof(i_t),
+                 cudaMemcpyDeviceToHost);
+      cudaMemcpy(Q_offsets.data(),
+                 view.get_quadratic_objective_offsets().data(),
+                 Q_offsets.size() * sizeof(i_t),
+                 cudaMemcpyDeviceToHost);
+    } else {
+      // Source is on host - direct copy
+      cudaGetLastError();  // Clear any error from cudaPointerGetAttributes
+      std::memcpy(Q_values.data(),
+                  view.get_quadratic_objective_values().data(),
+                  Q_values.size() * sizeof(f_t));
+      std::memcpy(Q_indices.data(),
+                  view.get_quadratic_objective_indices().data(),
+                  Q_indices.size() * sizeof(i_t));
+      std::memcpy(Q_offsets.data(),
+                  view.get_quadratic_objective_offsets().data(),
+                  Q_offsets.size() * sizeof(i_t));
+    }
+
+    op_problem.set_quadratic_objective_matrix(Q_values.data(),
+                                              Q_values.size(),
+                                              Q_indices.data(),
+                                              Q_indices.size(),
+                                              Q_offsets.data(),
+                                              Q_offsets.size());
+  }
+
+  return op_problem;
+}
+
+// Helper struct to hold CPU copies of GPU data for remote solve
+template <typename i_t, typename f_t>
+struct cpu_problem_data_t {
+  std::vector<f_t> A_values;
+  std::vector<i_t> A_indices;
+  std::vector<i_t> A_offsets;
+  std::vector<f_t> constraint_bounds;
+  std::vector<f_t> constraint_lower_bounds;
+  std::vector<f_t> constraint_upper_bounds;
+  std::vector<f_t> objective_coefficients;
+  std::vector<f_t> variable_lower_bounds;
+  std::vector<f_t> variable_upper_bounds;
+  std::vector<char> variable_types;
+  std::vector<f_t> quadratic_objective_values;
+  std::vector<i_t> quadratic_objective_indices;
+  std::vector<i_t> quadratic_objective_offsets;
+  bool maximize;
+  f_t objective_scaling_factor;
+  f_t objective_offset;
+
+  data_model_view_t<i_t, f_t> create_view() const
+  {
+    data_model_view_t<i_t, f_t> v;
+    v.set_maximize(maximize);
+    v.set_objective_scaling_factor(objective_scaling_factor);
+    v.set_objective_offset(objective_offset);
+
+    if (!A_values.empty()) {
+      v.set_csr_constraint_matrix(A_values.data(),
+                                  A_values.size(),
+                                  A_indices.data(),
+                                  A_indices.size(),
+                                  A_offsets.data(),
+                                  A_offsets.size());
+    }
+    if (!constraint_bounds.empty()) {
+      v.set_constraint_bounds(constraint_bounds.data(), constraint_bounds.size());
+    }
+    if (!constraint_lower_bounds.empty() && !constraint_upper_bounds.empty()) {
+      v.set_constraint_lower_bounds(constraint_lower_bounds.data(), constraint_lower_bounds.size());
+      v.set_constraint_upper_bounds(constraint_upper_bounds.data(), constraint_upper_bounds.size());
+    }
+    if (!objective_coefficients.empty()) {
+      v.set_objective_coefficients(objective_coefficients.data(), objective_coefficients.size());
+    }
+    if (!variable_lower_bounds.empty()) {
+      v.set_variable_lower_bounds(variable_lower_bounds.data(), variable_lower_bounds.size());
+    }
+    if (!variable_upper_bounds.empty()) {
+      v.set_variable_upper_bounds(variable_upper_bounds.data(), variable_upper_bounds.size());
+    }
+    if (!variable_types.empty()) {
+      v.set_variable_types(variable_types.data(), variable_types.size());
+    }
+    if (!quadratic_objective_values.empty()) {
+      v.set_quadratic_objective_matrix(quadratic_objective_values.data(),
+                                       quadratic_objective_values.size(),
+                                       quadratic_objective_indices.data(),
+                                       quadratic_objective_indices.size(),
+                                       quadratic_objective_offsets.data(),
+                                       quadratic_objective_offsets.size());
+    }
+    v.set_is_device_memory(false);
+    return v;
+  }
+};
+
+// Helper to copy GPU view data to CPU
+template <typename i_t, typename f_t>
+cpu_problem_data_t<i_t, f_t> copy_view_to_cpu(raft::handle_t const* handle_ptr,
+                                              const data_model_view_t<i_t, f_t>& gpu_view)
+{
+  cpu_problem_data_t<i_t, f_t> cpu_data;
+  auto stream = handle_ptr->get_stream();
+
+  cpu_data.maximize                 = gpu_view.get_sense();
+  cpu_data.objective_scaling_factor = gpu_view.get_objective_scaling_factor();
+  cpu_data.objective_offset         = gpu_view.get_objective_offset();
+
+  auto copy_to_host = [stream](auto& dst_vec, auto src_span) {
+    if (src_span.size() > 0) {
+      dst_vec.resize(src_span.size());
+      raft::copy(dst_vec.data(), src_span.data(), src_span.size(), stream);
+    }
+  };
+
+  copy_to_host(cpu_data.A_values, gpu_view.get_constraint_matrix_values());
+  copy_to_host(cpu_data.A_indices, gpu_view.get_constraint_matrix_indices());
+  copy_to_host(cpu_data.A_offsets, gpu_view.get_constraint_matrix_offsets());
+  copy_to_host(cpu_data.constraint_bounds, gpu_view.get_constraint_bounds());
+  copy_to_host(cpu_data.constraint_lower_bounds, gpu_view.get_constraint_lower_bounds());
+  copy_to_host(cpu_data.constraint_upper_bounds, gpu_view.get_constraint_upper_bounds());
+  copy_to_host(cpu_data.objective_coefficients, gpu_view.get_objective_coefficients());
+  copy_to_host(cpu_data.variable_lower_bounds, gpu_view.get_variable_lower_bounds());
+  copy_to_host(cpu_data.variable_upper_bounds, gpu_view.get_variable_upper_bounds());
+  copy_to_host(cpu_data.quadratic_objective_values, gpu_view.get_quadratic_objective_values());
+  copy_to_host(cpu_data.quadratic_objective_indices, gpu_view.get_quadratic_objective_indices());
+  copy_to_host(cpu_data.quadratic_objective_offsets, gpu_view.get_quadratic_objective_offsets());
+
+  // Variable types need special handling (char array)
+  auto var_types_span = gpu_view.get_variable_types();
+  if (var_types_span.size() > 0) {
+    cpu_data.variable_types.resize(var_types_span.size());
+    cudaMemcpyAsync(cpu_data.variable_types.data(),
+                    var_types_span.data(),
+                    var_types_span.size() * sizeof(char),
+                    cudaMemcpyDeviceToHost,
+                    stream);
+  }
+
+  // Synchronize to ensure all copies are complete
+  cudaStreamSynchronize(stream);
+
+  return cpu_data;
+}
+
+template <typename i_t, typename f_t>
+optimization_problem_solution_t<i_t, f_t> solve_lp(raft::handle_t const* handle_ptr,
+                                                   const data_model_view_t<i_t, f_t>& view,
+                                                   pdlp_solver_settings_t<i_t, f_t> const& settings,
+                                                   bool problem_checking,
+                                                   bool use_pdlp_solver_mode)
+{
+  // Initialize logger for this overload (needed for early returns)
+  init_logger_t log(settings.log_file, settings.log_to_console);
+
+  // Check for remote solve configuration first
+  auto remote_config = get_remote_solve_config();
+
+  if (view.is_device_memory()) {
+    if (remote_config.has_value()) {
+      // GPU data + remote solve requested: need valid handle to copy GPU→CPU
+      if (handle_ptr == nullptr) {
+        CUOPT_LOG_ERROR(
+          "[solve_lp] Remote solve requested with GPU data but no CUDA handle. "
+          "This is an internal error - GPU data should not exist without CUDA initialization.");
+        return optimization_problem_solution_t<i_t, f_t>(pdlp_termination_status_t::NumericalError);
+      }
+      CUOPT_LOG_WARN(
+        "[solve_lp] Remote solve requested but data is on GPU. "
+        "Copying to CPU for serialization (performance impact).");
+      auto cpu_data = copy_view_to_cpu(handle_ptr, view);
+      auto cpu_view = cpu_data.create_view();
+
+      CUOPT_LOG_INFO("[solve_lp] Remote solve detected: CUOPT_REMOTE_HOST=%s, CUOPT_REMOTE_PORT=%d",
+                     remote_config->host.c_str(),
+                     remote_config->port);
+      // Call the remote solve function with CPU-side view
+      return solve_lp_remote(*remote_config, cpu_view, settings);
+    }
+
+    // Local solve: data already on GPU - convert view to optimization_problem_t and solve
+    auto op_problem = data_model_view_to_optimization_problem(handle_ptr, view);
+    return solve_lp(op_problem, settings, problem_checking, use_pdlp_solver_mode);
+  }
+
+  // Data is on CPU
+  if (remote_config.has_value()) {
+    CUOPT_LOG_INFO("[solve_lp] Remote solve detected: CUOPT_REMOTE_HOST=%s, CUOPT_REMOTE_PORT=%d",
+                   remote_config->host.c_str(),
+                   remote_config->port);
+    // Call the remote solve function
+    return solve_lp_remote(*remote_config, view, settings);
+  }
+
+  // Local solve with CPU data: copy to GPU and solve
+  if (handle_ptr == nullptr) {
+    CUOPT_LOG_ERROR("[solve_lp] Local solve requested but handle_ptr is null.");
+    return optimization_problem_solution_t<i_t, f_t>(
+      cuopt::logic_error("No CUDA handle for CPU->GPU copy", cuopt::error_type_t::RuntimeError));
+  }
+  auto op_problem = data_model_view_to_optimization_problem(handle_ptr, view);
   return solve_lp(op_problem, settings, problem_checking, use_pdlp_solver_mode);
 }
 
-#define INSTANTIATE(F_TYPE)                                                            \
-  template optimization_problem_solution_t<int, F_TYPE> solve_lp(                      \
-    optimization_problem_t<int, F_TYPE>& op_problem,                                   \
-    pdlp_solver_settings_t<int, F_TYPE> const& settings,                               \
-    bool problem_checking,                                                             \
-    bool use_pdlp_solver_mode,                                                         \
-    bool is_batch_mode);                                                               \
-                                                                                       \
-  template optimization_problem_solution_t<int, F_TYPE> solve_lp(                      \
-    raft::handle_t const* handle_ptr,                                                  \
-    const cuopt::mps_parser::mps_data_model_t<int, F_TYPE>& mps_data_model,            \
-    pdlp_solver_settings_t<int, F_TYPE> const& settings,                               \
-    bool problem_checking,                                                             \
-    bool use_pdlp_solver_mode);                                                        \
-                                                                                       \
-  template optimization_problem_solution_t<int, F_TYPE> solve_lp_with_method(          \
-    detail::problem_t<int, F_TYPE>& problem,                                           \
-    pdlp_solver_settings_t<int, F_TYPE> const& settings,                               \
-    const timer_t& timer,                                                              \
-    bool is_batch_mode);                                                               \
-                                                                                       \
-  template optimization_problem_solution_t<int, F_TYPE> batch_pdlp_solve(              \
-    raft::handle_t const* handle_ptr,                                                  \
-    const cuopt::mps_parser::mps_data_model_t<int, F_TYPE>& mps_data_model,            \
-    const std::vector<int>& fractional,                                                \
-    const std::vector<F_TYPE>& root_soln_x,                                            \
-    pdlp_solver_settings_t<int, F_TYPE> const& settings);                              \
-                                                                                       \
-  template optimization_problem_t<int, F_TYPE> mps_data_model_to_optimization_problem( \
-    raft::handle_t const* handle_ptr,                                                  \
-    const cuopt::mps_parser::mps_data_model_t<int, F_TYPE>& data_model);               \
-  template void set_pdlp_solver_mode(pdlp_solver_settings_t<int, F_TYPE>& settings);
+#define INSTANTIATE(F_TYPE)                                                             \
+  template optimization_problem_solution_t<int, F_TYPE> solve_lp(                       \
+    optimization_problem_t<int, F_TYPE>& op_problem,                                    \
+    pdlp_solver_settings_t<int, F_TYPE> const& settings,                                \
+    bool problem_checking,                                                              \
+    bool use_pdlp_solver_mode,                                                          \
+    bool is_batch_mode);                                                                \
+                                                                                        \
+  template optimization_problem_solution_t<int, F_TYPE> solve_lp(                       \
+    raft::handle_t const* handle_ptr,                                                   \
+    const cuopt::mps_parser::mps_data_model_t<int, F_TYPE>& mps_data_model,             \
+    pdlp_solver_settings_t<int, F_TYPE> const& settings,                                \
+    bool problem_checking,                                                              \
+    bool use_pdlp_solver_mode);                                                         \
+                                                                                        \
+  template optimization_problem_solution_t<int, F_TYPE> solve_lp_with_method(           \
+    detail::problem_t<int, F_TYPE>& problem,                                            \
+    pdlp_solver_settings_t<int, F_TYPE> const& settings,                                \
+    const timer_t& timer,                                                               \
+    bool is_batch_mode);                                                                \
+                                                                                        \
+  template optimization_problem_t<int, F_TYPE> mps_data_model_to_optimization_problem(  \
+    raft::handle_t const* handle_ptr,                                                   \
+    const cuopt::mps_parser::mps_data_model_t<int, F_TYPE>& data_model);                \
+                                                                                        \
+  template optimization_problem_t<int, F_TYPE> data_model_view_to_optimization_problem( \
+    raft::handle_t const* handle_ptr, const data_model_view_t<int, F_TYPE>& view);      \
+                                                                                        \
+  template optimization_problem_solution_t<int, F_TYPE> solve_lp(                       \
+    raft::handle_t const* handle_ptr,                                                   \
+    const data_model_view_t<int, F_TYPE>& view,                                         \
+    pdlp_solver_settings_t<int, F_TYPE> const& settings,                                \
+    bool problem_checking,                                                              \
+    bool use_pdlp_solver_mode);                                                         \
+                                                                                        \
+  template void set_pdlp_solver_mode(pdlp_solver_settings_t<int, F_TYPE> const& settings);
 
 #if MIP_INSTANTIATE_FLOAT
 INSTANTIATE(float)
diff --git a/cpp/src/linear_programming/solver_solution.cu b/cpp/src/linear_programming/solver_solution.cu
index ff6234024..0e38e844d 100644
--- a/cpp/src/linear_programming/solver_solution.cu
+++ b/cpp/src/linear_programming/solver_solution.cu
@@ -25,10 +25,11 @@ namespace cuopt::linear_programming {
 template <typename i_t, typename f_t>
 optimization_problem_solution_t<i_t, f_t>::optimization_problem_solution_t(
   pdlp_termination_status_t termination_status, rmm::cuda_stream_view stream_view)
-  : primal_solution_{0, stream_view},
-    dual_solution_{0, stream_view},
-    reduced_cost_{0, stream_view},
-    termination_status_{termination_status},
+  : primal_solution_(std::make_unique<rmm::device_uvector<f_t>>(0, stream_view)),
+    dual_solution_(std::make_unique<rmm::device_uvector<f_t>>(0, stream_view)),
+    reduced_cost_(std::make_unique<rmm::device_uvector<f_t>>(0, stream_view)),
+    is_device_memory_(true),
+    termination_status_(termination_status),
     error_status_(cuopt::logic_error("", cuopt::error_type_t::Success))
 {
   cuopt_assert(termination_stats_.size() == termination_status_.size(),
@@ -38,16 +39,43 @@ optimization_problem_solution_t<i_t, f_t>::optimization_problem_solution_t(
 template <typename i_t, typename f_t>
 optimization_problem_solution_t<i_t, f_t>::optimization_problem_solution_t(
   cuopt::logic_error error_status_, rmm::cuda_stream_view stream_view)
-  : primal_solution_{0, stream_view},
-    dual_solution_{0, stream_view},
-    reduced_cost_{0, stream_view},
-    termination_status_{pdlp_termination_status_t::NoTermination},
+  : primal_solution_(std::make_unique<rmm::device_uvector<f_t>>(0, stream_view)),
+    dual_solution_(std::make_unique<rmm::device_uvector<f_t>>(0, stream_view)),
+    reduced_cost_(std::make_unique<rmm::device_uvector<f_t>>(0, stream_view)),
+    is_device_memory_(true),
+    termination_status_(pdlp_termination_status_t::NoTermination),
     error_status_(error_status_)
 {
   cuopt_assert(termination_stats_.size() == termination_status_.size(),
                "Termination statistics and status vectors must have the same size");
 }
 
+// CPU-only constructor for remote solve error cases
+template <typename i_t, typename f_t>
+optimization_problem_solution_t<i_t, f_t>::optimization_problem_solution_t(
+  pdlp_termination_status_t termination_status)
+  : primal_solution_host_(std::make_unique<std::vector<f_t>>()),
+    dual_solution_host_(std::make_unique<std::vector<f_t>>()),
+    reduced_cost_host_(std::make_unique<std::vector<f_t>>()),
+    is_device_memory_(false),
+    termination_status_(termination_status),
+    error_status_(cuopt::logic_error("", cuopt::error_type_t::Success))
+{
+}
+
+// CPU-only constructor for remote solve error cases
+template <typename i_t, typename f_t>
+optimization_problem_solution_t<i_t, f_t>::optimization_problem_solution_t(
+  cuopt::logic_error error_status)
+  : primal_solution_host_(std::make_unique<std::vector<f_t>>()),
+    dual_solution_host_(std::make_unique<std::vector<f_t>>()),
+    reduced_cost_host_(std::make_unique<std::vector<f_t>>()),
+    is_device_memory_(false),
+    termination_status_(pdlp_termination_status_t::NoTermination),
+    error_status_(error_status)
+{
+}
+
 template <typename i_t, typename f_t>
 optimization_problem_solution_t<i_t, f_t>::optimization_problem_solution_t(
   rmm::device_uvector<f_t>& final_primal_solution,
@@ -57,17 +85,18 @@ optimization_problem_solution_t<i_t, f_t>::optimization_problem_solution_t(
   const std::string objective_name,
   const std::vector<std::string>& var_names,
   const std::vector<std::string>& row_names,
-  std::vector<additional_termination_information_t>&& termination_stats,
-  std::vector<pdlp_termination_status_t>&& termination_status)
-  : primal_solution_(std::move(final_primal_solution)),
-    dual_solution_(std::move(final_dual_solution)),
-    reduced_cost_(std::move(final_reduced_cost)),
+  additional_termination_information_t& termination_stats,
+  pdlp_termination_status_t termination_status)
+  : primal_solution_(std::make_unique<rmm::device_uvector<f_t>>(std::move(final_primal_solution))),
+    dual_solution_(std::make_unique<rmm::device_uvector<f_t>>(std::move(final_dual_solution))),
+    reduced_cost_(std::make_unique<rmm::device_uvector<f_t>>(std::move(final_reduced_cost))),
+    is_device_memory_(true),
     pdlp_warm_start_data_(std::move(warm_start_data)),
     objective_name_(objective_name),
     var_names_(std::move(var_names)),
     row_names_(std::move(row_names)),
-    termination_stats_(std::move(termination_stats)),
-    termination_status_(std::move(termination_status)),
+    termination_stats_(termination_stats),
+    termination_status_(termination_status),
     error_status_(cuopt::logic_error("", cuopt::error_type_t::Success))
 {
   cuopt_assert(termination_stats_.size() == termination_status_.size(),
@@ -82,16 +111,17 @@ optimization_problem_solution_t<i_t, f_t>::optimization_problem_solution_t(
   const std::string objective_name,
   const std::vector<std::string>& var_names,
   const std::vector<std::string>& row_names,
-  std::vector<additional_termination_information_t>&& termination_stats,
-  std::vector<pdlp_termination_status_t>&& termination_status)
-  : primal_solution_(std::move(final_primal_solution)),
-    dual_solution_(std::move(final_dual_solution)),
-    reduced_cost_(std::move(final_reduced_cost)),
+  additional_termination_information_t& termination_stats,
+  pdlp_termination_status_t termination_status)
+  : primal_solution_(std::make_unique<rmm::device_uvector<f_t>>(std::move(final_primal_solution))),
+    dual_solution_(std::make_unique<rmm::device_uvector<f_t>>(std::move(final_dual_solution))),
+    reduced_cost_(std::make_unique<rmm::device_uvector<f_t>>(std::move(final_reduced_cost))),
+    is_device_memory_(true),
+    termination_status_(termination_status),
+    termination_stats_(std::move(termination_stats)),
     objective_name_(objective_name),
     var_names_(std::move(var_names)),
     row_names_(std::move(row_names)),
-    termination_stats_(std::move(termination_stats)),
-    termination_status_(std::move(termination_status)),
     error_status_(cuopt::logic_error("", cuopt::error_type_t::Success))
 {
   cuopt_assert(termination_stats_.size() == termination_status_.size(),
@@ -110,14 +140,42 @@ optimization_problem_solution_t<i_t, f_t>::optimization_problem_solution_t(
   pdlp_termination_status_t termination_status,
   const raft::handle_t* handler_ptr,
   [[maybe_unused]] bool deep_copy)
-  : primal_solution_(final_primal_solution, handler_ptr->get_stream()),
-    dual_solution_(final_dual_solution, handler_ptr->get_stream()),
-    reduced_cost_(final_reduced_cost, handler_ptr->get_stream()),
+  : primal_solution_(
+      std::make_unique<rmm::device_uvector<f_t>>(final_primal_solution, handler_ptr->get_stream())),
+    dual_solution_(
+      std::make_unique<rmm::device_uvector<f_t>>(final_dual_solution, handler_ptr->get_stream())),
+    reduced_cost_(
+      std::make_unique<rmm::device_uvector<f_t>>(final_reduced_cost, handler_ptr->get_stream())),
+    is_device_memory_(true),
+    termination_status_(termination_status),
+    termination_stats_(termination_stats),
+    objective_name_(objective_name),
+    var_names_(var_names),
+    row_names_(row_names),
+    error_status_(cuopt::logic_error("", cuopt::error_type_t::Success))
+{
+}
+
+// CPU-only constructor for remote solve with solution data
+template <typename i_t, typename f_t>
+optimization_problem_solution_t<i_t, f_t>::optimization_problem_solution_t(
+  std::vector<f_t> primal_solution,
+  std::vector<f_t> dual_solution,
+  std::vector<f_t> reduced_cost,
+  const std::string objective_name,
+  const std::vector<std::string>& var_names,
+  const std::vector<std::string>& row_names,
+  additional_termination_information_t& termination_stats,
+  pdlp_termination_status_t termination_status)
+  : primal_solution_host_(std::make_unique<std::vector<f_t>>(std::move(primal_solution))),
+    dual_solution_host_(std::make_unique<std::vector<f_t>>(std::move(dual_solution))),
+    reduced_cost_host_(std::make_unique<std::vector<f_t>>(std::move(reduced_cost))),
+    is_device_memory_(false),
+    termination_status_(termination_status),
+    termination_stats_(std::move(termination_stats)),
     objective_name_(objective_name),
     var_names_(var_names),
     row_names_(row_names),
-    termination_stats_{termination_stats},
-    termination_status_{termination_status},
     error_status_(cuopt::logic_error("", cuopt::error_type_t::Success))
 {
   cuopt_assert(termination_stats_.size() == termination_status_.size(),
@@ -128,31 +186,56 @@ template <typename i_t, typename f_t>
 void optimization_problem_solution_t<i_t, f_t>::copy_from(
   const raft::handle_t* handle_ptr, const optimization_problem_solution_t<i_t, f_t>& other)
 {
-  // Resize to make sure they are of same size
-  primal_solution_.resize(other.primal_solution_.size(), handle_ptr->get_stream());
-  dual_solution_.resize(other.dual_solution_.size(), handle_ptr->get_stream());
-  reduced_cost_.resize(other.reduced_cost_.size(), handle_ptr->get_stream());
-
-  // Copy the data
-  raft::copy(primal_solution_.data(),
-             other.primal_solution_.data(),
-             primal_solution_.size(),
-             handle_ptr->get_stream());
-  raft::copy(dual_solution_.data(),
-             other.dual_solution_.data(),
-             dual_solution_.size(),
-             handle_ptr->get_stream());
-  raft::copy(reduced_cost_.data(),
-             other.reduced_cost_.data(),
-             reduced_cost_.size(),
-             handle_ptr->get_stream());
+  is_device_memory_ = other.is_device_memory_;
+
+  if (other.is_device_memory_) {
+    // Copy GPU data
+    if (!primal_solution_) {
+      primal_solution_ = std::make_unique<rmm::device_uvector<f_t>>(0, handle_ptr->get_stream());
+    }
+    if (!dual_solution_) {
+      dual_solution_ = std::make_unique<rmm::device_uvector<f_t>>(0, handle_ptr->get_stream());
+    }
+    if (!reduced_cost_) {
+      reduced_cost_ = std::make_unique<rmm::device_uvector<f_t>>(0, handle_ptr->get_stream());
+    }
+
+    // Resize to make sure they are of same size
+    primal_solution_->resize(other.primal_solution_->size(), handle_ptr->get_stream());
+    dual_solution_->resize(other.dual_solution_->size(), handle_ptr->get_stream());
+    reduced_cost_->resize(other.reduced_cost_->size(), handle_ptr->get_stream());
+
+    // Copy the data
+    raft::copy(primal_solution_->data(),
+               other.primal_solution_->data(),
+               primal_solution_->size(),
+               handle_ptr->get_stream());
+    raft::copy(dual_solution_->data(),
+               other.dual_solution_->data(),
+               dual_solution_->size(),
+               handle_ptr->get_stream());
+    raft::copy(reduced_cost_->data(),
+               other.reduced_cost_->data(),
+               reduced_cost_->size(),
+               handle_ptr->get_stream());
+    handle_ptr->sync_stream();
+  } else {
+    // Copy CPU data
+    if (!primal_solution_host_) { primal_solution_host_ = std::make_unique<std::vector<f_t>>(); }
+    if (!dual_solution_host_) { dual_solution_host_ = std::make_unique<std::vector<f_t>>(); }
+    if (!reduced_cost_host_) { reduced_cost_host_ = std::make_unique<std::vector<f_t>>(); }
+
+    *primal_solution_host_ = *other.primal_solution_host_;
+    *dual_solution_host_   = *other.dual_solution_host_;
+    *reduced_cost_host_    = *other.reduced_cost_host_;
+  }
+
   termination_stats_  = other.termination_stats_;
   termination_status_ = other.termination_status_;
   objective_name_     = other.objective_name_;
   var_names_          = other.var_names_;
   row_names_          = other.row_names_;
   // We do not copy the warm start info. As it is not needed for this purpose.
-  handle_ptr->sync_stream();
 }
 
 template <typename i_t, typename f_t>
@@ -227,18 +310,31 @@ void optimization_problem_solution_t<i_t, f_t>::write_to_file(std::string_view f
            << std::endl;
     return;
   }
+
   std::vector<f_t> primal_solution;
   std::vector<f_t> dual_solution;
   std::vector<f_t> reduced_cost;
-  primal_solution.resize(primal_solution_.size());
-  dual_solution.resize(dual_solution_.size());
-  reduced_cost.resize(reduced_cost_.size());
-  raft::copy(
-    primal_solution.data(), primal_solution_.data(), primal_solution_.size(), stream_view.value());
-  raft::copy(
-    dual_solution.data(), dual_solution_.data(), dual_solution_.size(), stream_view.value());
-  raft::copy(reduced_cost.data(), reduced_cost_.data(), reduced_cost_.size(), stream_view.value());
-  RAFT_CUDA_TRY(cudaStreamSynchronize(stream_view.value()));
+
+  if (is_device_memory_) {
+    // Copy from GPU to CPU
+    primal_solution.resize(primal_solution_->size());
+    dual_solution.resize(dual_solution_->size());
+    reduced_cost.resize(reduced_cost_->size());
+    raft::copy(primal_solution.data(),
+               primal_solution_->data(),
+               primal_solution_->size(),
+               stream_view.value());
+    raft::copy(
+      dual_solution.data(), dual_solution_->data(), dual_solution_->size(), stream_view.value());
+    raft::copy(
+      reduced_cost.data(), reduced_cost_->data(), reduced_cost_->size(), stream_view.value());
+    RAFT_CUDA_TRY(cudaStreamSynchronize(stream_view.value()));
+  } else {
+    // Already on CPU
+    primal_solution = *primal_solution_host_;
+    dual_solution   = *dual_solution_host_;
+    reduced_cost    = *reduced_cost_host_;
+  }
 
   myfile << "{ " << std::endl;
   myfile << "\t\"Termination reason\" : \"" << get_termination_status_string() << "\","
@@ -341,35 +437,78 @@ f_t optimization_problem_solution_t<i_t, f_t>::get_dual_objective_value(i_t id)
   return termination_stats_[id].dual_objective;
 }
 
+template <typename i_t, typename f_t>
+bool optimization_problem_solution_t<i_t, f_t>::is_device_memory() const
+{
+  return is_device_memory_;
+}
+
 template <typename i_t, typename f_t>
 rmm::device_uvector<f_t>& optimization_problem_solution_t<i_t, f_t>::get_primal_solution()
 {
-  return primal_solution_;
+  return *primal_solution_;
 }
 
 template <typename i_t, typename f_t>
 const rmm::device_uvector<f_t>& optimization_problem_solution_t<i_t, f_t>::get_primal_solution()
   const
 {
-  return primal_solution_;
+  return *primal_solution_;
 }
 
 template <typename i_t, typename f_t>
 rmm::device_uvector<f_t>& optimization_problem_solution_t<i_t, f_t>::get_dual_solution()
 {
-  return dual_solution_;
+  return *dual_solution_;
 }
 
 template <typename i_t, typename f_t>
 const rmm::device_uvector<f_t>& optimization_problem_solution_t<i_t, f_t>::get_dual_solution() const
 {
-  return dual_solution_;
+  return *dual_solution_;
 }
 
 template <typename i_t, typename f_t>
 rmm::device_uvector<f_t>& optimization_problem_solution_t<i_t, f_t>::get_reduced_cost()
 {
-  return reduced_cost_;
+  return *reduced_cost_;
+}
+
+// Host (CPU) getters
+template <typename i_t, typename f_t>
+std::vector<f_t>& optimization_problem_solution_t<i_t, f_t>::get_primal_solution_host()
+{
+  return *primal_solution_host_;
+}
+
+template <typename i_t, typename f_t>
+const std::vector<f_t>& optimization_problem_solution_t<i_t, f_t>::get_primal_solution_host() const
+{
+  return *primal_solution_host_;
+}
+
+template <typename i_t, typename f_t>
+std::vector<f_t>& optimization_problem_solution_t<i_t, f_t>::get_dual_solution_host()
+{
+  return *dual_solution_host_;
+}
+
+template <typename i_t, typename f_t>
+const std::vector<f_t>& optimization_problem_solution_t<i_t, f_t>::get_dual_solution_host() const
+{
+  return *dual_solution_host_;
+}
+
+template <typename i_t, typename f_t>
+std::vector<f_t>& optimization_problem_solution_t<i_t, f_t>::get_reduced_cost_host()
+{
+  return *reduced_cost_host_;
+}
+
+template <typename i_t, typename f_t>
+const std::vector<f_t>& optimization_problem_solution_t<i_t, f_t>::get_reduced_cost_host() const
+{
+  return *reduced_cost_host_;
 }
 
 template <typename i_t, typename f_t>
@@ -424,6 +563,136 @@ optimization_problem_solution_t<i_t, f_t>::get_pdlp_warm_start_data()
   return pdlp_warm_start_data_;
 }
 
+//============================================================================
+// Setters for host solution data
+//============================================================================
+
+template <typename i_t, typename f_t>
+void optimization_problem_solution_t<i_t, f_t>::set_primal_solution_host(std::vector<f_t> solution)
+{
+  primal_solution_host_ = std::make_unique<std::vector<f_t>>(std::move(solution));
+  is_device_memory_     = false;
+}
+
+template <typename i_t, typename f_t>
+void optimization_problem_solution_t<i_t, f_t>::set_dual_solution_host(std::vector<f_t> solution)
+{
+  dual_solution_host_ = std::make_unique<std::vector<f_t>>(std::move(solution));
+  is_device_memory_   = false;
+}
+
+template <typename i_t, typename f_t>
+void optimization_problem_solution_t<i_t, f_t>::set_reduced_cost_host(std::vector<f_t> reduced_cost)
+{
+  reduced_cost_host_ = std::make_unique<std::vector<f_t>>(std::move(reduced_cost));
+  is_device_memory_  = false;
+}
+
+template <typename i_t, typename f_t>
+void optimization_problem_solution_t<i_t, f_t>::set_termination_stats(
+  const additional_termination_information_t& stats)
+{
+  termination_stats_ = stats;
+}
+
+//============================================================================
+// Getters for termination statistics
+//============================================================================
+
+template <typename i_t, typename f_t>
+f_t optimization_problem_solution_t<i_t, f_t>::get_l2_primal_residual() const
+{
+  return termination_stats_.l2_primal_residual;
+}
+
+template <typename i_t, typename f_t>
+f_t optimization_problem_solution_t<i_t, f_t>::get_l2_dual_residual() const
+{
+  return termination_stats_.l2_dual_residual;
+}
+
+template <typename i_t, typename f_t>
+f_t optimization_problem_solution_t<i_t, f_t>::get_primal_objective() const
+{
+  return termination_stats_.primal_objective;
+}
+
+template <typename i_t, typename f_t>
+f_t optimization_problem_solution_t<i_t, f_t>::get_dual_objective() const
+{
+  return termination_stats_.dual_objective;
+}
+
+template <typename i_t, typename f_t>
+f_t optimization_problem_solution_t<i_t, f_t>::get_gap() const
+{
+  return termination_stats_.gap;
+}
+
+template <typename i_t, typename f_t>
+i_t optimization_problem_solution_t<i_t, f_t>::get_nb_iterations() const
+{
+  return termination_stats_.number_of_steps_taken;
+}
+
+template <typename i_t, typename f_t>
+bool optimization_problem_solution_t<i_t, f_t>::get_solved_by_pdlp() const
+{
+  return solved_by_pdlp_;
+}
+
+//============================================================================
+// Setters for termination statistics
+//============================================================================
+
+template <typename i_t, typename f_t>
+void optimization_problem_solution_t<i_t, f_t>::set_l2_primal_residual(f_t value)
+{
+  termination_stats_.l2_primal_residual = value;
+}
+
+template <typename i_t, typename f_t>
+void optimization_problem_solution_t<i_t, f_t>::set_l2_dual_residual(f_t value)
+{
+  termination_stats_.l2_dual_residual = value;
+}
+
+template <typename i_t, typename f_t>
+void optimization_problem_solution_t<i_t, f_t>::set_primal_objective(f_t value)
+{
+  termination_stats_.primal_objective = value;
+}
+
+template <typename i_t, typename f_t>
+void optimization_problem_solution_t<i_t, f_t>::set_dual_objective(f_t value)
+{
+  termination_stats_.dual_objective = value;
+}
+
+template <typename i_t, typename f_t>
+void optimization_problem_solution_t<i_t, f_t>::set_gap(f_t value)
+{
+  termination_stats_.gap = value;
+}
+
+template <typename i_t, typename f_t>
+void optimization_problem_solution_t<i_t, f_t>::set_nb_iterations(i_t value)
+{
+  termination_stats_.number_of_steps_taken = value;
+}
+
+template <typename i_t, typename f_t>
+void optimization_problem_solution_t<i_t, f_t>::set_solved_by_pdlp(bool value)
+{
+  solved_by_pdlp_ = value;
+}
+
+template <typename i_t, typename f_t>
+std::string optimization_problem_solution_t<i_t, f_t>::get_error_string() const
+{
+  return error_status_.what();
+}
+
 template <typename i_t, typename f_t>
 void optimization_problem_solution_t<i_t, f_t>::write_to_sol_file(
   std::string_view filename, rmm::cuda_stream_view stream_view) const
@@ -440,14 +709,73 @@ void optimization_problem_solution_t<i_t, f_t>::write_to_sol_file(
 
   auto objective_value = get_objective_value(0);
   std::vector<f_t> solution;
-  solution.resize(primal_solution_.size());
-  raft::copy(
-    solution.data(), primal_solution_.data(), primal_solution_.size(), stream_view.value());
-  RAFT_CUDA_TRY(cudaStreamSynchronize(stream_view.value()));
+
+  if (is_device_memory_) {
+    // Copy from GPU to CPU
+    solution.resize(primal_solution_->size());
+    raft::copy(
+      solution.data(), primal_solution_->data(), primal_solution_->size(), stream_view.value());
+    RAFT_CUDA_TRY(cudaStreamSynchronize(stream_view.value()));
+  } else {
+    // Already on CPU
+    solution = *primal_solution_host_;
+  }
+
   solution_writer_t::write_solution_to_sol_file(
     std::string(filename), status, objective_value, var_names_, solution);
 }
 
+template <typename i_t, typename f_t>
+void optimization_problem_solution_t<i_t, f_t>::to_host(rmm::cuda_stream_view stream_view)
+{
+  if (!is_device_memory_) {
+    // Already on CPU, nothing to do
+    return;
+  }
+
+  // Initialize host storage if needed
+  if (!primal_solution_host_) { primal_solution_host_ = std::make_unique<std::vector<f_t>>(); }
+  if (!dual_solution_host_) { dual_solution_host_ = std::make_unique<std::vector<f_t>>(); }
+  if (!reduced_cost_host_) { reduced_cost_host_ = std::make_unique<std::vector<f_t>>(); }
+
+  // Copy primal solution
+  if (primal_solution_ && primal_solution_->size() > 0) {
+    primal_solution_host_->resize(primal_solution_->size());
+    raft::copy(primal_solution_host_->data(),
+               primal_solution_->data(),
+               primal_solution_->size(),
+               stream_view.value());
+  }
+
+  // Copy dual solution
+  if (dual_solution_ && dual_solution_->size() > 0) {
+    dual_solution_host_->resize(dual_solution_->size());
+    raft::copy(dual_solution_host_->data(),
+               dual_solution_->data(),
+               dual_solution_->size(),
+               stream_view.value());
+  }
+
+  // Copy reduced cost
+  if (reduced_cost_ && reduced_cost_->size() > 0) {
+    reduced_cost_host_->resize(reduced_cost_->size());
+    raft::copy(reduced_cost_host_->data(),
+               reduced_cost_->data(),
+               reduced_cost_->size(),
+               stream_view.value());
+  }
+
+  // Synchronize to ensure copies are complete
+  RAFT_CUDA_TRY(cudaStreamSynchronize(stream_view.value()));
+
+  // Clear GPU storage to free memory
+  primal_solution_.reset();
+  dual_solution_.reset();
+  reduced_cost_.reset();
+
+  is_device_memory_ = false;
+}
+
 #if MIP_INSTANTIATE_FLOAT
 template class optimization_problem_solution_t<int, float>;
 #endif
diff --git a/cpp/src/mip/diversity/population.cu b/cpp/src/mip/diversity/population.cu
index 766ed09cb..21654fce5 100644
--- a/cpp/src/mip/diversity/population.cu
+++ b/cpp/src/mip/diversity/population.cu
@@ -1,6 +1,6 @@
 /* clang-format off */
 /*
- * SPDX-FileCopyrightText: Copyright (c) 2024-2025, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+ * SPDX-FileCopyrightText: Copyright (c) 2024-2026, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
  * SPDX-License-Identifier: Apache-2.0
  */
 /* clang-format on */
@@ -265,6 +265,11 @@ void population_t<i_t, f_t>::run_solution_callbacks(solution_t<i_t, f_t>& sol)
   bool better_solution_found = is_better_than_best_feasible(sol);
   auto user_callbacks        = context.settings.get_mip_callbacks();
   if (better_solution_found) {
+    if (!user_callbacks.empty()) {
+      CUOPT_LOG_INFO("Population: incumbent callbacks=%zu objective=%g",
+                     user_callbacks.size(),
+                     sol.get_user_objective());
+    }
     if (context.settings.benchmark_info_ptr != nullptr) {
       context.settings.benchmark_info_ptr->last_improvement_of_best_feasible = timer.elapsed_time();
     }
@@ -275,6 +280,7 @@ void population_t<i_t, f_t>::run_solution_callbacks(solution_t<i_t, f_t>& sol)
 
     for (auto callback : user_callbacks) {
       if (callback->get_type() == internals::base_solution_callback_type::GET_SOLUTION) {
+        callback->set_memory_location(internals::callback_memory_location::DEVICE);
         auto get_sol_callback = static_cast<internals::get_solution_callback_t*>(callback);
         solution_t<i_t, f_t> temp_sol(sol);
         problem_ptr->post_process_assignment(temp_sol.assignment);
@@ -298,7 +304,7 @@ void population_t<i_t, f_t>::run_solution_callbacks(solution_t<i_t, f_t>& sol)
         f_t user_objective =
           temp_sol.problem_ptr->get_user_obj_from_solver_obj(temp_sol.get_objective());
         user_objective_vec.set_element_async(0, user_objective, temp_sol.handle_ptr->get_stream());
-        CUOPT_LOG_DEBUG("Returning incumbent solution with objective %g", user_objective);
+        CUOPT_LOG_INFO("Returning incumbent solution with objective %g", user_objective);
         get_sol_callback->get_solution(temp_sol.assignment.data(), user_objective_vec.data());
       }
     }
@@ -311,6 +317,7 @@ void population_t<i_t, f_t>::run_solution_callbacks(solution_t<i_t, f_t>& sol)
 
   for (auto callback : user_callbacks) {
     if (callback->get_type() == internals::base_solution_callback_type::SET_SOLUTION) {
+      callback->set_memory_location(internals::callback_memory_location::DEVICE);
       auto set_sol_callback = static_cast<internals::set_solution_callback_t*>(callback);
       rmm::device_uvector<f_t> incumbent_assignment(
         problem_ptr->original_problem_ptr->get_n_variables(), sol.handle_ptr->get_stream());
diff --git a/cpp/src/mip/solve.cu b/cpp/src/mip/solve.cu
index 3b665accb..c57c6ce2c 100644
--- a/cpp/src/mip/solve.cu
+++ b/cpp/src/mip/solve.cu
@@ -31,6 +31,8 @@
 
 #include <mps_parser/mps_data_model.hpp>
 
+#include <cuopt/linear_programming/utilities/remote_solve.hpp>
+
 #include <raft/sparse/detail/cusparse_macros.h>
 #include <raft/sparse/detail/cusparse_wrappers.h>
 #include <raft/common/nvtx.hpp>
@@ -285,13 +287,276 @@ mip_solution_t<i_t, f_t> solve_mip(optimization_problem_t<i_t, f_t>& op_problem,
   }
 }
 
+// Helper to create a data_model_view_t from mps_data_model_t (for remote solve path)
+template <typename i_t, typename f_t>
+static data_model_view_t<i_t, f_t> create_view_from_mps_data_model(
+  const cuopt::mps_parser::mps_data_model_t<i_t, f_t>& mps_data_model)
+{
+  data_model_view_t<i_t, f_t> view;
+
+  view.set_maximize(mps_data_model.get_sense());
+
+  if (!mps_data_model.get_constraint_matrix_values().empty()) {
+    view.set_csr_constraint_matrix(mps_data_model.get_constraint_matrix_values().data(),
+                                   mps_data_model.get_constraint_matrix_values().size(),
+                                   mps_data_model.get_constraint_matrix_indices().data(),
+                                   mps_data_model.get_constraint_matrix_indices().size(),
+                                   mps_data_model.get_constraint_matrix_offsets().data(),
+                                   mps_data_model.get_constraint_matrix_offsets().size());
+  }
+
+  if (!mps_data_model.get_constraint_bounds().empty()) {
+    view.set_constraint_bounds(mps_data_model.get_constraint_bounds().data(),
+                               mps_data_model.get_constraint_bounds().size());
+  }
+
+  if (!mps_data_model.get_objective_coefficients().empty()) {
+    view.set_objective_coefficients(mps_data_model.get_objective_coefficients().data(),
+                                    mps_data_model.get_objective_coefficients().size());
+  }
+
+  view.set_objective_scaling_factor(mps_data_model.get_objective_scaling_factor());
+  view.set_objective_offset(mps_data_model.get_objective_offset());
+
+  if (!mps_data_model.get_variable_lower_bounds().empty()) {
+    view.set_variable_lower_bounds(mps_data_model.get_variable_lower_bounds().data(),
+                                   mps_data_model.get_variable_lower_bounds().size());
+  }
+
+  if (!mps_data_model.get_variable_upper_bounds().empty()) {
+    view.set_variable_upper_bounds(mps_data_model.get_variable_upper_bounds().data(),
+                                   mps_data_model.get_variable_upper_bounds().size());
+  }
+
+  if (!mps_data_model.get_variable_types().empty()) {
+    view.set_variable_types(mps_data_model.get_variable_types().data(),
+                            mps_data_model.get_variable_types().size());
+  }
+
+  if (!mps_data_model.get_row_types().empty()) {
+    view.set_row_types(mps_data_model.get_row_types().data(),
+                       mps_data_model.get_row_types().size());
+  }
+
+  if (!mps_data_model.get_constraint_lower_bounds().empty()) {
+    view.set_constraint_lower_bounds(mps_data_model.get_constraint_lower_bounds().data(),
+                                     mps_data_model.get_constraint_lower_bounds().size());
+  }
+
+  if (!mps_data_model.get_constraint_upper_bounds().empty()) {
+    view.set_constraint_upper_bounds(mps_data_model.get_constraint_upper_bounds().data(),
+                                     mps_data_model.get_constraint_upper_bounds().size());
+  }
+
+  view.set_objective_name(mps_data_model.get_objective_name());
+  view.set_problem_name(mps_data_model.get_problem_name());
+
+  if (!mps_data_model.get_variable_names().empty()) {
+    view.set_variable_names(mps_data_model.get_variable_names());
+  }
+
+  if (!mps_data_model.get_row_names().empty()) {
+    view.set_row_names(mps_data_model.get_row_names());
+  }
+
+  if (!mps_data_model.get_initial_primal_solution().empty()) {
+    view.set_initial_primal_solution(mps_data_model.get_initial_primal_solution().data(),
+                                     mps_data_model.get_initial_primal_solution().size());
+  }
+
+  if (!mps_data_model.get_initial_dual_solution().empty()) {
+    view.set_initial_dual_solution(mps_data_model.get_initial_dual_solution().data(),
+                                   mps_data_model.get_initial_dual_solution().size());
+  }
+
+  return view;
+}
+
+// Helper struct to hold CPU copies of GPU data for remote solve
+template <typename i_t, typename f_t>
+struct cpu_problem_data_t {
+  std::vector<f_t> A_values;
+  std::vector<i_t> A_indices;
+  std::vector<i_t> A_offsets;
+  std::vector<f_t> constraint_bounds;
+  std::vector<f_t> constraint_lower_bounds;
+  std::vector<f_t> constraint_upper_bounds;
+  std::vector<f_t> objective_coefficients;
+  std::vector<f_t> variable_lower_bounds;
+  std::vector<f_t> variable_upper_bounds;
+  std::vector<char> variable_types;
+  std::vector<f_t> quadratic_objective_values;
+  std::vector<i_t> quadratic_objective_indices;
+  std::vector<i_t> quadratic_objective_offsets;
+  bool maximize;
+  f_t objective_scaling_factor;
+  f_t objective_offset;
+
+  data_model_view_t<i_t, f_t> create_view() const
+  {
+    data_model_view_t<i_t, f_t> v;
+    v.set_maximize(maximize);
+    v.set_objective_scaling_factor(objective_scaling_factor);
+    v.set_objective_offset(objective_offset);
+
+    if (!A_values.empty()) {
+      v.set_csr_constraint_matrix(A_values.data(),
+                                  A_values.size(),
+                                  A_indices.data(),
+                                  A_indices.size(),
+                                  A_offsets.data(),
+                                  A_offsets.size());
+    }
+    if (!constraint_bounds.empty()) {
+      v.set_constraint_bounds(constraint_bounds.data(), constraint_bounds.size());
+    }
+    if (!constraint_lower_bounds.empty() && !constraint_upper_bounds.empty()) {
+      v.set_constraint_lower_bounds(constraint_lower_bounds.data(), constraint_lower_bounds.size());
+      v.set_constraint_upper_bounds(constraint_upper_bounds.data(), constraint_upper_bounds.size());
+    }
+    if (!objective_coefficients.empty()) {
+      v.set_objective_coefficients(objective_coefficients.data(), objective_coefficients.size());
+    }
+    if (!variable_lower_bounds.empty()) {
+      v.set_variable_lower_bounds(variable_lower_bounds.data(), variable_lower_bounds.size());
+    }
+    if (!variable_upper_bounds.empty()) {
+      v.set_variable_upper_bounds(variable_upper_bounds.data(), variable_upper_bounds.size());
+    }
+    if (!variable_types.empty()) {
+      v.set_variable_types(variable_types.data(), variable_types.size());
+    }
+    if (!quadratic_objective_values.empty()) {
+      v.set_quadratic_objective_matrix(quadratic_objective_values.data(),
+                                       quadratic_objective_values.size(),
+                                       quadratic_objective_indices.data(),
+                                       quadratic_objective_indices.size(),
+                                       quadratic_objective_offsets.data(),
+                                       quadratic_objective_offsets.size());
+    }
+    v.set_is_device_memory(false);
+    return v;
+  }
+};
+
+// Helper to copy GPU view data to CPU
+template <typename i_t, typename f_t>
+cpu_problem_data_t<i_t, f_t> copy_view_to_cpu(raft::handle_t const* handle_ptr,
+                                              const data_model_view_t<i_t, f_t>& gpu_view)
+{
+  cpu_problem_data_t<i_t, f_t> cpu_data;
+  auto stream = handle_ptr->get_stream();
+
+  cpu_data.maximize                 = gpu_view.get_sense();
+  cpu_data.objective_scaling_factor = gpu_view.get_objective_scaling_factor();
+  cpu_data.objective_offset         = gpu_view.get_objective_offset();
+
+  auto copy_to_host = [stream](auto& dst_vec, auto src_span) {
+    if (src_span.size() > 0) {
+      dst_vec.resize(src_span.size());
+      raft::copy(dst_vec.data(), src_span.data(), src_span.size(), stream);
+    }
+  };
+
+  copy_to_host(cpu_data.A_values, gpu_view.get_constraint_matrix_values());
+  copy_to_host(cpu_data.A_indices, gpu_view.get_constraint_matrix_indices());
+  copy_to_host(cpu_data.A_offsets, gpu_view.get_constraint_matrix_offsets());
+  copy_to_host(cpu_data.constraint_bounds, gpu_view.get_constraint_bounds());
+  copy_to_host(cpu_data.constraint_lower_bounds, gpu_view.get_constraint_lower_bounds());
+  copy_to_host(cpu_data.constraint_upper_bounds, gpu_view.get_constraint_upper_bounds());
+  copy_to_host(cpu_data.objective_coefficients, gpu_view.get_objective_coefficients());
+  copy_to_host(cpu_data.variable_lower_bounds, gpu_view.get_variable_lower_bounds());
+  copy_to_host(cpu_data.variable_upper_bounds, gpu_view.get_variable_upper_bounds());
+  copy_to_host(cpu_data.quadratic_objective_values, gpu_view.get_quadratic_objective_values());
+  copy_to_host(cpu_data.quadratic_objective_indices, gpu_view.get_quadratic_objective_indices());
+  copy_to_host(cpu_data.quadratic_objective_offsets, gpu_view.get_quadratic_objective_offsets());
+
+  // Variable types need special handling (char array)
+  auto var_types_span = gpu_view.get_variable_types();
+  if (var_types_span.size() > 0) {
+    cpu_data.variable_types.resize(var_types_span.size());
+    cudaMemcpyAsync(cpu_data.variable_types.data(),
+                    var_types_span.data(),
+                    var_types_span.size() * sizeof(char),
+                    cudaMemcpyDeviceToHost,
+                    stream);
+  }
+
+  // Synchronize to ensure all copies are complete
+  cudaStreamSynchronize(stream);
+
+  return cpu_data;
+}
+
 template <typename i_t, typename f_t>
 mip_solution_t<i_t, f_t> solve_mip(
   raft::handle_t const* handle_ptr,
   const cuopt::mps_parser::mps_data_model_t<i_t, f_t>& mps_data_model,
   mip_solver_settings_t<i_t, f_t> const& settings)
 {
-  auto op_problem = mps_data_model_to_optimization_problem(handle_ptr, mps_data_model);
+  // Create a view pointing to CPU data and delegate to the view-based overload.
+  // The view overload handles local vs remote solve automatically.
+  auto view = create_view_from_mps_data_model(mps_data_model);
+  view.set_is_device_memory(false);  // MPS data is always in CPU memory
+  return solve_mip(handle_ptr, view, settings);
+}
+
+template <typename i_t, typename f_t>
+mip_solution_t<i_t, f_t> solve_mip(raft::handle_t const* handle_ptr,
+                                   const data_model_view_t<i_t, f_t>& view,
+                                   mip_solver_settings_t<i_t, f_t> const& settings)
+{
+  // Initialize logger for this overload (needed for early returns)
+  init_logger_t log(settings.log_file, settings.log_to_console);
+
+  // Check for remote solve configuration first
+  auto remote_config = get_remote_solve_config();
+
+  if (view.is_device_memory()) {
+    if (remote_config.has_value()) {
+      // GPU data + remote solve requested: need valid handle to copy GPU→CPU
+      if (handle_ptr == nullptr) {
+        CUOPT_LOG_ERROR(
+          "[solve_mip] Remote solve requested with GPU data but no CUDA handle. "
+          "This is an internal error - GPU data should not exist without CUDA initialization.");
+        return mip_solution_t<i_t, f_t>(
+          cuopt::logic_error("No CUDA handle for GPU data", cuopt::error_type_t::RuntimeError));
+      }
+      CUOPT_LOG_WARN(
+        "[solve_mip] Remote solve requested but data is on GPU. "
+        "Copying to CPU for serialization (performance impact).");
+      auto cpu_data = copy_view_to_cpu(handle_ptr, view);
+      auto cpu_view = cpu_data.create_view();
+
+      CUOPT_LOG_INFO(
+        "[solve_mip] Remote solve detected: CUOPT_REMOTE_HOST=%s, CUOPT_REMOTE_PORT=%d",
+        remote_config->host.c_str(),
+        remote_config->port);
+      // Remote solve with GPU data - serialize cpu_view and send to remote server
+      return solve_mip_remote(*remote_config, cpu_view, settings);
+    }
+
+    // Local solve: data already on GPU - convert view to optimization_problem_t and solve
+    auto op_problem = data_model_view_to_optimization_problem(handle_ptr, view);
+    return solve_mip(op_problem, settings);
+  }
+
+  // Data is on CPU
+  if (remote_config.has_value()) {
+    CUOPT_LOG_INFO("[solve_mip] Remote solve detected: CUOPT_REMOTE_HOST=%s, CUOPT_REMOTE_PORT=%d",
+                   remote_config->host.c_str(),
+                   remote_config->port);
+    // Remote solve with CPU data - serialize view and send to remote server
+    return solve_mip_remote(*remote_config, view, settings);
+  }
+
+  // Local solve with CPU data: copy to GPU and solve
+  if (handle_ptr == nullptr) {
+    CUOPT_LOG_ERROR("[solve_mip] Local solve requested but handle_ptr is null.");
+    return mip_solution_t<i_t, f_t>(
+      cuopt::logic_error("No CUDA handle for CPU->GPU copy", cuopt::error_type_t::RuntimeError));
+  }
+  auto op_problem = data_model_view_to_optimization_problem(handle_ptr, view);
   return solve_mip(op_problem, settings);
 }
 
@@ -303,6 +568,11 @@ mip_solution_t<i_t, f_t> solve_mip(
   template mip_solution_t<int, F_TYPE> solve_mip(                           \
     raft::handle_t const* handle_ptr,                                       \
     const cuopt::mps_parser::mps_data_model_t<int, F_TYPE>& mps_data_model, \
+    mip_solver_settings_t<int, F_TYPE> const& settings);                    \
+                                                                            \
+  template mip_solution_t<int, F_TYPE> solve_mip(                           \
+    raft::handle_t const* handle_ptr,                                       \
+    const data_model_view_t<int, F_TYPE>& view,                             \
     mip_solver_settings_t<int, F_TYPE> const& settings);
 
 #if MIP_INSTANTIATE_FLOAT
diff --git a/cpp/src/mip/solver_solution.cu b/cpp/src/mip/solver_solution.cu
index 2ce6d5700..fd8707732 100644
--- a/cpp/src/mip/solver_solution.cu
+++ b/cpp/src/mip/solver_solution.cu
@@ -1,6 +1,6 @@
 /* clang-format off */
 /*
- * SPDX-FileCopyrightText: Copyright (c) 2022-2025, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+ * SPDX-FileCopyrightText: Copyright (c) 2022-2026, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
  * SPDX-License-Identifier: Apache-2.0
  */
 /* clang-format on */
@@ -28,7 +28,8 @@ mip_solution_t<i_t, f_t>::mip_solution_t(rmm::device_uvector<f_t> solution,
                                          f_t max_variable_bound_violation,
                                          solver_stats_t<i_t, f_t> stats,
                                          std::vector<rmm::device_uvector<f_t>> solution_pool)
-  : solution_(std::move(solution)),
+  : solution_(std::make_unique<rmm::device_uvector<f_t>>(std::move(solution))),
+    is_device_memory_(true),
     var_names_(std::move(var_names)),
     objective_(objective),
     mip_gap_(mip_gap),
@@ -46,7 +47,8 @@ template <typename i_t, typename f_t>
 mip_solution_t<i_t, f_t>::mip_solution_t(mip_termination_status_t termination_status,
                                          solver_stats_t<i_t, f_t> stats,
                                          rmm::cuda_stream_view stream_view)
-  : solution_(0, stream_view),
+  : solution_(std::make_unique<rmm::device_uvector<f_t>>(0, stream_view)),
+    is_device_memory_(true),
     objective_(0),
     mip_gap_(0),
     termination_status_(termination_status),
@@ -61,7 +63,65 @@ mip_solution_t<i_t, f_t>::mip_solution_t(mip_termination_status_t termination_st
 template <typename i_t, typename f_t>
 mip_solution_t<i_t, f_t>::mip_solution_t(const cuopt::logic_error& error_status,
                                          rmm::cuda_stream_view stream_view)
-  : solution_(0, stream_view),
+  : solution_(std::make_unique<rmm::device_uvector<f_t>>(0, stream_view)),
+    is_device_memory_(true),
+    objective_(0),
+    mip_gap_(0),
+    termination_status_(mip_termination_status_t::NoTermination),
+    max_constraint_violation_(0),
+    max_int_violation_(0),
+    max_variable_bound_violation_(0),
+    error_status_(error_status)
+{
+}
+
+// CPU-only constructor for remote solve with solution data
+template <typename i_t, typename f_t>
+mip_solution_t<i_t, f_t>::mip_solution_t(std::vector<f_t> solution,
+                                         std::vector<std::string> var_names,
+                                         f_t objective,
+                                         f_t mip_gap,
+                                         mip_termination_status_t termination_status,
+                                         f_t max_constraint_violation,
+                                         f_t max_int_violation,
+                                         f_t max_variable_bound_violation,
+                                         solver_stats_t<i_t, f_t> stats)
+  : solution_host_(std::make_unique<std::vector<f_t>>(std::move(solution))),
+    is_device_memory_(false),
+    var_names_(std::move(var_names)),
+    objective_(objective),
+    mip_gap_(mip_gap),
+    termination_status_(termination_status),
+    max_constraint_violation_(max_constraint_violation),
+    max_int_violation_(max_int_violation),
+    max_variable_bound_violation_(max_variable_bound_violation),
+    stats_(stats),
+    error_status_(cuopt::logic_error("", cuopt::error_type_t::Success))
+{
+}
+
+// CPU-only constructor for remote solve error cases
+template <typename i_t, typename f_t>
+mip_solution_t<i_t, f_t>::mip_solution_t(mip_termination_status_t termination_status,
+                                         solver_stats_t<i_t, f_t> stats)
+  : solution_host_(std::make_unique<std::vector<f_t>>()),
+    is_device_memory_(false),
+    objective_(0),
+    mip_gap_(0),
+    termination_status_(termination_status),
+    max_constraint_violation_(0),
+    max_int_violation_(0),
+    max_variable_bound_violation_(0),
+    stats_(stats),
+    error_status_(cuopt::logic_error("", cuopt::error_type_t::Success))
+{
+}
+
+// CPU-only constructor for remote solve error cases
+template <typename i_t, typename f_t>
+mip_solution_t<i_t, f_t>::mip_solution_t(const cuopt::logic_error& error_status)
+  : solution_host_(std::make_unique<std::vector<f_t>>()),
+    is_device_memory_(false),
     objective_(0),
     mip_gap_(0),
     termination_status_(mip_termination_status_t::NoTermination),
@@ -78,16 +138,34 @@ const cuopt::logic_error& mip_solution_t<i_t, f_t>::get_error_status() const
   return error_status_;
 }
 
+template <typename i_t, typename f_t>
+bool mip_solution_t<i_t, f_t>::is_device_memory() const
+{
+  return is_device_memory_;
+}
+
 template <typename i_t, typename f_t>
 const rmm::device_uvector<f_t>& mip_solution_t<i_t, f_t>::get_solution() const
 {
-  return solution_;
+  return *solution_;
 }
 
 template <typename i_t, typename f_t>
 rmm::device_uvector<f_t>& mip_solution_t<i_t, f_t>::get_solution()
 {
-  return solution_;
+  return *solution_;
+}
+
+template <typename i_t, typename f_t>
+std::vector<f_t>& mip_solution_t<i_t, f_t>::get_solution_host()
+{
+  return *solution_host_;
+}
+
+template <typename i_t, typename f_t>
+const std::vector<f_t>& mip_solution_t<i_t, f_t>::get_solution_host() const
+{
+  return *solution_host_;
 }
 
 template <typename i_t, typename f_t>
@@ -211,9 +289,16 @@ void mip_solution_t<i_t, f_t>::write_to_sol_file(std::string_view filename,
   double objective_value = get_objective_value();
   auto& var_names        = get_variable_names();
   std::vector<f_t> solution;
-  solution.resize(solution_.size());
-  raft::copy(solution.data(), solution_.data(), solution_.size(), stream_view.value());
-  RAFT_CUDA_TRY(cudaStreamSynchronize(stream_view.value()));
+
+  if (is_device_memory_) {
+    // Copy from GPU to CPU
+    solution.resize(solution_->size());
+    raft::copy(solution.data(), solution_->data(), solution_->size(), stream_view.value());
+    RAFT_CUDA_TRY(cudaStreamSynchronize(stream_view.value()));
+  } else {
+    // Already on CPU
+    solution = *solution_host_;
+  }
 
   solution_writer_t::write_solution_to_sol_file(
     std::string(filename), status, objective_value, var_names, solution);
@@ -233,6 +318,121 @@ void mip_solution_t<i_t, f_t>::log_summary() const
   CUOPT_LOG_INFO("Total Solve Time: %f", get_total_solve_time());
 }
 
+//============================================================================
+// Setters for remote solve deserialization
+//============================================================================
+
+template <typename i_t, typename f_t>
+void mip_solution_t<i_t, f_t>::set_solution_host(std::vector<f_t> solution)
+{
+  solution_host_    = std::make_unique<std::vector<f_t>>(std::move(solution));
+  is_device_memory_ = false;
+}
+
+template <typename i_t, typename f_t>
+void mip_solution_t<i_t, f_t>::set_objective(f_t value)
+{
+  objective_ = value;
+}
+
+template <typename i_t, typename f_t>
+void mip_solution_t<i_t, f_t>::set_mip_gap(f_t value)
+{
+  mip_gap_ = value;
+}
+
+template <typename i_t, typename f_t>
+void mip_solution_t<i_t, f_t>::set_solution_bound(f_t value)
+{
+  stats_.solution_bound = value;
+}
+
+template <typename i_t, typename f_t>
+void mip_solution_t<i_t, f_t>::set_total_solve_time(double value)
+{
+  stats_.total_solve_time = value;
+}
+
+template <typename i_t, typename f_t>
+void mip_solution_t<i_t, f_t>::set_presolve_time(double value)
+{
+  stats_.presolve_time = value;
+}
+
+template <typename i_t, typename f_t>
+void mip_solution_t<i_t, f_t>::set_max_constraint_violation(f_t value)
+{
+  max_constraint_violation_ = value;
+}
+
+template <typename i_t, typename f_t>
+void mip_solution_t<i_t, f_t>::set_max_int_violation(f_t value)
+{
+  max_int_violation_ = value;
+}
+
+template <typename i_t, typename f_t>
+void mip_solution_t<i_t, f_t>::set_max_variable_bound_violation(f_t value)
+{
+  max_variable_bound_violation_ = value;
+}
+
+template <typename i_t, typename f_t>
+void mip_solution_t<i_t, f_t>::set_nodes(i_t value)
+{
+  stats_.num_nodes = value;
+}
+
+template <typename i_t, typename f_t>
+void mip_solution_t<i_t, f_t>::set_simplex_iterations(i_t value)
+{
+  stats_.num_simplex_iterations = value;
+}
+
+template <typename i_t, typename f_t>
+std::string mip_solution_t<i_t, f_t>::get_error_string() const
+{
+  return error_status_.what();
+}
+
+template <typename i_t, typename f_t>
+i_t mip_solution_t<i_t, f_t>::get_nodes() const
+{
+  return stats_.num_nodes;
+}
+
+template <typename i_t, typename f_t>
+i_t mip_solution_t<i_t, f_t>::get_simplex_iterations() const
+{
+  return stats_.num_simplex_iterations;
+}
+
+template <typename i_t, typename f_t>
+void mip_solution_t<i_t, f_t>::to_host(rmm::cuda_stream_view stream_view)
+{
+  if (!is_device_memory_) {
+    // Already on CPU, nothing to do
+    return;
+  }
+
+  // Initialize host storage if needed
+  if (!solution_host_) { solution_host_ = std::make_unique<std::vector<f_t>>(); }
+
+  // Copy solution
+  if (solution_ && solution_->size() > 0) {
+    solution_host_->resize(solution_->size());
+    raft::copy(solution_host_->data(), solution_->data(), solution_->size(), stream_view.value());
+
+    // Synchronize to ensure copy is complete
+    RAFT_CUDA_TRY(cudaStreamSynchronize(stream_view.value()));
+  }
+
+  // Clear GPU storage to free memory
+  solution_.reset();
+
+  is_device_memory_ = false;
+}
+
 #if MIP_INSTANTIATE_FLOAT
 template class mip_solution_t<int, float>;
 #endif

From 710e2fa7b658f7c6d3ae6a82da1d577607aebe67 Mon Sep 17 00:00:00 2001
From: Trevor McKay <tmgithub1@gmail.com>
Date: Tue, 27 Jan 2026 21:19:21 -0500
Subject: [PATCH 02/22] LP/MIP host memory for remote solves and stubs

---
 cpp/cuopt_cli.cpp                             | 182 +++++++++--
 .../utilities/remote_solve.hpp                |  64 +++-
 .../utilities/cython_solve.cu                 | 288 +++++++++++++-----
 3 files changed, 426 insertions(+), 108 deletions(-)

diff --git a/cpp/cuopt_cli.cpp b/cpp/cuopt_cli.cpp
index 5023cefc6..5ceccbc77 100644
--- a/cpp/cuopt_cli.cpp
+++ b/cpp/cuopt_cli.cpp
@@ -1,13 +1,15 @@
 /* clang-format off */
 /*
- * SPDX-FileCopyrightText: Copyright (c) 2025, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+ * SPDX-FileCopyrightText: Copyright (c) 2025-2026, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
  * SPDX-License-Identifier: Apache-2.0
  */
 /* clang-format on */
 
+#include <cuopt/linear_programming/data_model_view.hpp>
 #include <cuopt/linear_programming/mip/solver_settings.hpp>
 #include <cuopt/linear_programming/optimization_problem.hpp>
 #include <cuopt/linear_programming/solve.hpp>
+#include <cuopt/linear_programming/utilities/remote_solve.hpp>
 #include <mps_parser/parser.hpp>
 #include <utilities/logger.hpp>
 
@@ -17,6 +19,7 @@
 #include <rmm/mr/cuda_async_memory_resource.hpp>
 
 #include <unistd.h>
+#include <algorithm>
 #include <argparse/argparse.hpp>
 #include <iostream>
 #include <stdexcept>
@@ -66,6 +69,108 @@ static char cuda_module_loading_env[] = "CUDA_MODULE_LOADING=EAGER";
  */
 inline auto make_async() { return std::make_shared<rmm::mr::cuda_async_memory_resource>(); }
 
+/**
+ * @brief Create a data_model_view_t from mps_data_model_t
+ *
+ * This creates a non-owning view with spans pointing to the CPU data in the mps_data_model.
+ * Used for remote solve where data stays in CPU memory.
+ *
+ * @param mps_data_model The owning mps_data_model_t
+ * @return data_model_view_t with spans pointing to the mps_data_model's vectors
+ */
+template <typename i_t, typename f_t>
+cuopt::linear_programming::data_model_view_t<i_t, f_t> create_view_from_mps_data_model(
+  const cuopt::mps_parser::mps_data_model_t<i_t, f_t>& mps_data_model)
+{
+  cuopt::linear_programming::data_model_view_t<i_t, f_t> view;
+
+  view.set_maximize(mps_data_model.get_sense());
+
+  if (!mps_data_model.get_constraint_matrix_values().empty()) {
+    view.set_csr_constraint_matrix(mps_data_model.get_constraint_matrix_values().data(),
+                                   mps_data_model.get_constraint_matrix_values().size(),
+                                   mps_data_model.get_constraint_matrix_indices().data(),
+                                   mps_data_model.get_constraint_matrix_indices().size(),
+                                   mps_data_model.get_constraint_matrix_offsets().data(),
+                                   mps_data_model.get_constraint_matrix_offsets().size());
+  }
+
+  if (!mps_data_model.get_constraint_bounds().empty()) {
+    view.set_constraint_bounds(mps_data_model.get_constraint_bounds().data(),
+                               mps_data_model.get_constraint_bounds().size());
+  }
+
+  if (!mps_data_model.get_objective_coefficients().empty()) {
+    view.set_objective_coefficients(mps_data_model.get_objective_coefficients().data(),
+                                    mps_data_model.get_objective_coefficients().size());
+  }
+
+  view.set_objective_scaling_factor(mps_data_model.get_objective_scaling_factor());
+  view.set_objective_offset(mps_data_model.get_objective_offset());
+
+  if (!mps_data_model.get_variable_lower_bounds().empty()) {
+    view.set_variable_lower_bounds(mps_data_model.get_variable_lower_bounds().data(),
+                                   mps_data_model.get_variable_lower_bounds().size());
+  }
+
+  if (!mps_data_model.get_variable_upper_bounds().empty()) {
+    view.set_variable_upper_bounds(mps_data_model.get_variable_upper_bounds().data(),
+                                   mps_data_model.get_variable_upper_bounds().size());
+  }
+
+  if (!mps_data_model.get_variable_types().empty()) {
+    view.set_variable_types(mps_data_model.get_variable_types().data(),
+                            mps_data_model.get_variable_types().size());
+  }
+
+  if (!mps_data_model.get_row_types().empty()) {
+    view.set_row_types(mps_data_model.get_row_types().data(),
+                       mps_data_model.get_row_types().size());
+  }
+
+  if (!mps_data_model.get_constraint_lower_bounds().empty()) {
+    view.set_constraint_lower_bounds(mps_data_model.get_constraint_lower_bounds().data(),
+                                     mps_data_model.get_constraint_lower_bounds().size());
+  }
+
+  if (!mps_data_model.get_constraint_upper_bounds().empty()) {
+    view.set_constraint_upper_bounds(mps_data_model.get_constraint_upper_bounds().data(),
+                                     mps_data_model.get_constraint_upper_bounds().size());
+  }
+
+  view.set_objective_name(mps_data_model.get_objective_name());
+  view.set_problem_name(mps_data_model.get_problem_name());
+
+  if (!mps_data_model.get_variable_names().empty()) {
+    view.set_variable_names(mps_data_model.get_variable_names());
+  }
+
+  if (!mps_data_model.get_row_names().empty()) {
+    view.set_row_names(mps_data_model.get_row_names());
+  }
+
+  if (!mps_data_model.get_initial_primal_solution().empty()) {
+    view.set_initial_primal_solution(mps_data_model.get_initial_primal_solution().data(),
+                                     mps_data_model.get_initial_primal_solution().size());
+  }
+
+  if (!mps_data_model.get_initial_dual_solution().empty()) {
+    view.set_initial_dual_solution(mps_data_model.get_initial_dual_solution().data(),
+                                   mps_data_model.get_initial_dual_solution().size());
+  }
+
+  if (mps_data_model.has_quadratic_objective()) {
+    view.set_quadratic_objective_matrix(mps_data_model.get_quadratic_objective_values().data(),
+                                        mps_data_model.get_quadratic_objective_values().size(),
+                                        mps_data_model.get_quadratic_objective_indices().data(),
+                                        mps_data_model.get_quadratic_objective_indices().size(),
+                                        mps_data_model.get_quadratic_objective_offsets().data(),
+                                        mps_data_model.get_quadratic_objective_offsets().size());
+  }
+
+  return view;
+}
+
 /**
  * @brief Handle logger when error happens before logger is initialized
  * @param settings Solver settings
@@ -87,9 +192,12 @@ inline cuopt::init_logger_t dummy_logger(
 int run_single_file(const std::string& file_path,
                     const std::string& initial_solution_file,
                     bool solve_relaxation,
-                    const std::map<std::string, std::string>& settings_strings)
+                    const std::map<std::string, std::string>& settings_strings,
+                    bool is_remote_solve)
 {
-  const raft::handle_t handle_{};
+  // Only create raft handle for local solve - it triggers CUDA initialization
+  std::unique_ptr<raft::handle_t> handle_ptr;
+  if (!is_remote_solve) { handle_ptr = std::make_unique<raft::handle_t>(); }
   cuopt::linear_programming::solver_settings_t<int, double> settings;
 
   try {
@@ -122,13 +230,15 @@ int run_single_file(const std::string& file_path,
     return -1;
   }
 
-  auto op_problem =
-    cuopt::linear_programming::mps_data_model_to_optimization_problem(&handle_, mps_data_model);
-
-  const bool is_mip =
-    (op_problem.get_problem_category() == cuopt::linear_programming::problem_category_t::MIP ||
-     op_problem.get_problem_category() == cuopt::linear_programming::problem_category_t::IP) &&
-    !solve_relaxation;
+  // Determine if this is a MIP problem by checking variable types
+  bool has_integers = false;
+  for (const auto& vt : mps_data_model.get_variable_types()) {
+    if (vt == 'I' || vt == 'B') {
+      has_integers = true;
+      break;
+    }
+  }
+  const bool is_mip = has_integers && !solve_relaxation;
 
   try {
     auto initial_solution =
@@ -154,13 +264,29 @@ int run_single_file(const std::string& file_path,
     return -1;
   }
 
+  // Create a non-owning view from the mps_data_model
+  // solve_lp/solve_mip will handle remote vs local solve based on env vars
+  auto view = create_view_from_mps_data_model(mps_data_model);
+
   try {
+    // Pass handle_ptr.get() - can be nullptr for remote solve
     if (is_mip) {
       auto& mip_settings = settings.get_mip_settings();
-      auto solution      = cuopt::linear_programming::solve_mip(op_problem, mip_settings);
+      auto solution = cuopt::linear_programming::solve_mip(handle_ptr.get(), view, mip_settings);
+      if (solution.get_error_status().get_error_type() != cuopt::error_type_t::Success) {
+        auto log = dummy_logger(settings);
+        CUOPT_LOG_ERROR("MIP solve failed: %s", solution.get_error_status().what());
+        return -1;
+      }
     } else {
       auto& lp_settings = settings.get_pdlp_settings();
-      auto solution     = cuopt::linear_programming::solve_lp(op_problem, lp_settings);
+      auto solution     = cuopt::linear_programming::solve_lp(handle_ptr.get(), view, lp_settings);
+      if (solution.get_error_status().get_error_type() != cuopt::error_type_t::Success) {
+        auto log = dummy_logger(settings);
+        CUOPT_LOG_ERROR("LP solve failed: %s", solution.get_error_status().what());
+        return -1;
+      }
+      // Note: Solution output is now handled by solve_lp/solve_lp_remote via CUOPT_LOG_INFO
     }
   } catch (const std::exception& e) {
     CUOPT_LOG_ERROR("Error: %s", e.what());
@@ -331,22 +457,28 @@ int main(int argc, char* argv[])
   // Get the values
   std::string file_name = program.get<std::string>("filename");
 
-  const auto initial_solution_file = program.get<std::string>("--initial-solution");
-  const auto solve_relaxation      = program.get<bool>("--relaxation");
-
-  // All arguments are parsed as string, default values are parsed as int if unused.
-  const auto num_gpus = program.is_used("--num-gpus")
-                          ? std::stoi(program.get<std::string>("--num-gpus"))
-                          : program.get<int>("--num-gpus");
+  // Check for remote solve BEFORE any CUDA initialization
+  const bool is_remote_solve = cuopt::linear_programming::is_remote_solve_enabled();
 
   std::vector<std::shared_ptr<rmm::mr::device_memory_resource>> memory_resources;
 
-  for (int i = 0; i < std::min(raft::device_setter::get_device_count(), num_gpus); ++i) {
-    cudaSetDevice(i);
-    memory_resources.push_back(make_async());
-    rmm::mr::set_per_device_resource(rmm::cuda_device_id{i}, memory_resources.back().get());
+  if (!is_remote_solve) {
+    // Only initialize CUDA resources for local solve
+    // All arguments are parsed as string, default values are parsed as int if unused.
+    const auto num_gpus = program.is_used("--num-gpus")
+                            ? std::stoi(program.get<std::string>("--num-gpus"))
+                            : program.get<int>("--num-gpus");
+
+    for (int i = 0; i < std::min(raft::device_setter::get_device_count(), num_gpus); ++i) {
+      cudaSetDevice(i);
+      memory_resources.push_back(make_async());
+      rmm::mr::set_per_device_resource(rmm::cuda_device_id{i}, memory_resources.back().get());
+    }
+    cudaSetDevice(0);
   }
-  cudaSetDevice(0);
 
-  return run_single_file(file_name, initial_solution_file, solve_relaxation, settings_strings);
+  const auto initial_solution_file = program.get<std::string>("--initial-solution");
+  const auto solve_relaxation      = program.get<bool>("--relaxation");
+  return run_single_file(
+    file_name, initial_solution_file, solve_relaxation, settings_strings, is_remote_solve);
 }
diff --git a/cpp/include/cuopt/linear_programming/utilities/remote_solve.hpp b/cpp/include/cuopt/linear_programming/utilities/remote_solve.hpp
index afa1810dc..ff2829421 100644
--- a/cpp/include/cuopt/linear_programming/utilities/remote_solve.hpp
+++ b/cpp/include/cuopt/linear_programming/utilities/remote_solve.hpp
@@ -69,11 +69,43 @@ inline bool is_remote_solve_enabled() { return get_remote_solve_config().has_val
 template <typename i_t, typename f_t>
 optimization_problem_solution_t<i_t, f_t> solve_lp_remote(
   const remote_solve_config_t&,
-  const cuopt::mps_parser::data_model_view_t<i_t, f_t>&,
+  const cuopt::mps_parser::data_model_view_t<i_t, f_t>& view,
   const pdlp_solver_settings_t<i_t, f_t>&)
 {
-  return optimization_problem_solution_t<i_t, f_t>(cuopt::logic_error(
-    "Remote solve is not enabled in this build", cuopt::error_type_t::RuntimeError));
+  auto n_rows = view.get_constraint_matrix_offsets().size() > 0
+                  ? static_cast<i_t>(view.get_constraint_matrix_offsets().size()) - 1
+                  : 0;
+  auto n_cols = static_cast<i_t>(view.get_objective_coefficients().size());
+
+  std::vector<f_t> primal_solution(static_cast<size_t>(n_cols), f_t{0});
+  std::vector<f_t> dual_solution(static_cast<size_t>(n_rows), f_t{0});
+  std::vector<f_t> reduced_cost(static_cast<size_t>(n_cols), f_t{0});
+
+  typename optimization_problem_solution_t<i_t, f_t>::additional_termination_information_t stats;
+  stats.number_of_steps_taken           = 0;
+  stats.total_number_of_attempted_steps = 0;
+  stats.l2_primal_residual              = f_t{0};
+  stats.l2_relative_primal_residual     = f_t{0};
+  stats.l2_dual_residual                = f_t{0};
+  stats.l2_relative_dual_residual       = f_t{0};
+  stats.primal_objective                = f_t{0};
+  stats.dual_objective                  = f_t{0};
+  stats.gap                             = f_t{0};
+  stats.relative_gap                    = f_t{0};
+  stats.max_primal_ray_infeasibility    = f_t{0};
+  stats.primal_ray_linear_objective     = f_t{0};
+  stats.max_dual_ray_infeasibility      = f_t{0};
+  stats.dual_ray_linear_objective       = f_t{0};
+  stats.solve_time                      = 0.0;
+  stats.solved_by_pdlp                  = false;
+  return optimization_problem_solution_t<i_t, f_t>(std::move(primal_solution),
+                                                   std::move(dual_solution),
+                                                   std::move(reduced_cost),
+                                                   "",
+                                                   {},
+                                                   {},
+                                                   stats,
+                                                   pdlp_termination_status_t::Optimal);
 }
 
 /**
@@ -82,12 +114,28 @@ optimization_problem_solution_t<i_t, f_t> solve_lp_remote(
  * Stub implementation for the memory-model-only branch.
  */
 template <typename i_t, typename f_t>
-mip_solution_t<i_t, f_t> solve_mip_remote(const remote_solve_config_t&,
-                                          const cuopt::mps_parser::data_model_view_t<i_t, f_t>&,
-                                          const mip_solver_settings_t<i_t, f_t>&)
+mip_solution_t<i_t, f_t> solve_mip_remote(
+  const remote_solve_config_t&,
+  const cuopt::mps_parser::data_model_view_t<i_t, f_t>& view,
+  const mip_solver_settings_t<i_t, f_t>&)
 {
-  return mip_solution_t<i_t, f_t>(cuopt::logic_error("Remote solve is not enabled in this build",
-                                                     cuopt::error_type_t::RuntimeError));
+  auto n_cols = static_cast<i_t>(view.get_objective_coefficients().size());
+  std::vector<f_t> solution(static_cast<size_t>(n_cols), f_t{0});
+  solver_stats_t<i_t, f_t> stats{};
+  stats.total_solve_time       = f_t{0};
+  stats.presolve_time          = f_t{0};
+  stats.solution_bound         = f_t{0};
+  stats.num_nodes              = 0;
+  stats.num_simplex_iterations = 0;
+  return mip_solution_t<i_t, f_t>(std::move(solution),
+                                  {},
+                                  f_t{0},
+                                  f_t{0},
+                                  mip_termination_status_t::Optimal,
+                                  f_t{0},
+                                  f_t{0},
+                                  f_t{0},
+                                  stats);
 }
 
 }  // namespace cuopt::linear_programming
diff --git a/cpp/src/linear_programming/utilities/cython_solve.cu b/cpp/src/linear_programming/utilities/cython_solve.cu
index f49e2057b..f09168b52 100644
--- a/cpp/src/linear_programming/utilities/cython_solve.cu
+++ b/cpp/src/linear_programming/utilities/cython_solve.cu
@@ -10,6 +10,7 @@
 #include <cuopt/linear_programming/solve.hpp>
 #include <cuopt/linear_programming/solver_settings.hpp>
 #include <cuopt/linear_programming/utilities/cython_solve.hpp>
+#include <cuopt/linear_programming/utilities/remote_solve.hpp>
 #include <mip/logger.hpp>
 #include <mps_parser/data_model_view.hpp>
 #include <mps_parser/mps_data_model.hpp>
@@ -21,6 +22,7 @@
 
 #include <rmm/device_buffer.hpp>
 
+#include <algorithm>
 #include <utility>
 #include <vector>
 
@@ -142,47 +144,61 @@ linear_programming_ret_t call_solve_lp(
   const bool use_pdlp_solver_mode = true;
   auto solution                   = cuopt::linear_programming::solve_lp(
     op_problem, solver_settings, problem_checking, use_pdlp_solver_mode, is_batch_mode);
-  linear_programming_ret_t lp_ret{
-    std::make_unique<rmm::device_buffer>(solution.get_primal_solution().release()),
-    std::make_unique<rmm::device_buffer>(solution.get_dual_solution().release()),
-    std::make_unique<rmm::device_buffer>(solution.get_reduced_cost().release()),
-    std::make_unique<rmm::device_buffer>(
-      solution.get_pdlp_warm_start_data().current_primal_solution_.release()),
-    std::make_unique<rmm::device_buffer>(
-      solution.get_pdlp_warm_start_data().current_dual_solution_.release()),
-    std::make_unique<rmm::device_buffer>(
-      solution.get_pdlp_warm_start_data().initial_primal_average_.release()),
-    std::make_unique<rmm::device_buffer>(
-      solution.get_pdlp_warm_start_data().initial_dual_average_.release()),
-    std::make_unique<rmm::device_buffer>(
-      solution.get_pdlp_warm_start_data().current_ATY_.release()),
-    std::make_unique<rmm::device_buffer>(
-      solution.get_pdlp_warm_start_data().sum_primal_solutions_.release()),
-    std::make_unique<rmm::device_buffer>(
-      solution.get_pdlp_warm_start_data().sum_dual_solutions_.release()),
-    std::make_unique<rmm::device_buffer>(
-      solution.get_pdlp_warm_start_data().last_restart_duality_gap_primal_solution_.release()),
-    std::make_unique<rmm::device_buffer>(
-      solution.get_pdlp_warm_start_data().last_restart_duality_gap_dual_solution_.release()),
-    solution.get_pdlp_warm_start_data().initial_primal_weight_,
-    solution.get_pdlp_warm_start_data().initial_step_size_,
-    solution.get_pdlp_warm_start_data().total_pdlp_iterations_,
-    solution.get_pdlp_warm_start_data().total_pdhg_iterations_,
-    solution.get_pdlp_warm_start_data().last_candidate_kkt_score_,
-    solution.get_pdlp_warm_start_data().last_restart_kkt_score_,
-    solution.get_pdlp_warm_start_data().sum_solution_weight_,
-    solution.get_pdlp_warm_start_data().iterations_since_last_restart_,
-    solution.get_termination_status(),
-    solution.get_error_status().get_error_type(),
-    solution.get_error_status().what(),
-    solution.get_additional_termination_information().l2_primal_residual,
-    solution.get_additional_termination_information().l2_dual_residual,
-    solution.get_additional_termination_information().primal_objective,
-    solution.get_additional_termination_information().dual_objective,
-    solution.get_additional_termination_information().gap,
-    solution.get_additional_termination_information().number_of_steps_taken,
-    solution.get_additional_termination_information().solve_time,
-    solution.get_additional_termination_information().solved_by_pdlp};
+  linear_programming_ret_t lp_ret{};
+  const auto& stats          = solution.get_additional_termination_information();
+  auto& warm_start           = solution.get_pdlp_warm_start_data();
+  lp_ret.termination_status_ = solution.get_termination_status();
+  lp_ret.error_status_       = solution.get_error_status().get_error_type();
+  lp_ret.error_message_      = solution.get_error_status().what();
+  lp_ret.l2_primal_residual_ = stats.l2_primal_residual;
+  lp_ret.l2_dual_residual_   = stats.l2_dual_residual;
+  lp_ret.primal_objective_   = stats.primal_objective;
+  lp_ret.dual_objective_     = stats.dual_objective;
+  lp_ret.gap_                = stats.gap;
+  lp_ret.nb_iterations_      = stats.number_of_steps_taken;
+  lp_ret.solve_time_         = stats.solve_time;
+  lp_ret.solved_by_pdlp_     = stats.solved_by_pdlp;
+
+  lp_ret.initial_primal_weight_         = warm_start.initial_primal_weight_;
+  lp_ret.initial_step_size_             = warm_start.initial_step_size_;
+  lp_ret.total_pdlp_iterations_         = warm_start.total_pdlp_iterations_;
+  lp_ret.total_pdhg_iterations_         = warm_start.total_pdhg_iterations_;
+  lp_ret.last_candidate_kkt_score_      = warm_start.last_candidate_kkt_score_;
+  lp_ret.last_restart_kkt_score_        = warm_start.last_restart_kkt_score_;
+  lp_ret.sum_solution_weight_           = warm_start.sum_solution_weight_;
+  lp_ret.iterations_since_last_restart_ = warm_start.iterations_since_last_restart_;
+
+  if (solution.is_device_memory()) {
+    lp_ret.primal_solution_ =
+      std::make_unique<rmm::device_buffer>(solution.get_primal_solution().release());
+    lp_ret.dual_solution_ =
+      std::make_unique<rmm::device_buffer>(solution.get_dual_solution().release());
+    lp_ret.reduced_cost_ =
+      std::make_unique<rmm::device_buffer>(solution.get_reduced_cost().release());
+    lp_ret.current_primal_solution_ =
+      std::make_unique<rmm::device_buffer>(warm_start.current_primal_solution_.release());
+    lp_ret.current_dual_solution_ =
+      std::make_unique<rmm::device_buffer>(warm_start.current_dual_solution_.release());
+    lp_ret.initial_primal_average_ =
+      std::make_unique<rmm::device_buffer>(warm_start.initial_primal_average_.release());
+    lp_ret.initial_dual_average_ =
+      std::make_unique<rmm::device_buffer>(warm_start.initial_dual_average_.release());
+    lp_ret.current_ATY_ = std::make_unique<rmm::device_buffer>(warm_start.current_ATY_.release());
+    lp_ret.sum_primal_solutions_ =
+      std::make_unique<rmm::device_buffer>(warm_start.sum_primal_solutions_.release());
+    lp_ret.sum_dual_solutions_ =
+      std::make_unique<rmm::device_buffer>(warm_start.sum_dual_solutions_.release());
+    lp_ret.last_restart_duality_gap_primal_solution_ = std::make_unique<rmm::device_buffer>(
+      warm_start.last_restart_duality_gap_primal_solution_.release());
+    lp_ret.last_restart_duality_gap_dual_solution_ = std::make_unique<rmm::device_buffer>(
+      warm_start.last_restart_duality_gap_dual_solution_.release());
+    lp_ret.is_device_memory_ = true;
+  } else {
+    lp_ret.primal_solution_host_ = solution.get_primal_solution_host();
+    lp_ret.dual_solution_host_   = solution.get_dual_solution_host();
+    lp_ret.reduced_cost_host_    = solution.get_reduced_cost_host();
+    lp_ret.is_device_memory_     = false;
+  }
 
   return lp_ret;
 }
@@ -205,20 +221,28 @@ mip_ret_t call_solve_mip(
     error_type_t::ValidationError,
     "MIP solve cannot be called on an LP problem!");
   auto solution = cuopt::linear_programming::solve_mip(op_problem, solver_settings);
-  mip_ret_t mip_ret{std::make_unique<rmm::device_buffer>(solution.get_solution().release()),
-                    solution.get_termination_status(),
-                    solution.get_error_status().get_error_type(),
-                    solution.get_error_status().what(),
-                    solution.get_objective_value(),
-                    solution.get_mip_gap(),
-                    solution.get_solution_bound(),
-                    solution.get_total_solve_time(),
-                    solution.get_presolve_time(),
-                    solution.get_max_constraint_violation(),
-                    solution.get_max_int_violation(),
-                    solution.get_max_variable_bound_violation(),
-                    solution.get_num_nodes(),
-                    solution.get_num_simplex_iterations()};
+  mip_ret_t mip_ret{};
+  mip_ret.termination_status_           = solution.get_termination_status();
+  mip_ret.error_status_                 = solution.get_error_status().get_error_type();
+  mip_ret.error_message_                = solution.get_error_status().what();
+  mip_ret.objective_                    = solution.get_objective_value();
+  mip_ret.mip_gap_                      = solution.get_mip_gap();
+  mip_ret.solution_bound_               = solution.get_solution_bound();
+  mip_ret.total_solve_time_             = solution.get_total_solve_time();
+  mip_ret.presolve_time_                = solution.get_presolve_time();
+  mip_ret.max_constraint_violation_     = solution.get_max_constraint_violation();
+  mip_ret.max_int_violation_            = solution.get_max_int_violation();
+  mip_ret.max_variable_bound_violation_ = solution.get_max_variable_bound_violation();
+  mip_ret.nodes_                        = solution.get_num_nodes();
+  mip_ret.simplex_iterations_           = solution.get_num_simplex_iterations();
+
+  if (solution.is_device_memory()) {
+    mip_ret.solution_ = std::make_unique<rmm::device_buffer>(solution.get_solution().release());
+    mip_ret.is_device_memory_ = true;
+  } else {
+    mip_ret.solution_host_    = solution.get_solution_host();
+    mip_ret.is_device_memory_ = false;
+  }
   return mip_ret;
 }
 
@@ -228,6 +252,110 @@ std::unique_ptr<solver_ret_t> call_solve(
   unsigned int flags,
   bool is_batch_mode)
 {
+  // Check if remote solve is configured FIRST (before any CUDA operations)
+  if (linear_programming::is_remote_solve_enabled()) {
+    // Data coming from Python is in CPU memory - mark it as such
+    data_model->set_is_device_memory(false);
+
+    solver_ret_t response;
+
+    // Determine if LP or MIP based on variable types
+    bool is_mip    = false;
+    auto var_types = data_model->get_variable_types();
+    for (size_t i = 0; i < var_types.size(); ++i) {
+      if (var_types.data()[i] == 'I' || var_types.data()[i] == 'B') {
+        is_mip = true;
+        break;
+      }
+    }
+
+    if (!is_mip) {
+      // LP: call solve_lp with nullptr handle - remote solve doesn't need GPU
+      auto solution =
+        linear_programming::solve_lp(nullptr, *data_model, solver_settings->get_pdlp_settings());
+
+      auto term_info = solution.get_additional_termination_information();
+      linear_programming_ret_t lp_ret{};
+
+      if (solution.is_device_memory()) {
+        // GPU data (shouldn't happen for remote solve, but handle gracefully)
+        lp_ret.primal_solution_ =
+          std::make_unique<rmm::device_buffer>(solution.get_primal_solution().release());
+        lp_ret.dual_solution_ =
+          std::make_unique<rmm::device_buffer>(solution.get_dual_solution().release());
+        lp_ret.reduced_cost_ =
+          std::make_unique<rmm::device_buffer>(solution.get_reduced_cost().release());
+        lp_ret.is_device_memory_ = true;
+      } else {
+        // CPU data from remote solve - avoid device buffer allocations so CPU-only
+        // clients don't initialize CUDA.
+        lp_ret.primal_solution_host_ = std::move(solution.get_primal_solution_host());
+        lp_ret.dual_solution_host_   = std::move(solution.get_dual_solution_host());
+        lp_ret.reduced_cost_host_    = std::move(solution.get_reduced_cost_host());
+        lp_ret.is_device_memory_     = false;
+      }
+
+      // No warm-start data in remote stub path
+      lp_ret.initial_primal_weight_         = 0.0;
+      lp_ret.initial_step_size_             = 0.0;
+      lp_ret.total_pdlp_iterations_         = 0;
+      lp_ret.total_pdhg_iterations_         = 0;
+      lp_ret.last_candidate_kkt_score_      = 0.0;
+      lp_ret.last_restart_kkt_score_        = 0.0;
+      lp_ret.sum_solution_weight_           = 0.0;
+      lp_ret.iterations_since_last_restart_ = 0;
+
+      lp_ret.termination_status_ = solution.get_termination_status();
+      lp_ret.error_status_       = solution.get_error_status().get_error_type();
+      lp_ret.error_message_      = solution.get_error_status().what();
+      lp_ret.l2_primal_residual_ = term_info.l2_primal_residual;
+      lp_ret.l2_dual_residual_   = term_info.l2_dual_residual;
+      lp_ret.primal_objective_   = term_info.primal_objective;
+      lp_ret.dual_objective_     = term_info.dual_objective;
+      lp_ret.gap_                = term_info.gap;
+      lp_ret.nb_iterations_      = term_info.number_of_steps_taken;
+      lp_ret.solve_time_         = term_info.solve_time;
+      lp_ret.solved_by_pdlp_     = term_info.solved_by_pdlp;
+      response.lp_ret            = std::move(lp_ret);
+      response.problem_type      = linear_programming::problem_category_t::LP;
+    } else {
+      // MIP: call solve_mip with nullptr handle - remote solve doesn't need GPU
+      auto solution =
+        linear_programming::solve_mip(nullptr, *data_model, solver_settings->get_mip_settings());
+
+      mip_ret_t mip_ret{};
+
+      if (solution.is_device_memory()) {
+        // GPU data (shouldn't happen for remote solve, but handle gracefully)
+        mip_ret.solution_ = std::make_unique<rmm::device_buffer>(solution.get_solution().release());
+        mip_ret.is_device_memory_ = true;
+      } else {
+        // CPU data from remote solve - avoid device buffer allocations so CPU-only
+        // clients don't initialize CUDA.
+        mip_ret.solution_host_    = std::move(solution.get_solution_host());
+        mip_ret.is_device_memory_ = false;
+      }
+
+      mip_ret.termination_status_           = solution.get_termination_status();
+      mip_ret.error_status_                 = solution.get_error_status().get_error_type();
+      mip_ret.error_message_                = solution.get_error_status().what();
+      mip_ret.objective_                    = solution.get_objective_value();
+      mip_ret.mip_gap_                      = solution.get_mip_gap();
+      mip_ret.solution_bound_               = solution.get_solution_bound();
+      mip_ret.total_solve_time_             = solution.get_total_solve_time();
+      mip_ret.presolve_time_                = solution.get_presolve_time();
+      mip_ret.max_constraint_violation_     = solution.get_max_constraint_violation();
+      mip_ret.max_int_violation_            = solution.get_max_int_violation();
+      mip_ret.max_variable_bound_violation_ = solution.get_max_variable_bound_violation();
+      mip_ret.nodes_                        = solution.get_num_nodes();
+      mip_ret.simplex_iterations_           = solution.get_num_simplex_iterations();
+      response.mip_ret                      = std::move(mip_ret);
+      response.problem_type                 = linear_programming::problem_category_t::MIP;
+    }
+
+    return std::make_unique<solver_ret_t>(std::move(response));
+  }
+
   raft::common::nvtx::range fun_scope("Call Solve");
   rmm::cuda_stream stream(static_cast<rmm::cuda_stream::flags>(flags));
   const raft::handle_t handle_{stream};
@@ -239,28 +367,32 @@ std::unique_ptr<solver_ret_t> call_solve(
     response.lp_ret =
       call_solve_lp(op_problem, solver_settings->get_pdlp_settings(), is_batch_mode);
     response.problem_type = linear_programming::problem_category_t::LP;
-    // Reset stream to per-thread default as non-blocking stream is out of scope after the
-    // function returns.
-    response.lp_ret.primal_solution_->set_stream(rmm::cuda_stream_per_thread);
-    response.lp_ret.dual_solution_->set_stream(rmm::cuda_stream_per_thread);
-    response.lp_ret.reduced_cost_->set_stream(rmm::cuda_stream_per_thread);
-    response.lp_ret.current_primal_solution_->set_stream(rmm::cuda_stream_per_thread);
-    response.lp_ret.current_dual_solution_->set_stream(rmm::cuda_stream_per_thread);
-    response.lp_ret.initial_primal_average_->set_stream(rmm::cuda_stream_per_thread);
-    response.lp_ret.initial_dual_average_->set_stream(rmm::cuda_stream_per_thread);
-    response.lp_ret.current_ATY_->set_stream(rmm::cuda_stream_per_thread);
-    response.lp_ret.sum_primal_solutions_->set_stream(rmm::cuda_stream_per_thread);
-    response.lp_ret.sum_dual_solutions_->set_stream(rmm::cuda_stream_per_thread);
-    response.lp_ret.last_restart_duality_gap_primal_solution_->set_stream(
-      rmm::cuda_stream_per_thread);
-    response.lp_ret.last_restart_duality_gap_dual_solution_->set_stream(
-      rmm::cuda_stream_per_thread);
+    if (response.lp_ret.is_device_memory_) {
+      // Reset stream to per-thread default as non-blocking stream is out of scope after the
+      // function returns.
+      response.lp_ret.primal_solution_->set_stream(rmm::cuda_stream_per_thread);
+      response.lp_ret.dual_solution_->set_stream(rmm::cuda_stream_per_thread);
+      response.lp_ret.reduced_cost_->set_stream(rmm::cuda_stream_per_thread);
+      response.lp_ret.current_primal_solution_->set_stream(rmm::cuda_stream_per_thread);
+      response.lp_ret.current_dual_solution_->set_stream(rmm::cuda_stream_per_thread);
+      response.lp_ret.initial_primal_average_->set_stream(rmm::cuda_stream_per_thread);
+      response.lp_ret.initial_dual_average_->set_stream(rmm::cuda_stream_per_thread);
+      response.lp_ret.current_ATY_->set_stream(rmm::cuda_stream_per_thread);
+      response.lp_ret.sum_primal_solutions_->set_stream(rmm::cuda_stream_per_thread);
+      response.lp_ret.sum_dual_solutions_->set_stream(rmm::cuda_stream_per_thread);
+      response.lp_ret.last_restart_duality_gap_primal_solution_->set_stream(
+        rmm::cuda_stream_per_thread);
+      response.lp_ret.last_restart_duality_gap_dual_solution_->set_stream(
+        rmm::cuda_stream_per_thread);
+    }
   } else {
     response.mip_ret      = call_solve_mip(op_problem, solver_settings->get_mip_settings());
     response.problem_type = linear_programming::problem_category_t::MIP;
-    // Reset stream to per-thread default as non-blocking stream is out of scope after the
-    // function returns.
-    response.mip_ret.solution_->set_stream(rmm::cuda_stream_per_thread);
+    if (response.mip_ret.is_device_memory_) {
+      // Reset stream to per-thread default as non-blocking stream is out of scope after the
+      // function returns.
+      response.mip_ret.solution_->set_stream(rmm::cuda_stream_per_thread);
+    }
   }
 
   // Reset warmstart data streams in solver_settings to per-thread default before destroying our
@@ -327,7 +459,13 @@ std::pair<std::vector<std::unique_ptr<solver_ret_t>>, double> call_batch_solve(
   auto start_solver = std::chrono::high_resolution_clock::now();
 
   // Limit parallelism as too much stream overlap gets too slow
-  const int max_thread = compute_max_thread(data_models);
+  int max_thread = 1;
+  if (linear_programming::is_remote_solve_enabled()) {
+    constexpr std::size_t max_total = 4;
+    max_thread = static_cast<int>(std::min(std::max<std::size_t>(size, 1), max_total));
+  } else {
+    max_thread = compute_max_thread(data_models);
+  }
 
   if (solver_settings->get_parameter<int>(CUOPT_METHOD) == CUOPT_METHOD_CONCURRENT) {
     CUOPT_LOG_INFO("Concurrent mode not supported for batch solve. Using PDLP instead. ");

From 3d28ef7ea01a970bf7e490157fcd385af5935efc Mon Sep 17 00:00:00 2001
From: Trevor McKay <tmgithub1@gmail.com>
Date: Tue, 27 Jan 2026 21:21:12 -0500
Subject: [PATCH 03/22] python host solutions and lazy import in init

---
 python/cuopt/MANIFEST.in                      |   3 +
 python/cuopt/cuopt/__init__.py                |  22 ++-
 .../linear_programming/solver/solver.pxd      |   8 +-
 .../solver/solver_wrapper.pyx                 | 168 ++++++++++--------
 python/cuopt/pyproject.toml                   |  17 +-
 5 files changed, 136 insertions(+), 82 deletions(-)
 create mode 100644 python/cuopt/MANIFEST.in

diff --git a/python/cuopt/MANIFEST.in b/python/cuopt/MANIFEST.in
new file mode 100644
index 000000000..8c1f835a4
--- /dev/null
+++ b/python/cuopt/MANIFEST.in
@@ -0,0 +1,3 @@
+
+# Automatically generated by rapids-build-backend
+include cuopt/GIT_COMMIT
diff --git a/python/cuopt/cuopt/__init__.py b/python/cuopt/cuopt/__init__.py
index c6e9150c8..7ea141221 100644
--- a/python/cuopt/cuopt/__init__.py
+++ b/python/cuopt/cuopt/__init__.py
@@ -1,4 +1,4 @@
-# SPDX-FileCopyrightText: Copyright (c) 2021-2025 NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+# SPDX-FileCopyrightText: Copyright (c) 2021-2026, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
 # SPDX-License-Identifier: Apache-2.0
 
 try:
@@ -9,5 +9,23 @@
     libcuopt.load_library()
     del libcuopt
 
-from cuopt import linear_programming, routing
 from cuopt._version import __git_commit__, __version__, __version_major_minor__
+
+# Lazy imports for linear_programming and routing modules
+# This allows cuopt to be imported on CPU-only hosts when remote solve is configured
+_submodules = ["linear_programming", "routing"]
+
+
+def __getattr__(name):
+    """Lazy import submodules to support CPU-only hosts with remote solve."""
+    if name in _submodules:
+        import importlib
+        return importlib.import_module(f"cuopt.{name}")
+    raise AttributeError(f"module {__name__!r} has no attribute {name!r}")
+
+
+def __dir__():
+    return __all__ + _submodules
+
+
+__all__ = ["__git_commit__", "__version__", "__version_major_minor__"]
diff --git a/python/cuopt/cuopt/linear_programming/solver/solver.pxd b/python/cuopt/cuopt/linear_programming/solver/solver.pxd
index c140e3d0c..df631f825 100644
--- a/python/cuopt/cuopt/linear_programming/solver/solver.pxd
+++ b/python/cuopt/cuopt/linear_programming/solver/solver.pxd
@@ -1,4 +1,4 @@
-# SPDX-FileCopyrightText: Copyright (c) 2023-2025, NVIDIA CORPORATION & AFFILIATES. All rights reserved. # noqa
+# SPDX-FileCopyrightText: Copyright (c) 2023-2026, NVIDIA CORPORATION & AFFILIATES. All rights reserved. # noqa
 # SPDX-License-Identifier: Apache-2.0
 
 
@@ -123,6 +123,10 @@ cdef extern from "cuopt/linear_programming/utilities/cython_solve.hpp" namespace
         unique_ptr[device_buffer] primal_solution_
         unique_ptr[device_buffer] dual_solution_
         unique_ptr[device_buffer] reduced_cost_
+        vector[double] primal_solution_host_
+        vector[double] dual_solution_host_
+        vector[double] reduced_cost_host_
+        bool is_device_memory_
         # PDLP warm start data
         unique_ptr[device_buffer] current_primal_solution_
         unique_ptr[device_buffer] current_dual_solution_
@@ -156,6 +160,8 @@ cdef extern from "cuopt/linear_programming/utilities/cython_solve.hpp" namespace
 
     cdef cppclass mip_ret_t:
         unique_ptr[device_buffer] solution_
+        vector[double] solution_host_
+        bool is_device_memory_
         mip_termination_status_t termination_status_
         error_type_t error_status_
         string error_message_
diff --git a/python/cuopt/cuopt/linear_programming/solver/solver_wrapper.pyx b/python/cuopt/cuopt/linear_programming/solver/solver_wrapper.pyx
index 1991af0d6..d924947be 100644
--- a/python/cuopt/cuopt/linear_programming/solver/solver_wrapper.pyx
+++ b/python/cuopt/cuopt/linear_programming/solver/solver_wrapper.pyx
@@ -1,4 +1,4 @@
-# SPDX-FileCopyrightText: Copyright (c) 2023-2025, NVIDIA CORPORATION & AFFILIATES. All rights reserved. # noqa
+# SPDX-FileCopyrightText: Copyright (c) 2023-2026, NVIDIA CORPORATION & AFFILIATES. All rights reserved. # noqa
 # SPDX-License-Identifier: Apache-2.0
 
 
@@ -107,6 +107,14 @@ cdef char* c_get_string(string in_str):
     return c_string
 
 
+cdef object _vector_to_numpy(vector[double]& vec):
+    cdef Py_ssize_t size = vec.size()
+    if size == 0:
+        return np.array([], dtype=np.float64)
+    cdef double* data_ptr = vec.data()
+    return np.asarray(<double[:size]> data_ptr, dtype=np.float64).copy()
+
+
 def get_data_ptr(array):
     if isinstance(array, cudf.Series):
         return array.__cuda_array_interface__['data'][0]
@@ -300,9 +308,13 @@ cdef create_solution(unique_ptr[solver_ret_t] sol_ret_ptr,
     sol_ret = move(sol_ret_ptr.get()[0])
 
     if sol_ret.problem_type == ProblemCategory.MIP or sol_ret.problem_type == ProblemCategory.IP: # noqa
-        solution = DeviceBuffer.c_from_unique_ptr(
-            move(sol_ret.mip_ret.solution_)
-        )
+        if sol_ret.mip_ret.is_device_memory_:
+            solution = DeviceBuffer.c_from_unique_ptr(
+                move(sol_ret.mip_ret.solution_)
+            )
+            solution = series_from_buf(solution, pa.float64()).to_numpy()
+        else:
+            solution = _vector_to_numpy(sol_ret.mip_ret.solution_host_)
         termination_status = sol_ret.mip_ret.termination_status_
         error_status = sol_ret.mip_ret.error_status_
         error_message = sol_ret.mip_ret.error_message_
@@ -317,8 +329,6 @@ cdef create_solution(unique_ptr[solver_ret_t] sol_ret_ptr,
         num_nodes = sol_ret.mip_ret.nodes_
         num_simplex_iterations = sol_ret.mip_ret.simplex_iterations_
 
-        solution = series_from_buf(solution, pa.float64()).to_numpy()
-
         return Solution(
             ProblemCategory(sol_ret.problem_type),
             dict(zip(data_model_obj.get_variable_names(), solution)),
@@ -339,15 +349,20 @@ cdef create_solution(unique_ptr[solver_ret_t] sol_ret_ptr,
         )
 
     else:
-        primal_solution = DeviceBuffer.c_from_unique_ptr(
-            move(sol_ret.lp_ret.primal_solution_)
-        )
-        dual_solution = DeviceBuffer.c_from_unique_ptr(move(sol_ret.lp_ret.dual_solution_)) # noqa
-        reduced_cost = DeviceBuffer.c_from_unique_ptr(move(sol_ret.lp_ret.reduced_cost_)) # noqa
+        if sol_ret.lp_ret.is_device_memory_:
+            primal_solution = DeviceBuffer.c_from_unique_ptr(
+                move(sol_ret.lp_ret.primal_solution_)
+            )
+            dual_solution = DeviceBuffer.c_from_unique_ptr(move(sol_ret.lp_ret.dual_solution_)) # noqa
+            reduced_cost = DeviceBuffer.c_from_unique_ptr(move(sol_ret.lp_ret.reduced_cost_)) # noqa
 
-        primal_solution = series_from_buf(primal_solution, pa.float64()).to_numpy()
-        dual_solution = series_from_buf(dual_solution, pa.float64()).to_numpy()
-        reduced_cost = series_from_buf(reduced_cost, pa.float64()).to_numpy()
+            primal_solution = series_from_buf(primal_solution, pa.float64()).to_numpy()
+            dual_solution = series_from_buf(dual_solution, pa.float64()).to_numpy()
+            reduced_cost = series_from_buf(reduced_cost, pa.float64()).to_numpy()
+        else:
+            primal_solution = _vector_to_numpy(sol_ret.lp_ret.primal_solution_host_)
+            dual_solution = _vector_to_numpy(sol_ret.lp_ret.dual_solution_host_)
+            reduced_cost = _vector_to_numpy(sol_ret.lp_ret.reduced_cost_host_)
 
         termination_status = sol_ret.lp_ret.termination_status_
         error_status = sol_ret.lp_ret.error_status_
@@ -363,33 +378,74 @@ cdef create_solution(unique_ptr[solver_ret_t] sol_ret_ptr,
 
         # In BatchSolve, we don't get the warm start data
         if not is_batch:
-            current_primal_solution = DeviceBuffer.c_from_unique_ptr(
-                move(sol_ret.lp_ret.current_primal_solution_)
-            )
-            current_dual_solution = DeviceBuffer.c_from_unique_ptr(
-                move(sol_ret.lp_ret.current_dual_solution_)
-            )
-            initial_primal_average = DeviceBuffer.c_from_unique_ptr(
-                move(sol_ret.lp_ret.initial_primal_average_)
-            )
-            initial_dual_average = DeviceBuffer.c_from_unique_ptr(
-                move(sol_ret.lp_ret.initial_dual_average_)
-            )
-            current_ATY = DeviceBuffer.c_from_unique_ptr(
-                move(sol_ret.lp_ret.current_ATY_)
-            )
-            sum_primal_solutions = DeviceBuffer.c_from_unique_ptr(
-                move(sol_ret.lp_ret.sum_primal_solutions_)
-            )
-            sum_dual_solutions = DeviceBuffer.c_from_unique_ptr(
-                move(sol_ret.lp_ret.sum_dual_solutions_)
-            )
-            last_restart_duality_gap_primal_solution = DeviceBuffer.c_from_unique_ptr( # noqa
-                move(sol_ret.lp_ret.last_restart_duality_gap_primal_solution_)
-            )
-            last_restart_duality_gap_dual_solution = DeviceBuffer.c_from_unique_ptr( # noqa
-                move(sol_ret.lp_ret.last_restart_duality_gap_dual_solution_)
-            )
+            if sol_ret.lp_ret.is_device_memory_:
+                current_primal_solution = DeviceBuffer.c_from_unique_ptr(
+                    move(sol_ret.lp_ret.current_primal_solution_)
+                )
+                current_dual_solution = DeviceBuffer.c_from_unique_ptr(
+                    move(sol_ret.lp_ret.current_dual_solution_)
+                )
+                initial_primal_average = DeviceBuffer.c_from_unique_ptr(
+                    move(sol_ret.lp_ret.initial_primal_average_)
+                )
+                initial_dual_average = DeviceBuffer.c_from_unique_ptr(
+                    move(sol_ret.lp_ret.initial_dual_average_)
+                )
+                current_ATY = DeviceBuffer.c_from_unique_ptr(
+                    move(sol_ret.lp_ret.current_ATY_)
+                )
+                sum_primal_solutions = DeviceBuffer.c_from_unique_ptr(
+                    move(sol_ret.lp_ret.sum_primal_solutions_)
+                )
+                sum_dual_solutions = DeviceBuffer.c_from_unique_ptr(
+                    move(sol_ret.lp_ret.sum_dual_solutions_)
+                )
+                last_restart_duality_gap_primal_solution = DeviceBuffer.c_from_unique_ptr( # noqa
+                    move(sol_ret.lp_ret.last_restart_duality_gap_primal_solution_)
+                )
+                last_restart_duality_gap_dual_solution = DeviceBuffer.c_from_unique_ptr( # noqa
+                    move(sol_ret.lp_ret.last_restart_duality_gap_dual_solution_)
+                )
+                current_primal_solution = series_from_buf(
+                    current_primal_solution, pa.float64()
+                ).to_numpy()
+                current_dual_solution = series_from_buf(
+                    current_dual_solution, pa.float64()
+                ).to_numpy()
+                initial_primal_average = series_from_buf(
+                    initial_primal_average, pa.float64()
+                ).to_numpy()
+                initial_dual_average = series_from_buf(
+                    initial_dual_average, pa.float64()
+                ).to_numpy()
+                current_ATY = series_from_buf(
+                    current_ATY, pa.float64()
+                ).to_numpy()
+                sum_primal_solutions = series_from_buf(
+                    sum_primal_solutions, pa.float64()
+                ).to_numpy()
+                sum_dual_solutions = series_from_buf(
+                    sum_dual_solutions, pa.float64()
+                ).to_numpy()
+                last_restart_duality_gap_primal_solution = series_from_buf(
+                    last_restart_duality_gap_primal_solution,
+                    pa.float64()
+                ).to_numpy()
+                last_restart_duality_gap_dual_solution = series_from_buf(
+                    last_restart_duality_gap_dual_solution,
+                    pa.float64()
+                ).to_numpy()
+            else:
+                current_primal_solution = np.array([], dtype=np.float64)
+                current_dual_solution = np.array([], dtype=np.float64)
+                initial_primal_average = np.array([], dtype=np.float64)
+                initial_dual_average = np.array([], dtype=np.float64)
+                current_ATY = np.array([], dtype=np.float64)
+                sum_primal_solutions = np.array([], dtype=np.float64)
+                sum_dual_solutions = np.array([], dtype=np.float64)
+                last_restart_duality_gap_primal_solution = np.array([], dtype=np.float64)
+                last_restart_duality_gap_dual_solution = np.array([], dtype=np.float64)
+
             initial_primal_weight = sol_ret.lp_ret.initial_primal_weight_
             initial_step_size = sol_ret.lp_ret.initial_step_size_
             total_pdlp_iterations = sol_ret.lp_ret.total_pdlp_iterations_
@@ -399,36 +455,6 @@ cdef create_solution(unique_ptr[solver_ret_t] sol_ret_ptr,
             sum_solution_weight = sol_ret.lp_ret.sum_solution_weight_
             iterations_since_last_restart = sol_ret.lp_ret.iterations_since_last_restart_ # noqa
 
-            current_primal_solution = series_from_buf(
-                current_primal_solution, pa.float64()
-            ).to_numpy()
-            current_dual_solution = series_from_buf(
-                current_dual_solution, pa.float64()
-            ).to_numpy()
-            initial_primal_average = series_from_buf(
-                initial_primal_average, pa.float64()
-            ).to_numpy()
-            initial_dual_average = series_from_buf(
-                initial_dual_average, pa.float64()
-            ).to_numpy()
-            current_ATY = series_from_buf(
-                current_ATY, pa.float64()
-            ).to_numpy()
-            sum_primal_solutions = series_from_buf(
-                sum_primal_solutions, pa.float64()
-            ).to_numpy()
-            sum_dual_solutions = series_from_buf(
-                sum_dual_solutions, pa.float64()
-            ).to_numpy()
-            last_restart_duality_gap_primal_solution = series_from_buf(
-                last_restart_duality_gap_primal_solution,
-                pa.float64()
-            ).to_numpy()
-            last_restart_duality_gap_dual_solution = series_from_buf(
-                last_restart_duality_gap_dual_solution,
-                pa.float64()
-            ).to_numpy()
-
             return Solution(
                 ProblemCategory(sol_ret.problem_type),
                 dict(zip(data_model_obj.get_variable_names(), primal_solution)), # noqa
diff --git a/python/cuopt/pyproject.toml b/python/cuopt/pyproject.toml
index cbd86a376..65a637b5d 100644
--- a/python/cuopt/pyproject.toml
+++ b/python/cuopt/pyproject.toml
@@ -9,7 +9,7 @@ requires = [
 ] # This list was generated by `rapids-dependency-file-generator`. To make changes, edit ../../dependencies.yaml and run `rapids-dependency-file-generator`.
 
 [project]
-name = "cuopt"
+name = "cuopt-cu13"
 dynamic = ["version"]
 description = "cuOpt - GPU Combinatorial Optimization"
 readme = { file = "README.md", content-type = "text/markdown" }
@@ -20,18 +20,18 @@ license = "Apache-2.0"
 requires-python = ">=3.10"
 dependencies = [
     "cuda-python>=13.0.1,<14.0",
-    "cudf==26.2.*,>=0.0.0a0",
+    "cudf-cu13==26.2.*,>=0.0.0a0",
     "cuopt-mps-parser==26.2.*,>=0.0.0a0",
     "cupy-cuda13x>=13.6.0",
-    "libcuopt==26.2.*,>=0.0.0a0",
+    "libcuopt-cu13==26.2.*,>=0.0.0a0",
     "numba-cuda>=0.22.1,<0.23.0",
     "numba>=0.60.0",
     "numpy>=1.23.5,<3.0",
     "pandas>=2.0",
-    "pylibraft==26.2.*,>=0.0.0a0",
+    "pylibraft-cu13==26.2.*,>=0.0.0a0",
     "pyyaml>=6.0.0",
     "rapids-logger==0.2.*,>=0.0.0a0",
-    "rmm==26.2.*,>=0.0.0a0",
+    "rmm-cu13==26.2.*,>=0.0.0a0",
     "scipy>=1.14.1",
 ] # This list was generated by `rapids-dependency-file-generator`. To make changes, edit ../../dependencies.yaml and run `rapids-dependency-file-generator`.
 classifiers = [
@@ -97,6 +97,7 @@ regex = "(?P<value>.*)"
 
 [tool.rapids-build-backend]
 build-backend = "scikit_build_core.build"
+commit-files = ["cuopt/GIT_COMMIT"]
 dependencies-file = "../../dependencies.yaml"
 matrix-entry = "cuda_suffixed=true;use_cuda_wheels=true"
 requires = [
@@ -104,9 +105,9 @@ requires = [
     "cuopt-mps-parser==26.2.*,>=0.0.0a0",
     "cupy-cuda13x>=13.6.0",
     "cython>=3.0.3",
-    "libcuopt==26.2.*,>=0.0.0a0",
+    "libcuopt-cu13==26.2.*,>=0.0.0a0",
     "ninja",
-    "pylibraft==26.2.*,>=0.0.0a0",
+    "pylibraft-cu13==26.2.*,>=0.0.0a0",
     "rapids-logger==0.2.*,>=0.0.0a0",
-    "rmm==26.2.*,>=0.0.0a0",
+    "rmm-cu13==26.2.*,>=0.0.0a0",
 ] # This list was generated by `rapids-dependency-file-generator`. To make changes, edit ../../dependencies.yaml and run `rapids-dependency-file-generator`.

From 3ec538030ef4fbcddfeb9a3b56867019ce1b7f93 Mon Sep 17 00:00:00 2001
From: Trevor McKay <tmgithub1@gmail.com>
Date: Tue, 27 Jan 2026 21:22:25 -0500
Subject: [PATCH 04/22] add memory model summary

---
 MEMORY_MODEL_SUMMARY.md | 78 +++++++++++++++++++++++++++++++++++++++++
 1 file changed, 78 insertions(+)
 create mode 100644 MEMORY_MODEL_SUMMARY.md

diff --git a/MEMORY_MODEL_SUMMARY.md b/MEMORY_MODEL_SUMMARY.md
new file mode 100644
index 000000000..620af2a2b
--- /dev/null
+++ b/MEMORY_MODEL_SUMMARY.md
@@ -0,0 +1,78 @@
+# Memory Model Summary
+
+This document describes how memory is handled for **local** vs **remote** solves.
+
+ ## Core idea
+
+ The solver now supports **two memory modes** for problem input and solution output:
+
+- **Device (GPU) memory**: used for local solves.
+- **Host (CPU) memory**: used for remote solves.
+
+ A non-owning `data_model_view_t` (host or device) is the entry point that drives the path:
+ - Device view → local GPU solve
+ - Host view + `CUOPT_REMOTE_*` → remote solve path
+
+## Local solve (GPU memory)
+
+**C++ entry points** (`solve_lp`, `solve_mip` in `cpp/src/linear_programming/solve.cu` and
+`cpp/src/mip/solve.cu`) behave as follows:
+
+1. If the view is device memory, the view is converted into an `optimization_problem_t` and
+   solved locally.
+2. If the view is **host memory**, the data is copied **CPU → GPU** and solved locally.
+   This path requires a valid `raft::handle_t`.
+3. Solutions are returned in **device memory**, and wrappers expose device buffers.
+
+**Python / Cython (`python/cuopt/.../solver_wrapper.pyx`)**:
+- `DataModel` is **host-only**: the Cython wrapper accepts `np.ndarray` inputs and raises
+  if GPU-backed objects are provided.
+- For local solves, host data is **copied to GPU** when building the
+  `optimization_problem_t` (requires a valid `raft::handle_t`).
+- The solution is wrapped into `rmm::device_buffer` and converted to NumPy arrays via
+  `series_from_buf`.
+
+ **CLI (`cpp/cuopt_cli.cpp`)**:
+ - Initializes CUDA/RMM for local solve paths.
+ - Uses `raft::handle_t` and GPU memory as usual.
+
+## Remote solve (CPU memory)
+
+Remote solve is enabled when **both** `CUOPT_REMOTE_HOST` and `CUOPT_REMOTE_PORT` are set.
+This is detected early in the solve path.
+
+ **C++ entry points**:
+ - `solve_lp` / `solve_mip` check `get_remote_solve_config()` first.
+ - If input data is on **GPU** and remote is enabled, it is copied to CPU for serialization.
+ - If input data is already on **CPU**, it is passed directly to `solve_*_remote`.
+ - Remote solve returns **host vectors** and sets `is_device_memory = false`.
+
+**Remote stub implementation** (`cpp/include/cuopt/linear_programming/utilities/remote_solve.hpp`):
+- Returns **dummy host solutions** (all zeros).
+- Sets termination stats to **finite values** (no NaNs) for predictable output.
+
+**Python / Cython (`python/cuopt/.../solver_wrapper.pyx`)**:
+- **Input handling**: builds a `data_model_view_t` from the Python `DataModel` before calling C++.
+- **Solution handling**: for remote solves, the solution is **host memory**, so NumPy arrays
+  are built directly from host vectors and **avoid `rmm::device_buffer`** (no CUDA).
+
+ **CLI (`cpp/cuopt_cli.cpp`)**:
+ - Detects remote solve **before** any CUDA initialization.
+ - Skips `raft::handle_t` creation and GPU setup when remote is enabled.
+- Builds the problem in **host memory** for remote solves.
+
+ ## Batch solve
+
+ Batch solve uses the same memory model:
+
+ - **Local batch**: GPU memory, with CUDA resources and PDLP/dual simplex paths.
+- **Remote batch**: each problem is routed through `solve_lp_remote` or `solve_mip_remote`
+  and returns host data. If inputs are already on GPU, they are copied to host first.
+
+## Expected outputs for remote stubs
+
+ - Termination status: `Optimal`
+ - Objective values: `0.0`
+ - Primal/dual/reduced-cost vectors: zero-filled host arrays
+
+This is useful for verifying the **CPU-only data path** without a remote service.

From 8e9acc3c3e450d93248146d3c848aeca1b308d74 Mon Sep 17 00:00:00 2001
From: Trevor McKay <tmgithub1@gmail.com>
Date: Wed, 28 Jan 2026 10:30:30 -0500
Subject: [PATCH 05/22] fix missing import in linear programming __init__.pyw

---
 python/cuopt/cuopt/linear_programming/__init__.py | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/python/cuopt/cuopt/linear_programming/__init__.py b/python/cuopt/cuopt/linear_programming/__init__.py
index d267c2171..2655dcc1c 100644
--- a/python/cuopt/cuopt/linear_programming/__init__.py
+++ b/python/cuopt/cuopt/linear_programming/__init__.py
@@ -1,7 +1,8 @@
-# SPDX-FileCopyrightText: Copyright (c) 2023-2025 NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+# SPDX-FileCopyrightText: Copyright (c) 2023-2026, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
 # SPDX-License-Identifier: Apache-2.0
 
 from cuopt.linear_programming import internals
+from cuopt.linear_programming import solver_settings
 from cuopt.linear_programming.data_model import DataModel
 from cuopt.linear_programming.problem import Problem
 from cuopt.linear_programming.solution import Solution

From 0eb63c7dc927705312be6e14d75f0bc3d9be17a1 Mon Sep 17 00:00:00 2001
From: Trevor McKay <tmgithub1@gmail.com>
Date: Wed, 28 Jan 2026 10:40:05 -0500
Subject: [PATCH 06/22] resolve circular dependency likely exposted by lazy
 init

---
 python/cuopt/cuopt/utilities/utils.py | 17 ++++++++++-------
 1 file changed, 10 insertions(+), 7 deletions(-)

diff --git a/python/cuopt/cuopt/utilities/utils.py b/python/cuopt/cuopt/utilities/utils.py
index b92968d0e..aec8a7e57 100644
--- a/python/cuopt/cuopt/utilities/utils.py
+++ b/python/cuopt/cuopt/utilities/utils.py
@@ -1,4 +1,4 @@
-# SPDX-FileCopyrightText: Copyright (c) 2023-2025 NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+# SPDX-FileCopyrightText: Copyright (c) 2023-2026, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
 # SPDX-License-Identifier: Apache-2.0
 
 import numpy as np
@@ -6,12 +6,6 @@
 import cudf
 import pylibcudf as plc
 
-from cuopt.linear_programming.solver.solver_parameters import (
-    CUOPT_ABSOLUTE_PRIMAL_TOLERANCE,
-    CUOPT_MIP_INTEGRALITY_TOLERANCE,
-    CUOPT_RELATIVE_PRIMAL_TOLERANCE,
-)
-
 
 def series_from_buf(buf, dtype):
     """Helper function to create a cudf series from a buffer.
@@ -39,6 +33,10 @@ def series_from_buf(buf, dtype):
 
 
 def validate_variable_bounds(data, settings, solution):
+    from cuopt.linear_programming.solver.solver_parameters import (
+        CUOPT_MIP_INTEGRALITY_TOLERANCE,
+    )
+
     integrality_tolerance = settings.get_parameter(
         CUOPT_MIP_INTEGRALITY_TOLERANCE
     )
@@ -110,6 +108,11 @@ def validate_objective_sanity(data, solution, cost, tolerance):
 
 
 def check_solution(data, setting, solution, cost):
+    from cuopt.linear_programming.solver.solver_parameters import (
+        CUOPT_ABSOLUTE_PRIMAL_TOLERANCE,
+        CUOPT_RELATIVE_PRIMAL_TOLERANCE,
+    )
+
     # check size of the solution matches variable size
     assert len(solution) == len(data.get_variable_types())
 

From f4562b7ed4ec4e5a5b86a73984014389318657cf Mon Sep 17 00:00:00 2001
From: Trevor McKay <tmgithub1@gmail.com>
Date: Wed, 28 Jan 2026 13:19:01 -0500
Subject: [PATCH 07/22] fix missing variable types for quadratic problems

---
 cpp/src/linear_programming/cuopt_c.cpp | 8 ++++++++
 1 file changed, 8 insertions(+)

diff --git a/cpp/src/linear_programming/cuopt_c.cpp b/cpp/src/linear_programming/cuopt_c.cpp
index 717752e70..66f66f0af 100644
--- a/cpp/src/linear_programming/cuopt_c.cpp
+++ b/cpp/src/linear_programming/cuopt_c.cpp
@@ -680,6 +680,10 @@ cuopt_int_t cuOptCreateQuadraticProblem(
       gpu_problem.set_constraint_bounds(rhs, num_constraints);
       gpu_problem.set_variable_lower_bounds(lower_bounds, num_variables);
       gpu_problem.set_variable_upper_bounds(upper_bounds, num_variables);
+      if (num_variables > 0) {
+        std::vector<var_t> variable_types_host(num_variables, var_t::CONTINUOUS);
+        gpu_problem.set_variable_types(variable_types_host.data(), num_variables);
+      }
 
       // Create view pointing to GPU data
       problem_and_stream->create_view_from_gpu_problem();
@@ -798,6 +802,10 @@ cuopt_int_t cuOptCreateQuadraticRangedProblem(
       gpu_problem.set_constraint_upper_bounds(constraint_upper_bounds, num_constraints);
       gpu_problem.set_variable_lower_bounds(variable_lower_bounds, num_variables);
       gpu_problem.set_variable_upper_bounds(variable_upper_bounds, num_variables);
+      if (num_variables > 0) {
+        std::vector<var_t> variable_types_host(num_variables, var_t::CONTINUOUS);
+        gpu_problem.set_variable_types(variable_types_host.data(), num_variables);
+      }
 
       // Create view pointing to GPU data
       problem_and_stream->create_view_from_gpu_problem();

From 7c11efdf5c22fac37c629fea44ef496d30805692 Mon Sep 17 00:00:00 2001
From: Trevor McKay <tmgithub1@gmail.com>
Date: Wed, 28 Jan 2026 16:07:24 -0500
Subject: [PATCH 08/22] add ci fixes for empty mip problems and circular python
 imports

---
 cpp/src/linear_programming/solve.cu               | 14 ++++++++------
 python/cuopt/cuopt/linear_programming/__init__.py |  1 -
 2 files changed, 8 insertions(+), 7 deletions(-)

diff --git a/cpp/src/linear_programming/solve.cu b/cpp/src/linear_programming/solve.cu
index 1c21739c9..92eeef6db 100644
--- a/cpp/src/linear_programming/solve.cu
+++ b/cpp/src/linear_programming/solve.cu
@@ -1426,12 +1426,14 @@ optimization_problem_t<i_t, f_t> data_model_view_to_optimization_problem(
   optimization_problem_t<i_t, f_t> op_problem(handle_ptr);
   op_problem.set_maximize(view.get_sense());
 
-  op_problem.set_csr_constraint_matrix(view.get_constraint_matrix_values().data(),
-                                       view.get_constraint_matrix_values().size(),
-                                       view.get_constraint_matrix_indices().data(),
-                                       view.get_constraint_matrix_indices().size(),
-                                       view.get_constraint_matrix_offsets().data(),
-                                       view.get_constraint_matrix_offsets().size());
+  if (view.get_constraint_matrix_offsets().size() > 0) {
+    op_problem.set_csr_constraint_matrix(view.get_constraint_matrix_values().data(),
+                                         view.get_constraint_matrix_values().size(),
+                                         view.get_constraint_matrix_indices().data(),
+                                         view.get_constraint_matrix_indices().size(),
+                                         view.get_constraint_matrix_offsets().data(),
+                                         view.get_constraint_matrix_offsets().size());
+  }
 
   if (view.get_constraint_bounds().size() != 0) {
     op_problem.set_constraint_bounds(view.get_constraint_bounds().data(),
diff --git a/python/cuopt/cuopt/linear_programming/__init__.py b/python/cuopt/cuopt/linear_programming/__init__.py
index 2655dcc1c..233161865 100644
--- a/python/cuopt/cuopt/linear_programming/__init__.py
+++ b/python/cuopt/cuopt/linear_programming/__init__.py
@@ -2,7 +2,6 @@
 # SPDX-License-Identifier: Apache-2.0
 
 from cuopt.linear_programming import internals
-from cuopt.linear_programming import solver_settings
 from cuopt.linear_programming.data_model import DataModel
 from cuopt.linear_programming.problem import Problem
 from cuopt.linear_programming.solution import Solution

From fd178e6aba6b9d874b56ab54dec63c55d6b39242 Mon Sep 17 00:00:00 2001
From: Trevor McKay <tmgithub1@gmail.com>
Date: Wed, 28 Jan 2026 19:05:38 -0500
Subject: [PATCH 09/22] check_style fix for copyright

---
 python/cuopt/cuopt/linear_programming/__init__.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/python/cuopt/cuopt/linear_programming/__init__.py b/python/cuopt/cuopt/linear_programming/__init__.py
index 233161865..d267c2171 100644
--- a/python/cuopt/cuopt/linear_programming/__init__.py
+++ b/python/cuopt/cuopt/linear_programming/__init__.py
@@ -1,4 +1,4 @@
-# SPDX-FileCopyrightText: Copyright (c) 2023-2026, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+# SPDX-FileCopyrightText: Copyright (c) 2023-2025 NVIDIA CORPORATION & AFFILIATES. All rights reserved.
 # SPDX-License-Identifier: Apache-2.0
 
 from cuopt.linear_programming import internals

From a140c2034db0d07e068588dc33b513ba6c8b85c9 Mon Sep 17 00:00:00 2001
From: Trevor McKay <tmgithub1@gmail.com>
Date: Wed, 28 Jan 2026 22:03:46 -0500
Subject: [PATCH 10/22] add fixes for CI tests (emmpty problems)

---
 cpp/src/linear_programming/solve.cu | 5 ++++-
 cpp/src/mip/solve.cu                | 4 +++-
 2 files changed, 7 insertions(+), 2 deletions(-)

diff --git a/cpp/src/linear_programming/solve.cu b/cpp/src/linear_programming/solve.cu
index 92eeef6db..2d6daae04 100644
--- a/cpp/src/linear_programming/solve.cu
+++ b/cpp/src/linear_programming/solve.cu
@@ -1319,7 +1319,9 @@ static data_model_view_t<i_t, f_t> create_view_from_mps_data_model(
 
   view.set_maximize(mps_data_model.get_sense());
 
-  if (!mps_data_model.get_constraint_matrix_values().empty()) {
+  // Always set constraint matrix if offsets exist (even for empty problems with 0 constraints)
+  // Validation requires at least offsets=[0] to be set
+  if (!mps_data_model.get_constraint_matrix_offsets().empty()) {
     view.set_csr_constraint_matrix(mps_data_model.get_constraint_matrix_values().data(),
                                    mps_data_model.get_constraint_matrix_values().size(),
                                    mps_data_model.get_constraint_matrix_indices().data(),
@@ -1426,6 +1428,7 @@ optimization_problem_t<i_t, f_t> data_model_view_to_optimization_problem(
   optimization_problem_t<i_t, f_t> op_problem(handle_ptr);
   op_problem.set_maximize(view.get_sense());
 
+  // Set constraint matrix if offsets are present (includes empty problems with offsets=[0])
   if (view.get_constraint_matrix_offsets().size() > 0) {
     op_problem.set_csr_constraint_matrix(view.get_constraint_matrix_values().data(),
                                          view.get_constraint_matrix_values().size(),
diff --git a/cpp/src/mip/solve.cu b/cpp/src/mip/solve.cu
index c57c6ce2c..ee5780c5b 100644
--- a/cpp/src/mip/solve.cu
+++ b/cpp/src/mip/solve.cu
@@ -296,7 +296,9 @@ static data_model_view_t<i_t, f_t> create_view_from_mps_data_model(
 
   view.set_maximize(mps_data_model.get_sense());
 
-  if (!mps_data_model.get_constraint_matrix_values().empty()) {
+  // Always set constraint matrix if offsets exist (even for empty problems with 0 constraints)
+  // Validation requires at least offsets=[0] to be set
+  if (!mps_data_model.get_constraint_matrix_offsets().empty()) {
     view.set_csr_constraint_matrix(mps_data_model.get_constraint_matrix_values().data(),
                                    mps_data_model.get_constraint_matrix_values().size(),
                                    mps_data_model.get_constraint_matrix_indices().data(),

From 6bc8419099f1eda5b5a171f09471b775a0e4ded9 Mon Sep 17 00:00:00 2001
From: Trevor McKay <tmgithub1@gmail.com>
Date: Wed, 28 Jan 2026 23:38:57 -0500
Subject: [PATCH 11/22] Add comprehensive unit tests for memory model changes

Adds ~39 new unit tests to validate memory model infrastructure:

C++ tests:
- lp_solution_memory_test.cu: LP solution memory handling (4 tests)
- memory_model_infrastructure_test.cu: Remote solve config, data model
  views, view conversions, and remote solve stubs (20 tests)
- mip_solution_memory_test.cu: MIP solution memory handling (5 tests)

Python tests:
- test_memory_model.py: Lazy imports, remote solve triggering, circular
  import prevention (10 tests)

Test coverage includes:
- Solution memory handling (host vs device)
- Remote solve configuration detection
- Data model view memory flags and conversions
- Remote solve stub behavior (returns host memory)
- Python lazy loading to avoid CUDA on CPU-only hosts
- Cython buffer routing for dual host/device storage
---
 cpp/tests/linear_programming/CMakeLists.txt   |   2 +
 .../unit_tests/lp_solution_memory_test.cu     | 113 ++++++
 .../memory_model_infrastructure_test.cu       | 368 ++++++++++++++++++
 cpp/tests/mip/CMakeLists.txt                  |   1 +
 cpp/tests/mip/mip_solution_memory_test.cu     | 119 ++++++
 .../linear_programming/test_memory_model.py   | 259 ++++++++++++
 6 files changed, 862 insertions(+)
 create mode 100644 cpp/tests/linear_programming/unit_tests/lp_solution_memory_test.cu
 create mode 100644 cpp/tests/linear_programming/unit_tests/memory_model_infrastructure_test.cu
 create mode 100644 cpp/tests/mip/mip_solution_memory_test.cu
 create mode 100644 python/cuopt/cuopt/tests/linear_programming/test_memory_model.py

diff --git a/cpp/tests/linear_programming/CMakeLists.txt b/cpp/tests/linear_programming/CMakeLists.txt
index c091751f9..193f1b1dc 100644
--- a/cpp/tests/linear_programming/CMakeLists.txt
+++ b/cpp/tests/linear_programming/CMakeLists.txt
@@ -6,6 +6,8 @@
 ConfigureTest(LP_UNIT_TEST
     ${CMAKE_CURRENT_SOURCE_DIR}/unit_tests/optimization_problem_test.cu
     ${CMAKE_CURRENT_SOURCE_DIR}/unit_tests/solver_settings_test.cu
+    ${CMAKE_CURRENT_SOURCE_DIR}/unit_tests/lp_solution_memory_test.cu
+    ${CMAKE_CURRENT_SOURCE_DIR}/unit_tests/memory_model_infrastructure_test.cu
 )# ##################################################################################################
 # - Linear programming PDLP tests ----------------------------------------------------------------------
 ConfigureTest(PDLP_TEST
diff --git a/cpp/tests/linear_programming/unit_tests/lp_solution_memory_test.cu b/cpp/tests/linear_programming/unit_tests/lp_solution_memory_test.cu
new file mode 100644
index 000000000..2222cec5e
--- /dev/null
+++ b/cpp/tests/linear_programming/unit_tests/lp_solution_memory_test.cu
@@ -0,0 +1,113 @@
+/* clang-format off */
+/*
+ * SPDX-FileCopyrightText: Copyright (c) 2026, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+ * SPDX-License-Identifier: Apache-2.0
+ */
+/* clang-format on */
+
+#include <cuopt/error.hpp>
+#include <cuopt/linear_programming/pdlp/solver_solution.hpp>
+
+#include <raft/core/handle.hpp>
+
+#include <gtest/gtest.h>
+
+#include <vector>
+
+namespace {
+
+using cuopt::linear_programming::optimization_problem_solution_t;
+using cuopt::linear_programming::pdlp_termination_status_t;
+
+TEST(pdlp_solution_memory, host_only_accessors_need_coderabbit_patch)
+{
+  // This test validates that EXE_CUOPT_EXPECTS guards are in place
+  // Guards are added in coderabbit_changes.patch
+  optimization_problem_solution_t<int, double> solution(pdlp_termination_status_t::Optimal);
+
+  EXPECT_FALSE(solution.is_device_memory());
+
+  // After applying CodeRabbit patch, these should throw
+  // Currently they don't throw because guards aren't in place yet
+  // EXPECT_THROW(solution.get_primal_solution(), cuopt::logic_error);
+  // EXPECT_THROW(solution.get_dual_solution(), cuopt::logic_error);
+  // EXPECT_THROW(solution.get_reduced_cost(), cuopt::logic_error);
+
+  EXPECT_NO_THROW(solution.get_primal_solution_host());
+  EXPECT_NO_THROW(solution.get_dual_solution_host());
+  EXPECT_NO_THROW(solution.get_reduced_cost_host());
+}
+
+TEST(pdlp_solution_memory, host_solution_with_data)
+{
+  std::vector<double> primal{1.0, 2.0};
+  std::vector<double> dual{0.5};
+  std::vector<double> reduced{0.1, 0.2};
+  std::vector<std::string> var_names{"x0", "x1"};
+  std::vector<std::string> row_names{"c0"};
+
+  typename optimization_problem_solution_t<int, double>::additional_termination_information_t stats;
+  stats.number_of_steps_taken = 10;
+  stats.solve_time            = 1.5;
+
+  optimization_problem_solution_t<int, double> solution(std::move(primal),
+                                                        std::move(dual),
+                                                        std::move(reduced),
+                                                        std::string("OBJ"),
+                                                        var_names,
+                                                        row_names,
+                                                        stats,
+                                                        pdlp_termination_status_t::Optimal);
+
+  EXPECT_FALSE(solution.is_device_memory());
+  EXPECT_EQ(solution.get_primal_solution_host().size(), 2);
+  EXPECT_EQ(solution.get_dual_solution_host().size(), 1);
+  EXPECT_EQ(solution.get_reduced_cost_host().size(), 2);
+  EXPECT_DOUBLE_EQ(solution.get_primal_solution_host()[0], 1.0);
+  EXPECT_DOUBLE_EQ(solution.get_primal_solution_host()[1], 2.0);
+}
+
+TEST(pdlp_solution_memory, device_only_accessors_need_coderabbit_patch)
+{
+  // This test validates that EXE_CUOPT_EXPECTS guards are in place
+  // Guards are added in coderabbit_changes.patch
+  raft::handle_t handle;
+  rmm::device_uvector<double> primal(2, handle.get_stream());
+  rmm::device_uvector<double> dual(1, handle.get_stream());
+  rmm::device_uvector<double> reduced(2, handle.get_stream());
+  std::vector<std::string> var_names{"x0", "x1"};
+  std::vector<std::string> row_names{"c0"};
+
+  typename optimization_problem_solution_t<int, double>::additional_termination_information_t stats;
+
+  optimization_problem_solution_t<int, double> solution(primal,
+                                                        dual,
+                                                        reduced,
+                                                        std::string("OBJ"),
+                                                        var_names,
+                                                        row_names,
+                                                        stats,
+                                                        pdlp_termination_status_t::Optimal);
+
+  EXPECT_TRUE(solution.is_device_memory());
+  EXPECT_NO_THROW(solution.get_primal_solution());
+  EXPECT_NO_THROW(solution.get_dual_solution());
+  EXPECT_NO_THROW(solution.get_reduced_cost());
+
+  // After applying CodeRabbit patch, these should throw
+  // Currently they don't throw because guards aren't in place yet
+  // EXPECT_THROW(solution.get_primal_solution_host(), cuopt::logic_error);
+  // EXPECT_THROW(solution.get_dual_solution_host(), cuopt::logic_error);
+  // EXPECT_THROW(solution.get_reduced_cost_host(), cuopt::logic_error);
+}
+
+TEST(pdlp_solution_memory, solved_by_pdlp_tracks_termination_stats)
+{
+  optimization_problem_solution_t<int, double> solution(pdlp_termination_status_t::Optimal);
+
+  EXPECT_TRUE(solution.get_solved_by_pdlp());
+  solution.set_solved_by_pdlp(false);
+  EXPECT_FALSE(solution.get_solved_by_pdlp());
+}
+
+}  // namespace
diff --git a/cpp/tests/linear_programming/unit_tests/memory_model_infrastructure_test.cu b/cpp/tests/linear_programming/unit_tests/memory_model_infrastructure_test.cu
new file mode 100644
index 000000000..c3de1f1d4
--- /dev/null
+++ b/cpp/tests/linear_programming/unit_tests/memory_model_infrastructure_test.cu
@@ -0,0 +1,368 @@
+/* clang-format off */
+/*
+ * SPDX-FileCopyrightText: Copyright (c) 2026, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+ * SPDX-License-Identifier: Apache-2.0
+ */
+/* clang-format on */
+
+#include <cuopt/linear_programming/data_model_view.hpp>
+#include <cuopt/linear_programming/mip/solver_solution.hpp>
+#include <cuopt/linear_programming/pdlp/solver_solution.hpp>
+#include <cuopt/linear_programming/solve.hpp>
+#include <cuopt/linear_programming/utilities/remote_solve.hpp>
+#include <mps_parser/data_model_view.hpp>
+#include <mps_parser/mps_data_model.hpp>
+
+#include <raft/core/handle.hpp>
+
+#include <gtest/gtest.h>
+
+#include <cstdlib>
+#include <vector>
+
+namespace cuopt::linear_programming::test {
+
+using cuopt::linear_programming::data_model_view_t;
+using cuopt::linear_programming::mip_solution_t;
+using cuopt::linear_programming::mip_solver_settings_t;
+using cuopt::linear_programming::optimization_problem_solution_t;
+using cuopt::linear_programming::pdlp_solver_settings_t;
+using cuopt::mps_parser::mps_data_model_t;
+
+// ============================================================================
+// Remote Solve Configuration Tests
+// ============================================================================
+
+class RemoteSolveConfigTest : public ::testing::Test {
+ protected:
+  void SetUp() override
+  {
+    // Clean environment before each test
+    unsetenv("CUOPT_REMOTE_HOST");
+    unsetenv("CUOPT_REMOTE_PORT");
+  }
+
+  void TearDown() override
+  {
+    // Clean environment after each test
+    unsetenv("CUOPT_REMOTE_HOST");
+    unsetenv("CUOPT_REMOTE_PORT");
+  }
+};
+
+TEST_F(RemoteSolveConfigTest, valid_configuration)
+{
+  setenv("CUOPT_REMOTE_HOST", "example.com", 1);
+  setenv("CUOPT_REMOTE_PORT", "8080", 1);
+
+  auto config = get_remote_solve_config();
+  ASSERT_TRUE(config.has_value());
+  EXPECT_EQ(config->host, "example.com");
+  EXPECT_EQ(config->port, 8080);
+  EXPECT_TRUE(is_remote_solve_enabled());
+}
+
+TEST_F(RemoteSolveConfigTest, missing_host)
+{
+  setenv("CUOPT_REMOTE_PORT", "8080", 1);
+
+  auto config = get_remote_solve_config();
+  EXPECT_FALSE(config.has_value());
+  EXPECT_FALSE(is_remote_solve_enabled());
+}
+
+TEST_F(RemoteSolveConfigTest, missing_port)
+{
+  setenv("CUOPT_REMOTE_HOST", "example.com", 1);
+
+  auto config = get_remote_solve_config();
+  EXPECT_FALSE(config.has_value());
+  EXPECT_FALSE(is_remote_solve_enabled());
+}
+
+TEST_F(RemoteSolveConfigTest, empty_host_string)
+{
+  setenv("CUOPT_REMOTE_HOST", "", 1);
+  setenv("CUOPT_REMOTE_PORT", "8080", 1);
+
+  auto config = get_remote_solve_config();
+  EXPECT_FALSE(config.has_value());
+}
+
+TEST_F(RemoteSolveConfigTest, empty_port_string)
+{
+  setenv("CUOPT_REMOTE_HOST", "example.com", 1);
+  setenv("CUOPT_REMOTE_PORT", "", 1);
+
+  auto config = get_remote_solve_config();
+  EXPECT_FALSE(config.has_value());
+}
+
+TEST_F(RemoteSolveConfigTest, invalid_port_non_numeric)
+{
+  setenv("CUOPT_REMOTE_HOST", "example.com", 1);
+  setenv("CUOPT_REMOTE_PORT", "not_a_number", 1);
+
+  auto config = get_remote_solve_config();
+  EXPECT_FALSE(config.has_value());
+}
+
+TEST_F(RemoteSolveConfigTest, port_zero_needs_validation_patch)
+{
+  setenv("CUOPT_REMOTE_HOST", "example.com", 1);
+  setenv("CUOPT_REMOTE_PORT", "0", 1);
+
+  auto config = get_remote_solve_config();
+  // Port 0 validation is added in CodeRabbit patch
+  // Without patch, this returns valid config (will be fixed)
+  EXPECT_TRUE(config.has_value());  // Will be FALSE after patch applied
+}
+
+TEST_F(RemoteSolveConfigTest, port_negative_parsed_as_large)
+{
+  setenv("CUOPT_REMOTE_HOST", "example.com", 1);
+  setenv("CUOPT_REMOTE_PORT", "-1", 1);
+
+  auto config = get_remote_solve_config();
+  // stoi("-1") succeeds but port validation will catch it with patch
+  EXPECT_TRUE(config.has_value());  // Will be FALSE after patch applied
+}
+
+TEST_F(RemoteSolveConfigTest, port_too_large_needs_validation_patch)
+{
+  setenv("CUOPT_REMOTE_HOST", "example.com", 1);
+  setenv("CUOPT_REMOTE_PORT", "99999", 1);
+
+  auto config = get_remote_solve_config();
+  // Port > 65535 validation is added in CodeRabbit patch
+  EXPECT_TRUE(config.has_value());  // Will be FALSE after patch applied
+}
+
+TEST_F(RemoteSolveConfigTest, valid_port_boundaries)
+{
+  setenv("CUOPT_REMOTE_HOST", "example.com", 1);
+
+  // Test port 1 (minimum valid)
+  setenv("CUOPT_REMOTE_PORT", "1", 1);
+  auto config1 = get_remote_solve_config();
+  ASSERT_TRUE(config1.has_value());
+  EXPECT_EQ(config1->port, 1);
+
+  // Test port 65535 (maximum valid)
+  setenv("CUOPT_REMOTE_PORT", "65535", 1);
+  auto config2 = get_remote_solve_config();
+  ASSERT_TRUE(config2.has_value());
+  EXPECT_EQ(config2->port, 65535);
+
+  // Test common gRPC port
+  setenv("CUOPT_REMOTE_PORT", "50051", 1);
+  auto config3 = get_remote_solve_config();
+  ASSERT_TRUE(config3.has_value());
+  EXPECT_EQ(config3->port, 50051);
+}
+
+// ============================================================================
+// Data Model View Tests
+// ============================================================================
+
+TEST(DataModelViewMemory, cpu_memory_flag)
+{
+  data_model_view_t<int, double> view;
+
+  // Default is false (CPU memory) - views are agnostic by default
+  EXPECT_FALSE(view.is_device_memory());
+
+  // Can be set to device (GPU) memory
+  view.set_is_device_memory(true);
+  EXPECT_TRUE(view.is_device_memory());
+
+  // Can be changed back to host
+  view.set_is_device_memory(false);
+  EXPECT_FALSE(view.is_device_memory());
+}
+
+TEST(DataModelViewMemory, empty_constraint_matrix_handling)
+{
+  data_model_view_t<int, double> view;
+
+  // Test with truly empty arrays (0 constraints)
+  std::vector<double> values;
+  std::vector<int> indices;
+  std::vector<int> offsets{0};
+
+  EXPECT_NO_THROW(
+    view.set_csr_constraint_matrix(values.data(), 0, indices.data(), 0, offsets.data(), 1));
+}
+
+TEST(DataModelViewConversion, empty_constraint_matrix_to_optimization_problem)
+{
+  raft::handle_t handle;
+  data_model_view_t<int, double> view;
+
+  // Create a view with no constraints (empty problem)
+  std::vector<double> empty_values;
+  std::vector<int> empty_indices;
+  std::vector<int> empty_offsets{0};
+  std::vector<double> obj{1.0};
+
+  view.set_csr_constraint_matrix(
+    empty_values.data(), 0, empty_indices.data(), 0, empty_offsets.data(), 1);
+  view.set_objective_coefficients(obj.data(), 1);
+  view.set_is_device_memory(false);
+
+  // This should not throw - the fix for empty constraint matrices
+  EXPECT_NO_THROW({ auto op_problem = data_model_view_to_optimization_problem(&handle, view); });
+}
+
+TEST(DataModelViewConversion, view_from_cpu_data_marked_as_host)
+{
+  data_model_view_t<int, double> view;
+
+  // Set up minimal problem with CPU-side data
+  std::vector<double> values{1.0};
+  std::vector<int> indices{0};
+  std::vector<int> offsets{0, 1};
+  std::vector<double> bounds{1.0};
+  std::vector<double> obj{1.0};
+
+  view.set_csr_constraint_matrix(values.data(), 1, indices.data(), 1, offsets.data(), 2);
+  view.set_constraint_bounds(bounds.data(), 1);
+  view.set_objective_coefficients(obj.data(), 1);
+
+  // Explicitly mark as CPU memory (for remote solve path)
+  view.set_is_device_memory(false);
+
+  EXPECT_FALSE(view.is_device_memory());
+}
+
+// ============================================================================
+// Data Model View to Optimization Problem Conversion Tests
+// ============================================================================
+
+TEST(DataModelViewToOptimizationProblem, cpu_view_conversion)
+{
+  raft::handle_t handle;
+  data_model_view_t<int, double> view;
+
+  // Set up problem with CPU data
+  std::vector<double> values{1.0, 2.0};
+  std::vector<int> indices{0, 1};
+  std::vector<int> offsets{0, 1, 2};
+  std::vector<double> bounds{5.0, 10.0};
+  std::vector<double> obj{1.0, -1.0};
+
+  view.set_csr_constraint_matrix(values.data(), 2, indices.data(), 2, offsets.data(), 3);
+  view.set_constraint_bounds(bounds.data(), 2);
+  view.set_objective_coefficients(obj.data(), 2);
+  view.set_is_device_memory(false);  // CPU memory
+
+  // Convert to optimization problem
+  EXPECT_NO_THROW({
+    auto op_problem = data_model_view_to_optimization_problem(&handle, view);
+    // If we get here, conversion succeeded with CPU data
+  });
+}
+
+TEST(DataModelViewToOptimizationProblem, gpu_view_conversion)
+{
+  raft::handle_t handle;
+  data_model_view_t<int, double> view;
+
+  // Set up problem with GPU data (simulated with host pointers for test)
+  std::vector<double> values{1.0, 2.0};
+  std::vector<int> indices{0, 1};
+  std::vector<int> offsets{0, 1, 2};
+  std::vector<double> bounds{5.0, 10.0};
+  std::vector<double> obj{1.0, -1.0};
+
+  view.set_csr_constraint_matrix(values.data(), 2, indices.data(), 2, offsets.data(), 3);
+  view.set_constraint_bounds(bounds.data(), 2);
+  view.set_objective_coefficients(obj.data(), 2);
+  view.set_is_device_memory(true);  // GPU memory flag
+
+  // Convert to optimization problem
+  EXPECT_NO_THROW({
+    auto op_problem = data_model_view_to_optimization_problem(&handle, view);
+    // If we get here, conversion succeeded
+  });
+}
+
+TEST(DataModelViewToOptimizationProblem, empty_constraints_cpu_view)
+{
+  // Test the fix for empty constraint matrices with CPU memory
+  raft::handle_t handle;
+  data_model_view_t<int, double> view;
+
+  // Empty constraint matrix (0 constraints) - the fix we added
+  std::vector<double> empty_values;
+  std::vector<int> empty_indices;
+  std::vector<int> empty_offsets{0};
+  std::vector<double> obj{1.0, 2.0};
+
+  view.set_csr_constraint_matrix(
+    empty_values.data(), 0, empty_indices.data(), 0, empty_offsets.data(), 1);
+  view.set_objective_coefficients(obj.data(), 2);
+  view.set_is_device_memory(false);  // CPU memory
+
+  // This should not throw with the conditional check fix
+  EXPECT_NO_THROW({ auto op_problem = data_model_view_to_optimization_problem(&handle, view); });
+}
+
+// ============================================================================
+// Remote Solve Stub Tests
+// ============================================================================
+
+TEST(RemoteSolveStub, lp_returns_host_memory_solution)
+{
+  data_model_view_t<int, double> view;
+
+  // Simple problem setup
+  std::vector<double> values{1.0};
+  std::vector<int> indices{0};
+  std::vector<int> offsets{0, 1};
+  std::vector<double> bounds{1.0};
+  std::vector<double> obj{1.0};
+
+  view.set_csr_constraint_matrix(values.data(), 1, indices.data(), 1, offsets.data(), 2);
+  view.set_constraint_bounds(bounds.data(), 1);
+  view.set_objective_coefficients(obj.data(), 1);
+  view.set_is_device_memory(false);
+
+  remote_solve_config_t config{"localhost", 50051};
+  pdlp_solver_settings_t<int, double> settings;
+
+  auto solution = solve_lp_remote(config, view, settings);
+
+  // Stub returns host memory solution
+  EXPECT_FALSE(solution.is_device_memory());
+  EXPECT_EQ(solution.get_termination_status(), pdlp_termination_status_t::Optimal);
+  EXPECT_EQ(solution.get_primal_solution_host().size(), 1);
+  EXPECT_NO_THROW(solution.get_primal_solution_host());
+  EXPECT_NO_THROW(solution.get_dual_solution_host());
+}
+
+TEST(RemoteSolveStub, mip_returns_host_memory_solution)
+{
+  data_model_view_t<int, double> view;
+
+  // Simple MIP setup
+  std::vector<double> obj{1.0, 2.0};
+  std::vector<char> var_types{1, 1};  // Both integers
+
+  view.set_objective_coefficients(obj.data(), 2);
+  view.set_variable_types(var_types.data(), 2);
+  view.set_is_device_memory(false);
+
+  remote_solve_config_t config{"localhost", 50051};
+  mip_solver_settings_t<int, double> settings;
+
+  auto solution = solve_mip_remote(config, view, settings);
+
+  // Stub returns host memory solution
+  EXPECT_FALSE(solution.is_device_memory());
+  EXPECT_EQ(solution.get_termination_status(), mip_termination_status_t::Optimal);
+  EXPECT_EQ(solution.get_solution_host().size(), 2);
+  EXPECT_NO_THROW(solution.get_solution_host());
+}
+
+}  // namespace cuopt::linear_programming::test
diff --git a/cpp/tests/mip/CMakeLists.txt b/cpp/tests/mip/CMakeLists.txt
index ce47f3144..113ff6067 100644
--- a/cpp/tests/mip/CMakeLists.txt
+++ b/cpp/tests/mip/CMakeLists.txt
@@ -29,6 +29,7 @@ ConfigureTest(DOC_EXAMPLE_TEST
 ConfigureTest(UNIT_TEST
     ${CMAKE_CURRENT_SOURCE_DIR}/unit_test.cu
     ${CMAKE_CURRENT_SOURCE_DIR}/integer_with_real_bounds.cu
+    ${CMAKE_CURRENT_SOURCE_DIR}/mip_solution_memory_test.cu
 )
 ConfigureTest(EMPTY_FIXED_PROBLEMS_TEST
     ${CMAKE_CURRENT_SOURCE_DIR}/empty_fixed_problems_test.cu
diff --git a/cpp/tests/mip/mip_solution_memory_test.cu b/cpp/tests/mip/mip_solution_memory_test.cu
new file mode 100644
index 000000000..b3df0eff7
--- /dev/null
+++ b/cpp/tests/mip/mip_solution_memory_test.cu
@@ -0,0 +1,119 @@
+/* clang-format off */
+/*
+ * SPDX-FileCopyrightText: Copyright (c) 2026, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+ * SPDX-License-Identifier: Apache-2.0
+ */
+/* clang-format on */
+
+#include <cuopt/error.hpp>
+#include <cuopt/linear_programming/mip/solver_solution.hpp>
+#include <cuopt/linear_programming/mip/solver_stats.hpp>
+
+#include <raft/core/handle.hpp>
+
+#include <gtest/gtest.h>
+
+#include <string>
+#include <vector>
+
+namespace {
+
+using cuopt::linear_programming::mip_solution_t;
+using cuopt::linear_programming::mip_termination_status_t;
+using cuopt::linear_programming::solver_stats_t;
+
+TEST(mip_solution_memory, host_only_accessors_need_coderabbit_patch)
+{
+  // This test validates that EXE_CUOPT_EXPECTS guards are in place
+  // Guards are added in coderabbit_changes.patch
+  std::vector<double> solution{0.0};
+  std::vector<std::string> var_names{"x0"};
+  solver_stats_t<int, double> stats{};
+
+  mip_solution_t<int, double> mip_solution(std::move(solution),
+                                           std::move(var_names),
+                                           0.0,
+                                           0.0,
+                                           mip_termination_status_t::Optimal,
+                                           0.0,
+                                           0.0,
+                                           0.0,
+                                           stats);
+
+  EXPECT_FALSE(mip_solution.is_device_memory());
+  // After applying CodeRabbit patch, this should throw
+  // EXPECT_THROW(mip_solution.get_solution(), cuopt::logic_error);
+  EXPECT_NO_THROW(mip_solution.get_solution_host());
+}
+
+TEST(mip_solution_memory, host_solution_with_multiple_variables)
+{
+  std::vector<double> solution{1.0, 0.0, 1.0};
+  std::vector<std::string> var_names{"x0", "x1", "x2"};
+  solver_stats_t<int, double> stats{};
+  stats.total_solve_time = 0.5;
+  stats.num_nodes        = 10;
+
+  mip_solution_t<int, double> mip_solution(std::move(solution),
+                                           std::move(var_names),
+                                           15.0,  // objective
+                                           0.0,   // mip_gap
+                                           mip_termination_status_t::Optimal,
+                                           0.0,  // max_constraint_violation
+                                           0.0,  // max_int_violation
+                                           0.0,  // max_variable_bound_violation
+                                           stats);
+
+  EXPECT_FALSE(mip_solution.is_device_memory());
+  EXPECT_EQ(mip_solution.get_solution_host().size(), 3);
+  EXPECT_DOUBLE_EQ(mip_solution.get_solution_host()[0], 1.0);
+  EXPECT_DOUBLE_EQ(mip_solution.get_solution_host()[1], 0.0);
+  EXPECT_DOUBLE_EQ(mip_solution.get_solution_host()[2], 1.0);
+  EXPECT_DOUBLE_EQ(mip_solution.get_objective_value(), 15.0);
+}
+
+TEST(mip_solution_memory, device_only_accessors_need_coderabbit_patch)
+{
+  // This test validates that EXE_CUOPT_EXPECTS guards are in place
+  // Guards are added in coderabbit_changes.patch
+  raft::handle_t handle;
+  rmm::device_uvector<double> solution(3, handle.get_stream());
+  std::vector<std::string> var_names{"x0", "x1", "x2"};
+  solver_stats_t<int, double> stats{};
+
+  mip_solution_t<int, double> mip_solution(std::move(solution),
+                                           std::move(var_names),
+                                           10.0,  // objective
+                                           0.0,   // mip_gap
+                                           mip_termination_status_t::Optimal,
+                                           0.0,  // max_constraint_violation
+                                           0.0,  // max_int_violation
+                                           0.0,  // max_variable_bound_violation
+                                           stats);
+
+  EXPECT_TRUE(mip_solution.is_device_memory());
+  EXPECT_NO_THROW(mip_solution.get_solution());
+  // After applying CodeRabbit patch, this should throw
+  // EXPECT_THROW(mip_solution.get_solution_host(), cuopt::logic_error);
+  EXPECT_EQ(mip_solution.get_solution().size(), 3);
+}
+
+TEST(mip_solution_memory, termination_status_only_constructor)
+{
+  solver_stats_t<int, double> stats{};
+  mip_solution_t<int, double> solution(mip_termination_status_t::Infeasible, stats);
+
+  EXPECT_FALSE(solution.is_device_memory());
+  EXPECT_EQ(solution.get_termination_status(), mip_termination_status_t::Infeasible);
+}
+
+TEST(mip_solution_memory, error_constructor)
+{
+  cuopt::logic_error error("Test error", cuopt::error_type_t::RuntimeError);
+  mip_solution_t<int, double> solution(error);
+
+  EXPECT_FALSE(solution.is_device_memory());
+  EXPECT_EQ(solution.get_termination_status(), mip_termination_status_t::NoTermination);
+}
+
+}  // namespace
diff --git a/python/cuopt/cuopt/tests/linear_programming/test_memory_model.py b/python/cuopt/cuopt/tests/linear_programming/test_memory_model.py
new file mode 100644
index 000000000..7432c480e
--- /dev/null
+++ b/python/cuopt/cuopt/tests/linear_programming/test_memory_model.py
@@ -0,0 +1,259 @@
+# SPDX-FileCopyrightText: Copyright (c) 2026 NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+# SPDX-License-Identifier: Apache-2.0
+
+"""
+Tests for memory model functionality including remote solve configuration,
+lazy loading, and host/device memory handling.
+"""
+
+import os
+
+import numpy as np
+import pytest
+
+from cuopt.linear_programming import DataModel, Solve, SolverSettings
+from cuopt.linear_programming.solver_settings import SolverMethod
+
+
+class TestLazyModuleLoading:
+    """Test that cuopt modules can be lazily loaded without triggering CUDA initialization."""
+
+    def test_import_cuopt_without_submodules(self):
+        """Test that importing cuopt doesn't immediately load submodules."""
+        # This test verifies the __getattr__ mechanism works
+        import cuopt
+
+        # These should be available via lazy loading
+        assert hasattr(cuopt, "linear_programming")
+        assert hasattr(cuopt, "routing")
+
+    def test_submodules_in_dir(self):
+        """Test that submodules appear in dir() output."""
+        import cuopt
+
+        dir_contents = dir(cuopt)
+        assert "linear_programming" in dir_contents
+        assert "routing" in dir_contents
+
+    def test_lazy_import_caches_module(self):
+        """Test that lazy imports are cached in globals."""
+        import cuopt
+
+        # First access loads and caches
+        lp = cuopt.linear_programming
+
+        # Second access should return same object (cached)
+        lp2 = cuopt.linear_programming
+        assert lp is lp2
+
+
+class TestRemoteSolveEnvironment:
+    """Test remote solve environment variable detection and handling."""
+
+    def setup_method(self):
+        """Clean up environment before each test."""
+        for var in ["CUOPT_REMOTE_HOST", "CUOPT_REMOTE_PORT"]:
+            if var in os.environ:
+                del os.environ[var]
+
+    def teardown_method(self):
+        """Clean up environment after each test."""
+        for var in ["CUOPT_REMOTE_HOST", "CUOPT_REMOTE_PORT"]:
+            if var in os.environ:
+                del os.environ[var]
+
+    def test_local_solve_by_default(self):
+        """Test that solve works without remote environment variables (local GPU solve)."""
+        data_model_obj = DataModel()
+
+        # Simple LP: minimize x subject to x >= 1
+        A_values = np.array([1.0])
+        A_indices = np.array([0])
+        A_offsets = np.array([0, 1])
+        data_model_obj.set_csr_constraint_matrix(
+            A_values, A_indices, A_offsets
+        )
+
+        b = np.array([1.0])
+        data_model_obj.set_constraint_bounds(b)
+
+        c = np.array([1.0])
+        data_model_obj.set_objective_coefficients(c)
+
+        row_types = np.array(["G"])
+        data_model_obj.set_row_types(row_types)
+
+        settings = SolverSettings()
+        settings.set_parameter("method", SolverMethod.DualSimplex)
+
+        solution = Solve(data_model_obj, settings)
+
+        assert solution.get_termination_reason() == "Optimal"
+        assert solution.get_primal_solution()[0] == pytest.approx(1.0)
+
+    def test_remote_solve_stub_with_env_vars(self):
+        """Test that remote solve path is triggered and returns host memory data."""
+        os.environ["CUOPT_REMOTE_HOST"] = "localhost"
+        os.environ["CUOPT_REMOTE_PORT"] = "50051"
+
+        data_model_obj = DataModel()
+
+        # Simple LP: minimize x subject to x >= 1
+        A_values = np.array([1.0])
+        A_indices = np.array([0])
+        A_offsets = np.array([0, 1])
+        data_model_obj.set_csr_constraint_matrix(
+            A_values, A_indices, A_offsets
+        )
+
+        b = np.array([1.0])
+        data_model_obj.set_constraint_bounds(b)
+
+        c = np.array([1.0])
+        data_model_obj.set_objective_coefficients(c)
+
+        row_types = np.array(["G"])
+        data_model_obj.set_row_types(row_types)
+
+        settings = SolverSettings()
+        settings.set_parameter("method", SolverMethod.DualSimplex)
+
+        # Remote solve stub should return a solution (all zeros currently)
+        solution = Solve(data_model_obj, settings)
+
+        # Verify remote solve path was taken (stub returns Optimal with zeros)
+        assert solution.get_termination_reason() == "Optimal"
+
+        # Stub returns zeros (not actual solution), but data should be accessible
+        primal = solution.get_primal_solution()
+        assert isinstance(primal, np.ndarray)
+        assert len(primal) == 1
+        assert primal[0] == pytest.approx(0.0)  # Stub value
+
+        # Verify we can access other solution components (host memory)
+        dual = solution.get_dual_solution()
+        assert isinstance(dual, np.ndarray)
+
+    def test_remote_solve_mip_stub_with_env_vars(self):
+        """Test that remote solve path works for MIP and returns host memory data."""
+        os.environ["CUOPT_REMOTE_HOST"] = "localhost"
+        os.environ["CUOPT_REMOTE_PORT"] = "50051"
+
+        data_model_obj = DataModel()
+
+        # Simple MIP: maximize x subject to x <= 10, x integer
+        A_values = np.array([1.0])
+        A_indices = np.array([0])
+        A_offsets = np.array([0, 1])
+        data_model_obj.set_csr_constraint_matrix(
+            A_values, A_indices, A_offsets
+        )
+
+        b = np.array([10.0])
+        data_model_obj.set_constraint_bounds(b)
+
+        c = np.array([1.0])
+        data_model_obj.set_objective_coefficients(c)
+
+        row_types = np.array(["L"])
+        data_model_obj.set_row_types(row_types)
+
+        var_types = np.array([1])  # Integer
+        data_model_obj.set_variable_types(var_types)
+
+        data_model_obj.set_maximize(True)
+
+        settings = SolverSettings()
+
+        # Remote solve stub should return a solution
+        solution = Solve(data_model_obj, settings)
+
+        # Verify remote solve path was taken
+        assert solution.get_termination_reason() == "Optimal"
+
+        # Stub returns zeros, but data should be accessible from host memory
+        sol = solution.get_primal_solution()
+        assert isinstance(sol, np.ndarray)
+        assert len(sol) == 1
+        assert sol[0] == pytest.approx(0.0)  # Stub value
+
+
+class TestEmptyConstraintMatrix:
+    """Test handling of problems with no constraints (edge case for memory model)."""
+
+    def test_empty_problem_with_objective_offset(self):
+        """Test problem with no variables or constraints, only objective offset."""
+        import cuopt_mps_parser
+
+        mps_path = os.path.join(
+            os.path.dirname(__file__),
+            "../../../../datasets/mip/empty-problem-obj.mps",
+        )
+
+        if not os.path.exists(mps_path):
+            pytest.skip(f"Test dataset not found: {mps_path}")
+
+        data_model_obj = cuopt_mps_parser.MPS_Parser.parse_file(mps_path)
+        settings = SolverSettings()
+        settings.set_parameter("time_limit", 5.0)
+
+        solution = Solve(data_model_obj, settings)
+
+        assert solution.get_termination_reason() == "Optimal"
+        assert solution.get_primal_objective() == pytest.approx(81.0, abs=1e-3)
+
+    def test_empty_problem_with_variables(self):
+        """Test problem with variables but no constraints."""
+        import cuopt_mps_parser
+
+        mps_path = os.path.join(
+            os.path.dirname(__file__),
+            "../../../../datasets/mip/empty-problem-objective-vars.mps",
+        )
+
+        if not os.path.exists(mps_path):
+            pytest.skip(f"Test dataset not found: {mps_path}")
+
+        data_model_obj = cuopt_mps_parser.MPS_Parser.parse_file(mps_path)
+        settings = SolverSettings()
+        settings.set_parameter("time_limit", 5.0)
+
+        solution = Solve(data_model_obj, settings)
+
+        assert solution.get_termination_reason() == "Optimal"
+        assert solution.get_primal_objective() == pytest.approx(-2.0, abs=1e-3)
+
+
+class TestCircularImportPrevention:
+    """Test that circular import issues are resolved."""
+
+    def test_direct_import_solver_wrapper(self):
+        """Test that solver_wrapper can be imported directly without circular dependency."""
+        try:
+            from cuopt.linear_programming.solver.solver_wrapper import (
+                ErrorStatus,
+                LPTerminationStatus,
+                MILPTerminationStatus,
+            )
+
+            # If we get here without ImportError, the circular dependency is resolved
+            assert ErrorStatus is not None
+            assert LPTerminationStatus is not None
+            assert MILPTerminationStatus is not None
+        except ImportError as e:
+            pytest.fail(f"Circular import detected: {e}")
+
+    def test_import_order_independence(self):
+        """Test that imports work regardless of order."""
+        # These imports should work in any order without circular dependency
+        from cuopt.linear_programming import SolverSettings
+        from cuopt.linear_programming.solver_settings import (
+            PDLPSolverMode,
+            SolverMethod,
+        )
+        from cuopt.linear_programming import Solve
+
+        assert SolverSettings is not None
+        assert PDLPSolverMode is not None
+        assert SolverMethod is not None
+        assert Solve is not None

From 780ac29db6dbbe057d6d5a7d505c5eada69ee622 Mon Sep 17 00:00:00 2001
From: Trevor McKay <tmgithub1@gmail.com>
Date: Thu, 29 Jan 2026 07:32:41 -0500
Subject: [PATCH 12/22] copyright check_style issues

---
 cpp/tests/linear_programming/CMakeLists.txt | 2 +-
 cpp/tests/mip/CMakeLists.txt                | 2 +-
 2 files changed, 2 insertions(+), 2 deletions(-)

diff --git a/cpp/tests/linear_programming/CMakeLists.txt b/cpp/tests/linear_programming/CMakeLists.txt
index 193f1b1dc..0abfc04fe 100644
--- a/cpp/tests/linear_programming/CMakeLists.txt
+++ b/cpp/tests/linear_programming/CMakeLists.txt
@@ -1,5 +1,5 @@
 # cmake-format: off
-# SPDX-FileCopyrightText: Copyright (c) 2024-2025 NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+# SPDX-FileCopyrightText: Copyright (c) 2024-2026, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
 # SPDX-License-Identifier: Apache-2.0
 # cmake-format: on
 
diff --git a/cpp/tests/mip/CMakeLists.txt b/cpp/tests/mip/CMakeLists.txt
index 113ff6067..f9e5ea458 100644
--- a/cpp/tests/mip/CMakeLists.txt
+++ b/cpp/tests/mip/CMakeLists.txt
@@ -1,5 +1,5 @@
 # cmake-format: off
-# SPDX-FileCopyrightText: Copyright (c) 2025 NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+# SPDX-FileCopyrightText: Copyright (c) 2025-2026, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
 # SPDX-License-Identifier: Apache-2.0
 # cmake-format: on
 

From 249d8e2539eca46d3fea00bf6f69e43c4289defe Mon Sep 17 00:00:00 2001
From: Trevor McKay <tmgithub1@gmail.com>
Date: Thu, 29 Jan 2026 10:09:54 -0500
Subject: [PATCH 13/22] implement CodeRabbit suggestions on the PR

---
 MEMORY_MODEL_SUMMARY.md                       | 38 +++++++++---------
 .../mip/solver_solution.hpp                   | 33 +++++++++++++++-
 .../pdlp/solver_solution.hpp                  |  5 +--
 .../cuopt/linear_programming/solve.hpp        |  4 +-
 .../utilities/remote_solve.hpp                |  1 +
 cpp/src/linear_programming/solve.cu           | 39 ++++++++++---------
 cpp/src/linear_programming/solver_solution.cu | 37 +++++++++++++++++-
 .../utilities/cython_solve.cu                 |  3 +-
 cpp/src/mip/solve.cu                          | 13 ++++---
 cpp/src/mip/solver_solution.cu                |  8 ++++
 .../memory_model_infrastructure_test.cu       | 30 ++++++++++++--
 python/cuopt/cuopt/__init__.py                |  6 ++-
 .../linear_programming/test_memory_model.py   | 14 +++++--
 13 files changed, 168 insertions(+), 63 deletions(-)

diff --git a/MEMORY_MODEL_SUMMARY.md b/MEMORY_MODEL_SUMMARY.md
index 620af2a2b..a6b6b1522 100644
--- a/MEMORY_MODEL_SUMMARY.md
+++ b/MEMORY_MODEL_SUMMARY.md
@@ -2,16 +2,16 @@
 
 This document describes how memory is handled for **local** vs **remote** solves.
 
- ## Core idea
+## Core idea
 
- The solver now supports **two memory modes** for problem input and solution output:
+The solver now supports **two memory modes** for problem input and solution output:
 
 - **Device (GPU) memory**: used for local solves.
 - **Host (CPU) memory**: used for remote solves.
 
- A non-owning `data_model_view_t` (host or device) is the entry point that drives the path:
- - Device view → local GPU solve
- - Host view + `CUOPT_REMOTE_*` → remote solve path
+A non-owning `data_model_view_t` (host or device) is the entry point that drives the path:
+- Device view → local GPU solve
+- Host view + `CUOPT_REMOTE_*` → remote solve path
 
 ## Local solve (GPU memory)
 
@@ -32,20 +32,20 @@ This document describes how memory is handled for **local** vs **remote** solves
 - The solution is wrapped into `rmm::device_buffer` and converted to NumPy arrays via
   `series_from_buf`.
 
- **CLI (`cpp/cuopt_cli.cpp`)**:
- - Initializes CUDA/RMM for local solve paths.
- - Uses `raft::handle_t` and GPU memory as usual.
+**CLI (`cpp/cuopt_cli.cpp`)**:
+- Initializes CUDA/RMM for local solve paths.
+- Uses `raft::handle_t` and GPU memory as usual.
 
 ## Remote solve (CPU memory)
 
 Remote solve is enabled when **both** `CUOPT_REMOTE_HOST` and `CUOPT_REMOTE_PORT` are set.
 This is detected early in the solve path.
 
- **C++ entry points**:
- - `solve_lp` / `solve_mip` check `get_remote_solve_config()` first.
- - If input data is on **GPU** and remote is enabled, it is copied to CPU for serialization.
- - If input data is already on **CPU**, it is passed directly to `solve_*_remote`.
- - Remote solve returns **host vectors** and sets `is_device_memory = false`.
+**C++ entry points**:
+- `solve_lp` / `solve_mip` check `get_remote_solve_config()` first.
+- If input data is on **GPU** and remote is enabled, it is copied to CPU for serialization.
+- If input data is already on **CPU**, it is passed directly to `solve_*_remote`.
+- Remote solve returns **host vectors** and sets `is_device_memory = false`.
 
 **Remote stub implementation** (`cpp/include/cuopt/linear_programming/utilities/remote_solve.hpp`):
 - Returns **dummy host solutions** (all zeros).
@@ -56,16 +56,16 @@ This is detected early in the solve path.
 - **Solution handling**: for remote solves, the solution is **host memory**, so NumPy arrays
   are built directly from host vectors and **avoid `rmm::device_buffer`** (no CUDA).
 
- **CLI (`cpp/cuopt_cli.cpp`)**:
- - Detects remote solve **before** any CUDA initialization.
- - Skips `raft::handle_t` creation and GPU setup when remote is enabled.
+**CLI (`cpp/cuopt_cli.cpp`)**:
+- Detects remote solve **before** any CUDA initialization.
+- Skips `raft::handle_t` creation and GPU setup when remote is enabled.
 - Builds the problem in **host memory** for remote solves.
 
- ## Batch solve
+## Batch solve
 
- Batch solve uses the same memory model:
+Batch solve uses the same memory model:
 
- - **Local batch**: GPU memory, with CUDA resources and PDLP/dual simplex paths.
+- **Local batch**: GPU memory, with CUDA resources and PDLP/dual simplex paths.
 - **Remote batch**: each problem is routed through `solve_lp_remote` or `solve_mip_remote`
   and returns host data. If inputs are already on GPU, they are copied to host first.
 
diff --git a/cpp/include/cuopt/linear_programming/mip/solver_solution.hpp b/cpp/include/cuopt/linear_programming/mip/solver_solution.hpp
index 4d896cf7d..6b868cde2 100644
--- a/cpp/include/cuopt/linear_programming/mip/solver_solution.hpp
+++ b/cpp/include/cuopt/linear_programming/mip/solver_solution.hpp
@@ -52,7 +52,21 @@ class mip_solution_t : public base_solution_t {
                  rmm::cuda_stream_view stream_view);
   mip_solution_t(const cuopt::logic_error& error_status, rmm::cuda_stream_view stream_view);
 
-  // CPU-only constructors for remote solve
+  /**
+   * @brief Construct a CPU-only solution for remote solve results.
+   *
+   * @param solution Host-side solution vector
+   * @param var_names Variable names (host-side)
+   * @param objective Objective value
+   * @param mip_gap MIP gap
+   * @param termination_status Termination status for the solve
+   * @param max_constraint_violation Maximum constraint violation
+   * @param max_int_violation Maximum integer violation
+   * @param max_variable_bound_violation Maximum variable bound violation
+   * @param stats Solver statistics (host-side)
+   *
+   * @note This constructor stores data in host memory and sets is_device_memory() to false.
+   */
   mip_solution_t(std::vector<f_t> solution,
                  std::vector<std::string> var_names,
                  f_t objective,
@@ -63,7 +77,24 @@ class mip_solution_t : public base_solution_t {
                  f_t max_variable_bound_violation,
                  solver_stats_t<i_t, f_t> stats);
 
+  /**
+   * @brief Construct a CPU-only solution with termination status and stats.
+   *
+   * @param termination_status Termination status for a remote solve
+   * @param stats Solver statistics (host-side)
+   *
+   * @note This constructor stores data in host memory and sets is_device_memory() to false.
+   *       Use this when a remote solve terminates without a full solution vector.
+   */
   mip_solution_t(mip_termination_status_t termination_status, solver_stats_t<i_t, f_t> stats);
+
+  /**
+   * @brief Construct a CPU-only solution for error cases.
+   *
+   * @param error_status Error status describing the failure
+   *
+   * @note This constructor stores data in host memory and sets is_device_memory() to false.
+   */
   mip_solution_t(const cuopt::logic_error& error_status);
 
   bool is_mip() const override { return true; }
diff --git a/cpp/include/cuopt/linear_programming/pdlp/solver_solution.hpp b/cpp/include/cuopt/linear_programming/pdlp/solver_solution.hpp
index 09a1378cc..805d13b14 100644
--- a/cpp/include/cuopt/linear_programming/pdlp/solver_solution.hpp
+++ b/cpp/include/cuopt/linear_programming/pdlp/solver_solution.hpp
@@ -90,7 +90,7 @@ class optimization_problem_solution_t : public base_solution_t {
     double solve_time{std::numeric_limits<double>::signaling_NaN()};
 
     /** Whether the problem was solved by PDLP or Dual Simplex */
-    bool solved_by_pdlp{false};
+    bool solved_by_pdlp{true};
   };
 
   /**
@@ -510,9 +510,6 @@ class optimization_problem_solution_t : public base_solution_t {
   // Flag indicating where solution data is stored
   bool is_device_memory_ = true;
 
-  // Flag indicating if solved by PDLP (vs dual simplex)
-  bool solved_by_pdlp_ = true;
-
   pdlp_warm_start_data_t<i_t, f_t> pdlp_warm_start_data_;
 
   std::vector<pdlp_termination_status_t> termination_status_{1};
diff --git a/cpp/include/cuopt/linear_programming/solve.hpp b/cpp/include/cuopt/linear_programming/solve.hpp
index 5e8007020..c55fe46f0 100644
--- a/cpp/include/cuopt/linear_programming/solve.hpp
+++ b/cpp/include/cuopt/linear_programming/solve.hpp
@@ -149,14 +149,14 @@ optimization_problem_t<i_t, f_t> mps_data_model_to_optimization_problem(
 /**
  * @brief Convert a data_model_view_t to an optimization_problem_t.
  *
- * This function copies data from the view (which points to GPU memory)
+ * This function copies data from the view (which can point to CPU or GPU memory)
  * into an owning optimization_problem_t.
  *
  * @tparam i_t Data type of indexes
  * @tparam f_t Data type of the variables and their weights in the equations
  *
  * @param[in] handle_ptr  A raft::handle_t object with its corresponding CUDA stream.
- * @param[in] view  A data_model_view_t<i_t, f_t> object with spans pointing to GPU memory
+ * @param[in] view  A data_model_view_t<i_t, f_t> object with spans pointing to CPU or GPU memory
  * @return optimization_problem_t<i_t, f_t> owning container for the problem
  */
 template <typename i_t, typename f_t>
diff --git a/cpp/include/cuopt/linear_programming/utilities/remote_solve.hpp b/cpp/include/cuopt/linear_programming/utilities/remote_solve.hpp
index ff2829421..33834fa75 100644
--- a/cpp/include/cuopt/linear_programming/utilities/remote_solve.hpp
+++ b/cpp/include/cuopt/linear_programming/utilities/remote_solve.hpp
@@ -45,6 +45,7 @@ inline std::optional<remote_solve_config_t> get_remote_solve_config()
   if (host != nullptr && port != nullptr && host[0] != '\0' && port[0] != '\0') {
     try {
       int port_num = std::stoi(port);
+      if (port_num < 1 || port_num > 65535) { return std::nullopt; }
       return remote_solve_config_t{std::string(host), port_num};
     } catch (...) {
       // Invalid port number, fall back to local solve
diff --git a/cpp/src/linear_programming/solve.cu b/cpp/src/linear_programming/solve.cu
index 2d6daae04..0fb6b5514 100644
--- a/cpp/src/linear_programming/solve.cu
+++ b/cpp/src/linear_programming/solve.cu
@@ -44,6 +44,7 @@
 #include <raft/common/nvtx.hpp>
 #include <raft/core/device_setter.hpp>
 #include <raft/core/handle.hpp>
+#include <raft/util/cudart_utils.hpp>
 
 #include <cstring>  // For std::memcpy
 #include <thread>   // For std::thread
@@ -1466,13 +1467,14 @@ optimization_problem_t<i_t, f_t> data_model_view_to_optimization_problem(
     std::vector<char> host_var_types(var_types.size());
     if (err == cudaSuccess && attrs.type == cudaMemoryTypeDevice) {
       // Source is on GPU - copy to host
-      cudaMemcpy(host_var_types.data(),
-                 var_types.data(),
-                 var_types.size() * sizeof(char),
-                 cudaMemcpyDeviceToHost);
+      RAFT_CUDA_TRY(cudaMemcpy(host_var_types.data(),
+                               var_types.data(),
+                               var_types.size() * sizeof(char),
+                               cudaMemcpyDeviceToHost));
     } else {
       // Source is on host (or unregistered) - direct copy
-      cudaGetLastError();  // Clear any error from cudaPointerGetAttributes
+      if (err != cudaSuccess) { cudaGetLastError(); }  // Clear cudaPointerGetAttributes error
+      if (err != cudaSuccess && err != cudaErrorInvalidValue) { RAFT_CUDA_TRY(err); }
       std::memcpy(host_var_types.data(), var_types.data(), var_types.size() * sizeof(char));
     }
 
@@ -1519,21 +1521,22 @@ optimization_problem_t<i_t, f_t> data_model_view_to_optimization_problem(
 
     if (err == cudaSuccess && attrs.type == cudaMemoryTypeDevice) {
       // Source is on GPU - copy to host
-      cudaMemcpy(Q_values.data(),
-                 view.get_quadratic_objective_values().data(),
-                 Q_values.size() * sizeof(f_t),
-                 cudaMemcpyDeviceToHost);
-      cudaMemcpy(Q_indices.data(),
-                 view.get_quadratic_objective_indices().data(),
-                 Q_indices.size() * sizeof(i_t),
-                 cudaMemcpyDeviceToHost);
-      cudaMemcpy(Q_offsets.data(),
-                 view.get_quadratic_objective_offsets().data(),
-                 Q_offsets.size() * sizeof(i_t),
-                 cudaMemcpyDeviceToHost);
+      RAFT_CUDA_TRY(cudaMemcpy(Q_values.data(),
+                               view.get_quadratic_objective_values().data(),
+                               Q_values.size() * sizeof(f_t),
+                               cudaMemcpyDeviceToHost));
+      RAFT_CUDA_TRY(cudaMemcpy(Q_indices.data(),
+                               view.get_quadratic_objective_indices().data(),
+                               Q_indices.size() * sizeof(i_t),
+                               cudaMemcpyDeviceToHost));
+      RAFT_CUDA_TRY(cudaMemcpy(Q_offsets.data(),
+                               view.get_quadratic_objective_offsets().data(),
+                               Q_offsets.size() * sizeof(i_t),
+                               cudaMemcpyDeviceToHost));
     } else {
       // Source is on host - direct copy
-      cudaGetLastError();  // Clear any error from cudaPointerGetAttributes
+      if (err != cudaSuccess) { cudaGetLastError(); }  // Clear cudaPointerGetAttributes error
+      if (err != cudaSuccess && err != cudaErrorInvalidValue) { RAFT_CUDA_TRY(err); }
       std::memcpy(Q_values.data(),
                   view.get_quadratic_objective_values().data(),
                   Q_values.size() * sizeof(f_t));
diff --git a/cpp/src/linear_programming/solver_solution.cu b/cpp/src/linear_programming/solver_solution.cu
index 0e38e844d..bd61c03bd 100644
--- a/cpp/src/linear_programming/solver_solution.cu
+++ b/cpp/src/linear_programming/solver_solution.cu
@@ -446,6 +446,9 @@ bool optimization_problem_solution_t<i_t, f_t>::is_device_memory() const
 template <typename i_t, typename f_t>
 rmm::device_uvector<f_t>& optimization_problem_solution_t<i_t, f_t>::get_primal_solution()
 {
+  EXE_CUOPT_EXPECTS(primal_solution_ != nullptr,
+                    "Device primal solution not available (call to_device or construct with GPU "
+                    "data).");
   return *primal_solution_;
 }
 
@@ -453,24 +456,36 @@ template <typename i_t, typename f_t>
 const rmm::device_uvector<f_t>& optimization_problem_solution_t<i_t, f_t>::get_primal_solution()
   const
 {
+  EXE_CUOPT_EXPECTS(primal_solution_ != nullptr,
+                    "Device primal solution not available (call to_device or construct with GPU "
+                    "data).");
   return *primal_solution_;
 }
 
 template <typename i_t, typename f_t>
 rmm::device_uvector<f_t>& optimization_problem_solution_t<i_t, f_t>::get_dual_solution()
 {
+  EXE_CUOPT_EXPECTS(dual_solution_ != nullptr,
+                    "Device dual solution not available (call to_device or construct with GPU "
+                    "data).");
   return *dual_solution_;
 }
 
 template <typename i_t, typename f_t>
 const rmm::device_uvector<f_t>& optimization_problem_solution_t<i_t, f_t>::get_dual_solution() const
 {
+  EXE_CUOPT_EXPECTS(dual_solution_ != nullptr,
+                    "Device dual solution not available (call to_device or construct with GPU "
+                    "data).");
   return *dual_solution_;
 }
 
 template <typename i_t, typename f_t>
 rmm::device_uvector<f_t>& optimization_problem_solution_t<i_t, f_t>::get_reduced_cost()
 {
+  EXE_CUOPT_EXPECTS(reduced_cost_ != nullptr,
+                    "Device reduced cost not available (call to_device or construct with GPU "
+                    "data).");
   return *reduced_cost_;
 }
 
@@ -478,36 +493,54 @@ rmm::device_uvector<f_t>& optimization_problem_solution_t<i_t, f_t>::get_reduced
 template <typename i_t, typename f_t>
 std::vector<f_t>& optimization_problem_solution_t<i_t, f_t>::get_primal_solution_host()
 {
+  EXE_CUOPT_EXPECTS(primal_solution_host_ != nullptr,
+                    "Host primal solution not available (call to_host or construct with CPU "
+                    "data).");
   return *primal_solution_host_;
 }
 
 template <typename i_t, typename f_t>
 const std::vector<f_t>& optimization_problem_solution_t<i_t, f_t>::get_primal_solution_host() const
 {
+  EXE_CUOPT_EXPECTS(primal_solution_host_ != nullptr,
+                    "Host primal solution not available (call to_host or construct with CPU "
+                    "data).");
   return *primal_solution_host_;
 }
 
 template <typename i_t, typename f_t>
 std::vector<f_t>& optimization_problem_solution_t<i_t, f_t>::get_dual_solution_host()
 {
+  EXE_CUOPT_EXPECTS(dual_solution_host_ != nullptr,
+                    "Host dual solution not available (call to_host or construct with CPU "
+                    "data).");
   return *dual_solution_host_;
 }
 
 template <typename i_t, typename f_t>
 const std::vector<f_t>& optimization_problem_solution_t<i_t, f_t>::get_dual_solution_host() const
 {
+  EXE_CUOPT_EXPECTS(dual_solution_host_ != nullptr,
+                    "Host dual solution not available (call to_host or construct with CPU "
+                    "data).");
   return *dual_solution_host_;
 }
 
 template <typename i_t, typename f_t>
 std::vector<f_t>& optimization_problem_solution_t<i_t, f_t>::get_reduced_cost_host()
 {
+  EXE_CUOPT_EXPECTS(reduced_cost_host_ != nullptr,
+                    "Host reduced cost not available (call to_host or construct with CPU "
+                    "data).");
   return *reduced_cost_host_;
 }
 
 template <typename i_t, typename f_t>
 const std::vector<f_t>& optimization_problem_solution_t<i_t, f_t>::get_reduced_cost_host() const
 {
+  EXE_CUOPT_EXPECTS(reduced_cost_host_ != nullptr,
+                    "Host reduced cost not available (call to_host or construct with CPU "
+                    "data).");
   return *reduced_cost_host_;
 }
 
@@ -638,7 +671,7 @@ i_t optimization_problem_solution_t<i_t, f_t>::get_nb_iterations() const
 template <typename i_t, typename f_t>
 bool optimization_problem_solution_t<i_t, f_t>::get_solved_by_pdlp() const
 {
-  return solved_by_pdlp_;
+  return termination_stats_.solved_by_pdlp;
 }
 
 //============================================================================
@@ -684,7 +717,7 @@ void optimization_problem_solution_t<i_t, f_t>::set_nb_iterations(i_t value)
 template <typename i_t, typename f_t>
 void optimization_problem_solution_t<i_t, f_t>::set_solved_by_pdlp(bool value)
 {
-  solved_by_pdlp_ = value;
+  termination_stats_.solved_by_pdlp = value;
 }
 
 template <typename i_t, typename f_t>
diff --git a/cpp/src/linear_programming/utilities/cython_solve.cu b/cpp/src/linear_programming/utilities/cython_solve.cu
index f09168b52..64f982244 100644
--- a/cpp/src/linear_programming/utilities/cython_solve.cu
+++ b/cpp/src/linear_programming/utilities/cython_solve.cu
@@ -295,7 +295,7 @@ std::unique_ptr<solver_ret_t> call_solve(
         lp_ret.is_device_memory_     = false;
       }
 
-      // No warm-start data in remote stub path
+      // Remote stub path doesn't provide warm-start data yet.
       lp_ret.initial_primal_weight_         = 0.0;
       lp_ret.initial_step_size_             = 0.0;
       lp_ret.total_pdlp_iterations_         = 0;
@@ -461,6 +461,7 @@ std::pair<std::vector<std::unique_ptr<solver_ret_t>>, double> call_batch_solve(
   // Limit parallelism as too much stream overlap gets too slow
   int max_thread = 1;
   if (linear_programming::is_remote_solve_enabled()) {
+    // Cap parallelism for remote solve to avoid overwhelming the remote service.
     constexpr std::size_t max_total = 4;
     max_thread = static_cast<int>(std::min(std::max<std::size_t>(size, 1), max_total));
   } else {
diff --git a/cpp/src/mip/solve.cu b/cpp/src/mip/solve.cu
index ee5780c5b..4ab411a5d 100644
--- a/cpp/src/mip/solve.cu
+++ b/cpp/src/mip/solve.cu
@@ -20,6 +20,7 @@
 #include <linear_programming/step_size_strategy/adaptive_step_size_strategy.hpp>
 #include <linear_programming/utilities/problem_checking.cuh>
 #include <linear_programming/utils.cuh>
+#include <raft/util/cudart_utils.hpp>
 #include <utilities/logger.hpp>
 #include <utilities/timer.hpp>
 #include <utilities/version_info.hpp>
@@ -477,15 +478,15 @@ cpu_problem_data_t<i_t, f_t> copy_view_to_cpu(raft::handle_t const* handle_ptr,
   auto var_types_span = gpu_view.get_variable_types();
   if (var_types_span.size() > 0) {
     cpu_data.variable_types.resize(var_types_span.size());
-    cudaMemcpyAsync(cpu_data.variable_types.data(),
-                    var_types_span.data(),
-                    var_types_span.size() * sizeof(char),
-                    cudaMemcpyDeviceToHost,
-                    stream);
+    RAFT_CUDA_TRY(cudaMemcpyAsync(cpu_data.variable_types.data(),
+                                  var_types_span.data(),
+                                  var_types_span.size() * sizeof(char),
+                                  cudaMemcpyDeviceToHost,
+                                  stream));
   }
 
   // Synchronize to ensure all copies are complete
-  cudaStreamSynchronize(stream);
+  RAFT_CUDA_TRY(cudaStreamSynchronize(stream));
 
   return cpu_data;
 }
diff --git a/cpp/src/mip/solver_solution.cu b/cpp/src/mip/solver_solution.cu
index fd8707732..4ea545bbb 100644
--- a/cpp/src/mip/solver_solution.cu
+++ b/cpp/src/mip/solver_solution.cu
@@ -147,24 +147,32 @@ bool mip_solution_t<i_t, f_t>::is_device_memory() const
 template <typename i_t, typename f_t>
 const rmm::device_uvector<f_t>& mip_solution_t<i_t, f_t>::get_solution() const
 {
+  EXE_CUOPT_EXPECTS(solution_ != nullptr,
+                    "Device solution not available (call to_device or construct with GPU data).");
   return *solution_;
 }
 
 template <typename i_t, typename f_t>
 rmm::device_uvector<f_t>& mip_solution_t<i_t, f_t>::get_solution()
 {
+  EXE_CUOPT_EXPECTS(solution_ != nullptr,
+                    "Device solution not available (call to_device or construct with GPU data).");
   return *solution_;
 }
 
 template <typename i_t, typename f_t>
 std::vector<f_t>& mip_solution_t<i_t, f_t>::get_solution_host()
 {
+  EXE_CUOPT_EXPECTS(solution_host_ != nullptr,
+                    "Host solution not available (call to_host or construct with CPU data).");
   return *solution_host_;
 }
 
 template <typename i_t, typename f_t>
 const std::vector<f_t>& mip_solution_t<i_t, f_t>::get_solution_host() const
 {
+  EXE_CUOPT_EXPECTS(solution_host_ != nullptr,
+                    "Host solution not available (call to_host or construct with CPU data).");
   return *solution_host_;
 }
 
diff --git a/cpp/tests/linear_programming/unit_tests/memory_model_infrastructure_test.cu b/cpp/tests/linear_programming/unit_tests/memory_model_infrastructure_test.cu
index c3de1f1d4..897905c3a 100644
--- a/cpp/tests/linear_programming/unit_tests/memory_model_infrastructure_test.cu
+++ b/cpp/tests/linear_programming/unit_tests/memory_model_infrastructure_test.cu
@@ -37,17 +37,39 @@ class RemoteSolveConfigTest : public ::testing::Test {
  protected:
   void SetUp() override
   {
-    // Clean environment before each test
+    // Save original environment variables
+    const char* host_env = std::getenv("CUOPT_REMOTE_HOST");
+    const char* port_env = std::getenv("CUOPT_REMOTE_PORT");
+    saved_host_          = host_env ? std::string(host_env) : std::string();
+    saved_port_          = port_env ? std::string(port_env) : std::string();
+    had_host_            = (host_env != nullptr);
+    had_port_            = (port_env != nullptr);
+
+    // Clean environment for test
     unsetenv("CUOPT_REMOTE_HOST");
     unsetenv("CUOPT_REMOTE_PORT");
   }
 
   void TearDown() override
   {
-    // Clean environment after each test
-    unsetenv("CUOPT_REMOTE_HOST");
-    unsetenv("CUOPT_REMOTE_PORT");
+    // Restore original environment variables
+    if (had_host_) {
+      setenv("CUOPT_REMOTE_HOST", saved_host_.c_str(), 1);
+    } else {
+      unsetenv("CUOPT_REMOTE_HOST");
+    }
+    if (had_port_) {
+      setenv("CUOPT_REMOTE_PORT", saved_port_.c_str(), 1);
+    } else {
+      unsetenv("CUOPT_REMOTE_PORT");
+    }
   }
+
+ private:
+  std::string saved_host_;
+  std::string saved_port_;
+  bool had_host_ = false;
+  bool had_port_ = false;
 };
 
 TEST_F(RemoteSolveConfigTest, valid_configuration)
diff --git a/python/cuopt/cuopt/__init__.py b/python/cuopt/cuopt/__init__.py
index 7ea141221..8382e0019 100644
--- a/python/cuopt/cuopt/__init__.py
+++ b/python/cuopt/cuopt/__init__.py
@@ -20,7 +20,9 @@ def __getattr__(name):
     """Lazy import submodules to support CPU-only hosts with remote solve."""
     if name in _submodules:
         import importlib
-        return importlib.import_module(f"cuopt.{name}")
+        module = importlib.import_module(f"cuopt.{name}")
+        globals()[name] = module
+        return module
     raise AttributeError(f"module {__name__!r} has no attribute {name!r}")
 
 
@@ -28,4 +30,4 @@ def __dir__():
     return __all__ + _submodules
 
 
-__all__ = ["__git_commit__", "__version__", "__version_major_minor__"]
+__all__ = ["__git_commit__", "__version__", "__version_major_minor__", *_submodules]
diff --git a/python/cuopt/cuopt/tests/linear_programming/test_memory_model.py b/python/cuopt/cuopt/tests/linear_programming/test_memory_model.py
index 7432c480e..90ed29678 100644
--- a/python/cuopt/cuopt/tests/linear_programming/test_memory_model.py
+++ b/python/cuopt/cuopt/tests/linear_programming/test_memory_model.py
@@ -51,15 +51,21 @@ class TestRemoteSolveEnvironment:
     """Test remote solve environment variable detection and handling."""
 
     def setup_method(self):
-        """Clean up environment before each test."""
+        """Save and clean environment before each test."""
+        self._orig_env = {
+            "CUOPT_REMOTE_HOST": os.environ.get("CUOPT_REMOTE_HOST"),
+            "CUOPT_REMOTE_PORT": os.environ.get("CUOPT_REMOTE_PORT"),
+        }
         for var in ["CUOPT_REMOTE_HOST", "CUOPT_REMOTE_PORT"]:
             if var in os.environ:
                 del os.environ[var]
 
     def teardown_method(self):
-        """Clean up environment after each test."""
-        for var in ["CUOPT_REMOTE_HOST", "CUOPT_REMOTE_PORT"]:
-            if var in os.environ:
+        """Restore original environment after each test."""
+        for var, value in self._orig_env.items():
+            if value is not None:
+                os.environ[var] = value
+            elif var in os.environ:
                 del os.environ[var]
 
     def test_local_solve_by_default(self):

From e60256047c1f02b23b6eedcd26143498112f4254 Mon Sep 17 00:00:00 2001
From: Trevor McKay <tmgithub1@gmail.com>
Date: Thu, 29 Jan 2026 10:36:23 -0500
Subject: [PATCH 14/22] Address remaining CodeRabbit suggestions for memory
 model

- Add RAFT_CUDA_TRY error checking for cudaMemcpyAsync and cudaStreamSynchronize
- Fix one-sided constraint bounds handling in LP and MIP solve
- Update port validation test expectations to match implemented validation logic
---
 cpp/src/linear_programming/solve.cu              | 16 +++++++++-------
 cpp/src/mip/solve.cu                             |  4 +++-
 .../memory_model_infrastructure_test.cu          |  9 ++++-----
 3 files changed, 16 insertions(+), 13 deletions(-)

diff --git a/cpp/src/linear_programming/solve.cu b/cpp/src/linear_programming/solve.cu
index 0fb6b5514..40cdd8034 100644
--- a/cpp/src/linear_programming/solve.cu
+++ b/cpp/src/linear_programming/solve.cu
@@ -1597,8 +1597,10 @@ struct cpu_problem_data_t {
     if (!constraint_bounds.empty()) {
       v.set_constraint_bounds(constraint_bounds.data(), constraint_bounds.size());
     }
-    if (!constraint_lower_bounds.empty() && !constraint_upper_bounds.empty()) {
+    if (!constraint_lower_bounds.empty()) {
       v.set_constraint_lower_bounds(constraint_lower_bounds.data(), constraint_lower_bounds.size());
+    }
+    if (!constraint_upper_bounds.empty()) {
       v.set_constraint_upper_bounds(constraint_upper_bounds.data(), constraint_upper_bounds.size());
     }
     if (!objective_coefficients.empty()) {
@@ -1662,15 +1664,15 @@ cpu_problem_data_t<i_t, f_t> copy_view_to_cpu(raft::handle_t const* handle_ptr,
   auto var_types_span = gpu_view.get_variable_types();
   if (var_types_span.size() > 0) {
     cpu_data.variable_types.resize(var_types_span.size());
-    cudaMemcpyAsync(cpu_data.variable_types.data(),
-                    var_types_span.data(),
-                    var_types_span.size() * sizeof(char),
-                    cudaMemcpyDeviceToHost,
-                    stream);
+    RAFT_CUDA_TRY(cudaMemcpyAsync(cpu_data.variable_types.data(),
+                                  var_types_span.data(),
+                                  var_types_span.size() * sizeof(char),
+                                  cudaMemcpyDeviceToHost,
+                                  stream));
   }
 
   // Synchronize to ensure all copies are complete
-  cudaStreamSynchronize(stream);
+  RAFT_CUDA_TRY(cudaStreamSynchronize(stream));
 
   return cpu_data;
 }
diff --git a/cpp/src/mip/solve.cu b/cpp/src/mip/solve.cu
index 4ab411a5d..c0cd6b16f 100644
--- a/cpp/src/mip/solve.cu
+++ b/cpp/src/mip/solve.cu
@@ -413,8 +413,10 @@ struct cpu_problem_data_t {
     if (!constraint_bounds.empty()) {
       v.set_constraint_bounds(constraint_bounds.data(), constraint_bounds.size());
     }
-    if (!constraint_lower_bounds.empty() && !constraint_upper_bounds.empty()) {
+    if (!constraint_lower_bounds.empty()) {
       v.set_constraint_lower_bounds(constraint_lower_bounds.data(), constraint_lower_bounds.size());
+    }
+    if (!constraint_upper_bounds.empty()) {
       v.set_constraint_upper_bounds(constraint_upper_bounds.data(), constraint_upper_bounds.size());
     }
     if (!objective_coefficients.empty()) {
diff --git a/cpp/tests/linear_programming/unit_tests/memory_model_infrastructure_test.cu b/cpp/tests/linear_programming/unit_tests/memory_model_infrastructure_test.cu
index 897905c3a..daec0fcae 100644
--- a/cpp/tests/linear_programming/unit_tests/memory_model_infrastructure_test.cu
+++ b/cpp/tests/linear_programming/unit_tests/memory_model_infrastructure_test.cu
@@ -136,8 +136,7 @@ TEST_F(RemoteSolveConfigTest, port_zero_needs_validation_patch)
 
   auto config = get_remote_solve_config();
   // Port 0 validation is added in CodeRabbit patch
-  // Without patch, this returns valid config (will be fixed)
-  EXPECT_TRUE(config.has_value());  // Will be FALSE after patch applied
+  EXPECT_FALSE(config.has_value());  // Port 0 is invalid
 }
 
 TEST_F(RemoteSolveConfigTest, port_negative_parsed_as_large)
@@ -146,8 +145,8 @@ TEST_F(RemoteSolveConfigTest, port_negative_parsed_as_large)
   setenv("CUOPT_REMOTE_PORT", "-1", 1);
 
   auto config = get_remote_solve_config();
-  // stoi("-1") succeeds but port validation will catch it with patch
-  EXPECT_TRUE(config.has_value());  // Will be FALSE after patch applied
+  // stoi("-1") succeeds but port validation catches it
+  EXPECT_FALSE(config.has_value());  // Negative ports are invalid
 }
 
 TEST_F(RemoteSolveConfigTest, port_too_large_needs_validation_patch)
@@ -157,7 +156,7 @@ TEST_F(RemoteSolveConfigTest, port_too_large_needs_validation_patch)
 
   auto config = get_remote_solve_config();
   // Port > 65535 validation is added in CodeRabbit patch
-  EXPECT_TRUE(config.has_value());  // Will be FALSE after patch applied
+  EXPECT_FALSE(config.has_value());  // Port > 65535 is invalid
 }
 
 TEST_F(RemoteSolveConfigTest, valid_port_boundaries)

From 0e70c617a8109e092d5ad38f2f44b85e9b85fcd3 Mon Sep 17 00:00:00 2001
From: Trevor McKay <tmgithub1@gmail.com>
Date: Thu, 29 Jan 2026 11:01:37 -0500
Subject: [PATCH 15/22] Remove auto-generated MANIFEST.in build artifact

---
 python/cuopt/MANIFEST.in | 3 ---
 1 file changed, 3 deletions(-)
 delete mode 100644 python/cuopt/MANIFEST.in

diff --git a/python/cuopt/MANIFEST.in b/python/cuopt/MANIFEST.in
deleted file mode 100644
index 8c1f835a4..000000000
--- a/python/cuopt/MANIFEST.in
+++ /dev/null
@@ -1,3 +0,0 @@
-
-# Automatically generated by rapids-build-backend
-include cuopt/GIT_COMMIT

From 3475cedd99b2db0ec41a34d4cba4274ceb10826b Mon Sep 17 00:00:00 2001
From: Trevor McKay <tmgithub1@gmail.com>
Date: Thu, 29 Jan 2026 11:05:39 -0500
Subject: [PATCH 16/22] Fix errors introduced in update to latest release/26.02

---
 cpp/src/linear_programming/solve.cu           |  9 ++-
 cpp/src/linear_programming/solver_solution.cu | 60 +++++++++----------
 .../unit_tests/lp_solution_memory_test.cu     |  4 +-
 python/cuopt/pyproject.toml                   | 17 +++---
 4 files changed, 49 insertions(+), 41 deletions(-)

diff --git a/cpp/src/linear_programming/solve.cu b/cpp/src/linear_programming/solve.cu
index 40cdd8034..bd60d6ccb 100644
--- a/cpp/src/linear_programming/solve.cu
+++ b/cpp/src/linear_programming/solve.cu
@@ -1771,7 +1771,14 @@ optimization_problem_solution_t<i_t, f_t> solve_lp(raft::handle_t const* handle_
     bool problem_checking,                                                              \
     bool use_pdlp_solver_mode);                                                         \
                                                                                         \
-  template void set_pdlp_solver_mode(pdlp_solver_settings_t<int, F_TYPE> const& settings);
+  template optimization_problem_solution_t<int, F_TYPE> batch_pdlp_solve(               \
+    raft::handle_t const* handle_ptr,                                                   \
+    const cuopt::mps_parser::mps_data_model_t<int, F_TYPE>& mps_data_model,             \
+    const std::vector<int>& fractional,                                                 \
+    const std::vector<F_TYPE>& root_soln_x,                                             \
+    pdlp_solver_settings_t<int, F_TYPE> const& settings);                               \
+                                                                                        \
+  template void set_pdlp_solver_mode(pdlp_solver_settings_t<int, F_TYPE>& settings);
 
 #if MIP_INSTANTIATE_FLOAT
 INSTANTIATE(float)
diff --git a/cpp/src/linear_programming/solver_solution.cu b/cpp/src/linear_programming/solver_solution.cu
index bd61c03bd..a0538034f 100644
--- a/cpp/src/linear_programming/solver_solution.cu
+++ b/cpp/src/linear_programming/solver_solution.cu
@@ -29,7 +29,7 @@ optimization_problem_solution_t<i_t, f_t>::optimization_problem_solution_t(
     dual_solution_(std::make_unique<rmm::device_uvector<f_t>>(0, stream_view)),
     reduced_cost_(std::make_unique<rmm::device_uvector<f_t>>(0, stream_view)),
     is_device_memory_(true),
-    termination_status_(termination_status),
+    termination_status_{{termination_status}},
     error_status_(cuopt::logic_error("", cuopt::error_type_t::Success))
 {
   cuopt_assert(termination_stats_.size() == termination_status_.size(),
@@ -43,7 +43,7 @@ optimization_problem_solution_t<i_t, f_t>::optimization_problem_solution_t(
     dual_solution_(std::make_unique<rmm::device_uvector<f_t>>(0, stream_view)),
     reduced_cost_(std::make_unique<rmm::device_uvector<f_t>>(0, stream_view)),
     is_device_memory_(true),
-    termination_status_(pdlp_termination_status_t::NoTermination),
+    termination_status_{{pdlp_termination_status_t::NoTermination}},
     error_status_(error_status_)
 {
   cuopt_assert(termination_stats_.size() == termination_status_.size(),
@@ -58,7 +58,7 @@ optimization_problem_solution_t<i_t, f_t>::optimization_problem_solution_t(
     dual_solution_host_(std::make_unique<std::vector<f_t>>()),
     reduced_cost_host_(std::make_unique<std::vector<f_t>>()),
     is_device_memory_(false),
-    termination_status_(termination_status),
+    termination_status_{{termination_status}},
     error_status_(cuopt::logic_error("", cuopt::error_type_t::Success))
 {
 }
@@ -71,7 +71,7 @@ optimization_problem_solution_t<i_t, f_t>::optimization_problem_solution_t(
     dual_solution_host_(std::make_unique<std::vector<f_t>>()),
     reduced_cost_host_(std::make_unique<std::vector<f_t>>()),
     is_device_memory_(false),
-    termination_status_(pdlp_termination_status_t::NoTermination),
+    termination_status_{{pdlp_termination_status_t::NoTermination}},
     error_status_(error_status)
 {
 }
@@ -85,8 +85,8 @@ optimization_problem_solution_t<i_t, f_t>::optimization_problem_solution_t(
   const std::string objective_name,
   const std::vector<std::string>& var_names,
   const std::vector<std::string>& row_names,
-  additional_termination_information_t& termination_stats,
-  pdlp_termination_status_t termination_status)
+  std::vector<additional_termination_information_t>&& termination_stats,
+  std::vector<pdlp_termination_status_t>&& termination_status)
   : primal_solution_(std::make_unique<rmm::device_uvector<f_t>>(std::move(final_primal_solution))),
     dual_solution_(std::make_unique<rmm::device_uvector<f_t>>(std::move(final_dual_solution))),
     reduced_cost_(std::make_unique<rmm::device_uvector<f_t>>(std::move(final_reduced_cost))),
@@ -95,8 +95,8 @@ optimization_problem_solution_t<i_t, f_t>::optimization_problem_solution_t(
     objective_name_(objective_name),
     var_names_(std::move(var_names)),
     row_names_(std::move(row_names)),
-    termination_stats_(termination_stats),
-    termination_status_(termination_status),
+    termination_stats_(std::move(termination_stats)),
+    termination_status_(std::move(termination_status)),
     error_status_(cuopt::logic_error("", cuopt::error_type_t::Success))
 {
   cuopt_assert(termination_stats_.size() == termination_status_.size(),
@@ -111,13 +111,13 @@ optimization_problem_solution_t<i_t, f_t>::optimization_problem_solution_t(
   const std::string objective_name,
   const std::vector<std::string>& var_names,
   const std::vector<std::string>& row_names,
-  additional_termination_information_t& termination_stats,
-  pdlp_termination_status_t termination_status)
+  std::vector<additional_termination_information_t>&& termination_stats,
+  std::vector<pdlp_termination_status_t>&& termination_status)
   : primal_solution_(std::make_unique<rmm::device_uvector<f_t>>(std::move(final_primal_solution))),
     dual_solution_(std::make_unique<rmm::device_uvector<f_t>>(std::move(final_dual_solution))),
     reduced_cost_(std::make_unique<rmm::device_uvector<f_t>>(std::move(final_reduced_cost))),
     is_device_memory_(true),
-    termination_status_(termination_status),
+    termination_status_(std::move(termination_status)),
     termination_stats_(std::move(termination_stats)),
     objective_name_(objective_name),
     var_names_(std::move(var_names)),
@@ -147,8 +147,8 @@ optimization_problem_solution_t<i_t, f_t>::optimization_problem_solution_t(
     reduced_cost_(
       std::make_unique<rmm::device_uvector<f_t>>(final_reduced_cost, handler_ptr->get_stream())),
     is_device_memory_(true),
-    termination_status_(termination_status),
-    termination_stats_(termination_stats),
+    termination_status_{{termination_status}},
+    termination_stats_{{termination_stats}},
     objective_name_(objective_name),
     var_names_(var_names),
     row_names_(row_names),
@@ -171,8 +171,8 @@ optimization_problem_solution_t<i_t, f_t>::optimization_problem_solution_t(
     dual_solution_host_(std::make_unique<std::vector<f_t>>(std::move(dual_solution))),
     reduced_cost_host_(std::make_unique<std::vector<f_t>>(std::move(reduced_cost))),
     is_device_memory_(false),
-    termination_status_(termination_status),
-    termination_stats_(std::move(termination_stats)),
+    termination_status_{{termination_status}},
+    termination_stats_{{termination_stats}},
     objective_name_(objective_name),
     var_names_(var_names),
     row_names_(row_names),
@@ -625,7 +625,7 @@ template <typename i_t, typename f_t>
 void optimization_problem_solution_t<i_t, f_t>::set_termination_stats(
   const additional_termination_information_t& stats)
 {
-  termination_stats_ = stats;
+  termination_stats_[0] = stats;
 }
 
 //============================================================================
@@ -635,43 +635,43 @@ void optimization_problem_solution_t<i_t, f_t>::set_termination_stats(
 template <typename i_t, typename f_t>
 f_t optimization_problem_solution_t<i_t, f_t>::get_l2_primal_residual() const
 {
-  return termination_stats_.l2_primal_residual;
+  return termination_stats_[0].l2_primal_residual;
 }
 
 template <typename i_t, typename f_t>
 f_t optimization_problem_solution_t<i_t, f_t>::get_l2_dual_residual() const
 {
-  return termination_stats_.l2_dual_residual;
+  return termination_stats_[0].l2_dual_residual;
 }
 
 template <typename i_t, typename f_t>
 f_t optimization_problem_solution_t<i_t, f_t>::get_primal_objective() const
 {
-  return termination_stats_.primal_objective;
+  return termination_stats_[0].primal_objective;
 }
 
 template <typename i_t, typename f_t>
 f_t optimization_problem_solution_t<i_t, f_t>::get_dual_objective() const
 {
-  return termination_stats_.dual_objective;
+  return termination_stats_[0].dual_objective;
 }
 
 template <typename i_t, typename f_t>
 f_t optimization_problem_solution_t<i_t, f_t>::get_gap() const
 {
-  return termination_stats_.gap;
+  return termination_stats_[0].gap;
 }
 
 template <typename i_t, typename f_t>
 i_t optimization_problem_solution_t<i_t, f_t>::get_nb_iterations() const
 {
-  return termination_stats_.number_of_steps_taken;
+  return termination_stats_[0].number_of_steps_taken;
 }
 
 template <typename i_t, typename f_t>
 bool optimization_problem_solution_t<i_t, f_t>::get_solved_by_pdlp() const
 {
-  return termination_stats_.solved_by_pdlp;
+  return termination_stats_[0].solved_by_pdlp;
 }
 
 //============================================================================
@@ -681,43 +681,43 @@ bool optimization_problem_solution_t<i_t, f_t>::get_solved_by_pdlp() const
 template <typename i_t, typename f_t>
 void optimization_problem_solution_t<i_t, f_t>::set_l2_primal_residual(f_t value)
 {
-  termination_stats_.l2_primal_residual = value;
+  termination_stats_[0].l2_primal_residual = value;
 }
 
 template <typename i_t, typename f_t>
 void optimization_problem_solution_t<i_t, f_t>::set_l2_dual_residual(f_t value)
 {
-  termination_stats_.l2_dual_residual = value;
+  termination_stats_[0].l2_dual_residual = value;
 }
 
 template <typename i_t, typename f_t>
 void optimization_problem_solution_t<i_t, f_t>::set_primal_objective(f_t value)
 {
-  termination_stats_.primal_objective = value;
+  termination_stats_[0].primal_objective = value;
 }
 
 template <typename i_t, typename f_t>
 void optimization_problem_solution_t<i_t, f_t>::set_dual_objective(f_t value)
 {
-  termination_stats_.dual_objective = value;
+  termination_stats_[0].dual_objective = value;
 }
 
 template <typename i_t, typename f_t>
 void optimization_problem_solution_t<i_t, f_t>::set_gap(f_t value)
 {
-  termination_stats_.gap = value;
+  termination_stats_[0].gap = value;
 }
 
 template <typename i_t, typename f_t>
 void optimization_problem_solution_t<i_t, f_t>::set_nb_iterations(i_t value)
 {
-  termination_stats_.number_of_steps_taken = value;
+  termination_stats_[0].number_of_steps_taken = value;
 }
 
 template <typename i_t, typename f_t>
 void optimization_problem_solution_t<i_t, f_t>::set_solved_by_pdlp(bool value)
 {
-  termination_stats_.solved_by_pdlp = value;
+  termination_stats_[0].solved_by_pdlp = value;
 }
 
 template <typename i_t, typename f_t>
diff --git a/cpp/tests/linear_programming/unit_tests/lp_solution_memory_test.cu b/cpp/tests/linear_programming/unit_tests/lp_solution_memory_test.cu
index 2222cec5e..40f420640 100644
--- a/cpp/tests/linear_programming/unit_tests/lp_solution_memory_test.cu
+++ b/cpp/tests/linear_programming/unit_tests/lp_solution_memory_test.cu
@@ -87,7 +87,9 @@ TEST(pdlp_solution_memory, device_only_accessors_need_coderabbit_patch)
                                                         var_names,
                                                         row_names,
                                                         stats,
-                                                        pdlp_termination_status_t::Optimal);
+                                                        pdlp_termination_status_t::Optimal,
+                                                        &handle,
+                                                        true);
 
   EXPECT_TRUE(solution.is_device_memory());
   EXPECT_NO_THROW(solution.get_primal_solution());
diff --git a/python/cuopt/pyproject.toml b/python/cuopt/pyproject.toml
index 65a637b5d..cbd86a376 100644
--- a/python/cuopt/pyproject.toml
+++ b/python/cuopt/pyproject.toml
@@ -9,7 +9,7 @@ requires = [
 ] # This list was generated by `rapids-dependency-file-generator`. To make changes, edit ../../dependencies.yaml and run `rapids-dependency-file-generator`.
 
 [project]
-name = "cuopt-cu13"
+name = "cuopt"
 dynamic = ["version"]
 description = "cuOpt - GPU Combinatorial Optimization"
 readme = { file = "README.md", content-type = "text/markdown" }
@@ -20,18 +20,18 @@ license = "Apache-2.0"
 requires-python = ">=3.10"
 dependencies = [
     "cuda-python>=13.0.1,<14.0",
-    "cudf-cu13==26.2.*,>=0.0.0a0",
+    "cudf==26.2.*,>=0.0.0a0",
     "cuopt-mps-parser==26.2.*,>=0.0.0a0",
     "cupy-cuda13x>=13.6.0",
-    "libcuopt-cu13==26.2.*,>=0.0.0a0",
+    "libcuopt==26.2.*,>=0.0.0a0",
     "numba-cuda>=0.22.1,<0.23.0",
     "numba>=0.60.0",
     "numpy>=1.23.5,<3.0",
     "pandas>=2.0",
-    "pylibraft-cu13==26.2.*,>=0.0.0a0",
+    "pylibraft==26.2.*,>=0.0.0a0",
     "pyyaml>=6.0.0",
     "rapids-logger==0.2.*,>=0.0.0a0",
-    "rmm-cu13==26.2.*,>=0.0.0a0",
+    "rmm==26.2.*,>=0.0.0a0",
     "scipy>=1.14.1",
 ] # This list was generated by `rapids-dependency-file-generator`. To make changes, edit ../../dependencies.yaml and run `rapids-dependency-file-generator`.
 classifiers = [
@@ -97,7 +97,6 @@ regex = "(?P<value>.*)"
 
 [tool.rapids-build-backend]
 build-backend = "scikit_build_core.build"
-commit-files = ["cuopt/GIT_COMMIT"]
 dependencies-file = "../../dependencies.yaml"
 matrix-entry = "cuda_suffixed=true;use_cuda_wheels=true"
 requires = [
@@ -105,9 +104,9 @@ requires = [
     "cuopt-mps-parser==26.2.*,>=0.0.0a0",
     "cupy-cuda13x>=13.6.0",
     "cython>=3.0.3",
-    "libcuopt-cu13==26.2.*,>=0.0.0a0",
+    "libcuopt==26.2.*,>=0.0.0a0",
     "ninja",
-    "pylibraft-cu13==26.2.*,>=0.0.0a0",
+    "pylibraft==26.2.*,>=0.0.0a0",
     "rapids-logger==0.2.*,>=0.0.0a0",
-    "rmm-cu13==26.2.*,>=0.0.0a0",
+    "rmm==26.2.*,>=0.0.0a0",
 ] # This list was generated by `rapids-dependency-file-generator`. To make changes, edit ../../dependencies.yaml and run `rapids-dependency-file-generator`.

From f4c73c35d27f36dc11092b70e963e0f7077a3f55 Mon Sep 17 00:00:00 2001
From: Trevor McKay <tmgithub1@gmail.com>
Date: Thu, 29 Jan 2026 14:37:17 -0500
Subject: [PATCH 17/22] additional updates to memory model changes suggested by
 CodeRabbit

---
 MEMORY_MODEL_SUMMARY.md                       |   6 +-
 cpp/src/linear_programming/solve.cu           |  24 ++-
 cpp/src/linear_programming/solver_solution.cu | 151 ++++++++++++++----
 .../utilities/cython_solve.cu                 |   2 +-
 cpp/src/mip/solve.cu                          |  13 ++
 cpp/src/mip/solver_solution.cu                |  16 +-
 .../linear_programming/test_memory_model.py   |  19 +++
 7 files changed, 194 insertions(+), 37 deletions(-)

diff --git a/MEMORY_MODEL_SUMMARY.md b/MEMORY_MODEL_SUMMARY.md
index a6b6b1522..4717a227b 100644
--- a/MEMORY_MODEL_SUMMARY.md
+++ b/MEMORY_MODEL_SUMMARY.md
@@ -71,8 +71,8 @@ Batch solve uses the same memory model:
 
 ## Expected outputs for remote stubs
 
- - Termination status: `Optimal`
- - Objective values: `0.0`
- - Primal/dual/reduced-cost vectors: zero-filled host arrays
+- Termination status: `Optimal`
+- Objective values: `0.0`
+- Primal/dual/reduced-cost vectors: zero-filled host arrays
 
 This is useful for verifying the **CPU-only data path** without a remote service.
diff --git a/cpp/src/linear_programming/solve.cu b/cpp/src/linear_programming/solve.cu
index bd60d6ccb..d97176f1e 100644
--- a/cpp/src/linear_programming/solve.cu
+++ b/cpp/src/linear_programming/solve.cu
@@ -1664,11 +1664,25 @@ cpu_problem_data_t<i_t, f_t> copy_view_to_cpu(raft::handle_t const* handle_ptr,
   auto var_types_span = gpu_view.get_variable_types();
   if (var_types_span.size() > 0) {
     cpu_data.variable_types.resize(var_types_span.size());
-    RAFT_CUDA_TRY(cudaMemcpyAsync(cpu_data.variable_types.data(),
-                                  var_types_span.data(),
-                                  var_types_span.size() * sizeof(char),
-                                  cudaMemcpyDeviceToHost,
-                                  stream));
+
+    // Check if variable_types is host-backed or device-backed
+    cudaPointerAttributes attrs;
+    cudaError_t err = cudaPointerGetAttributes(&attrs, var_types_span.data());
+
+    if (err == cudaSuccess && attrs.type == cudaMemoryTypeDevice) {
+      // Device memory - use async copy
+      RAFT_CUDA_TRY(cudaMemcpyAsync(cpu_data.variable_types.data(),
+                                    var_types_span.data(),
+                                    var_types_span.size() * sizeof(char),
+                                    cudaMemcpyDeviceToHost,
+                                    stream));
+    } else {
+      // Host memory or unregistered - use direct copy
+      if (err != cudaSuccess && err != cudaErrorInvalidValue) { RAFT_CUDA_TRY(err); }
+      std::memcpy(cpu_data.variable_types.data(),
+                  var_types_span.data(),
+                  var_types_span.size() * sizeof(char));
+    }
   }
 
   // Synchronize to ensure all copies are complete
diff --git a/cpp/src/linear_programming/solver_solution.cu b/cpp/src/linear_programming/solver_solution.cu
index a0538034f..1252497f1 100644
--- a/cpp/src/linear_programming/solver_solution.cu
+++ b/cpp/src/linear_programming/solver_solution.cu
@@ -59,8 +59,11 @@ optimization_problem_solution_t<i_t, f_t>::optimization_problem_solution_t(
     reduced_cost_host_(std::make_unique<std::vector<f_t>>()),
     is_device_memory_(false),
     termination_status_{{termination_status}},
+    termination_stats_{{additional_termination_information_t{}}},
     error_status_(cuopt::logic_error("", cuopt::error_type_t::Success))
 {
+  cuopt_assert(termination_stats_.size() == termination_status_.size(),
+               "Termination statistics and status vectors must have the same size");
 }
 
 // CPU-only constructor for remote solve error cases
@@ -72,8 +75,11 @@ optimization_problem_solution_t<i_t, f_t>::optimization_problem_solution_t(
     reduced_cost_host_(std::make_unique<std::vector<f_t>>()),
     is_device_memory_(false),
     termination_status_{{pdlp_termination_status_t::NoTermination}},
+    termination_stats_{{additional_termination_information_t{}}},
     error_status_(error_status)
 {
+  cuopt_assert(termination_stats_.size() == termination_status_.size(),
+               "Termination statistics and status vectors must have the same size");
 }
 
 template <typename i_t, typename f_t>
@@ -200,24 +206,37 @@ void optimization_problem_solution_t<i_t, f_t>::copy_from(
       reduced_cost_ = std::make_unique<rmm::device_uvector<f_t>>(0, handle_ptr->get_stream());
     }
 
-    // Resize to make sure they are of same size
-    primal_solution_->resize(other.primal_solution_->size(), handle_ptr->get_stream());
-    dual_solution_->resize(other.dual_solution_->size(), handle_ptr->get_stream());
-    reduced_cost_->resize(other.reduced_cost_->size(), handle_ptr->get_stream());
+    // Check source pointers before dereferencing
+    if (other.primal_solution_) {
+      primal_solution_->resize(other.primal_solution_->size(), handle_ptr->get_stream());
+      raft::copy(primal_solution_->data(),
+                 other.primal_solution_->data(),
+                 primal_solution_->size(),
+                 handle_ptr->get_stream());
+    } else {
+      primal_solution_->resize(0, handle_ptr->get_stream());
+    }
+
+    if (other.dual_solution_) {
+      dual_solution_->resize(other.dual_solution_->size(), handle_ptr->get_stream());
+      raft::copy(dual_solution_->data(),
+                 other.dual_solution_->data(),
+                 dual_solution_->size(),
+                 handle_ptr->get_stream());
+    } else {
+      dual_solution_->resize(0, handle_ptr->get_stream());
+    }
+
+    if (other.reduced_cost_) {
+      reduced_cost_->resize(other.reduced_cost_->size(), handle_ptr->get_stream());
+      raft::copy(reduced_cost_->data(),
+                 other.reduced_cost_->data(),
+                 reduced_cost_->size(),
+                 handle_ptr->get_stream());
+    } else {
+      reduced_cost_->resize(0, handle_ptr->get_stream());
+    }
 
-    // Copy the data
-    raft::copy(primal_solution_->data(),
-               other.primal_solution_->data(),
-               primal_solution_->size(),
-               handle_ptr->get_stream());
-    raft::copy(dual_solution_->data(),
-               other.dual_solution_->data(),
-               dual_solution_->size(),
-               handle_ptr->get_stream());
-    raft::copy(reduced_cost_->data(),
-               other.reduced_cost_->data(),
-               reduced_cost_->size(),
-               handle_ptr->get_stream());
     handle_ptr->sync_stream();
   } else {
     // Copy CPU data
@@ -225,9 +244,24 @@ void optimization_problem_solution_t<i_t, f_t>::copy_from(
     if (!dual_solution_host_) { dual_solution_host_ = std::make_unique<std::vector<f_t>>(); }
     if (!reduced_cost_host_) { reduced_cost_host_ = std::make_unique<std::vector<f_t>>(); }
 
-    *primal_solution_host_ = *other.primal_solution_host_;
-    *dual_solution_host_   = *other.dual_solution_host_;
-    *reduced_cost_host_    = *other.reduced_cost_host_;
+    // Check source pointers before dereferencing
+    if (other.primal_solution_host_) {
+      *primal_solution_host_ = *other.primal_solution_host_;
+    } else {
+      primal_solution_host_->clear();
+    }
+
+    if (other.dual_solution_host_) {
+      *dual_solution_host_ = *other.dual_solution_host_;
+    } else {
+      dual_solution_host_->clear();
+    }
+
+    if (other.reduced_cost_host_) {
+      *reduced_cost_host_ = *other.reduced_cost_host_;
+    } else {
+      reduced_cost_host_->clear();
+    }
   }
 
   termination_stats_  = other.termination_stats_;
@@ -330,10 +364,22 @@ void optimization_problem_solution_t<i_t, f_t>::write_to_file(std::string_view f
       reduced_cost.data(), reduced_cost_->data(), reduced_cost_->size(), stream_view.value());
     RAFT_CUDA_TRY(cudaStreamSynchronize(stream_view.value()));
   } else {
-    // Already on CPU
-    primal_solution = *primal_solution_host_;
-    dual_solution   = *dual_solution_host_;
-    reduced_cost    = *reduced_cost_host_;
+    // Already on CPU - check for null pointers
+    if (primal_solution_host_) {
+      primal_solution = *primal_solution_host_;
+    } else {
+      primal_solution.clear();
+    }
+    if (dual_solution_host_) {
+      dual_solution = *dual_solution_host_;
+    } else {
+      dual_solution.clear();
+    }
+    if (reduced_cost_host_) {
+      reduced_cost = *reduced_cost_host_;
+    } else {
+      reduced_cost.clear();
+    }
   }
 
   myfile << "{ " << std::endl;
@@ -604,27 +650,58 @@ template <typename i_t, typename f_t>
 void optimization_problem_solution_t<i_t, f_t>::set_primal_solution_host(std::vector<f_t> solution)
 {
   primal_solution_host_ = std::make_unique<std::vector<f_t>>(std::move(solution));
-  is_device_memory_     = false;
+
+  // Ensure all host vectors are initialized to avoid mixed state
+  if (!dual_solution_host_) { dual_solution_host_ = std::make_unique<std::vector<f_t>>(); }
+  if (!reduced_cost_host_) { reduced_cost_host_ = std::make_unique<std::vector<f_t>>(); }
+
+  // Clear device buffers to avoid memory leaks
+  primal_solution_.reset();
+  dual_solution_.reset();
+  reduced_cost_.reset();
+
+  is_device_memory_ = false;
 }
 
 template <typename i_t, typename f_t>
 void optimization_problem_solution_t<i_t, f_t>::set_dual_solution_host(std::vector<f_t> solution)
 {
   dual_solution_host_ = std::make_unique<std::vector<f_t>>(std::move(solution));
-  is_device_memory_   = false;
+
+  // Ensure all host vectors are initialized to avoid mixed state
+  if (!primal_solution_host_) { primal_solution_host_ = std::make_unique<std::vector<f_t>>(); }
+  if (!reduced_cost_host_) { reduced_cost_host_ = std::make_unique<std::vector<f_t>>(); }
+
+  // Clear device buffers to avoid memory leaks
+  primal_solution_.reset();
+  dual_solution_.reset();
+  reduced_cost_.reset();
+
+  is_device_memory_ = false;
 }
 
 template <typename i_t, typename f_t>
 void optimization_problem_solution_t<i_t, f_t>::set_reduced_cost_host(std::vector<f_t> reduced_cost)
 {
   reduced_cost_host_ = std::make_unique<std::vector<f_t>>(std::move(reduced_cost));
-  is_device_memory_  = false;
+
+  // Ensure all host vectors are initialized to avoid mixed state
+  if (!primal_solution_host_) { primal_solution_host_ = std::make_unique<std::vector<f_t>>(); }
+  if (!dual_solution_host_) { dual_solution_host_ = std::make_unique<std::vector<f_t>>(); }
+
+  // Clear device buffers to avoid memory leaks
+  primal_solution_.reset();
+  dual_solution_.reset();
+  reduced_cost_.reset();
+
+  is_device_memory_ = false;
 }
 
 template <typename i_t, typename f_t>
 void optimization_problem_solution_t<i_t, f_t>::set_termination_stats(
   const additional_termination_information_t& stats)
 {
+  cuopt_assert(!termination_stats_.empty(), "termination_stats_ is empty");
   termination_stats_[0] = stats;
 }
 
@@ -635,42 +712,49 @@ void optimization_problem_solution_t<i_t, f_t>::set_termination_stats(
 template <typename i_t, typename f_t>
 f_t optimization_problem_solution_t<i_t, f_t>::get_l2_primal_residual() const
 {
+  cuopt_assert(!termination_stats_.empty(), "termination_stats_ is empty");
   return termination_stats_[0].l2_primal_residual;
 }
 
 template <typename i_t, typename f_t>
 f_t optimization_problem_solution_t<i_t, f_t>::get_l2_dual_residual() const
 {
+  cuopt_assert(!termination_stats_.empty(), "termination_stats_ is empty");
   return termination_stats_[0].l2_dual_residual;
 }
 
 template <typename i_t, typename f_t>
 f_t optimization_problem_solution_t<i_t, f_t>::get_primal_objective() const
 {
+  cuopt_assert(!termination_stats_.empty(), "termination_stats_ is empty");
   return termination_stats_[0].primal_objective;
 }
 
 template <typename i_t, typename f_t>
 f_t optimization_problem_solution_t<i_t, f_t>::get_dual_objective() const
 {
+  cuopt_assert(!termination_stats_.empty(), "termination_stats_ is empty");
   return termination_stats_[0].dual_objective;
 }
 
 template <typename i_t, typename f_t>
 f_t optimization_problem_solution_t<i_t, f_t>::get_gap() const
 {
+  cuopt_assert(!termination_stats_.empty(), "termination_stats_ is empty");
   return termination_stats_[0].gap;
 }
 
 template <typename i_t, typename f_t>
 i_t optimization_problem_solution_t<i_t, f_t>::get_nb_iterations() const
 {
+  cuopt_assert(!termination_stats_.empty(), "termination_stats_ is empty");
   return termination_stats_[0].number_of_steps_taken;
 }
 
 template <typename i_t, typename f_t>
 bool optimization_problem_solution_t<i_t, f_t>::get_solved_by_pdlp() const
 {
+  cuopt_assert(!termination_stats_.empty(), "termination_stats_ is empty");
   return termination_stats_[0].solved_by_pdlp;
 }
 
@@ -681,42 +765,49 @@ bool optimization_problem_solution_t<i_t, f_t>::get_solved_by_pdlp() const
 template <typename i_t, typename f_t>
 void optimization_problem_solution_t<i_t, f_t>::set_l2_primal_residual(f_t value)
 {
+  cuopt_assert(!termination_stats_.empty(), "termination_stats_ is empty");
   termination_stats_[0].l2_primal_residual = value;
 }
 
 template <typename i_t, typename f_t>
 void optimization_problem_solution_t<i_t, f_t>::set_l2_dual_residual(f_t value)
 {
+  cuopt_assert(!termination_stats_.empty(), "termination_stats_ is empty");
   termination_stats_[0].l2_dual_residual = value;
 }
 
 template <typename i_t, typename f_t>
 void optimization_problem_solution_t<i_t, f_t>::set_primal_objective(f_t value)
 {
+  cuopt_assert(!termination_stats_.empty(), "termination_stats_ is empty");
   termination_stats_[0].primal_objective = value;
 }
 
 template <typename i_t, typename f_t>
 void optimization_problem_solution_t<i_t, f_t>::set_dual_objective(f_t value)
 {
+  cuopt_assert(!termination_stats_.empty(), "termination_stats_ is empty");
   termination_stats_[0].dual_objective = value;
 }
 
 template <typename i_t, typename f_t>
 void optimization_problem_solution_t<i_t, f_t>::set_gap(f_t value)
 {
+  cuopt_assert(!termination_stats_.empty(), "termination_stats_ is empty");
   termination_stats_[0].gap = value;
 }
 
 template <typename i_t, typename f_t>
 void optimization_problem_solution_t<i_t, f_t>::set_nb_iterations(i_t value)
 {
+  cuopt_assert(!termination_stats_.empty(), "termination_stats_ is empty");
   termination_stats_[0].number_of_steps_taken = value;
 }
 
 template <typename i_t, typename f_t>
 void optimization_problem_solution_t<i_t, f_t>::set_solved_by_pdlp(bool value)
 {
+  cuopt_assert(!termination_stats_.empty(), "termination_stats_ is empty");
   termination_stats_[0].solved_by_pdlp = value;
 }
 
@@ -745,12 +836,18 @@ void optimization_problem_solution_t<i_t, f_t>::write_to_sol_file(
 
   if (is_device_memory_) {
     // Copy from GPU to CPU
+    cuopt_expects(primal_solution_ != nullptr,
+                  error_type_t::ValidationError,
+                  "Device primal solution is null in write_to_sol_file");
     solution.resize(primal_solution_->size());
     raft::copy(
       solution.data(), primal_solution_->data(), primal_solution_->size(), stream_view.value());
     RAFT_CUDA_TRY(cudaStreamSynchronize(stream_view.value()));
   } else {
     // Already on CPU
+    cuopt_expects(primal_solution_host_ != nullptr,
+                  error_type_t::ValidationError,
+                  "Host primal solution is null in write_to_sol_file");
     solution = *primal_solution_host_;
   }
 
diff --git a/cpp/src/linear_programming/utilities/cython_solve.cu b/cpp/src/linear_programming/utilities/cython_solve.cu
index 64f982244..939090a57 100644
--- a/cpp/src/linear_programming/utilities/cython_solve.cu
+++ b/cpp/src/linear_programming/utilities/cython_solve.cu
@@ -263,7 +263,7 @@ std::unique_ptr<solver_ret_t> call_solve(
     bool is_mip    = false;
     auto var_types = data_model->get_variable_types();
     for (size_t i = 0; i < var_types.size(); ++i) {
-      if (var_types.data()[i] == 'I' || var_types.data()[i] == 'B') {
+      if (var_types.data()[i] == 'I') {
         is_mip = true;
         break;
       }
diff --git a/cpp/src/mip/solve.cu b/cpp/src/mip/solve.cu
index c0cd6b16f..92a3b64b4 100644
--- a/cpp/src/mip/solve.cu
+++ b/cpp/src/mip/solve.cu
@@ -388,6 +388,7 @@ struct cpu_problem_data_t {
   std::vector<f_t> variable_lower_bounds;
   std::vector<f_t> variable_upper_bounds;
   std::vector<char> variable_types;
+  std::vector<char> row_types;
   std::vector<f_t> quadratic_objective_values;
   std::vector<i_t> quadratic_objective_indices;
   std::vector<i_t> quadratic_objective_offsets;
@@ -431,6 +432,7 @@ struct cpu_problem_data_t {
     if (!variable_types.empty()) {
       v.set_variable_types(variable_types.data(), variable_types.size());
     }
+    if (!row_types.empty()) { v.set_row_types(row_types.data(), row_types.size()); }
     if (!quadratic_objective_values.empty()) {
       v.set_quadratic_objective_matrix(quadratic_objective_values.data(),
                                        quadratic_objective_values.size(),
@@ -487,6 +489,17 @@ cpu_problem_data_t<i_t, f_t> copy_view_to_cpu(raft::handle_t const* handle_ptr,
                                   stream));
   }
 
+  // Row types need special handling (char array)
+  auto row_types_span = gpu_view.get_row_types();
+  if (row_types_span.size() > 0) {
+    cpu_data.row_types.resize(row_types_span.size());
+    RAFT_CUDA_TRY(cudaMemcpyAsync(cpu_data.row_types.data(),
+                                  row_types_span.data(),
+                                  row_types_span.size() * sizeof(char),
+                                  cudaMemcpyDeviceToHost,
+                                  stream));
+  }
+
   // Synchronize to ensure all copies are complete
   RAFT_CUDA_TRY(cudaStreamSynchronize(stream));
 
diff --git a/cpp/src/mip/solver_solution.cu b/cpp/src/mip/solver_solution.cu
index 4ea545bbb..a88a4d217 100644
--- a/cpp/src/mip/solver_solution.cu
+++ b/cpp/src/mip/solver_solution.cu
@@ -333,7 +333,14 @@ void mip_solution_t<i_t, f_t>::log_summary() const
 template <typename i_t, typename f_t>
 void mip_solution_t<i_t, f_t>::set_solution_host(std::vector<f_t> solution)
 {
-  solution_host_    = std::make_unique<std::vector<f_t>>(std::move(solution));
+  solution_host_ = std::make_unique<std::vector<f_t>>(std::move(solution));
+
+  // Clear device storage to free GPU memory
+  solution_.reset();
+
+  // Note: solution_pool_ is typically empty for remote solves and doesn't need explicit cleanup
+  // If solution_pool_ contains device data, it will be freed when the object is destroyed
+
   is_device_memory_ = false;
 }
 
@@ -438,6 +445,13 @@ void mip_solution_t<i_t, f_t>::to_host(rmm::cuda_stream_view stream_view)
   // Clear GPU storage to free memory
   solution_.reset();
 
+  // Clear solution pool if it contains device buffers
+  if (!solution_pool_.empty()) {
+    // solution_pool_ contains rmm::device_uvector objects which will be freed automatically
+    // when the vector is cleared (RAII cleanup)
+    solution_pool_.clear();
+  }
+
   is_device_memory_ = false;
 }
 
diff --git a/python/cuopt/cuopt/tests/linear_programming/test_memory_model.py b/python/cuopt/cuopt/tests/linear_programming/test_memory_model.py
index 90ed29678..cb99ff7c5 100644
--- a/python/cuopt/cuopt/tests/linear_programming/test_memory_model.py
+++ b/python/cuopt/cuopt/tests/linear_programming/test_memory_model.py
@@ -187,6 +187,25 @@ def test_remote_solve_mip_stub_with_env_vars(self):
 class TestEmptyConstraintMatrix:
     """Test handling of problems with no constraints (edge case for memory model)."""
 
+    def setup_method(self):
+        """Force local solve by clearing remote environment variables."""
+        self._orig_env = {
+            "CUOPT_REMOTE_HOST": os.environ.get("CUOPT_REMOTE_HOST"),
+            "CUOPT_REMOTE_PORT": os.environ.get("CUOPT_REMOTE_PORT"),
+        }
+        # Clear to ensure local solve
+        for var in ["CUOPT_REMOTE_HOST", "CUOPT_REMOTE_PORT"]:
+            if var in os.environ:
+                del os.environ[var]
+
+    def teardown_method(self):
+        """Restore original environment after each test."""
+        for var, value in self._orig_env.items():
+            if value is not None:
+                os.environ[var] = value
+            elif var in os.environ:
+                del os.environ[var]
+
     def test_empty_problem_with_objective_offset(self):
         """Test problem with no variables or constraints, only objective offset."""
         import cuopt_mps_parser

From 649191b9b2143e7976a235e3f9878e89eed85d0c Mon Sep 17 00:00:00 2001
From: Trevor McKay <tmgithub1@gmail.com>
Date: Thu, 29 Jan 2026 22:19:28 -0500
Subject: [PATCH 18/22] Consolidate data model conversion functions and remove
 unused code

---
 cpp/cuopt_cli.cpp                             | 107 +---
 .../mip/solver_solution.hpp                   |  55 --
 .../optimization_problem_conversions.hpp      | 136 +++++
 .../pdlp/solver_solution.hpp                  |  59 ---
 .../cuopt/linear_programming/solve.hpp        |  24 +-
 cpp/libmps_parser/src/data_model_view.cpp     |   2 -
 cpp/src/linear_programming/CMakeLists.txt     |   1 +
 cpp/src/linear_programming/cuopt_c.cpp        |  20 +-
 .../optimization_problem_conversions.cu       | 479 ++++++++++++++++++
 cpp/src/linear_programming/solve.cu           | 456 +----------------
 cpp/src/linear_programming/solver_solution.cu | 104 +---
 .../utilities/cython_solve.cu                 | 126 ++---
 cpp/src/mip/solve.cu                          | 217 +-------
 cpp/src/mip/solver_solution.cu                |  74 ---
 14 files changed, 685 insertions(+), 1175 deletions(-)
 create mode 100644 cpp/include/cuopt/linear_programming/optimization_problem_conversions.hpp
 create mode 100644 cpp/src/linear_programming/optimization_problem_conversions.cu

diff --git a/cpp/cuopt_cli.cpp b/cpp/cuopt_cli.cpp
index 5ceccbc77..d8106bf47 100644
--- a/cpp/cuopt_cli.cpp
+++ b/cpp/cuopt_cli.cpp
@@ -8,6 +8,7 @@
 #include <cuopt/linear_programming/data_model_view.hpp>
 #include <cuopt/linear_programming/mip/solver_settings.hpp>
 #include <cuopt/linear_programming/optimization_problem.hpp>
+#include <cuopt/linear_programming/optimization_problem_conversions.hpp>
 #include <cuopt/linear_programming/solve.hpp>
 #include <cuopt/linear_programming/utilities/remote_solve.hpp>
 #include <mps_parser/parser.hpp>
@@ -69,108 +70,6 @@ static char cuda_module_loading_env[] = "CUDA_MODULE_LOADING=EAGER";
  */
 inline auto make_async() { return std::make_shared<rmm::mr::cuda_async_memory_resource>(); }
 
-/**
- * @brief Create a data_model_view_t from mps_data_model_t
- *
- * This creates a non-owning view with spans pointing to the CPU data in the mps_data_model.
- * Used for remote solve where data stays in CPU memory.
- *
- * @param mps_data_model The owning mps_data_model_t
- * @return data_model_view_t with spans pointing to the mps_data_model's vectors
- */
-template <typename i_t, typename f_t>
-cuopt::linear_programming::data_model_view_t<i_t, f_t> create_view_from_mps_data_model(
-  const cuopt::mps_parser::mps_data_model_t<i_t, f_t>& mps_data_model)
-{
-  cuopt::linear_programming::data_model_view_t<i_t, f_t> view;
-
-  view.set_maximize(mps_data_model.get_sense());
-
-  if (!mps_data_model.get_constraint_matrix_values().empty()) {
-    view.set_csr_constraint_matrix(mps_data_model.get_constraint_matrix_values().data(),
-                                   mps_data_model.get_constraint_matrix_values().size(),
-                                   mps_data_model.get_constraint_matrix_indices().data(),
-                                   mps_data_model.get_constraint_matrix_indices().size(),
-                                   mps_data_model.get_constraint_matrix_offsets().data(),
-                                   mps_data_model.get_constraint_matrix_offsets().size());
-  }
-
-  if (!mps_data_model.get_constraint_bounds().empty()) {
-    view.set_constraint_bounds(mps_data_model.get_constraint_bounds().data(),
-                               mps_data_model.get_constraint_bounds().size());
-  }
-
-  if (!mps_data_model.get_objective_coefficients().empty()) {
-    view.set_objective_coefficients(mps_data_model.get_objective_coefficients().data(),
-                                    mps_data_model.get_objective_coefficients().size());
-  }
-
-  view.set_objective_scaling_factor(mps_data_model.get_objective_scaling_factor());
-  view.set_objective_offset(mps_data_model.get_objective_offset());
-
-  if (!mps_data_model.get_variable_lower_bounds().empty()) {
-    view.set_variable_lower_bounds(mps_data_model.get_variable_lower_bounds().data(),
-                                   mps_data_model.get_variable_lower_bounds().size());
-  }
-
-  if (!mps_data_model.get_variable_upper_bounds().empty()) {
-    view.set_variable_upper_bounds(mps_data_model.get_variable_upper_bounds().data(),
-                                   mps_data_model.get_variable_upper_bounds().size());
-  }
-
-  if (!mps_data_model.get_variable_types().empty()) {
-    view.set_variable_types(mps_data_model.get_variable_types().data(),
-                            mps_data_model.get_variable_types().size());
-  }
-
-  if (!mps_data_model.get_row_types().empty()) {
-    view.set_row_types(mps_data_model.get_row_types().data(),
-                       mps_data_model.get_row_types().size());
-  }
-
-  if (!mps_data_model.get_constraint_lower_bounds().empty()) {
-    view.set_constraint_lower_bounds(mps_data_model.get_constraint_lower_bounds().data(),
-                                     mps_data_model.get_constraint_lower_bounds().size());
-  }
-
-  if (!mps_data_model.get_constraint_upper_bounds().empty()) {
-    view.set_constraint_upper_bounds(mps_data_model.get_constraint_upper_bounds().data(),
-                                     mps_data_model.get_constraint_upper_bounds().size());
-  }
-
-  view.set_objective_name(mps_data_model.get_objective_name());
-  view.set_problem_name(mps_data_model.get_problem_name());
-
-  if (!mps_data_model.get_variable_names().empty()) {
-    view.set_variable_names(mps_data_model.get_variable_names());
-  }
-
-  if (!mps_data_model.get_row_names().empty()) {
-    view.set_row_names(mps_data_model.get_row_names());
-  }
-
-  if (!mps_data_model.get_initial_primal_solution().empty()) {
-    view.set_initial_primal_solution(mps_data_model.get_initial_primal_solution().data(),
-                                     mps_data_model.get_initial_primal_solution().size());
-  }
-
-  if (!mps_data_model.get_initial_dual_solution().empty()) {
-    view.set_initial_dual_solution(mps_data_model.get_initial_dual_solution().data(),
-                                   mps_data_model.get_initial_dual_solution().size());
-  }
-
-  if (mps_data_model.has_quadratic_objective()) {
-    view.set_quadratic_objective_matrix(mps_data_model.get_quadratic_objective_values().data(),
-                                        mps_data_model.get_quadratic_objective_values().size(),
-                                        mps_data_model.get_quadratic_objective_indices().data(),
-                                        mps_data_model.get_quadratic_objective_indices().size(),
-                                        mps_data_model.get_quadratic_objective_offsets().data(),
-                                        mps_data_model.get_quadratic_objective_offsets().size());
-  }
-
-  return view;
-}
-
 /**
  * @brief Handle logger when error happens before logger is initialized
  * @param settings Solver settings
@@ -264,9 +163,9 @@ int run_single_file(const std::string& file_path,
     return -1;
   }
 
-  // Create a non-owning view from the mps_data_model
+  // Create a non-owning view from the mps_data_model (using shared conversion function)
   // solve_lp/solve_mip will handle remote vs local solve based on env vars
-  auto view = create_view_from_mps_data_model(mps_data_model);
+  auto view = cuopt::linear_programming::create_view_from_mps_data_model(mps_data_model);
 
   try {
     // Pass handle_ptr.get() - can be nullptr for remote solve
diff --git a/cpp/include/cuopt/linear_programming/mip/solver_solution.hpp b/cpp/include/cuopt/linear_programming/mip/solver_solution.hpp
index 6b868cde2..bcff1bfc7 100644
--- a/cpp/include/cuopt/linear_programming/mip/solver_solution.hpp
+++ b/cpp/include/cuopt/linear_programming/mip/solver_solution.hpp
@@ -139,61 +139,6 @@ class mip_solution_t : public base_solution_t {
   // Setters for remote solve deserialization
   //============================================================================
 
-  /**
-   * @brief Set the solution in host memory
-   * @param solution The solution vector
-   */
-  void set_solution_host(std::vector<f_t> solution);
-
-  /**
-   * @brief Set the objective value
-   */
-  void set_objective(f_t value);
-
-  /**
-   * @brief Set the MIP gap
-   */
-  void set_mip_gap(f_t value);
-
-  /**
-   * @brief Set the solution bound
-   */
-  void set_solution_bound(f_t value);
-
-  /**
-   * @brief Set total solve time
-   */
-  void set_total_solve_time(double value);
-
-  /**
-   * @brief Set presolve time
-   */
-  void set_presolve_time(double value);
-
-  /**
-   * @brief Set max constraint violation
-   */
-  void set_max_constraint_violation(f_t value);
-
-  /**
-   * @brief Set max integer violation
-   */
-  void set_max_int_violation(f_t value);
-
-  /**
-   * @brief Set max variable bound violation
-   */
-  void set_max_variable_bound_violation(f_t value);
-
-  /**
-   * @brief Set number of nodes
-   */
-  void set_nodes(i_t value);
-
-  /**
-   * @brief Set number of simplex iterations
-   */
-  void set_simplex_iterations(i_t value);
 
   /**
    * @brief Get error string
diff --git a/cpp/include/cuopt/linear_programming/optimization_problem_conversions.hpp b/cpp/include/cuopt/linear_programming/optimization_problem_conversions.hpp
new file mode 100644
index 000000000..afcf5c1dd
--- /dev/null
+++ b/cpp/include/cuopt/linear_programming/optimization_problem_conversions.hpp
@@ -0,0 +1,136 @@
+/* clang-format off */
+/*
+ * SPDX-FileCopyrightText: Copyright (c) 2023-2026, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+ * SPDX-License-Identifier: Apache-2.0
+ */
+/* clang-format on */
+
+#pragma once
+
+#include <cuopt/linear_programming/optimization_problem.hpp>
+#include <mps_parser/data_model_view.hpp>
+#include <mps_parser/mps_data_model.hpp>
+
+#include <raft/core/handle.hpp>
+
+namespace cuopt {
+namespace linear_programming {
+
+/**
+ * @brief Convert a data_model_view_t to an optimization_problem_t.
+ * 
+ * This function creates a GPU-resident optimization problem from a view that can
+ * point to either CPU or GPU memory. The view's pointers are checked at runtime to
+ * determine their memory location, and appropriate copy operations are performed.
+ * 
+ * @tparam i_t Integer type (typically int)
+ * @tparam f_t Floating-point type (float or double)
+ * @param handle_ptr RAFT handle for GPU operations. Must not be null.
+ * @param view Non-owning view pointing to problem data (CPU or GPU memory)
+ * @return optimization_problem_t<i_t, f_t> GPU-resident optimization problem
+ * 
+ * @note This function handles the conversion from both CPU and GPU source data.
+ *       Variable types and quadratic objective data are always copied to CPU first
+ *       before being set on the optimization_problem_t (as required by the API).
+ */
+template <typename i_t, typename f_t>
+optimization_problem_t<i_t, f_t> data_model_view_to_optimization_problem(
+  raft::handle_t const* handle_ptr,
+  const cuopt::mps_parser::data_model_view_t<i_t, f_t>& view);
+
+/**
+ * @brief Convert an mps_data_model_t to an optimization_problem_t.
+ * 
+ * This function creates a GPU-resident optimization problem from MPS data that
+ * resides in CPU memory. All data is copied from CPU to GPU.
+ * 
+ * @tparam i_t Integer type (typically int)
+ * @tparam f_t Floating-point type (float or double)
+ * @param handle_ptr RAFT handle for GPU operations. Must not be null.
+ * @param data_model MPS data model with problem data in CPU memory
+ * @return optimization_problem_t<i_t, f_t> GPU-resident optimization problem
+ * 
+ * @note All data in mps_data_model_t is in CPU memory (std::vector).
+ *       This function performs CPU → GPU copies for all problem data.
+ */
+template <typename i_t, typename f_t>
+optimization_problem_t<i_t, f_t> mps_data_model_to_optimization_problem(
+  raft::handle_t const* handle_ptr,
+  const cuopt::mps_parser::mps_data_model_t<i_t, f_t>& data_model);
+
+/**
+ * @brief Create a data_model_view_t from an mps_data_model_t.
+ * 
+ * This helper function creates a non-owning view pointing to the CPU memory
+ * in an mps_data_model_t. The view can be used for remote solves or for
+ * creating an optimization_problem_t.
+ * 
+ * @tparam i_t Integer type (typically int)
+ * @tparam f_t Floating-point type (float or double)
+ * @param mps_data_model MPS data model with problem data in CPU memory
+ * @return data_model_view_t<i_t, f_t> Non-owning view with is_device_memory_=false
+ * 
+ * @note The returned view points to memory owned by mps_data_model.
+ *       The mps_data_model must remain alive while the view is in use.
+ */
+template <typename i_t, typename f_t>
+cuopt::mps_parser::data_model_view_t<i_t, f_t> create_view_from_mps_data_model(
+  const cuopt::mps_parser::mps_data_model_t<i_t, f_t>& mps_data_model);
+
+/**
+ * @brief Helper struct to hold CPU copies of GPU problem data.
+ * 
+ * This struct is used when GPU data needs to be copied to CPU for remote solve.
+ * It provides a create_view() method to create a data_model_view_t pointing to
+ * its CPU memory.
+ * 
+ * @tparam i_t Integer type (typically int)
+ * @tparam f_t Floating-point type (float or double)
+ */
+template <typename i_t, typename f_t>
+struct cpu_problem_data_t {
+  std::vector<f_t> A_values;
+  std::vector<i_t> A_indices;
+  std::vector<i_t> A_offsets;
+  std::vector<f_t> constraint_bounds;
+  std::vector<f_t> constraint_lower_bounds;
+  std::vector<f_t> constraint_upper_bounds;
+  std::vector<f_t> objective_coefficients;
+  std::vector<f_t> variable_lower_bounds;
+  std::vector<f_t> variable_upper_bounds;
+  std::vector<char> variable_types;
+  std::vector<f_t> quadratic_objective_values;
+  std::vector<i_t> quadratic_objective_indices;
+  std::vector<i_t> quadratic_objective_offsets;
+  bool maximize;
+  f_t objective_scaling_factor;
+  f_t objective_offset;
+
+  /**
+   * @brief Create a data_model_view_t pointing to this CPU data.
+   * @return data_model_view_t<i_t, f_t> Non-owning view with is_device_memory_=false
+   */
+  cuopt::mps_parser::data_model_view_t<i_t, f_t> create_view() const;
+};
+
+/**
+ * @brief Copy GPU view data to CPU memory.
+ * 
+ * This function is used when we have a GPU-resident view but need CPU data
+ * (e.g., for remote solve). All data is copied from GPU to CPU synchronously.
+ * 
+ * @tparam i_t Integer type (typically int)
+ * @tparam f_t Floating-point type (float or double)
+ * @param handle_ptr RAFT handle for GPU operations. Must not be null.
+ * @param gpu_view View pointing to GPU memory
+ * @return cpu_problem_data_t<i_t, f_t> CPU copy of all problem data
+ * 
+ * @note This function synchronizes the CUDA stream to ensure all copies complete.
+ */
+template <typename i_t, typename f_t>
+cpu_problem_data_t<i_t, f_t> copy_view_to_cpu(
+  raft::handle_t const* handle_ptr,
+  const cuopt::mps_parser::data_model_view_t<i_t, f_t>& gpu_view);
+
+}  // namespace linear_programming
+}  // namespace cuopt
diff --git a/cpp/include/cuopt/linear_programming/pdlp/solver_solution.hpp b/cpp/include/cuopt/linear_programming/pdlp/solver_solution.hpp
index 805d13b14..a4b7b8427 100644
--- a/cpp/include/cuopt/linear_programming/pdlp/solver_solution.hpp
+++ b/cpp/include/cuopt/linear_programming/pdlp/solver_solution.hpp
@@ -335,29 +335,6 @@ class optimization_problem_solution_t : public base_solution_t {
   // Setters for host solution data (used by remote solve deserialization)
   //============================================================================
 
-  /**
-   * @brief Set the primal solution in host memory
-   * @param solution The primal solution vector
-   */
-  void set_primal_solution_host(std::vector<f_t> solution);
-
-  /**
-   * @brief Set the dual solution in host memory
-   * @param solution The dual solution vector
-   */
-  void set_dual_solution_host(std::vector<f_t> solution);
-
-  /**
-   * @brief Set the reduced cost in host memory
-   * @param reduced_cost The reduced cost vector
-   */
-  void set_reduced_cost_host(std::vector<f_t> reduced_cost);
-
-  /**
-   * @brief Set the termination statistics
-   * @param stats The termination statistics
-   */
-  void set_termination_stats(const additional_termination_information_t& stats);
 
   //============================================================================
   // Getters for termination statistics
@@ -405,42 +382,6 @@ class optimization_problem_solution_t : public base_solution_t {
    */
   bool get_solved_by_pdlp() const;
 
-  /**
-   * @brief Set L2 primal residual
-   * @param value The value
-   */
-  void set_l2_primal_residual(f_t value);
-
-  /**
-   * @brief Set L2 dual residual
-   * @param value The value
-   */
-  void set_l2_dual_residual(f_t value);
-
-  /**
-   * @brief Set primal objective
-   * @param value The value
-   */
-  void set_primal_objective(f_t value);
-
-  /**
-   * @brief Set dual objective
-   * @param value The value
-   */
-  void set_dual_objective(f_t value);
-
-  /**
-   * @brief Set gap
-   * @param value The value
-   */
-  void set_gap(f_t value);
-
-  /**
-   * @brief Set number of iterations
-   * @param value The value
-   */
-  void set_nb_iterations(i_t value);
-
   /**
    * @brief Set solved by PDLP flag
    * @param value The value
diff --git a/cpp/include/cuopt/linear_programming/solve.hpp b/cpp/include/cuopt/linear_programming/solve.hpp
index c55fe46f0..e9d1c4c02 100644
--- a/cpp/include/cuopt/linear_programming/solve.hpp
+++ b/cpp/include/cuopt/linear_programming/solve.hpp
@@ -11,6 +11,7 @@
 #include <cuopt/linear_programming/mip/solver_settings.hpp>
 #include <cuopt/linear_programming/mip/solver_solution.hpp>
 #include <cuopt/linear_programming/optimization_problem.hpp>
+#include <cuopt/linear_programming/optimization_problem_conversions.hpp>
 #include <cuopt/linear_programming/pdlp/solver_settings.hpp>
 #include <cuopt/linear_programming/pdlp/solver_solution.hpp>
 #include <cuopt/linear_programming/solver_settings.hpp>
@@ -141,27 +142,8 @@ mip_solution_t<i_t, f_t> solve_mip(
   const cuopt::mps_parser::mps_data_model_t<i_t, f_t>& mps_data_model,
   mip_solver_settings_t<i_t, f_t> const& settings = mip_solver_settings_t<i_t, f_t>{});
 
-template <typename i_t, typename f_t>
-optimization_problem_t<i_t, f_t> mps_data_model_to_optimization_problem(
-  raft::handle_t const* handle_ptr,
-  const cuopt::mps_parser::mps_data_model_t<i_t, f_t>& data_model);
-
-/**
- * @brief Convert a data_model_view_t to an optimization_problem_t.
- *
- * This function copies data from the view (which can point to CPU or GPU memory)
- * into an owning optimization_problem_t.
- *
- * @tparam i_t Data type of indexes
- * @tparam f_t Data type of the variables and their weights in the equations
- *
- * @param[in] handle_ptr  A raft::handle_t object with its corresponding CUDA stream.
- * @param[in] view  A data_model_view_t<i_t, f_t> object with spans pointing to CPU or GPU memory
- * @return optimization_problem_t<i_t, f_t> owning container for the problem
- */
-template <typename i_t, typename f_t>
-optimization_problem_t<i_t, f_t> data_model_view_to_optimization_problem(
-  raft::handle_t const* handle_ptr, const data_model_view_t<i_t, f_t>& view);
+// Conversion functions are now declared in optimization_problem_conversions.hpp
+// (included above) and implemented in optimization_problem_conversions.cu
 
 /**
  * @brief Linear programming solve function using data_model_view_t.
diff --git a/cpp/libmps_parser/src/data_model_view.cpp b/cpp/libmps_parser/src/data_model_view.cpp
index 8be1b899a..a8035eead 100644
--- a/cpp/libmps_parser/src/data_model_view.cpp
+++ b/cpp/libmps_parser/src/data_model_view.cpp
@@ -351,7 +351,5 @@ bool data_model_view_t<i_t, f_t>::has_quadratic_objective() const noexcept
 // NOTE: Explicitly instantiate all types here in order to avoid linker error
 template class data_model_view_t<int, float>;
 template class data_model_view_t<int, double>;
-template class data_model_view_t<int64_t, float>;
-template class data_model_view_t<int64_t, double>;
 
 }  // namespace cuopt::mps_parser
diff --git a/cpp/src/linear_programming/CMakeLists.txt b/cpp/src/linear_programming/CMakeLists.txt
index ced9da8ed..c5f1a9780 100644
--- a/cpp/src/linear_programming/CMakeLists.txt
+++ b/cpp/src/linear_programming/CMakeLists.txt
@@ -9,6 +9,7 @@ set(LP_CORE_FILES
   ${CMAKE_CURRENT_SOURCE_DIR}/optimization_problem.cu
   ${CMAKE_CURRENT_SOURCE_DIR}/utilities/problem_checking.cu
   ${CMAKE_CURRENT_SOURCE_DIR}/solve.cu
+  ${CMAKE_CURRENT_SOURCE_DIR}/optimization_problem_conversions.cu
   ${CMAKE_CURRENT_SOURCE_DIR}/pdlp.cu
   ${CMAKE_CURRENT_SOURCE_DIR}/pdhg.cu
   ${CMAKE_CURRENT_SOURCE_DIR}/solver_solution.cu
diff --git a/cpp/src/linear_programming/cuopt_c.cpp b/cpp/src/linear_programming/cuopt_c.cpp
index 66f66f0af..3485caced 100644
--- a/cpp/src/linear_programming/cuopt_c.cpp
+++ b/cpp/src/linear_programming/cuopt_c.cpp
@@ -1293,8 +1293,24 @@ cuopt_int_t cuOptSolve(cuOptOptimizationProblem problem,
   const auto& view = problem_and_stream_view->view;
 
   if (view.is_device_memory()) {
-    // Local path: data is already on GPU
-    // Use gpu_problem directly for optimal performance (no extra copy)
+    // PERFORMANCE OPTIMIZATION: GPU path bypasses data_model_view_t interface
+    //
+    // When data is already on GPU (optimization_problem_t exists), we call the
+    // solver directly with optimization_problem_t& instead of going through the
+    // data_model_view_t interface. This avoids an unnecessary conversion:
+    //   solve_lp(view) → data_model_view_to_optimization_problem(view) → NEW optimization_problem_t
+    //
+    // Since we already have optimization_problem_t in memory, creating another one
+    // would be redundant (GPU → GPU copy). Instead, we use the direct solver interface:
+    //   solve_lp(optimization_problem_t&)
+    //
+    // This optimization is safe because:
+    // 1. The view was created from gpu_problem (create_view_from_gpu_problem)
+    // 2. The view is only used for is_device_memory() check and is_mip() detection
+    // 3. All actual problem data is in gpu_problem, not the view
+    //
+    // For CPU paths, we always use solve_lp(handle, view, settings) which handles
+    // both remote solve and local CPU→GPU conversion.
     auto& gpu_problem = *problem_and_stream_view->gpu_problem;
 
     if (is_mip) {
diff --git a/cpp/src/linear_programming/optimization_problem_conversions.cu b/cpp/src/linear_programming/optimization_problem_conversions.cu
new file mode 100644
index 000000000..2f0f78f76
--- /dev/null
+++ b/cpp/src/linear_programming/optimization_problem_conversions.cu
@@ -0,0 +1,479 @@
+/* clang-format off */
+/*
+ * SPDX-FileCopyrightText: Copyright (c) 2023-2026, NVIDIA CORPORATION & AFFILIATES. All rights reserved.
+ * SPDX-License-Identifier: Apache-2.0
+ */
+/* clang-format on */
+
+#include <cuopt/linear_programming/optimization_problem_conversions.hpp>
+
+#include <mip/mip_constants.hpp>
+
+#include <raft/core/copy.hpp>
+#include <raft/core/error.hpp>
+
+#include <algorithm>
+#include <cstring>
+#include <vector>
+
+namespace cuopt {
+namespace linear_programming {
+
+template <typename i_t, typename f_t>
+optimization_problem_t<i_t, f_t> data_model_view_to_optimization_problem(
+  raft::handle_t const* handle_ptr, const cuopt::mps_parser::data_model_view_t<i_t, f_t>& view)
+{
+  optimization_problem_t<i_t, f_t> op_problem(handle_ptr);
+  op_problem.set_maximize(view.get_sense());
+
+  // Set constraint matrix if offsets are present (includes empty problems with offsets=[0])
+  if (view.get_constraint_matrix_offsets().size() > 0) {
+    op_problem.set_csr_constraint_matrix(view.get_constraint_matrix_values().data(),
+                                         view.get_constraint_matrix_values().size(),
+                                         view.get_constraint_matrix_indices().data(),
+                                         view.get_constraint_matrix_indices().size(),
+                                         view.get_constraint_matrix_offsets().data(),
+                                         view.get_constraint_matrix_offsets().size());
+  }
+
+  if (view.get_constraint_bounds().size() != 0) {
+    op_problem.set_constraint_bounds(view.get_constraint_bounds().data(),
+                                     view.get_constraint_bounds().size());
+  }
+  if (view.get_objective_coefficients().size() != 0) {
+    op_problem.set_objective_coefficients(view.get_objective_coefficients().data(),
+                                          view.get_objective_coefficients().size());
+  }
+  op_problem.set_objective_scaling_factor(view.get_objective_scaling_factor());
+  op_problem.set_objective_offset(view.get_objective_offset());
+  if (view.get_variable_lower_bounds().size() != 0) {
+    op_problem.set_variable_lower_bounds(view.get_variable_lower_bounds().data(),
+                                         view.get_variable_lower_bounds().size());
+  }
+  if (view.get_variable_upper_bounds().size() != 0) {
+    op_problem.set_variable_upper_bounds(view.get_variable_upper_bounds().data(),
+                                         view.get_variable_upper_bounds().size());
+  }
+  if (view.get_variable_types().size() != 0) {
+    auto var_types = view.get_variable_types();
+
+    // Check if the pointer is on host or device
+    cudaPointerAttributes attrs;
+    cudaError_t err = cudaPointerGetAttributes(&attrs, var_types.data());
+
+    std::vector<char> host_var_types(var_types.size());
+    if (err == cudaSuccess && attrs.type == cudaMemoryTypeDevice) {
+      // Source is on GPU - copy to host
+      RAFT_CUDA_TRY(cudaMemcpy(host_var_types.data(),
+                               var_types.data(),
+                               var_types.size() * sizeof(char),
+                               cudaMemcpyDeviceToHost));
+    } else {
+      // Source is on host (or unregistered) - direct copy
+      if (err != cudaSuccess) { cudaGetLastError(); }  // Clear cudaPointerGetAttributes error
+      if (err != cudaSuccess && err != cudaErrorInvalidValue) { RAFT_CUDA_TRY(err); }
+      std::memcpy(host_var_types.data(), var_types.data(), var_types.size() * sizeof(char));
+    }
+
+    std::vector<var_t> enum_variable_types(var_types.size());
+    for (std::size_t i = 0; i < var_types.size(); ++i) {
+      enum_variable_types[i] = host_var_types[i] == 'I' ? var_t::INTEGER : var_t::CONTINUOUS;
+    }
+    op_problem.set_variable_types(enum_variable_types.data(), enum_variable_types.size());
+  }
+
+  if (view.get_row_types().size() != 0) {
+    op_problem.set_row_types(view.get_row_types().data(), view.get_row_types().size());
+  }
+  if (view.get_constraint_lower_bounds().size() != 0) {
+    op_problem.set_constraint_lower_bounds(view.get_constraint_lower_bounds().data(),
+                                           view.get_constraint_lower_bounds().size());
+  }
+  if (view.get_constraint_upper_bounds().size() != 0) {
+    op_problem.set_constraint_upper_bounds(view.get_constraint_upper_bounds().data(),
+                                           view.get_constraint_upper_bounds().size());
+  }
+
+  if (view.get_objective_name().size() != 0) {
+    op_problem.set_objective_name(view.get_objective_name());
+  }
+  if (view.get_problem_name().size() != 0) {
+    op_problem.set_problem_name(view.get_problem_name().data());
+  }
+  if (view.get_variable_names().size() != 0) {
+    op_problem.set_variable_names(view.get_variable_names());
+  }
+  if (view.get_row_names().size() != 0) { op_problem.set_row_names(view.get_row_names()); }
+
+  if (view.has_quadratic_objective()) {
+    // Copy quadratic objective from view to vectors first since we need host data
+    std::vector<f_t> Q_values(view.get_quadratic_objective_values().size());
+    std::vector<i_t> Q_indices(view.get_quadratic_objective_indices().size());
+    std::vector<i_t> Q_offsets(view.get_quadratic_objective_offsets().size());
+
+    // Check if the pointer is on host or device
+    cudaPointerAttributes attrs;
+    cudaError_t err =
+      cudaPointerGetAttributes(&attrs, view.get_quadratic_objective_values().data());
+
+    if (err == cudaSuccess && attrs.type == cudaMemoryTypeDevice) {
+      // Source is on GPU - copy to host
+      RAFT_CUDA_TRY(cudaMemcpy(Q_values.data(),
+                               view.get_quadratic_objective_values().data(),
+                               Q_values.size() * sizeof(f_t),
+                               cudaMemcpyDeviceToHost));
+      RAFT_CUDA_TRY(cudaMemcpy(Q_indices.data(),
+                               view.get_quadratic_objective_indices().data(),
+                               Q_indices.size() * sizeof(i_t),
+                               cudaMemcpyDeviceToHost));
+      RAFT_CUDA_TRY(cudaMemcpy(Q_offsets.data(),
+                               view.get_quadratic_objective_offsets().data(),
+                               Q_offsets.size() * sizeof(i_t),
+                               cudaMemcpyDeviceToHost));
+    } else {
+      // Source is on host - direct copy
+      if (err != cudaSuccess) { cudaGetLastError(); }  // Clear cudaPointerGetAttributes error
+      if (err != cudaSuccess && err != cudaErrorInvalidValue) { RAFT_CUDA_TRY(err); }
+      std::memcpy(Q_values.data(),
+                  view.get_quadratic_objective_values().data(),
+                  Q_values.size() * sizeof(f_t));
+      std::memcpy(Q_indices.data(),
+                  view.get_quadratic_objective_indices().data(),
+                  Q_indices.size() * sizeof(i_t));
+      std::memcpy(Q_offsets.data(),
+                  view.get_quadratic_objective_offsets().data(),
+                  Q_offsets.size() * sizeof(i_t));
+    }
+
+    op_problem.set_quadratic_objective_matrix(Q_values.data(),
+                                              Q_values.size(),
+                                              Q_indices.data(),
+                                              Q_indices.size(),
+                                              Q_offsets.data(),
+                                              Q_offsets.size());
+  }
+
+  return op_problem;
+}
+
+template <typename i_t, typename f_t>
+optimization_problem_t<i_t, f_t> mps_data_model_to_optimization_problem(
+  raft::handle_t const* handle_ptr, const cuopt::mps_parser::mps_data_model_t<i_t, f_t>& data_model)
+{
+  optimization_problem_t<i_t, f_t> op_problem(handle_ptr);
+  op_problem.set_maximize(data_model.get_sense());
+
+  op_problem.set_csr_constraint_matrix(data_model.get_constraint_matrix_values().data(),
+                                       data_model.get_constraint_matrix_values().size(),
+                                       data_model.get_constraint_matrix_indices().data(),
+                                       data_model.get_constraint_matrix_indices().size(),
+                                       data_model.get_constraint_matrix_offsets().data(),
+                                       data_model.get_constraint_matrix_offsets().size());
+
+  if (data_model.get_constraint_bounds().size() != 0) {
+    op_problem.set_constraint_bounds(data_model.get_constraint_bounds().data(),
+                                     data_model.get_constraint_bounds().size());
+  }
+  if (data_model.get_objective_coefficients().size() != 0) {
+    op_problem.set_objective_coefficients(data_model.get_objective_coefficients().data(),
+                                          data_model.get_objective_coefficients().size());
+  }
+  op_problem.set_objective_scaling_factor(data_model.get_objective_scaling_factor());
+  op_problem.set_objective_offset(data_model.get_objective_offset());
+  if (data_model.get_variable_lower_bounds().size() != 0) {
+    op_problem.set_variable_lower_bounds(data_model.get_variable_lower_bounds().data(),
+                                         data_model.get_variable_lower_bounds().size());
+  }
+  if (data_model.get_variable_upper_bounds().size() != 0) {
+    op_problem.set_variable_upper_bounds(data_model.get_variable_upper_bounds().data(),
+                                         data_model.get_variable_upper_bounds().size());
+  }
+  if (data_model.get_variable_types().size() != 0) {
+    std::vector<var_t> enum_variable_types(data_model.get_variable_types().size());
+    std::transform(
+      data_model.get_variable_types().cbegin(),
+      data_model.get_variable_types().cend(),
+      enum_variable_types.begin(),
+      [](const auto val) -> var_t { return val == 'I' ? var_t::INTEGER : var_t::CONTINUOUS; });
+    op_problem.set_variable_types(enum_variable_types.data(), enum_variable_types.size());
+  }
+
+  if (data_model.get_row_types().size() != 0) {
+    op_problem.set_row_types(data_model.get_row_types().data(), data_model.get_row_types().size());
+  }
+  if (data_model.get_constraint_lower_bounds().size() != 0) {
+    op_problem.set_constraint_lower_bounds(data_model.get_constraint_lower_bounds().data(),
+                                           data_model.get_constraint_lower_bounds().size());
+  }
+  if (data_model.get_constraint_upper_bounds().size() != 0) {
+    op_problem.set_constraint_upper_bounds(data_model.get_constraint_upper_bounds().data(),
+                                           data_model.get_constraint_upper_bounds().size());
+  }
+
+  if (data_model.get_objective_name().size() != 0) {
+    op_problem.set_objective_name(data_model.get_objective_name());
+  }
+  if (data_model.get_problem_name().size() != 0) {
+    op_problem.set_problem_name(data_model.get_problem_name().data());
+  }
+  if (data_model.get_variable_names().size() != 0) {
+    op_problem.set_variable_names(data_model.get_variable_names());
+  }
+  if (data_model.get_row_names().size() != 0) {
+    op_problem.set_row_names(data_model.get_row_names());
+  }
+
+  if (data_model.get_quadratic_objective_values().size() != 0) {
+    const std::vector<f_t> Q_values  = data_model.get_quadratic_objective_values();
+    const std::vector<i_t> Q_indices = data_model.get_quadratic_objective_indices();
+    const std::vector<i_t> Q_offsets = data_model.get_quadratic_objective_offsets();
+    op_problem.set_quadratic_objective_matrix(Q_values.data(),
+                                              Q_values.size(),
+                                              Q_indices.data(),
+                                              Q_indices.size(),
+                                              Q_offsets.data(),
+                                              Q_offsets.size());
+  }
+
+  return op_problem;
+}
+
+template <typename i_t, typename f_t>
+cuopt::mps_parser::data_model_view_t<i_t, f_t> create_view_from_mps_data_model(
+  const cuopt::mps_parser::mps_data_model_t<i_t, f_t>& mps_data_model)
+{
+  cuopt::mps_parser::data_model_view_t<i_t, f_t> view;
+
+  view.set_maximize(mps_data_model.get_sense());
+
+  // Always set constraint matrix if offsets exist (even for empty problems with 0 constraints)
+  // Validation requires at least offsets=[0] to be set
+  if (!mps_data_model.get_constraint_matrix_offsets().empty()) {
+    view.set_csr_constraint_matrix(mps_data_model.get_constraint_matrix_values().data(),
+                                   mps_data_model.get_constraint_matrix_values().size(),
+                                   mps_data_model.get_constraint_matrix_indices().data(),
+                                   mps_data_model.get_constraint_matrix_indices().size(),
+                                   mps_data_model.get_constraint_matrix_offsets().data(),
+                                   mps_data_model.get_constraint_matrix_offsets().size());
+  }
+
+  if (!mps_data_model.get_constraint_bounds().empty()) {
+    view.set_constraint_bounds(mps_data_model.get_constraint_bounds().data(),
+                               mps_data_model.get_constraint_bounds().size());
+  }
+
+  if (!mps_data_model.get_objective_coefficients().empty()) {
+    view.set_objective_coefficients(mps_data_model.get_objective_coefficients().data(),
+                                    mps_data_model.get_objective_coefficients().size());
+  }
+
+  if (mps_data_model.has_quadratic_objective()) {
+    view.set_quadratic_objective_matrix(mps_data_model.get_quadratic_objective_values().data(),
+                                        mps_data_model.get_quadratic_objective_values().size(),
+                                        mps_data_model.get_quadratic_objective_indices().data(),
+                                        mps_data_model.get_quadratic_objective_indices().size(),
+                                        mps_data_model.get_quadratic_objective_offsets().data(),
+                                        mps_data_model.get_quadratic_objective_offsets().size());
+  }
+
+  view.set_objective_scaling_factor(mps_data_model.get_objective_scaling_factor());
+  view.set_objective_offset(mps_data_model.get_objective_offset());
+
+  if (!mps_data_model.get_variable_lower_bounds().empty()) {
+    view.set_variable_lower_bounds(mps_data_model.get_variable_lower_bounds().data(),
+                                   mps_data_model.get_variable_lower_bounds().size());
+  }
+
+  if (!mps_data_model.get_variable_upper_bounds().empty()) {
+    view.set_variable_upper_bounds(mps_data_model.get_variable_upper_bounds().data(),
+                                   mps_data_model.get_variable_upper_bounds().size());
+  }
+
+  if (!mps_data_model.get_variable_types().empty()) {
+    view.set_variable_types(mps_data_model.get_variable_types().data(),
+                            mps_data_model.get_variable_types().size());
+  }
+
+  if (!mps_data_model.get_row_types().empty()) {
+    view.set_row_types(mps_data_model.get_row_types().data(),
+                       mps_data_model.get_row_types().size());
+  }
+
+  if (!mps_data_model.get_constraint_lower_bounds().empty()) {
+    view.set_constraint_lower_bounds(mps_data_model.get_constraint_lower_bounds().data(),
+                                     mps_data_model.get_constraint_lower_bounds().size());
+  }
+
+  if (!mps_data_model.get_constraint_upper_bounds().empty()) {
+    view.set_constraint_upper_bounds(mps_data_model.get_constraint_upper_bounds().data(),
+                                     mps_data_model.get_constraint_upper_bounds().size());
+  }
+
+  view.set_objective_name(mps_data_model.get_objective_name());
+  view.set_problem_name(mps_data_model.get_problem_name());
+
+  if (!mps_data_model.get_variable_names().empty()) {
+    view.set_variable_names(mps_data_model.get_variable_names());
+  }
+
+  if (!mps_data_model.get_row_names().empty()) {
+    view.set_row_names(mps_data_model.get_row_names());
+  }
+
+  if (!mps_data_model.get_initial_primal_solution().empty()) {
+    view.set_initial_primal_solution(mps_data_model.get_initial_primal_solution().data(),
+                                     mps_data_model.get_initial_primal_solution().size());
+  }
+
+  if (!mps_data_model.get_initial_dual_solution().empty()) {
+    view.set_initial_dual_solution(mps_data_model.get_initial_dual_solution().data(),
+                                   mps_data_model.get_initial_dual_solution().size());
+  }
+
+  view.set_is_device_memory(false);  // MPS data is always in CPU memory
+  return view;
+}
+
+template <typename i_t, typename f_t>
+cuopt::mps_parser::data_model_view_t<i_t, f_t> cpu_problem_data_t<i_t, f_t>::create_view() const
+{
+  cuopt::mps_parser::data_model_view_t<i_t, f_t> v;
+  v.set_maximize(maximize);
+  v.set_objective_scaling_factor(objective_scaling_factor);
+  v.set_objective_offset(objective_offset);
+
+  if (!A_values.empty()) {
+    v.set_csr_constraint_matrix(A_values.data(),
+                                A_values.size(),
+                                A_indices.data(),
+                                A_indices.size(),
+                                A_offsets.data(),
+                                A_offsets.size());
+  }
+  if (!constraint_bounds.empty()) {
+    v.set_constraint_bounds(constraint_bounds.data(), constraint_bounds.size());
+  }
+  if (!constraint_lower_bounds.empty()) {
+    v.set_constraint_lower_bounds(constraint_lower_bounds.data(), constraint_lower_bounds.size());
+  }
+  if (!constraint_upper_bounds.empty()) {
+    v.set_constraint_upper_bounds(constraint_upper_bounds.data(), constraint_upper_bounds.size());
+  }
+  if (!objective_coefficients.empty()) {
+    v.set_objective_coefficients(objective_coefficients.data(), objective_coefficients.size());
+  }
+  if (!variable_lower_bounds.empty()) {
+    v.set_variable_lower_bounds(variable_lower_bounds.data(), variable_lower_bounds.size());
+  }
+  if (!variable_upper_bounds.empty()) {
+    v.set_variable_upper_bounds(variable_upper_bounds.data(), variable_upper_bounds.size());
+  }
+  if (!variable_types.empty()) {
+    v.set_variable_types(variable_types.data(), variable_types.size());
+  }
+  if (!quadratic_objective_values.empty()) {
+    v.set_quadratic_objective_matrix(quadratic_objective_values.data(),
+                                     quadratic_objective_values.size(),
+                                     quadratic_objective_indices.data(),
+                                     quadratic_objective_indices.size(),
+                                     quadratic_objective_offsets.data(),
+                                     quadratic_objective_offsets.size());
+  }
+  v.set_is_device_memory(false);
+  return v;
+}
+
+template <typename i_t, typename f_t>
+cpu_problem_data_t<i_t, f_t> copy_view_to_cpu(
+  raft::handle_t const* handle_ptr,
+  const cuopt::mps_parser::data_model_view_t<i_t, f_t>& gpu_view)
+{
+  cpu_problem_data_t<i_t, f_t> cpu_data;
+  auto stream = handle_ptr->get_stream();
+
+  cpu_data.maximize                 = gpu_view.get_sense();
+  cpu_data.objective_scaling_factor = gpu_view.get_objective_scaling_factor();
+  cpu_data.objective_offset         = gpu_view.get_objective_offset();
+
+  auto copy_to_host = [stream](auto& dst_vec, auto src_span) {
+    if (src_span.size() > 0) {
+      dst_vec.resize(src_span.size());
+      raft::copy(dst_vec.data(), src_span.data(), src_span.size(), stream);
+    }
+  };
+
+  copy_to_host(cpu_data.A_values, gpu_view.get_constraint_matrix_values());
+  copy_to_host(cpu_data.A_indices, gpu_view.get_constraint_matrix_indices());
+  copy_to_host(cpu_data.A_offsets, gpu_view.get_constraint_matrix_offsets());
+  copy_to_host(cpu_data.constraint_bounds, gpu_view.get_constraint_bounds());
+  copy_to_host(cpu_data.constraint_lower_bounds, gpu_view.get_constraint_lower_bounds());
+  copy_to_host(cpu_data.constraint_upper_bounds, gpu_view.get_constraint_upper_bounds());
+  copy_to_host(cpu_data.objective_coefficients, gpu_view.get_objective_coefficients());
+  copy_to_host(cpu_data.variable_lower_bounds, gpu_view.get_variable_lower_bounds());
+  copy_to_host(cpu_data.variable_upper_bounds, gpu_view.get_variable_upper_bounds());
+  copy_to_host(cpu_data.quadratic_objective_values, gpu_view.get_quadratic_objective_values());
+  copy_to_host(cpu_data.quadratic_objective_indices, gpu_view.get_quadratic_objective_indices());
+  copy_to_host(cpu_data.quadratic_objective_offsets, gpu_view.get_quadratic_objective_offsets());
+
+  // Variable types need special handling (char array)
+  auto var_types_span = gpu_view.get_variable_types();
+  if (var_types_span.size() > 0) {
+    cpu_data.variable_types.resize(var_types_span.size());
+
+    // Check if variable_types is host-backed or device-backed
+    cudaPointerAttributes attrs;
+    cudaError_t err = cudaPointerGetAttributes(&attrs, var_types_span.data());
+
+    if (err == cudaSuccess && attrs.type == cudaMemoryTypeDevice) {
+      // Device memory - use async copy
+      RAFT_CUDA_TRY(cudaMemcpyAsync(cpu_data.variable_types.data(),
+                                    var_types_span.data(),
+                                    var_types_span.size() * sizeof(char),
+                                    cudaMemcpyDeviceToHost,
+                                    stream));
+    } else {
+      // Host memory or unregistered - use direct copy
+      if (err != cudaSuccess && err != cudaErrorInvalidValue) { RAFT_CUDA_TRY(err); }
+      std::memcpy(cpu_data.variable_types.data(),
+                  var_types_span.data(),
+                  var_types_span.size() * sizeof(char));
+    }
+  }
+
+  // Synchronize to ensure all copies are complete
+  RAFT_CUDA_TRY(cudaStreamSynchronize(stream));
+
+  return cpu_data;
+}
+
+// Explicit template instantiations
+#define INSTANTIATE(F_TYPE)                                                                \
+  template optimization_problem_t<int, F_TYPE> data_model_view_to_optimization_problem(    \
+    raft::handle_t const* handle_ptr,                                                      \
+    const cuopt::mps_parser::data_model_view_t<int, F_TYPE>& view);                        \
+                                                                                            \
+  template optimization_problem_t<int, F_TYPE> mps_data_model_to_optimization_problem(     \
+    raft::handle_t const* handle_ptr,                                                      \
+    const cuopt::mps_parser::mps_data_model_t<int, F_TYPE>& data_model);                   \
+                                                                                            \
+  template cuopt::mps_parser::data_model_view_t<int, F_TYPE> create_view_from_mps_data_model( \
+    const cuopt::mps_parser::mps_data_model_t<int, F_TYPE>& mps_data_model);               \
+                                                                                            \
+  template struct cpu_problem_data_t<int, F_TYPE>;                                         \
+                                                                                            \
+  template cpu_problem_data_t<int, F_TYPE> copy_view_to_cpu(                               \
+    raft::handle_t const* handle_ptr,                                                      \
+    const cuopt::mps_parser::data_model_view_t<int, F_TYPE>& gpu_view);
+
+#if MIP_INSTANTIATE_FLOAT
+INSTANTIATE(float)
+#endif
+
+#if MIP_INSTANTIATE_DOUBLE
+INSTANTIATE(double)
+#endif
+
+#undef INSTANTIATE
+
+}  // namespace linear_programming
+}  // namespace cuopt
diff --git a/cpp/src/linear_programming/solve.cu b/cpp/src/linear_programming/solve.cu
index d97176f1e..92d153fc0 100644
--- a/cpp/src/linear_programming/solve.cu
+++ b/cpp/src/linear_programming/solve.cu
@@ -1229,183 +1229,9 @@ optimization_problem_solution_t<i_t, f_t> solve_lp(
   }
 }
 
-template <typename i_t, typename f_t>
-cuopt::linear_programming::optimization_problem_t<i_t, f_t> mps_data_model_to_optimization_problem(
-  raft::handle_t const* handle_ptr, const cuopt::mps_parser::mps_data_model_t<i_t, f_t>& data_model)
-{
-  cuopt::linear_programming::optimization_problem_t<i_t, f_t> op_problem(handle_ptr);
-  op_problem.set_maximize(data_model.get_sense());
-
-  op_problem.set_csr_constraint_matrix(data_model.get_constraint_matrix_values().data(),
-                                       data_model.get_constraint_matrix_values().size(),
-                                       data_model.get_constraint_matrix_indices().data(),
-                                       data_model.get_constraint_matrix_indices().size(),
-                                       data_model.get_constraint_matrix_offsets().data(),
-                                       data_model.get_constraint_matrix_offsets().size());
-
-  if (data_model.get_constraint_bounds().size() != 0) {
-    op_problem.set_constraint_bounds(data_model.get_constraint_bounds().data(),
-                                     data_model.get_constraint_bounds().size());
-  }
-  if (data_model.get_objective_coefficients().size() != 0) {
-    op_problem.set_objective_coefficients(data_model.get_objective_coefficients().data(),
-                                          data_model.get_objective_coefficients().size());
-  }
-  op_problem.set_objective_scaling_factor(data_model.get_objective_scaling_factor());
-  op_problem.set_objective_offset(data_model.get_objective_offset());
-  if (data_model.get_variable_lower_bounds().size() != 0) {
-    op_problem.set_variable_lower_bounds(data_model.get_variable_lower_bounds().data(),
-                                         data_model.get_variable_lower_bounds().size());
-  }
-  if (data_model.get_variable_upper_bounds().size() != 0) {
-    op_problem.set_variable_upper_bounds(data_model.get_variable_upper_bounds().data(),
-                                         data_model.get_variable_upper_bounds().size());
-  }
-  if (data_model.get_variable_types().size() != 0) {
-    std::vector<var_t> enum_variable_types(data_model.get_variable_types().size());
-    std::transform(
-      data_model.get_variable_types().cbegin(),
-      data_model.get_variable_types().cend(),
-      enum_variable_types.begin(),
-      [](const auto val) -> var_t { return val == 'I' ? var_t::INTEGER : var_t::CONTINUOUS; });
-    op_problem.set_variable_types(enum_variable_types.data(), enum_variable_types.size());
-  }
-
-  if (data_model.get_row_types().size() != 0) {
-    op_problem.set_row_types(data_model.get_row_types().data(), data_model.get_row_types().size());
-  }
-  if (data_model.get_constraint_lower_bounds().size() != 0) {
-    op_problem.set_constraint_lower_bounds(data_model.get_constraint_lower_bounds().data(),
-                                           data_model.get_constraint_lower_bounds().size());
-  }
-  if (data_model.get_constraint_upper_bounds().size() != 0) {
-    op_problem.set_constraint_upper_bounds(data_model.get_constraint_upper_bounds().data(),
-                                           data_model.get_constraint_upper_bounds().size());
-  }
-
-  if (data_model.get_objective_name().size() != 0) {
-    op_problem.set_objective_name(data_model.get_objective_name());
-  }
-  if (data_model.get_problem_name().size() != 0) {
-    op_problem.set_problem_name(data_model.get_problem_name().data());
-  }
-  if (data_model.get_variable_names().size() != 0) {
-    op_problem.set_variable_names(data_model.get_variable_names());
-  }
-  if (data_model.get_row_names().size() != 0) {
-    op_problem.set_row_names(data_model.get_row_names());
-  }
-
-  if (data_model.get_quadratic_objective_values().size() != 0) {
-    const std::vector<f_t> Q_values  = data_model.get_quadratic_objective_values();
-    const std::vector<i_t> Q_indices = data_model.get_quadratic_objective_indices();
-    const std::vector<i_t> Q_offsets = data_model.get_quadratic_objective_offsets();
-    op_problem.set_quadratic_objective_matrix(Q_values.data(),
-                                              Q_values.size(),
-                                              Q_indices.data(),
-                                              Q_indices.size(),
-                                              Q_offsets.data(),
-                                              Q_offsets.size());
-  }
-
-  return op_problem;
-}
-
-// Helper to create a data_model_view_t from mps_data_model_t (for remote solve path)
-template <typename i_t, typename f_t>
-static data_model_view_t<i_t, f_t> create_view_from_mps_data_model(
-  const cuopt::mps_parser::mps_data_model_t<i_t, f_t>& mps_data_model)
-{
-  data_model_view_t<i_t, f_t> view;
-
-  view.set_maximize(mps_data_model.get_sense());
-
-  // Always set constraint matrix if offsets exist (even for empty problems with 0 constraints)
-  // Validation requires at least offsets=[0] to be set
-  if (!mps_data_model.get_constraint_matrix_offsets().empty()) {
-    view.set_csr_constraint_matrix(mps_data_model.get_constraint_matrix_values().data(),
-                                   mps_data_model.get_constraint_matrix_values().size(),
-                                   mps_data_model.get_constraint_matrix_indices().data(),
-                                   mps_data_model.get_constraint_matrix_indices().size(),
-                                   mps_data_model.get_constraint_matrix_offsets().data(),
-                                   mps_data_model.get_constraint_matrix_offsets().size());
-  }
-
-  if (!mps_data_model.get_constraint_bounds().empty()) {
-    view.set_constraint_bounds(mps_data_model.get_constraint_bounds().data(),
-                               mps_data_model.get_constraint_bounds().size());
-  }
-
-  if (!mps_data_model.get_objective_coefficients().empty()) {
-    view.set_objective_coefficients(mps_data_model.get_objective_coefficients().data(),
-                                    mps_data_model.get_objective_coefficients().size());
-  }
-
-  if (mps_data_model.has_quadratic_objective()) {
-    view.set_quadratic_objective_matrix(mps_data_model.get_quadratic_objective_values().data(),
-                                        mps_data_model.get_quadratic_objective_values().size(),
-                                        mps_data_model.get_quadratic_objective_indices().data(),
-                                        mps_data_model.get_quadratic_objective_indices().size(),
-                                        mps_data_model.get_quadratic_objective_offsets().data(),
-                                        mps_data_model.get_quadratic_objective_offsets().size());
-  }
-
-  view.set_objective_scaling_factor(mps_data_model.get_objective_scaling_factor());
-  view.set_objective_offset(mps_data_model.get_objective_offset());
-
-  if (!mps_data_model.get_variable_lower_bounds().empty()) {
-    view.set_variable_lower_bounds(mps_data_model.get_variable_lower_bounds().data(),
-                                   mps_data_model.get_variable_lower_bounds().size());
-  }
-
-  if (!mps_data_model.get_variable_upper_bounds().empty()) {
-    view.set_variable_upper_bounds(mps_data_model.get_variable_upper_bounds().data(),
-                                   mps_data_model.get_variable_upper_bounds().size());
-  }
-
-  if (!mps_data_model.get_variable_types().empty()) {
-    view.set_variable_types(mps_data_model.get_variable_types().data(),
-                            mps_data_model.get_variable_types().size());
-  }
-
-  if (!mps_data_model.get_row_types().empty()) {
-    view.set_row_types(mps_data_model.get_row_types().data(),
-                       mps_data_model.get_row_types().size());
-  }
-
-  if (!mps_data_model.get_constraint_lower_bounds().empty()) {
-    view.set_constraint_lower_bounds(mps_data_model.get_constraint_lower_bounds().data(),
-                                     mps_data_model.get_constraint_lower_bounds().size());
-  }
-
-  if (!mps_data_model.get_constraint_upper_bounds().empty()) {
-    view.set_constraint_upper_bounds(mps_data_model.get_constraint_upper_bounds().data(),
-                                     mps_data_model.get_constraint_upper_bounds().size());
-  }
-
-  view.set_objective_name(mps_data_model.get_objective_name());
-  view.set_problem_name(mps_data_model.get_problem_name());
-
-  if (!mps_data_model.get_variable_names().empty()) {
-    view.set_variable_names(mps_data_model.get_variable_names());
-  }
-
-  if (!mps_data_model.get_row_names().empty()) {
-    view.set_row_names(mps_data_model.get_row_names());
-  }
-
-  if (!mps_data_model.get_initial_primal_solution().empty()) {
-    view.set_initial_primal_solution(mps_data_model.get_initial_primal_solution().data(),
-                                     mps_data_model.get_initial_primal_solution().size());
-  }
-
-  if (!mps_data_model.get_initial_dual_solution().empty()) {
-    view.set_initial_dual_solution(mps_data_model.get_initial_dual_solution().data(),
-                                   mps_data_model.get_initial_dual_solution().size());
-  }
-
-  return view;
-}
+// Note: mps_data_model_to_optimization_problem(), create_view_from_mps_data_model(),
+// and data_model_view_to_optimization_problem() have been moved to
+// optimization_problem_conversions.cu for better code organization.
 
 template <typename i_t, typename f_t>
 optimization_problem_solution_t<i_t, f_t> solve_lp(
@@ -1422,274 +1248,11 @@ optimization_problem_solution_t<i_t, f_t> solve_lp(
   return solve_lp(handle_ptr, view, settings, problem_checking, use_pdlp_solver_mode);
 }
 
-template <typename i_t, typename f_t>
-optimization_problem_t<i_t, f_t> data_model_view_to_optimization_problem(
-  raft::handle_t const* handle_ptr, const data_model_view_t<i_t, f_t>& view)
-{
-  optimization_problem_t<i_t, f_t> op_problem(handle_ptr);
-  op_problem.set_maximize(view.get_sense());
-
-  // Set constraint matrix if offsets are present (includes empty problems with offsets=[0])
-  if (view.get_constraint_matrix_offsets().size() > 0) {
-    op_problem.set_csr_constraint_matrix(view.get_constraint_matrix_values().data(),
-                                         view.get_constraint_matrix_values().size(),
-                                         view.get_constraint_matrix_indices().data(),
-                                         view.get_constraint_matrix_indices().size(),
-                                         view.get_constraint_matrix_offsets().data(),
-                                         view.get_constraint_matrix_offsets().size());
-  }
-
-  if (view.get_constraint_bounds().size() != 0) {
-    op_problem.set_constraint_bounds(view.get_constraint_bounds().data(),
-                                     view.get_constraint_bounds().size());
-  }
-  if (view.get_objective_coefficients().size() != 0) {
-    op_problem.set_objective_coefficients(view.get_objective_coefficients().data(),
-                                          view.get_objective_coefficients().size());
-  }
-  op_problem.set_objective_scaling_factor(view.get_objective_scaling_factor());
-  op_problem.set_objective_offset(view.get_objective_offset());
-  if (view.get_variable_lower_bounds().size() != 0) {
-    op_problem.set_variable_lower_bounds(view.get_variable_lower_bounds().data(),
-                                         view.get_variable_lower_bounds().size());
-  }
-  if (view.get_variable_upper_bounds().size() != 0) {
-    op_problem.set_variable_upper_bounds(view.get_variable_upper_bounds().data(),
-                                         view.get_variable_upper_bounds().size());
-  }
-  if (view.get_variable_types().size() != 0) {
-    auto var_types = view.get_variable_types();
-
-    // Check if the pointer is on host or device
-    cudaPointerAttributes attrs;
-    cudaError_t err = cudaPointerGetAttributes(&attrs, var_types.data());
-
-    std::vector<char> host_var_types(var_types.size());
-    if (err == cudaSuccess && attrs.type == cudaMemoryTypeDevice) {
-      // Source is on GPU - copy to host
-      RAFT_CUDA_TRY(cudaMemcpy(host_var_types.data(),
-                               var_types.data(),
-                               var_types.size() * sizeof(char),
-                               cudaMemcpyDeviceToHost));
-    } else {
-      // Source is on host (or unregistered) - direct copy
-      if (err != cudaSuccess) { cudaGetLastError(); }  // Clear cudaPointerGetAttributes error
-      if (err != cudaSuccess && err != cudaErrorInvalidValue) { RAFT_CUDA_TRY(err); }
-      std::memcpy(host_var_types.data(), var_types.data(), var_types.size() * sizeof(char));
-    }
-
-    std::vector<var_t> enum_variable_types(var_types.size());
-    for (std::size_t i = 0; i < var_types.size(); ++i) {
-      enum_variable_types[i] = host_var_types[i] == 'I' ? var_t::INTEGER : var_t::CONTINUOUS;
-    }
-    op_problem.set_variable_types(enum_variable_types.data(), enum_variable_types.size());
-  }
-
-  if (view.get_row_types().size() != 0) {
-    op_problem.set_row_types(view.get_row_types().data(), view.get_row_types().size());
-  }
-  if (view.get_constraint_lower_bounds().size() != 0) {
-    op_problem.set_constraint_lower_bounds(view.get_constraint_lower_bounds().data(),
-                                           view.get_constraint_lower_bounds().size());
-  }
-  if (view.get_constraint_upper_bounds().size() != 0) {
-    op_problem.set_constraint_upper_bounds(view.get_constraint_upper_bounds().data(),
-                                           view.get_constraint_upper_bounds().size());
-  }
-
-  if (view.get_objective_name().size() != 0) {
-    op_problem.set_objective_name(view.get_objective_name());
-  }
-  if (view.get_problem_name().size() != 0) {
-    op_problem.set_problem_name(view.get_problem_name().data());
-  }
-  if (view.get_variable_names().size() != 0) {
-    op_problem.set_variable_names(view.get_variable_names());
-  }
-  if (view.get_row_names().size() != 0) { op_problem.set_row_names(view.get_row_names()); }
-
-  if (view.has_quadratic_objective()) {
-    // Copy quadratic objective from view to vectors first since we need host data
-    std::vector<f_t> Q_values(view.get_quadratic_objective_values().size());
-    std::vector<i_t> Q_indices(view.get_quadratic_objective_indices().size());
-    std::vector<i_t> Q_offsets(view.get_quadratic_objective_offsets().size());
-
-    // Check if the pointer is on host or device
-    cudaPointerAttributes attrs;
-    cudaError_t err =
-      cudaPointerGetAttributes(&attrs, view.get_quadratic_objective_values().data());
-
-    if (err == cudaSuccess && attrs.type == cudaMemoryTypeDevice) {
-      // Source is on GPU - copy to host
-      RAFT_CUDA_TRY(cudaMemcpy(Q_values.data(),
-                               view.get_quadratic_objective_values().data(),
-                               Q_values.size() * sizeof(f_t),
-                               cudaMemcpyDeviceToHost));
-      RAFT_CUDA_TRY(cudaMemcpy(Q_indices.data(),
-                               view.get_quadratic_objective_indices().data(),
-                               Q_indices.size() * sizeof(i_t),
-                               cudaMemcpyDeviceToHost));
-      RAFT_CUDA_TRY(cudaMemcpy(Q_offsets.data(),
-                               view.get_quadratic_objective_offsets().data(),
-                               Q_offsets.size() * sizeof(i_t),
-                               cudaMemcpyDeviceToHost));
-    } else {
-      // Source is on host - direct copy
-      if (err != cudaSuccess) { cudaGetLastError(); }  // Clear cudaPointerGetAttributes error
-      if (err != cudaSuccess && err != cudaErrorInvalidValue) { RAFT_CUDA_TRY(err); }
-      std::memcpy(Q_values.data(),
-                  view.get_quadratic_objective_values().data(),
-                  Q_values.size() * sizeof(f_t));
-      std::memcpy(Q_indices.data(),
-                  view.get_quadratic_objective_indices().data(),
-                  Q_indices.size() * sizeof(i_t));
-      std::memcpy(Q_offsets.data(),
-                  view.get_quadratic_objective_offsets().data(),
-                  Q_offsets.size() * sizeof(i_t));
-    }
-
-    op_problem.set_quadratic_objective_matrix(Q_values.data(),
-                                              Q_values.size(),
-                                              Q_indices.data(),
-                                              Q_indices.size(),
-                                              Q_offsets.data(),
-                                              Q_offsets.size());
-  }
-
-  return op_problem;
-}
+// Note: data_model_view_to_optimization_problem() moved to optimization_problem_conversions.cu
 
-// Helper struct to hold CPU copies of GPU data for remote solve
-template <typename i_t, typename f_t>
-struct cpu_problem_data_t {
-  std::vector<f_t> A_values;
-  std::vector<i_t> A_indices;
-  std::vector<i_t> A_offsets;
-  std::vector<f_t> constraint_bounds;
-  std::vector<f_t> constraint_lower_bounds;
-  std::vector<f_t> constraint_upper_bounds;
-  std::vector<f_t> objective_coefficients;
-  std::vector<f_t> variable_lower_bounds;
-  std::vector<f_t> variable_upper_bounds;
-  std::vector<char> variable_types;
-  std::vector<f_t> quadratic_objective_values;
-  std::vector<i_t> quadratic_objective_indices;
-  std::vector<i_t> quadratic_objective_offsets;
-  bool maximize;
-  f_t objective_scaling_factor;
-  f_t objective_offset;
-
-  data_model_view_t<i_t, f_t> create_view() const
-  {
-    data_model_view_t<i_t, f_t> v;
-    v.set_maximize(maximize);
-    v.set_objective_scaling_factor(objective_scaling_factor);
-    v.set_objective_offset(objective_offset);
-
-    if (!A_values.empty()) {
-      v.set_csr_constraint_matrix(A_values.data(),
-                                  A_values.size(),
-                                  A_indices.data(),
-                                  A_indices.size(),
-                                  A_offsets.data(),
-                                  A_offsets.size());
-    }
-    if (!constraint_bounds.empty()) {
-      v.set_constraint_bounds(constraint_bounds.data(), constraint_bounds.size());
-    }
-    if (!constraint_lower_bounds.empty()) {
-      v.set_constraint_lower_bounds(constraint_lower_bounds.data(), constraint_lower_bounds.size());
-    }
-    if (!constraint_upper_bounds.empty()) {
-      v.set_constraint_upper_bounds(constraint_upper_bounds.data(), constraint_upper_bounds.size());
-    }
-    if (!objective_coefficients.empty()) {
-      v.set_objective_coefficients(objective_coefficients.data(), objective_coefficients.size());
-    }
-    if (!variable_lower_bounds.empty()) {
-      v.set_variable_lower_bounds(variable_lower_bounds.data(), variable_lower_bounds.size());
-    }
-    if (!variable_upper_bounds.empty()) {
-      v.set_variable_upper_bounds(variable_upper_bounds.data(), variable_upper_bounds.size());
-    }
-    if (!variable_types.empty()) {
-      v.set_variable_types(variable_types.data(), variable_types.size());
-    }
-    if (!quadratic_objective_values.empty()) {
-      v.set_quadratic_objective_matrix(quadratic_objective_values.data(),
-                                       quadratic_objective_values.size(),
-                                       quadratic_objective_indices.data(),
-                                       quadratic_objective_indices.size(),
-                                       quadratic_objective_offsets.data(),
-                                       quadratic_objective_offsets.size());
-    }
-    v.set_is_device_memory(false);
-    return v;
-  }
-};
-
-// Helper to copy GPU view data to CPU
-template <typename i_t, typename f_t>
-cpu_problem_data_t<i_t, f_t> copy_view_to_cpu(raft::handle_t const* handle_ptr,
-                                              const data_model_view_t<i_t, f_t>& gpu_view)
-{
-  cpu_problem_data_t<i_t, f_t> cpu_data;
-  auto stream = handle_ptr->get_stream();
+// Note: cpu_problem_data_t and copy_view_to_cpu moved to optimization_problem_conversions.hpp/.cu
 
-  cpu_data.maximize                 = gpu_view.get_sense();
-  cpu_data.objective_scaling_factor = gpu_view.get_objective_scaling_factor();
-  cpu_data.objective_offset         = gpu_view.get_objective_offset();
-
-  auto copy_to_host = [stream](auto& dst_vec, auto src_span) {
-    if (src_span.size() > 0) {
-      dst_vec.resize(src_span.size());
-      raft::copy(dst_vec.data(), src_span.data(), src_span.size(), stream);
-    }
-  };
-
-  copy_to_host(cpu_data.A_values, gpu_view.get_constraint_matrix_values());
-  copy_to_host(cpu_data.A_indices, gpu_view.get_constraint_matrix_indices());
-  copy_to_host(cpu_data.A_offsets, gpu_view.get_constraint_matrix_offsets());
-  copy_to_host(cpu_data.constraint_bounds, gpu_view.get_constraint_bounds());
-  copy_to_host(cpu_data.constraint_lower_bounds, gpu_view.get_constraint_lower_bounds());
-  copy_to_host(cpu_data.constraint_upper_bounds, gpu_view.get_constraint_upper_bounds());
-  copy_to_host(cpu_data.objective_coefficients, gpu_view.get_objective_coefficients());
-  copy_to_host(cpu_data.variable_lower_bounds, gpu_view.get_variable_lower_bounds());
-  copy_to_host(cpu_data.variable_upper_bounds, gpu_view.get_variable_upper_bounds());
-  copy_to_host(cpu_data.quadratic_objective_values, gpu_view.get_quadratic_objective_values());
-  copy_to_host(cpu_data.quadratic_objective_indices, gpu_view.get_quadratic_objective_indices());
-  copy_to_host(cpu_data.quadratic_objective_offsets, gpu_view.get_quadratic_objective_offsets());
-
-  // Variable types need special handling (char array)
-  auto var_types_span = gpu_view.get_variable_types();
-  if (var_types_span.size() > 0) {
-    cpu_data.variable_types.resize(var_types_span.size());
-
-    // Check if variable_types is host-backed or device-backed
-    cudaPointerAttributes attrs;
-    cudaError_t err = cudaPointerGetAttributes(&attrs, var_types_span.data());
-
-    if (err == cudaSuccess && attrs.type == cudaMemoryTypeDevice) {
-      // Device memory - use async copy
-      RAFT_CUDA_TRY(cudaMemcpyAsync(cpu_data.variable_types.data(),
-                                    var_types_span.data(),
-                                    var_types_span.size() * sizeof(char),
-                                    cudaMemcpyDeviceToHost,
-                                    stream));
-    } else {
-      // Host memory or unregistered - use direct copy
-      if (err != cudaSuccess && err != cudaErrorInvalidValue) { RAFT_CUDA_TRY(err); }
-      std::memcpy(cpu_data.variable_types.data(),
-                  var_types_span.data(),
-                  var_types_span.size() * sizeof(char));
-    }
-  }
-
-  // Synchronize to ensure all copies are complete
-  RAFT_CUDA_TRY(cudaStreamSynchronize(stream));
-
-  return cpu_data;
-}
+// (The struct and function definitions that were here have been moved)
 
 template <typename i_t, typename f_t>
 optimization_problem_solution_t<i_t, f_t> solve_lp(raft::handle_t const* handle_ptr,
@@ -1771,13 +1334,6 @@ optimization_problem_solution_t<i_t, f_t> solve_lp(raft::handle_t const* handle_
     const timer_t& timer,                                                               \
     bool is_batch_mode);                                                                \
                                                                                         \
-  template optimization_problem_t<int, F_TYPE> mps_data_model_to_optimization_problem(  \
-    raft::handle_t const* handle_ptr,                                                   \
-    const cuopt::mps_parser::mps_data_model_t<int, F_TYPE>& data_model);                \
-                                                                                        \
-  template optimization_problem_t<int, F_TYPE> data_model_view_to_optimization_problem( \
-    raft::handle_t const* handle_ptr, const data_model_view_t<int, F_TYPE>& view);      \
-                                                                                        \
   template optimization_problem_solution_t<int, F_TYPE> solve_lp(                       \
     raft::handle_t const* handle_ptr,                                                   \
     const data_model_view_t<int, F_TYPE>& view,                                         \
diff --git a/cpp/src/linear_programming/solver_solution.cu b/cpp/src/linear_programming/solver_solution.cu
index 1252497f1..a256b2e91 100644
--- a/cpp/src/linear_programming/solver_solution.cu
+++ b/cpp/src/linear_programming/solver_solution.cu
@@ -24,12 +24,12 @@ namespace cuopt::linear_programming {
 
 template <typename i_t, typename f_t>
 optimization_problem_solution_t<i_t, f_t>::optimization_problem_solution_t(
-  pdlp_termination_status_t termination_status, rmm::cuda_stream_view stream_view)
+  pdlp_termination_status_t termination_status_, rmm::cuda_stream_view stream_view)
   : primal_solution_(std::make_unique<rmm::device_uvector<f_t>>(0, stream_view)),
     dual_solution_(std::make_unique<rmm::device_uvector<f_t>>(0, stream_view)),
     reduced_cost_(std::make_unique<rmm::device_uvector<f_t>>(0, stream_view)),
     is_device_memory_(true),
-    termination_status_{{termination_status}},
+    termination_status_{{termination_status_}},
     error_status_(cuopt::logic_error("", cuopt::error_type_t::Success))
 {
   cuopt_assert(termination_stats_.size() == termination_status_.size(),
@@ -646,64 +646,6 @@ optimization_problem_solution_t<i_t, f_t>::get_pdlp_warm_start_data()
 // Setters for host solution data
 //============================================================================
 
-template <typename i_t, typename f_t>
-void optimization_problem_solution_t<i_t, f_t>::set_primal_solution_host(std::vector<f_t> solution)
-{
-  primal_solution_host_ = std::make_unique<std::vector<f_t>>(std::move(solution));
-
-  // Ensure all host vectors are initialized to avoid mixed state
-  if (!dual_solution_host_) { dual_solution_host_ = std::make_unique<std::vector<f_t>>(); }
-  if (!reduced_cost_host_) { reduced_cost_host_ = std::make_unique<std::vector<f_t>>(); }
-
-  // Clear device buffers to avoid memory leaks
-  primal_solution_.reset();
-  dual_solution_.reset();
-  reduced_cost_.reset();
-
-  is_device_memory_ = false;
-}
-
-template <typename i_t, typename f_t>
-void optimization_problem_solution_t<i_t, f_t>::set_dual_solution_host(std::vector<f_t> solution)
-{
-  dual_solution_host_ = std::make_unique<std::vector<f_t>>(std::move(solution));
-
-  // Ensure all host vectors are initialized to avoid mixed state
-  if (!primal_solution_host_) { primal_solution_host_ = std::make_unique<std::vector<f_t>>(); }
-  if (!reduced_cost_host_) { reduced_cost_host_ = std::make_unique<std::vector<f_t>>(); }
-
-  // Clear device buffers to avoid memory leaks
-  primal_solution_.reset();
-  dual_solution_.reset();
-  reduced_cost_.reset();
-
-  is_device_memory_ = false;
-}
-
-template <typename i_t, typename f_t>
-void optimization_problem_solution_t<i_t, f_t>::set_reduced_cost_host(std::vector<f_t> reduced_cost)
-{
-  reduced_cost_host_ = std::make_unique<std::vector<f_t>>(std::move(reduced_cost));
-
-  // Ensure all host vectors are initialized to avoid mixed state
-  if (!primal_solution_host_) { primal_solution_host_ = std::make_unique<std::vector<f_t>>(); }
-  if (!dual_solution_host_) { dual_solution_host_ = std::make_unique<std::vector<f_t>>(); }
-
-  // Clear device buffers to avoid memory leaks
-  primal_solution_.reset();
-  dual_solution_.reset();
-  reduced_cost_.reset();
-
-  is_device_memory_ = false;
-}
-
-template <typename i_t, typename f_t>
-void optimization_problem_solution_t<i_t, f_t>::set_termination_stats(
-  const additional_termination_information_t& stats)
-{
-  cuopt_assert(!termination_stats_.empty(), "termination_stats_ is empty");
-  termination_stats_[0] = stats;
-}
 
 //============================================================================
 // Getters for termination statistics
@@ -762,48 +704,6 @@ bool optimization_problem_solution_t<i_t, f_t>::get_solved_by_pdlp() const
 // Setters for termination statistics
 //============================================================================
 
-template <typename i_t, typename f_t>
-void optimization_problem_solution_t<i_t, f_t>::set_l2_primal_residual(f_t value)
-{
-  cuopt_assert(!termination_stats_.empty(), "termination_stats_ is empty");
-  termination_stats_[0].l2_primal_residual = value;
-}
-
-template <typename i_t, typename f_t>
-void optimization_problem_solution_t<i_t, f_t>::set_l2_dual_residual(f_t value)
-{
-  cuopt_assert(!termination_stats_.empty(), "termination_stats_ is empty");
-  termination_stats_[0].l2_dual_residual = value;
-}
-
-template <typename i_t, typename f_t>
-void optimization_problem_solution_t<i_t, f_t>::set_primal_objective(f_t value)
-{
-  cuopt_assert(!termination_stats_.empty(), "termination_stats_ is empty");
-  termination_stats_[0].primal_objective = value;
-}
-
-template <typename i_t, typename f_t>
-void optimization_problem_solution_t<i_t, f_t>::set_dual_objective(f_t value)
-{
-  cuopt_assert(!termination_stats_.empty(), "termination_stats_ is empty");
-  termination_stats_[0].dual_objective = value;
-}
-
-template <typename i_t, typename f_t>
-void optimization_problem_solution_t<i_t, f_t>::set_gap(f_t value)
-{
-  cuopt_assert(!termination_stats_.empty(), "termination_stats_ is empty");
-  termination_stats_[0].gap = value;
-}
-
-template <typename i_t, typename f_t>
-void optimization_problem_solution_t<i_t, f_t>::set_nb_iterations(i_t value)
-{
-  cuopt_assert(!termination_stats_.empty(), "termination_stats_ is empty");
-  termination_stats_[0].number_of_steps_taken = value;
-}
-
 template <typename i_t, typename f_t>
 void optimization_problem_solution_t<i_t, f_t>::set_solved_by_pdlp(bool value)
 {
diff --git a/cpp/src/linear_programming/utilities/cython_solve.cu b/cpp/src/linear_programming/utilities/cython_solve.cu
index 939090a57..c10ec324e 100644
--- a/cpp/src/linear_programming/utilities/cython_solve.cu
+++ b/cpp/src/linear_programming/utilities/cython_solve.cu
@@ -7,6 +7,7 @@
 
 #include <cuopt/error.hpp>
 #include <cuopt/linear_programming/optimization_problem.hpp>
+#include <cuopt/linear_programming/optimization_problem_conversions.hpp>
 #include <cuopt/linear_programming/solve.hpp>
 #include <cuopt/linear_programming/solver_settings.hpp>
 #include <cuopt/linear_programming/utilities/cython_solve.hpp>
@@ -33,95 +34,9 @@ namespace cython {
 
 using cuopt::linear_programming::var_t;
 
-static cuopt::linear_programming::optimization_problem_t<int, double>
-data_model_to_optimization_problem(
-  cuopt::mps_parser::data_model_view_t<int, double>* data_model,
-  cuopt::linear_programming::solver_settings_t<int, double>* solver_settings,
-  raft::handle_t const* handle_ptr)
-{
-  cuopt::linear_programming::optimization_problem_t<int, double> op_problem(handle_ptr);
-  op_problem.set_maximize(data_model->get_sense());
-  if (data_model->get_constraint_matrix_values().size() != 0 &&
-      data_model->get_constraint_matrix_indices().size() != 0 &&
-      data_model->get_constraint_matrix_offsets().size() != 0) {
-    op_problem.set_csr_constraint_matrix(data_model->get_constraint_matrix_values().data(),
-                                         data_model->get_constraint_matrix_values().size(),
-                                         data_model->get_constraint_matrix_indices().data(),
-                                         data_model->get_constraint_matrix_indices().size(),
-                                         data_model->get_constraint_matrix_offsets().data(),
-                                         data_model->get_constraint_matrix_offsets().size());
-  }
-  if (data_model->get_constraint_bounds().size() != 0) {
-    op_problem.set_constraint_bounds(data_model->get_constraint_bounds().data(),
-                                     data_model->get_constraint_bounds().size());
-  }
-  if (data_model->get_objective_coefficients().size() != 0) {
-    op_problem.set_objective_coefficients(data_model->get_objective_coefficients().data(),
-                                          data_model->get_objective_coefficients().size());
-  }
-  op_problem.set_objective_scaling_factor(data_model->get_objective_scaling_factor());
-  op_problem.set_objective_offset(data_model->get_objective_offset());
-
-  if (data_model->get_quadratic_objective_values().size() != 0 &&
-      data_model->get_quadratic_objective_indices().size() != 0 &&
-      data_model->get_quadratic_objective_offsets().size() != 0) {
-    op_problem.set_quadratic_objective_matrix(data_model->get_quadratic_objective_values().data(),
-                                              data_model->get_quadratic_objective_values().size(),
-                                              data_model->get_quadratic_objective_indices().data(),
-                                              data_model->get_quadratic_objective_indices().size(),
-                                              data_model->get_quadratic_objective_offsets().data(),
-                                              data_model->get_quadratic_objective_offsets().size());
-  }
-  if (data_model->get_variable_lower_bounds().size() != 0) {
-    op_problem.set_variable_lower_bounds(data_model->get_variable_lower_bounds().data(),
-                                         data_model->get_variable_lower_bounds().size());
-  }
-  if (data_model->get_variable_upper_bounds().size() != 0) {
-    op_problem.set_variable_upper_bounds(data_model->get_variable_upper_bounds().data(),
-                                         data_model->get_variable_upper_bounds().size());
-  }
-
-  if (data_model->get_row_types().size() != 0) {
-    op_problem.set_row_types(data_model->get_row_types().data(),
-                             data_model->get_row_types().size());
-  }
-  if (data_model->get_constraint_lower_bounds().size() != 0) {
-    op_problem.set_constraint_lower_bounds(data_model->get_constraint_lower_bounds().data(),
-                                           data_model->get_constraint_lower_bounds().size());
-  }
-  if (data_model->get_constraint_upper_bounds().size() != 0) {
-    op_problem.set_constraint_upper_bounds(data_model->get_constraint_upper_bounds().data(),
-                                           data_model->get_constraint_upper_bounds().size());
-  }
-
-  if (solver_settings->get_pdlp_warm_start_data_view()
-        .last_restart_duality_gap_dual_solution_.data() != nullptr) {
-    // Moved inside
-    cuopt::linear_programming::pdlp_warm_start_data_t<int, double> pdlp_warm_start_data(
-      solver_settings->get_pdlp_warm_start_data_view(), handle_ptr->get_stream());
-    solver_settings->get_pdlp_settings().set_pdlp_warm_start_data(pdlp_warm_start_data);
-  }
-
-  if (data_model->get_variable_types().size() != 0) {
-    std::vector<var_t> enum_variable_types(data_model->get_variable_types().size());
-    std::transform(
-      data_model->get_variable_types().data(),
-      data_model->get_variable_types().data() + data_model->get_variable_types().size(),
-      enum_variable_types.begin(),
-      [](const auto val) -> var_t { return val == 'I' ? var_t::INTEGER : var_t::CONTINUOUS; });
-    op_problem.set_variable_types(enum_variable_types.data(), enum_variable_types.size());
-  }
-
-  if (data_model->get_variable_names().size() != 0) {
-    op_problem.set_variable_names(data_model->get_variable_names());
-  }
-
-  if (data_model->get_row_names().size() != 0) {
-    op_problem.set_row_names(data_model->get_row_names());
-  }
-
-  return op_problem;
-}
+// Note: data_model_to_optimization_problem() has been replaced with
+// data_model_view_to_optimization_problem() from optimization_problem_conversions.hpp
+// Warm start handling is now done inline where needed.
 
 /**
  * @brief Wrapper for linear_programming to expose the API to cython
@@ -142,8 +57,13 @@ linear_programming_ret_t call_solve_lp(
     "LP solve cannot be called on a MIP problem!");
   const bool problem_checking     = true;
   const bool use_pdlp_solver_mode = true;
-  auto solution                   = cuopt::linear_programming::solve_lp(
+
+  // Call solver (local GPU or remote depending on CUOPT_REMOTE_HOST/PORT env vars)
+  // Note: If remote execution is enabled, solution is guaranteed to be in host memory
+  auto solution = cuopt::linear_programming::solve_lp(
     op_problem, solver_settings, problem_checking, use_pdlp_solver_mode, is_batch_mode);
+
+  // Extract termination statistics (scalars - same for both device and host memory)
   linear_programming_ret_t lp_ret{};
   const auto& stats          = solution.get_additional_termination_information();
   auto& warm_start           = solution.get_pdlp_warm_start_data();
@@ -159,6 +79,7 @@ linear_programming_ret_t call_solve_lp(
   lp_ret.solve_time_         = stats.solve_time;
   lp_ret.solved_by_pdlp_     = stats.solved_by_pdlp;
 
+  // Extract warm-start data (scalars - same for both device and host memory)
   lp_ret.initial_primal_weight_         = warm_start.initial_primal_weight_;
   lp_ret.initial_step_size_             = warm_start.initial_step_size_;
   lp_ret.total_pdlp_iterations_         = warm_start.total_pdlp_iterations_;
@@ -168,7 +89,9 @@ linear_programming_ret_t call_solve_lp(
   lp_ret.sum_solution_weight_           = warm_start.sum_solution_weight_;
   lp_ret.iterations_since_last_restart_ = warm_start.iterations_since_last_restart_;
 
+  // Transfer solution data - either GPU or CPU depending on where it was solved
   if (solution.is_device_memory()) {
+    // Local GPU solve: transfer device buffers
     lp_ret.primal_solution_ =
       std::make_unique<rmm::device_buffer>(solution.get_primal_solution().release());
     lp_ret.dual_solution_ =
@@ -194,6 +117,7 @@ linear_programming_ret_t call_solve_lp(
       warm_start.last_restart_duality_gap_dual_solution_.release());
     lp_ret.is_device_memory_ = true;
   } else {
+    // Remote solve: use host vectors
     lp_ret.primal_solution_host_ = solution.get_primal_solution_host();
     lp_ret.dual_solution_host_   = solution.get_dual_solution_host();
     lp_ret.reduced_cost_host_    = solution.get_reduced_cost_host();
@@ -220,7 +144,12 @@ mip_ret_t call_solve_mip(
       (op_problem.get_problem_category() == cuopt::linear_programming::problem_category_t::IP),
     error_type_t::ValidationError,
     "MIP solve cannot be called on an LP problem!");
+
+  // Call solver (local GPU or remote depending on CUOPT_REMOTE_HOST/PORT env vars)
+  // Note: If remote execution is enabled, solution is guaranteed to be in host memory
   auto solution = cuopt::linear_programming::solve_mip(op_problem, solver_settings);
+
+  // Extract solution statistics (scalars - same for both device and host memory)
   mip_ret_t mip_ret{};
   mip_ret.termination_status_           = solution.get_termination_status();
   mip_ret.error_status_                 = solution.get_error_status().get_error_type();
@@ -236,10 +165,13 @@ mip_ret_t call_solve_mip(
   mip_ret.nodes_                        = solution.get_num_nodes();
   mip_ret.simplex_iterations_           = solution.get_num_simplex_iterations();
 
+  // Transfer solution data - either GPU or CPU depending on where it was solved
   if (solution.is_device_memory()) {
-    mip_ret.solution_ = std::make_unique<rmm::device_buffer>(solution.get_solution().release());
+    // Local GPU solve: transfer device buffer
+    mip_ret.solution_         = std::make_unique<rmm::device_buffer>(solution.get_solution().release());
     mip_ret.is_device_memory_ = true;
   } else {
+    // Remote solve: use host vector
     mip_ret.solution_host_    = solution.get_solution_host();
     mip_ret.is_device_memory_ = false;
   }
@@ -362,7 +294,17 @@ std::unique_ptr<solver_ret_t> call_solve(
 
   solver_ret_t response;
 
-  auto op_problem = data_model_to_optimization_problem(data_model, solver_settings, &handle_);
+  // Handle warm start data if present (needs to be done before creating optimization_problem_t)
+  if (solver_settings->get_pdlp_warm_start_data_view()
+        .last_restart_duality_gap_dual_solution_.data() != nullptr) {
+    cuopt::linear_programming::pdlp_warm_start_data_t<int, double> pdlp_warm_start_data(
+      solver_settings->get_pdlp_warm_start_data_view(), handle_.get_stream());
+    solver_settings->get_pdlp_settings().set_pdlp_warm_start_data(pdlp_warm_start_data);
+  }
+
+  // Use shared conversion function from optimization_problem_conversions.hpp
+  auto op_problem = cuopt::linear_programming::data_model_view_to_optimization_problem(&handle_, *data_model);
+  
   if (op_problem.get_problem_category() == linear_programming::problem_category_t::LP) {
     response.lp_ret =
       call_solve_lp(op_problem, solver_settings->get_pdlp_settings(), is_batch_mode);
diff --git a/cpp/src/mip/solve.cu b/cpp/src/mip/solve.cu
index 92a3b64b4..a2a0d9c49 100644
--- a/cpp/src/mip/solve.cu
+++ b/cpp/src/mip/solve.cu
@@ -27,6 +27,7 @@
 
 #include <cuopt/linear_programming/mip/solver_settings.hpp>
 #include <cuopt/linear_programming/mip/solver_solution.hpp>
+#include <cuopt/linear_programming/optimization_problem_conversions.hpp>
 #include <cuopt/linear_programming/pdlp/pdlp_hyper_params.cuh>
 #include <cuopt/linear_programming/solve.hpp>
 
@@ -288,223 +289,11 @@ mip_solution_t<i_t, f_t> solve_mip(optimization_problem_t<i_t, f_t>& op_problem,
   }
 }
 
-// Helper to create a data_model_view_t from mps_data_model_t (for remote solve path)
-template <typename i_t, typename f_t>
-static data_model_view_t<i_t, f_t> create_view_from_mps_data_model(
-  const cuopt::mps_parser::mps_data_model_t<i_t, f_t>& mps_data_model)
-{
-  data_model_view_t<i_t, f_t> view;
-
-  view.set_maximize(mps_data_model.get_sense());
-
-  // Always set constraint matrix if offsets exist (even for empty problems with 0 constraints)
-  // Validation requires at least offsets=[0] to be set
-  if (!mps_data_model.get_constraint_matrix_offsets().empty()) {
-    view.set_csr_constraint_matrix(mps_data_model.get_constraint_matrix_values().data(),
-                                   mps_data_model.get_constraint_matrix_values().size(),
-                                   mps_data_model.get_constraint_matrix_indices().data(),
-                                   mps_data_model.get_constraint_matrix_indices().size(),
-                                   mps_data_model.get_constraint_matrix_offsets().data(),
-                                   mps_data_model.get_constraint_matrix_offsets().size());
-  }
-
-  if (!mps_data_model.get_constraint_bounds().empty()) {
-    view.set_constraint_bounds(mps_data_model.get_constraint_bounds().data(),
-                               mps_data_model.get_constraint_bounds().size());
-  }
-
-  if (!mps_data_model.get_objective_coefficients().empty()) {
-    view.set_objective_coefficients(mps_data_model.get_objective_coefficients().data(),
-                                    mps_data_model.get_objective_coefficients().size());
-  }
-
-  view.set_objective_scaling_factor(mps_data_model.get_objective_scaling_factor());
-  view.set_objective_offset(mps_data_model.get_objective_offset());
-
-  if (!mps_data_model.get_variable_lower_bounds().empty()) {
-    view.set_variable_lower_bounds(mps_data_model.get_variable_lower_bounds().data(),
-                                   mps_data_model.get_variable_lower_bounds().size());
-  }
-
-  if (!mps_data_model.get_variable_upper_bounds().empty()) {
-    view.set_variable_upper_bounds(mps_data_model.get_variable_upper_bounds().data(),
-                                   mps_data_model.get_variable_upper_bounds().size());
-  }
-
-  if (!mps_data_model.get_variable_types().empty()) {
-    view.set_variable_types(mps_data_model.get_variable_types().data(),
-                            mps_data_model.get_variable_types().size());
-  }
-
-  if (!mps_data_model.get_row_types().empty()) {
-    view.set_row_types(mps_data_model.get_row_types().data(),
-                       mps_data_model.get_row_types().size());
-  }
-
-  if (!mps_data_model.get_constraint_lower_bounds().empty()) {
-    view.set_constraint_lower_bounds(mps_data_model.get_constraint_lower_bounds().data(),
-                                     mps_data_model.get_constraint_lower_bounds().size());
-  }
-
-  if (!mps_data_model.get_constraint_upper_bounds().empty()) {
-    view.set_constraint_upper_bounds(mps_data_model.get_constraint_upper_bounds().data(),
-                                     mps_data_model.get_constraint_upper_bounds().size());
-  }
-
-  view.set_objective_name(mps_data_model.get_objective_name());
-  view.set_problem_name(mps_data_model.get_problem_name());
-
-  if (!mps_data_model.get_variable_names().empty()) {
-    view.set_variable_names(mps_data_model.get_variable_names());
-  }
-
-  if (!mps_data_model.get_row_names().empty()) {
-    view.set_row_names(mps_data_model.get_row_names());
-  }
-
-  if (!mps_data_model.get_initial_primal_solution().empty()) {
-    view.set_initial_primal_solution(mps_data_model.get_initial_primal_solution().data(),
-                                     mps_data_model.get_initial_primal_solution().size());
-  }
-
-  if (!mps_data_model.get_initial_dual_solution().empty()) {
-    view.set_initial_dual_solution(mps_data_model.get_initial_dual_solution().data(),
-                                   mps_data_model.get_initial_dual_solution().size());
-  }
-
-  return view;
-}
-
-// Helper struct to hold CPU copies of GPU data for remote solve
-template <typename i_t, typename f_t>
-struct cpu_problem_data_t {
-  std::vector<f_t> A_values;
-  std::vector<i_t> A_indices;
-  std::vector<i_t> A_offsets;
-  std::vector<f_t> constraint_bounds;
-  std::vector<f_t> constraint_lower_bounds;
-  std::vector<f_t> constraint_upper_bounds;
-  std::vector<f_t> objective_coefficients;
-  std::vector<f_t> variable_lower_bounds;
-  std::vector<f_t> variable_upper_bounds;
-  std::vector<char> variable_types;
-  std::vector<char> row_types;
-  std::vector<f_t> quadratic_objective_values;
-  std::vector<i_t> quadratic_objective_indices;
-  std::vector<i_t> quadratic_objective_offsets;
-  bool maximize;
-  f_t objective_scaling_factor;
-  f_t objective_offset;
-
-  data_model_view_t<i_t, f_t> create_view() const
-  {
-    data_model_view_t<i_t, f_t> v;
-    v.set_maximize(maximize);
-    v.set_objective_scaling_factor(objective_scaling_factor);
-    v.set_objective_offset(objective_offset);
-
-    if (!A_values.empty()) {
-      v.set_csr_constraint_matrix(A_values.data(),
-                                  A_values.size(),
-                                  A_indices.data(),
-                                  A_indices.size(),
-                                  A_offsets.data(),
-                                  A_offsets.size());
-    }
-    if (!constraint_bounds.empty()) {
-      v.set_constraint_bounds(constraint_bounds.data(), constraint_bounds.size());
-    }
-    if (!constraint_lower_bounds.empty()) {
-      v.set_constraint_lower_bounds(constraint_lower_bounds.data(), constraint_lower_bounds.size());
-    }
-    if (!constraint_upper_bounds.empty()) {
-      v.set_constraint_upper_bounds(constraint_upper_bounds.data(), constraint_upper_bounds.size());
-    }
-    if (!objective_coefficients.empty()) {
-      v.set_objective_coefficients(objective_coefficients.data(), objective_coefficients.size());
-    }
-    if (!variable_lower_bounds.empty()) {
-      v.set_variable_lower_bounds(variable_lower_bounds.data(), variable_lower_bounds.size());
-    }
-    if (!variable_upper_bounds.empty()) {
-      v.set_variable_upper_bounds(variable_upper_bounds.data(), variable_upper_bounds.size());
-    }
-    if (!variable_types.empty()) {
-      v.set_variable_types(variable_types.data(), variable_types.size());
-    }
-    if (!row_types.empty()) { v.set_row_types(row_types.data(), row_types.size()); }
-    if (!quadratic_objective_values.empty()) {
-      v.set_quadratic_objective_matrix(quadratic_objective_values.data(),
-                                       quadratic_objective_values.size(),
-                                       quadratic_objective_indices.data(),
-                                       quadratic_objective_indices.size(),
-                                       quadratic_objective_offsets.data(),
-                                       quadratic_objective_offsets.size());
-    }
-    v.set_is_device_memory(false);
-    return v;
-  }
-};
 
-// Helper to copy GPU view data to CPU
-template <typename i_t, typename f_t>
-cpu_problem_data_t<i_t, f_t> copy_view_to_cpu(raft::handle_t const* handle_ptr,
-                                              const data_model_view_t<i_t, f_t>& gpu_view)
-{
-  cpu_problem_data_t<i_t, f_t> cpu_data;
-  auto stream = handle_ptr->get_stream();
+// Note: create_view_from_mps_data_model() is in optimization_problem_conversions.hpp
 
-  cpu_data.maximize                 = gpu_view.get_sense();
-  cpu_data.objective_scaling_factor = gpu_view.get_objective_scaling_factor();
-  cpu_data.objective_offset         = gpu_view.get_objective_offset();
 
-  auto copy_to_host = [stream](auto& dst_vec, auto src_span) {
-    if (src_span.size() > 0) {
-      dst_vec.resize(src_span.size());
-      raft::copy(dst_vec.data(), src_span.data(), src_span.size(), stream);
-    }
-  };
-
-  copy_to_host(cpu_data.A_values, gpu_view.get_constraint_matrix_values());
-  copy_to_host(cpu_data.A_indices, gpu_view.get_constraint_matrix_indices());
-  copy_to_host(cpu_data.A_offsets, gpu_view.get_constraint_matrix_offsets());
-  copy_to_host(cpu_data.constraint_bounds, gpu_view.get_constraint_bounds());
-  copy_to_host(cpu_data.constraint_lower_bounds, gpu_view.get_constraint_lower_bounds());
-  copy_to_host(cpu_data.constraint_upper_bounds, gpu_view.get_constraint_upper_bounds());
-  copy_to_host(cpu_data.objective_coefficients, gpu_view.get_objective_coefficients());
-  copy_to_host(cpu_data.variable_lower_bounds, gpu_view.get_variable_lower_bounds());
-  copy_to_host(cpu_data.variable_upper_bounds, gpu_view.get_variable_upper_bounds());
-  copy_to_host(cpu_data.quadratic_objective_values, gpu_view.get_quadratic_objective_values());
-  copy_to_host(cpu_data.quadratic_objective_indices, gpu_view.get_quadratic_objective_indices());
-  copy_to_host(cpu_data.quadratic_objective_offsets, gpu_view.get_quadratic_objective_offsets());
-
-  // Variable types need special handling (char array)
-  auto var_types_span = gpu_view.get_variable_types();
-  if (var_types_span.size() > 0) {
-    cpu_data.variable_types.resize(var_types_span.size());
-    RAFT_CUDA_TRY(cudaMemcpyAsync(cpu_data.variable_types.data(),
-                                  var_types_span.data(),
-                                  var_types_span.size() * sizeof(char),
-                                  cudaMemcpyDeviceToHost,
-                                  stream));
-  }
-
-  // Row types need special handling (char array)
-  auto row_types_span = gpu_view.get_row_types();
-  if (row_types_span.size() > 0) {
-    cpu_data.row_types.resize(row_types_span.size());
-    RAFT_CUDA_TRY(cudaMemcpyAsync(cpu_data.row_types.data(),
-                                  row_types_span.data(),
-                                  row_types_span.size() * sizeof(char),
-                                  cudaMemcpyDeviceToHost,
-                                  stream));
-  }
-
-  // Synchronize to ensure all copies are complete
-  RAFT_CUDA_TRY(cudaStreamSynchronize(stream));
-
-  return cpu_data;
-}
+// Note: cpu_problem_data_t and copy_view_to_cpu are in optimization_problem_conversions.hpp
 
 template <typename i_t, typename f_t>
 mip_solution_t<i_t, f_t> solve_mip(
diff --git a/cpp/src/mip/solver_solution.cu b/cpp/src/mip/solver_solution.cu
index a88a4d217..7224d045d 100644
--- a/cpp/src/mip/solver_solution.cu
+++ b/cpp/src/mip/solver_solution.cu
@@ -330,80 +330,6 @@ void mip_solution_t<i_t, f_t>::log_summary() const
 // Setters for remote solve deserialization
 //============================================================================
 
-template <typename i_t, typename f_t>
-void mip_solution_t<i_t, f_t>::set_solution_host(std::vector<f_t> solution)
-{
-  solution_host_ = std::make_unique<std::vector<f_t>>(std::move(solution));
-
-  // Clear device storage to free GPU memory
-  solution_.reset();
-
-  // Note: solution_pool_ is typically empty for remote solves and doesn't need explicit cleanup
-  // If solution_pool_ contains device data, it will be freed when the object is destroyed
-
-  is_device_memory_ = false;
-}
-
-template <typename i_t, typename f_t>
-void mip_solution_t<i_t, f_t>::set_objective(f_t value)
-{
-  objective_ = value;
-}
-
-template <typename i_t, typename f_t>
-void mip_solution_t<i_t, f_t>::set_mip_gap(f_t value)
-{
-  mip_gap_ = value;
-}
-
-template <typename i_t, typename f_t>
-void mip_solution_t<i_t, f_t>::set_solution_bound(f_t value)
-{
-  stats_.solution_bound = value;
-}
-
-template <typename i_t, typename f_t>
-void mip_solution_t<i_t, f_t>::set_total_solve_time(double value)
-{
-  stats_.total_solve_time = value;
-}
-
-template <typename i_t, typename f_t>
-void mip_solution_t<i_t, f_t>::set_presolve_time(double value)
-{
-  stats_.presolve_time = value;
-}
-
-template <typename i_t, typename f_t>
-void mip_solution_t<i_t, f_t>::set_max_constraint_violation(f_t value)
-{
-  max_constraint_violation_ = value;
-}
-
-template <typename i_t, typename f_t>
-void mip_solution_t<i_t, f_t>::set_max_int_violation(f_t value)
-{
-  max_int_violation_ = value;
-}
-
-template <typename i_t, typename f_t>
-void mip_solution_t<i_t, f_t>::set_max_variable_bound_violation(f_t value)
-{
-  max_variable_bound_violation_ = value;
-}
-
-template <typename i_t, typename f_t>
-void mip_solution_t<i_t, f_t>::set_nodes(i_t value)
-{
-  stats_.num_nodes = value;
-}
-
-template <typename i_t, typename f_t>
-void mip_solution_t<i_t, f_t>::set_simplex_iterations(i_t value)
-{
-  stats_.num_simplex_iterations = value;
-}
-
 template <typename i_t, typename f_t>
 std::string mip_solution_t<i_t, f_t>::get_error_string() const
 {

From 84c081f8f1df784d43dbd4dce7460a459d6a55ef Mon Sep 17 00:00:00 2001
From: Trevor McKay <tmgithub1@gmail.com>
Date: Fri, 30 Jan 2026 00:00:48 -0500
Subject: [PATCH 19/22] Refactor solve helpers to use data_model_view_t and add
 validation guards

- Update call_solve_lp/call_solve_mip to take data_model_view_t instead of optimization_problem_t
- Add get_problem_category() to data_model_view_t with lazy evaluation for efficient LP/MIP detection
- Add validation guards to ensure LP solve isn't called on MIP and vice versa
- Add batch mode parameter to solve_lp with remote batch validation
- Update CLI to use new problem category detection
---
 cpp/cuopt_cli.cpp                             |  20 +--
 .../cuopt/linear_programming/solve.hpp        |   3 +-
 .../include/mps_parser/data_model_view.hpp    |  24 +++
 cpp/libmps_parser/src/data_model_view.cpp     |  43 +++++
 cpp/src/linear_programming/solve.cu           |  18 +-
 .../utilities/cython_solve.cu                 | 168 +++++-------------
 6 files changed, 131 insertions(+), 145 deletions(-)

diff --git a/cpp/cuopt_cli.cpp b/cpp/cuopt_cli.cpp
index d8106bf47..862a95f69 100644
--- a/cpp/cuopt_cli.cpp
+++ b/cpp/cuopt_cli.cpp
@@ -129,14 +129,14 @@ int run_single_file(const std::string& file_path,
     return -1;
   }
 
-  // Determine if this is a MIP problem by checking variable types
-  bool has_integers = false;
-  for (const auto& vt : mps_data_model.get_variable_types()) {
-    if (vt == 'I' || vt == 'B') {
-      has_integers = true;
-      break;
-    }
-  }
+  // Create a non-owning view from the mps_data_model (using shared conversion function)
+  // solve_lp/solve_mip will handle remote vs local solve based on env vars
+  auto view = cuopt::linear_programming::create_view_from_mps_data_model(mps_data_model);
+
+  // Determine if this is a MIP problem by checking problem category
+  auto problem_category = view.get_problem_category();
+  bool has_integers = (problem_category == cuopt::linear_programming::problem_category_t::MIP) ||
+                      (problem_category == cuopt::linear_programming::problem_category_t::IP);
   const bool is_mip = has_integers && !solve_relaxation;
 
   try {
@@ -163,10 +163,6 @@ int run_single_file(const std::string& file_path,
     return -1;
   }
 
-  // Create a non-owning view from the mps_data_model (using shared conversion function)
-  // solve_lp/solve_mip will handle remote vs local solve based on env vars
-  auto view = cuopt::linear_programming::create_view_from_mps_data_model(mps_data_model);
-
   try {
     // Pass handle_ptr.get() - can be nullptr for remote solve
     if (is_mip) {
diff --git a/cpp/include/cuopt/linear_programming/solve.hpp b/cpp/include/cuopt/linear_programming/solve.hpp
index e9d1c4c02..32d331389 100644
--- a/cpp/include/cuopt/linear_programming/solve.hpp
+++ b/cpp/include/cuopt/linear_programming/solve.hpp
@@ -173,7 +173,8 @@ optimization_problem_solution_t<i_t, f_t> solve_lp(
   const data_model_view_t<i_t, f_t>& view,
   pdlp_solver_settings_t<i_t, f_t> const& settings = pdlp_solver_settings_t<i_t, f_t>{},
   bool problem_checking                            = true,
-  bool use_pdlp_solver_mode                        = true);
+  bool use_pdlp_solver_mode                        = true,
+  bool is_batch_mode                               = false);
 
 /**
  * @brief Mixed integer programming solve function using data_model_view_t.
diff --git a/cpp/libmps_parser/include/mps_parser/data_model_view.hpp b/cpp/libmps_parser/include/mps_parser/data_model_view.hpp
index d92357179..c4f5385c1 100644
--- a/cpp/libmps_parser/include/mps_parser/data_model_view.hpp
+++ b/cpp/libmps_parser/include/mps_parser/data_model_view.hpp
@@ -14,6 +14,11 @@
 #include <type_traits>
 #include <vector>
 
+// Forward declaration to avoid circular dependency
+namespace cuopt::linear_programming {
+enum class problem_category_t : int8_t;
+}
+
 namespace cuopt::mps_parser {
 
 /**
@@ -421,9 +426,28 @@ class data_model_view_t {
    */
   bool is_device_memory() const noexcept { return is_device_memory_; }
 
+  /**
+   * @brief Get the problem category (LP, MIP, or IP)
+   *
+   * Computes the problem category based on variable types on first call, then caches the result.
+   * Uses early-exit optimization for MIP detection (exits as soon as both continuous and integer
+   * variables are found).
+   *
+   * - LP: all continuous variables
+   * - IP: all integer variables
+   * - MIP: mix of continuous and integer variables
+   *
+   * @return cuopt::linear_programming::problem_category_t
+   */
+  cuopt::linear_programming::problem_category_t get_problem_category() const;
+
  private:
   bool maximize_{false};
   bool is_device_memory_{false};  // true if spans point to GPU memory, false for CPU
+  
+  // Lazy-evaluated problem category cache
+  mutable cuopt::linear_programming::problem_category_t problem_category_;
+  mutable bool problem_category_computed_{false};
   span<f_t const> A_;
   span<i_t const> A_indices_;
   span<i_t const> A_offsets_;
diff --git a/cpp/libmps_parser/src/data_model_view.cpp b/cpp/libmps_parser/src/data_model_view.cpp
index a8035eead..341f47cc3 100644
--- a/cpp/libmps_parser/src/data_model_view.cpp
+++ b/cpp/libmps_parser/src/data_model_view.cpp
@@ -348,6 +348,49 @@ bool data_model_view_t<i_t, f_t>::has_quadratic_objective() const noexcept
   return Q_objective_.size() > 0;
 }
 
+template <typename i_t, typename f_t>
+cuopt::linear_programming::problem_category_t data_model_view_t<i_t, f_t>::get_problem_category()
+  const
+{
+  // Return cached value if already computed
+  if (problem_category_computed_) { return problem_category_; }
+
+  // Compute problem category based on variable types
+  // Use early-exit optimization: as soon as we find both continuous and integer, it's MIP
+  bool has_continuous = false;
+  bool has_integer    = false;
+
+  for (size_t i = 0; i < variable_types_.size(); ++i) {
+    if (variable_types_.data()[i] == 'I' || variable_types_.data()[i] == 'B') {
+      has_integer = true;
+      if (has_continuous) {
+        // Found both types - it's MIP, cache and return
+        // Note: problem_category_t values: LP=0, MIP=1, IP=2
+        problem_category_ = static_cast<cuopt::linear_programming::problem_category_t>(1);  // MIP
+        problem_category_computed_ = true;
+        return problem_category_;
+      }
+    } else {  // 'C' or other continuous type
+      has_continuous = true;
+      if (has_integer) {
+        // Found both types - it's MIP, cache and return
+        problem_category_ = static_cast<cuopt::linear_programming::problem_category_t>(1);  // MIP
+        problem_category_computed_ = true;
+        return problem_category_;
+      }
+    }
+  }
+
+  // All variables are of the same type
+  if (has_integer) {
+    problem_category_ = static_cast<cuopt::linear_programming::problem_category_t>(2);  // IP
+  } else {
+    problem_category_ = static_cast<cuopt::linear_programming::problem_category_t>(0);  // LP
+  }
+  problem_category_computed_ = true;
+  return problem_category_;
+}
+
 // NOTE: Explicitly instantiate all types here in order to avoid linker error
 template class data_model_view_t<int, float>;
 template class data_model_view_t<int, double>;
diff --git a/cpp/src/linear_programming/solve.cu b/cpp/src/linear_programming/solve.cu
index 92d153fc0..155ef6cdb 100644
--- a/cpp/src/linear_programming/solve.cu
+++ b/cpp/src/linear_programming/solve.cu
@@ -1259,7 +1259,8 @@ optimization_problem_solution_t<i_t, f_t> solve_lp(raft::handle_t const* handle_
                                                    const data_model_view_t<i_t, f_t>& view,
                                                    pdlp_solver_settings_t<i_t, f_t> const& settings,
                                                    bool problem_checking,
-                                                   bool use_pdlp_solver_mode)
+                                                   bool use_pdlp_solver_mode,
+                                                   bool is_batch_mode)
 {
   // Initialize logger for this overload (needed for early returns)
   init_logger_t log(settings.log_file, settings.log_to_console);
@@ -1267,6 +1268,14 @@ optimization_problem_solution_t<i_t, f_t> solve_lp(raft::handle_t const* handle_
   // Check for remote solve configuration first
   auto remote_config = get_remote_solve_config();
 
+  // Batch mode with remote solve is not yet supported
+  if (is_batch_mode && remote_config.has_value()) {
+    CUOPT_LOG_ERROR("[solve_lp] Batch mode with remote solve is not currently supported.");
+    return optimization_problem_solution_t<i_t, f_t>(
+      cuopt::logic_error("Batch mode with remote solve is not currently supported",
+                         cuopt::error_type_t::RuntimeError));
+  }
+
   if (view.is_device_memory()) {
     if (remote_config.has_value()) {
       // GPU data + remote solve requested: need valid handle to copy GPU→CPU
@@ -1291,7 +1300,7 @@ optimization_problem_solution_t<i_t, f_t> solve_lp(raft::handle_t const* handle_
 
     // Local solve: data already on GPU - convert view to optimization_problem_t and solve
     auto op_problem = data_model_view_to_optimization_problem(handle_ptr, view);
-    return solve_lp(op_problem, settings, problem_checking, use_pdlp_solver_mode);
+    return solve_lp(op_problem, settings, problem_checking, use_pdlp_solver_mode, is_batch_mode);
   }
 
   // Data is on CPU
@@ -1310,7 +1319,7 @@ optimization_problem_solution_t<i_t, f_t> solve_lp(raft::handle_t const* handle_
       cuopt::logic_error("No CUDA handle for CPU->GPU copy", cuopt::error_type_t::RuntimeError));
   }
   auto op_problem = data_model_view_to_optimization_problem(handle_ptr, view);
-  return solve_lp(op_problem, settings, problem_checking, use_pdlp_solver_mode);
+  return solve_lp(op_problem, settings, problem_checking, use_pdlp_solver_mode, is_batch_mode);
 }
 
 #define INSTANTIATE(F_TYPE)                                                             \
@@ -1339,7 +1348,8 @@ optimization_problem_solution_t<i_t, f_t> solve_lp(raft::handle_t const* handle_
     const data_model_view_t<int, F_TYPE>& view,                                         \
     pdlp_solver_settings_t<int, F_TYPE> const& settings,                                \
     bool problem_checking,                                                              \
-    bool use_pdlp_solver_mode);                                                         \
+    bool use_pdlp_solver_mode,                                                          \
+    bool is_batch_mode);                                                         \
                                                                                         \
   template optimization_problem_solution_t<int, F_TYPE> batch_pdlp_solve(               \
     raft::handle_t const* handle_ptr,                                                   \
diff --git a/cpp/src/linear_programming/utilities/cython_solve.cu b/cpp/src/linear_programming/utilities/cython_solve.cu
index c10ec324e..3cd8064d9 100644
--- a/cpp/src/linear_programming/utilities/cython_solve.cu
+++ b/cpp/src/linear_programming/utilities/cython_solve.cu
@@ -46,22 +46,25 @@ using cuopt::linear_programming::var_t;
  * @return linear_programming_ret_t
  */
 linear_programming_ret_t call_solve_lp(
-  cuopt::linear_programming::optimization_problem_t<int, double>& op_problem,
+  raft::handle_t const* handle_ptr,
+  const cuopt::mps_parser::data_model_view_t<int, double>& view,
   cuopt::linear_programming::pdlp_solver_settings_t<int, double>& solver_settings,
   bool is_batch_mode)
 {
   raft::common::nvtx::range fun_scope("Call Solve");
+  
+  // Validate that this is an LP problem (not MIP/IP)
   cuopt_expects(
-    op_problem.get_problem_category() == cuopt::linear_programming::problem_category_t::LP,
-    error_type_t::ValidationError,
+    view.get_problem_category() == cuopt::linear_programming::problem_category_t::LP,
+    cuopt::error_type_t::ValidationError,
     "LP solve cannot be called on a MIP problem!");
+  
   const bool problem_checking     = true;
   const bool use_pdlp_solver_mode = true;
 
-  // Call solver (local GPU or remote depending on CUOPT_REMOTE_HOST/PORT env vars)
-  // Note: If remote execution is enabled, solution is guaranteed to be in host memory
+  // Call solver - handles remote/local branching and batch mode validation
   auto solution = cuopt::linear_programming::solve_lp(
-    op_problem, solver_settings, problem_checking, use_pdlp_solver_mode, is_batch_mode);
+    handle_ptr, view, solver_settings, problem_checking, use_pdlp_solver_mode, is_batch_mode);
 
   // Extract termination statistics (scalars - same for both device and host memory)
   linear_programming_ret_t lp_ret{};
@@ -135,19 +138,22 @@ linear_programming_ret_t call_solve_lp(
  * @return mip_ret_t
  */
 mip_ret_t call_solve_mip(
-  cuopt::linear_programming::optimization_problem_t<int, double>& op_problem,
+  raft::handle_t const* handle_ptr,
+  const cuopt::mps_parser::data_model_view_t<int, double>& view,
   cuopt::linear_programming::mip_solver_settings_t<int, double>& solver_settings)
 {
   raft::common::nvtx::range fun_scope("Call Solve");
+  
+  // Validate that this is a MIP or IP problem (not pure LP)
   cuopt_expects(
-    (op_problem.get_problem_category() == cuopt::linear_programming::problem_category_t::MIP) or
-      (op_problem.get_problem_category() == cuopt::linear_programming::problem_category_t::IP),
-    error_type_t::ValidationError,
+    (view.get_problem_category() == cuopt::linear_programming::problem_category_t::MIP) ||
+      (view.get_problem_category() == cuopt::linear_programming::problem_category_t::IP),
+    cuopt::error_type_t::ValidationError,
     "MIP solve cannot be called on an LP problem!");
 
-  // Call solver (local GPU or remote depending on CUOPT_REMOTE_HOST/PORT env vars)
-  // Note: If remote execution is enabled, solution is guaranteed to be in host memory
-  auto solution = cuopt::linear_programming::solve_mip(op_problem, solver_settings);
+  // Call solver - handles both remote and local solves
+  // Remote: returns CPU solution, Local: returns GPU solution
+  auto solution = cuopt::linear_programming::solve_mip(handle_ptr, view, solver_settings);
 
   // Extract solution statistics (scalars - same for both device and host memory)
   mip_ret_t mip_ret{};
@@ -184,130 +190,35 @@ std::unique_ptr<solver_ret_t> call_solve(
   unsigned int flags,
   bool is_batch_mode)
 {
-  // Check if remote solve is configured FIRST (before any CUDA operations)
-  if (linear_programming::is_remote_solve_enabled()) {
-    // Data coming from Python is in CPU memory - mark it as such
-    data_model->set_is_device_memory(false);
-
-    solver_ret_t response;
-
-    // Determine if LP or MIP based on variable types
-    bool is_mip    = false;
-    auto var_types = data_model->get_variable_types();
-    for (size_t i = 0; i < var_types.size(); ++i) {
-      if (var_types.data()[i] == 'I') {
-        is_mip = true;
-        break;
-      }
-    }
-
-    if (!is_mip) {
-      // LP: call solve_lp with nullptr handle - remote solve doesn't need GPU
-      auto solution =
-        linear_programming::solve_lp(nullptr, *data_model, solver_settings->get_pdlp_settings());
-
-      auto term_info = solution.get_additional_termination_information();
-      linear_programming_ret_t lp_ret{};
-
-      if (solution.is_device_memory()) {
-        // GPU data (shouldn't happen for remote solve, but handle gracefully)
-        lp_ret.primal_solution_ =
-          std::make_unique<rmm::device_buffer>(solution.get_primal_solution().release());
-        lp_ret.dual_solution_ =
-          std::make_unique<rmm::device_buffer>(solution.get_dual_solution().release());
-        lp_ret.reduced_cost_ =
-          std::make_unique<rmm::device_buffer>(solution.get_reduced_cost().release());
-        lp_ret.is_device_memory_ = true;
-      } else {
-        // CPU data from remote solve - avoid device buffer allocations so CPU-only
-        // clients don't initialize CUDA.
-        lp_ret.primal_solution_host_ = std::move(solution.get_primal_solution_host());
-        lp_ret.dual_solution_host_   = std::move(solution.get_dual_solution_host());
-        lp_ret.reduced_cost_host_    = std::move(solution.get_reduced_cost_host());
-        lp_ret.is_device_memory_     = false;
-      }
-
-      // Remote stub path doesn't provide warm-start data yet.
-      lp_ret.initial_primal_weight_         = 0.0;
-      lp_ret.initial_step_size_             = 0.0;
-      lp_ret.total_pdlp_iterations_         = 0;
-      lp_ret.total_pdhg_iterations_         = 0;
-      lp_ret.last_candidate_kkt_score_      = 0.0;
-      lp_ret.last_restart_kkt_score_        = 0.0;
-      lp_ret.sum_solution_weight_           = 0.0;
-      lp_ret.iterations_since_last_restart_ = 0;
-
-      lp_ret.termination_status_ = solution.get_termination_status();
-      lp_ret.error_status_       = solution.get_error_status().get_error_type();
-      lp_ret.error_message_      = solution.get_error_status().what();
-      lp_ret.l2_primal_residual_ = term_info.l2_primal_residual;
-      lp_ret.l2_dual_residual_   = term_info.l2_dual_residual;
-      lp_ret.primal_objective_   = term_info.primal_objective;
-      lp_ret.dual_objective_     = term_info.dual_objective;
-      lp_ret.gap_                = term_info.gap;
-      lp_ret.nb_iterations_      = term_info.number_of_steps_taken;
-      lp_ret.solve_time_         = term_info.solve_time;
-      lp_ret.solved_by_pdlp_     = term_info.solved_by_pdlp;
-      response.lp_ret            = std::move(lp_ret);
-      response.problem_type      = linear_programming::problem_category_t::LP;
-    } else {
-      // MIP: call solve_mip with nullptr handle - remote solve doesn't need GPU
-      auto solution =
-        linear_programming::solve_mip(nullptr, *data_model, solver_settings->get_mip_settings());
-
-      mip_ret_t mip_ret{};
-
-      if (solution.is_device_memory()) {
-        // GPU data (shouldn't happen for remote solve, but handle gracefully)
-        mip_ret.solution_ = std::make_unique<rmm::device_buffer>(solution.get_solution().release());
-        mip_ret.is_device_memory_ = true;
-      } else {
-        // CPU data from remote solve - avoid device buffer allocations so CPU-only
-        // clients don't initialize CUDA.
-        mip_ret.solution_host_    = std::move(solution.get_solution_host());
-        mip_ret.is_device_memory_ = false;
-      }
-
-      mip_ret.termination_status_           = solution.get_termination_status();
-      mip_ret.error_status_                 = solution.get_error_status().get_error_type();
-      mip_ret.error_message_                = solution.get_error_status().what();
-      mip_ret.objective_                    = solution.get_objective_value();
-      mip_ret.mip_gap_                      = solution.get_mip_gap();
-      mip_ret.solution_bound_               = solution.get_solution_bound();
-      mip_ret.total_solve_time_             = solution.get_total_solve_time();
-      mip_ret.presolve_time_                = solution.get_presolve_time();
-      mip_ret.max_constraint_violation_     = solution.get_max_constraint_violation();
-      mip_ret.max_int_violation_            = solution.get_max_int_violation();
-      mip_ret.max_variable_bound_violation_ = solution.get_max_variable_bound_violation();
-      mip_ret.nodes_                        = solution.get_num_nodes();
-      mip_ret.simplex_iterations_           = solution.get_num_simplex_iterations();
-      response.mip_ret                      = std::move(mip_ret);
-      response.problem_type                 = linear_programming::problem_category_t::MIP;
-    }
+  raft::common::nvtx::range fun_scope("Call Solve");
+  
+  // Data from Python is always in CPU memory
+  data_model->set_is_device_memory(false);
 
-    return std::make_unique<solver_ret_t>(std::move(response));
-  }
+  // Determine if LP or MIP based on variable types (uses cached value)
+  auto problem_category = data_model->get_problem_category();
+  bool is_mip = (problem_category == cuopt::linear_programming::problem_category_t::MIP) ||
+                (problem_category == cuopt::linear_programming::problem_category_t::IP);
 
-  raft::common::nvtx::range fun_scope("Call Solve");
+  // Create handle for local solve (unused for remote solve)
+  // Remote solve is detected by solve_lp/solve_mip via CUOPT_REMOTE_HOST/PORT env vars
   rmm::cuda_stream stream(static_cast<rmm::cuda_stream::flags>(flags));
   const raft::handle_t handle_{stream};
+  const raft::handle_t* handle_ptr = &handle_;
 
-  solver_ret_t response;
-
-  // Handle warm start data if present (needs to be done before creating optimization_problem_t)
-  if (solver_settings->get_pdlp_warm_start_data_view()
-        .last_restart_duality_gap_dual_solution_.data() != nullptr) {
+  // Handle warm start data if present (only for local LP solves)
+  if (!is_mip && solver_settings->get_pdlp_warm_start_data_view()
+                   .last_restart_duality_gap_dual_solution_.data() != nullptr) {
     cuopt::linear_programming::pdlp_warm_start_data_t<int, double> pdlp_warm_start_data(
       solver_settings->get_pdlp_warm_start_data_view(), handle_.get_stream());
     solver_settings->get_pdlp_settings().set_pdlp_warm_start_data(pdlp_warm_start_data);
   }
 
-  // Use shared conversion function from optimization_problem_conversions.hpp
-  auto op_problem = cuopt::linear_programming::data_model_view_to_optimization_problem(&handle_, *data_model);
-  
-  if (op_problem.get_problem_category() == linear_programming::problem_category_t::LP) {
-    response.lp_ret =
-      call_solve_lp(op_problem, solver_settings->get_pdlp_settings(), is_batch_mode);
+  solver_ret_t response;
+
+  if (!is_mip) {
+    // LP solve
+    response.lp_ret       = call_solve_lp(handle_ptr, *data_model, solver_settings->get_pdlp_settings(), is_batch_mode);
     response.problem_type = linear_programming::problem_category_t::LP;
     if (response.lp_ret.is_device_memory_) {
       // Reset stream to per-thread default as non-blocking stream is out of scope after the
@@ -328,7 +239,8 @@ std::unique_ptr<solver_ret_t> call_solve(
         rmm::cuda_stream_per_thread);
     }
   } else {
-    response.mip_ret      = call_solve_mip(op_problem, solver_settings->get_mip_settings());
+    // MIP solve
+    response.mip_ret      = call_solve_mip(handle_ptr, *data_model, solver_settings->get_mip_settings());
     response.problem_type = linear_programming::problem_category_t::MIP;
     if (response.mip_ret.is_device_memory_) {
       // Reset stream to per-thread default as non-blocking stream is out of scope after the

From a032ec6dce02c56f4d6e855a659e96dbf7aac7da Mon Sep 17 00:00:00 2001
From: Trevor McKay <tmgithub1@gmail.com>
Date: Fri, 30 Jan 2026 00:53:04 -0500
Subject: [PATCH 20/22] fix check_style errors and address coderabbit comments

---
 .../mip/solver_solution.hpp                   |  1 -
 .../optimization_problem_conversions.hpp      | 35 ++++----
 .../pdlp/solver_solution.hpp                  |  1 -
 .../include/mps_parser/data_model_view.hpp    | 10 ++-
 cpp/libmps_parser/src/data_model_view.cpp     | 67 +++++++--------
 .../optimization_problem_conversions.cu       | 58 +++++++++----
 cpp/src/linear_programming/solve.cu           | 81 ++++++++++---------
 cpp/src/linear_programming/solver_solution.cu |  1 -
 .../utilities/cython_solve.cu                 | 24 +++---
 cpp/src/mip/solve.cu                          |  2 -
 10 files changed, 155 insertions(+), 125 deletions(-)

diff --git a/cpp/include/cuopt/linear_programming/mip/solver_solution.hpp b/cpp/include/cuopt/linear_programming/mip/solver_solution.hpp
index bcff1bfc7..ac471b4f0 100644
--- a/cpp/include/cuopt/linear_programming/mip/solver_solution.hpp
+++ b/cpp/include/cuopt/linear_programming/mip/solver_solution.hpp
@@ -139,7 +139,6 @@ class mip_solution_t : public base_solution_t {
   // Setters for remote solve deserialization
   //============================================================================
 
-
   /**
    * @brief Get error string
    */
diff --git a/cpp/include/cuopt/linear_programming/optimization_problem_conversions.hpp b/cpp/include/cuopt/linear_programming/optimization_problem_conversions.hpp
index afcf5c1dd..c4f31dce1 100644
--- a/cpp/include/cuopt/linear_programming/optimization_problem_conversions.hpp
+++ b/cpp/include/cuopt/linear_programming/optimization_problem_conversions.hpp
@@ -18,38 +18,37 @@ namespace linear_programming {
 
 /**
  * @brief Convert a data_model_view_t to an optimization_problem_t.
- * 
+ *
  * This function creates a GPU-resident optimization problem from a view that can
  * point to either CPU or GPU memory. The view's pointers are checked at runtime to
  * determine their memory location, and appropriate copy operations are performed.
- * 
+ *
  * @tparam i_t Integer type (typically int)
  * @tparam f_t Floating-point type (float or double)
  * @param handle_ptr RAFT handle for GPU operations. Must not be null.
  * @param view Non-owning view pointing to problem data (CPU or GPU memory)
  * @return optimization_problem_t<i_t, f_t> GPU-resident optimization problem
- * 
+ *
  * @note This function handles the conversion from both CPU and GPU source data.
  *       Variable types and quadratic objective data are always copied to CPU first
  *       before being set on the optimization_problem_t (as required by the API).
  */
 template <typename i_t, typename f_t>
 optimization_problem_t<i_t, f_t> data_model_view_to_optimization_problem(
-  raft::handle_t const* handle_ptr,
-  const cuopt::mps_parser::data_model_view_t<i_t, f_t>& view);
+  raft::handle_t const* handle_ptr, const cuopt::mps_parser::data_model_view_t<i_t, f_t>& view);
 
 /**
  * @brief Convert an mps_data_model_t to an optimization_problem_t.
- * 
+ *
  * This function creates a GPU-resident optimization problem from MPS data that
  * resides in CPU memory. All data is copied from CPU to GPU.
- * 
+ *
  * @tparam i_t Integer type (typically int)
  * @tparam f_t Floating-point type (float or double)
  * @param handle_ptr RAFT handle for GPU operations. Must not be null.
  * @param data_model MPS data model with problem data in CPU memory
  * @return optimization_problem_t<i_t, f_t> GPU-resident optimization problem
- * 
+ *
  * @note All data in mps_data_model_t is in CPU memory (std::vector).
  *       This function performs CPU → GPU copies for all problem data.
  */
@@ -60,16 +59,16 @@ optimization_problem_t<i_t, f_t> mps_data_model_to_optimization_problem(
 
 /**
  * @brief Create a data_model_view_t from an mps_data_model_t.
- * 
+ *
  * This helper function creates a non-owning view pointing to the CPU memory
  * in an mps_data_model_t. The view can be used for remote solves or for
  * creating an optimization_problem_t.
- * 
+ *
  * @tparam i_t Integer type (typically int)
  * @tparam f_t Floating-point type (float or double)
  * @param mps_data_model MPS data model with problem data in CPU memory
  * @return data_model_view_t<i_t, f_t> Non-owning view with is_device_memory_=false
- * 
+ *
  * @note The returned view points to memory owned by mps_data_model.
  *       The mps_data_model must remain alive while the view is in use.
  */
@@ -79,11 +78,11 @@ cuopt::mps_parser::data_model_view_t<i_t, f_t> create_view_from_mps_data_model(
 
 /**
  * @brief Helper struct to hold CPU copies of GPU problem data.
- * 
+ *
  * This struct is used when GPU data needs to be copied to CPU for remote solve.
  * It provides a create_view() method to create a data_model_view_t pointing to
  * its CPU memory.
- * 
+ *
  * @tparam i_t Integer type (typically int)
  * @tparam f_t Floating-point type (float or double)
  */
@@ -99,6 +98,7 @@ struct cpu_problem_data_t {
   std::vector<f_t> variable_lower_bounds;
   std::vector<f_t> variable_upper_bounds;
   std::vector<char> variable_types;
+  std::vector<char> row_types;  // 'E' for equality, 'L' for less-than, 'G' for greater-than
   std::vector<f_t> quadratic_objective_values;
   std::vector<i_t> quadratic_objective_indices;
   std::vector<i_t> quadratic_objective_offsets;
@@ -115,22 +115,21 @@ struct cpu_problem_data_t {
 
 /**
  * @brief Copy GPU view data to CPU memory.
- * 
+ *
  * This function is used when we have a GPU-resident view but need CPU data
  * (e.g., for remote solve). All data is copied from GPU to CPU synchronously.
- * 
+ *
  * @tparam i_t Integer type (typically int)
  * @tparam f_t Floating-point type (float or double)
  * @param handle_ptr RAFT handle for GPU operations. Must not be null.
  * @param gpu_view View pointing to GPU memory
  * @return cpu_problem_data_t<i_t, f_t> CPU copy of all problem data
- * 
+ *
  * @note This function synchronizes the CUDA stream to ensure all copies complete.
  */
 template <typename i_t, typename f_t>
 cpu_problem_data_t<i_t, f_t> copy_view_to_cpu(
-  raft::handle_t const* handle_ptr,
-  const cuopt::mps_parser::data_model_view_t<i_t, f_t>& gpu_view);
+  raft::handle_t const* handle_ptr, const cuopt::mps_parser::data_model_view_t<i_t, f_t>& gpu_view);
 
 }  // namespace linear_programming
 }  // namespace cuopt
diff --git a/cpp/include/cuopt/linear_programming/pdlp/solver_solution.hpp b/cpp/include/cuopt/linear_programming/pdlp/solver_solution.hpp
index a4b7b8427..1b0e7b096 100644
--- a/cpp/include/cuopt/linear_programming/pdlp/solver_solution.hpp
+++ b/cpp/include/cuopt/linear_programming/pdlp/solver_solution.hpp
@@ -335,7 +335,6 @@ class optimization_problem_solution_t : public base_solution_t {
   // Setters for host solution data (used by remote solve deserialization)
   //============================================================================
 
-
   //============================================================================
   // Getters for termination statistics
   //============================================================================
diff --git a/cpp/libmps_parser/include/mps_parser/data_model_view.hpp b/cpp/libmps_parser/include/mps_parser/data_model_view.hpp
index c4f5385c1..d64e34acf 100644
--- a/cpp/libmps_parser/include/mps_parser/data_model_view.hpp
+++ b/cpp/libmps_parser/include/mps_parser/data_model_view.hpp
@@ -10,6 +10,8 @@
 #include <mps_parser/utilities/span.hpp>
 
 #include <cstdint>
+#include <memory>
+#include <mutex>
 #include <string>
 #include <type_traits>
 #include <vector>
@@ -444,10 +446,12 @@ class data_model_view_t {
  private:
   bool maximize_{false};
   bool is_device_memory_{false};  // true if spans point to GPU memory, false for CPU
-  
-  // Lazy-evaluated problem category cache
+
+  // Lazy-evaluated problem category cache (thread-safe with std::call_once)
+  // Using unique_ptr to make the class movable (std::once_flag is non-movable)
   mutable cuopt::linear_programming::problem_category_t problem_category_;
-  mutable bool problem_category_computed_{false};
+  mutable std::unique_ptr<std::once_flag> problem_category_flag_{
+    std::make_unique<std::once_flag>()};
   span<f_t const> A_;
   span<i_t const> A_indices_;
   span<i_t const> A_offsets_;
diff --git a/cpp/libmps_parser/src/data_model_view.cpp b/cpp/libmps_parser/src/data_model_view.cpp
index 341f47cc3..db74ee5e8 100644
--- a/cpp/libmps_parser/src/data_model_view.cpp
+++ b/cpp/libmps_parser/src/data_model_view.cpp
@@ -352,42 +352,43 @@ template <typename i_t, typename f_t>
 cuopt::linear_programming::problem_category_t data_model_view_t<i_t, f_t>::get_problem_category()
   const
 {
-  // Return cached value if already computed
-  if (problem_category_computed_) { return problem_category_; }
-
-  // Compute problem category based on variable types
-  // Use early-exit optimization: as soon as we find both continuous and integer, it's MIP
-  bool has_continuous = false;
-  bool has_integer    = false;
-
-  for (size_t i = 0; i < variable_types_.size(); ++i) {
-    if (variable_types_.data()[i] == 'I' || variable_types_.data()[i] == 'B') {
-      has_integer = true;
-      if (has_continuous) {
-        // Found both types - it's MIP, cache and return
-        // Note: problem_category_t values: LP=0, MIP=1, IP=2
-        problem_category_ = static_cast<cuopt::linear_programming::problem_category_t>(1);  // MIP
-        problem_category_computed_ = true;
-        return problem_category_;
-      }
-    } else {  // 'C' or other continuous type
-      has_continuous = true;
-      if (has_integer) {
-        // Found both types - it's MIP, cache and return
-        problem_category_ = static_cast<cuopt::linear_programming::problem_category_t>(1);  // MIP
-        problem_category_computed_ = true;
-        return problem_category_;
+  // Thread-safe lazy initialization using std::call_once
+  std::call_once(*problem_category_flag_, [this]() {
+    // Compute problem category based on variable types
+    // Use early-exit optimization: as soon as we find both continuous and integer, it's MIP
+    bool has_continuous = false;
+    bool has_integer    = false;
+
+    for (size_t i = 0; i < variable_types_.size(); ++i) {
+      if (variable_types_.data()[i] == 'I' || variable_types_.data()[i] == 'B') {
+        has_integer = true;
+        if (has_continuous) {
+          // Found both types - it's MIP (Mixed Integer Programming)
+          // Note: Using static_cast because we can't include the full enum header here
+          // (would pull in CUDA dependencies). Enum values: LP=0, MIP=1, IP=2
+          problem_category_ = static_cast<cuopt::linear_programming::problem_category_t>(1);
+          return;
+        }
+      } else {  // 'C' or other continuous type
+        has_continuous = true;
+        if (has_integer) {
+          // Found both types - it's MIP (Mixed Integer Programming)
+          problem_category_ = static_cast<cuopt::linear_programming::problem_category_t>(1);
+          return;
+        }
       }
     }
-  }
 
-  // All variables are of the same type
-  if (has_integer) {
-    problem_category_ = static_cast<cuopt::linear_programming::problem_category_t>(2);  // IP
-  } else {
-    problem_category_ = static_cast<cuopt::linear_programming::problem_category_t>(0);  // LP
-  }
-  problem_category_computed_ = true;
+    // All variables are of the same type
+    if (has_integer) {
+      // All integer - it's IP (Integer Programming)
+      problem_category_ = static_cast<cuopt::linear_programming::problem_category_t>(2);
+    } else {
+      // All continuous - it's LP (Linear Programming)
+      problem_category_ = static_cast<cuopt::linear_programming::problem_category_t>(0);
+    }
+  });
+
   return problem_category_;
 }
 
diff --git a/cpp/src/linear_programming/optimization_problem_conversions.cu b/cpp/src/linear_programming/optimization_problem_conversions.cu
index 2f0f78f76..35e9d9550 100644
--- a/cpp/src/linear_programming/optimization_problem_conversions.cu
+++ b/cpp/src/linear_programming/optimization_problem_conversions.cu
@@ -371,6 +371,7 @@ cuopt::mps_parser::data_model_view_t<i_t, f_t> cpu_problem_data_t<i_t, f_t>::cre
   if (!variable_types.empty()) {
     v.set_variable_types(variable_types.data(), variable_types.size());
   }
+  if (!row_types.empty()) { v.set_row_types(row_types.data(), row_types.size()); }
   if (!quadratic_objective_values.empty()) {
     v.set_quadratic_objective_matrix(quadratic_objective_values.data(),
                                      quadratic_objective_values.size(),
@@ -385,8 +386,7 @@ cuopt::mps_parser::data_model_view_t<i_t, f_t> cpu_problem_data_t<i_t, f_t>::cre
 
 template <typename i_t, typename f_t>
 cpu_problem_data_t<i_t, f_t> copy_view_to_cpu(
-  raft::handle_t const* handle_ptr,
-  const cuopt::mps_parser::data_model_view_t<i_t, f_t>& gpu_view)
+  raft::handle_t const* handle_ptr, const cuopt::mps_parser::data_model_view_t<i_t, f_t>& gpu_view)
 {
   cpu_problem_data_t<i_t, f_t> cpu_data;
   auto stream = handle_ptr->get_stream();
@@ -440,6 +440,30 @@ cpu_problem_data_t<i_t, f_t> copy_view_to_cpu(
     }
   }
 
+  // Row types need special handling (char array)
+  auto row_types_span = gpu_view.get_row_types();
+  if (row_types_span.size() > 0) {
+    cpu_data.row_types.resize(row_types_span.size());
+
+    // Check if row_types is host-backed or device-backed
+    cudaPointerAttributes attrs;
+    cudaError_t err = cudaPointerGetAttributes(&attrs, row_types_span.data());
+
+    if (err == cudaSuccess && attrs.type == cudaMemoryTypeDevice) {
+      // Device memory - use async copy
+      RAFT_CUDA_TRY(cudaMemcpyAsync(cpu_data.row_types.data(),
+                                    row_types_span.data(),
+                                    row_types_span.size() * sizeof(char),
+                                    cudaMemcpyDeviceToHost,
+                                    stream));
+    } else {
+      // Host memory or unregistered - use direct copy
+      if (err != cudaSuccess && err != cudaErrorInvalidValue) { RAFT_CUDA_TRY(err); }
+      std::memcpy(
+        cpu_data.row_types.data(), row_types_span.data(), row_types_span.size() * sizeof(char));
+    }
+  }
+
   // Synchronize to ensure all copies are complete
   RAFT_CUDA_TRY(cudaStreamSynchronize(stream));
 
@@ -447,22 +471,22 @@ cpu_problem_data_t<i_t, f_t> copy_view_to_cpu(
 }
 
 // Explicit template instantiations
-#define INSTANTIATE(F_TYPE)                                                                \
-  template optimization_problem_t<int, F_TYPE> data_model_view_to_optimization_problem(    \
-    raft::handle_t const* handle_ptr,                                                      \
-    const cuopt::mps_parser::data_model_view_t<int, F_TYPE>& view);                        \
-                                                                                            \
-  template optimization_problem_t<int, F_TYPE> mps_data_model_to_optimization_problem(     \
-    raft::handle_t const* handle_ptr,                                                      \
-    const cuopt::mps_parser::mps_data_model_t<int, F_TYPE>& data_model);                   \
-                                                                                            \
+#define INSTANTIATE(F_TYPE)                                                                   \
+  template optimization_problem_t<int, F_TYPE> data_model_view_to_optimization_problem(       \
+    raft::handle_t const* handle_ptr,                                                         \
+    const cuopt::mps_parser::data_model_view_t<int, F_TYPE>& view);                           \
+                                                                                              \
+  template optimization_problem_t<int, F_TYPE> mps_data_model_to_optimization_problem(        \
+    raft::handle_t const* handle_ptr,                                                         \
+    const cuopt::mps_parser::mps_data_model_t<int, F_TYPE>& data_model);                      \
+                                                                                              \
   template cuopt::mps_parser::data_model_view_t<int, F_TYPE> create_view_from_mps_data_model( \
-    const cuopt::mps_parser::mps_data_model_t<int, F_TYPE>& mps_data_model);               \
-                                                                                            \
-  template struct cpu_problem_data_t<int, F_TYPE>;                                         \
-                                                                                            \
-  template cpu_problem_data_t<int, F_TYPE> copy_view_to_cpu(                               \
-    raft::handle_t const* handle_ptr,                                                      \
+    const cuopt::mps_parser::mps_data_model_t<int, F_TYPE>& mps_data_model);                  \
+                                                                                              \
+  template struct cpu_problem_data_t<int, F_TYPE>;                                            \
+                                                                                              \
+  template cpu_problem_data_t<int, F_TYPE> copy_view_to_cpu(                                  \
+    raft::handle_t const* handle_ptr,                                                         \
     const cuopt::mps_parser::data_model_view_t<int, F_TYPE>& gpu_view);
 
 #if MIP_INSTANTIATE_FLOAT
diff --git a/cpp/src/linear_programming/solve.cu b/cpp/src/linear_programming/solve.cu
index 155ef6cdb..6b1904374 100644
--- a/cpp/src/linear_programming/solve.cu
+++ b/cpp/src/linear_programming/solve.cu
@@ -1283,7 +1283,9 @@ optimization_problem_solution_t<i_t, f_t> solve_lp(raft::handle_t const* handle_
         CUOPT_LOG_ERROR(
           "[solve_lp] Remote solve requested with GPU data but no CUDA handle. "
           "This is an internal error - GPU data should not exist without CUDA initialization.");
-        return optimization_problem_solution_t<i_t, f_t>(pdlp_termination_status_t::NumericalError);
+        return optimization_problem_solution_t<i_t, f_t>(
+          cuopt::logic_error("Remote solve with GPU data requires CUDA handle for GPU->CPU copy",
+                             cuopt::error_type_t::RuntimeError));
       }
       CUOPT_LOG_WARN(
         "[solve_lp] Remote solve requested but data is on GPU. "
@@ -1299,6 +1301,11 @@ optimization_problem_solution_t<i_t, f_t> solve_lp(raft::handle_t const* handle_
     }
 
     // Local solve: data already on GPU - convert view to optimization_problem_t and solve
+    if (handle_ptr == nullptr) {
+      CUOPT_LOG_ERROR("[solve_lp] Local GPU solve requested but handle_ptr is null.");
+      return optimization_problem_solution_t<i_t, f_t>(cuopt::logic_error(
+        "Local GPU solve requires CUDA handle", cuopt::error_type_t::RuntimeError));
+    }
     auto op_problem = data_model_view_to_optimization_problem(handle_ptr, view);
     return solve_lp(op_problem, settings, problem_checking, use_pdlp_solver_mode, is_batch_mode);
   }
@@ -1322,42 +1329,42 @@ optimization_problem_solution_t<i_t, f_t> solve_lp(raft::handle_t const* handle_
   return solve_lp(op_problem, settings, problem_checking, use_pdlp_solver_mode, is_batch_mode);
 }
 
-#define INSTANTIATE(F_TYPE)                                                             \
-  template optimization_problem_solution_t<int, F_TYPE> solve_lp(                       \
-    optimization_problem_t<int, F_TYPE>& op_problem,                                    \
-    pdlp_solver_settings_t<int, F_TYPE> const& settings,                                \
-    bool problem_checking,                                                              \
-    bool use_pdlp_solver_mode,                                                          \
-    bool is_batch_mode);                                                                \
-                                                                                        \
-  template optimization_problem_solution_t<int, F_TYPE> solve_lp(                       \
-    raft::handle_t const* handle_ptr,                                                   \
-    const cuopt::mps_parser::mps_data_model_t<int, F_TYPE>& mps_data_model,             \
-    pdlp_solver_settings_t<int, F_TYPE> const& settings,                                \
-    bool problem_checking,                                                              \
-    bool use_pdlp_solver_mode);                                                         \
-                                                                                        \
-  template optimization_problem_solution_t<int, F_TYPE> solve_lp_with_method(           \
-    detail::problem_t<int, F_TYPE>& problem,                                            \
-    pdlp_solver_settings_t<int, F_TYPE> const& settings,                                \
-    const timer_t& timer,                                                               \
-    bool is_batch_mode);                                                                \
-                                                                                        \
-  template optimization_problem_solution_t<int, F_TYPE> solve_lp(                       \
-    raft::handle_t const* handle_ptr,                                                   \
-    const data_model_view_t<int, F_TYPE>& view,                                         \
-    pdlp_solver_settings_t<int, F_TYPE> const& settings,                                \
-    bool problem_checking,                                                              \
-    bool use_pdlp_solver_mode,                                                          \
-    bool is_batch_mode);                                                         \
-                                                                                        \
-  template optimization_problem_solution_t<int, F_TYPE> batch_pdlp_solve(               \
-    raft::handle_t const* handle_ptr,                                                   \
-    const cuopt::mps_parser::mps_data_model_t<int, F_TYPE>& mps_data_model,             \
-    const std::vector<int>& fractional,                                                 \
-    const std::vector<F_TYPE>& root_soln_x,                                             \
-    pdlp_solver_settings_t<int, F_TYPE> const& settings);                               \
-                                                                                        \
+#define INSTANTIATE(F_TYPE)                                                   \
+  template optimization_problem_solution_t<int, F_TYPE> solve_lp(             \
+    optimization_problem_t<int, F_TYPE>& op_problem,                          \
+    pdlp_solver_settings_t<int, F_TYPE> const& settings,                      \
+    bool problem_checking,                                                    \
+    bool use_pdlp_solver_mode,                                                \
+    bool is_batch_mode);                                                      \
+                                                                              \
+  template optimization_problem_solution_t<int, F_TYPE> solve_lp(             \
+    raft::handle_t const* handle_ptr,                                         \
+    const cuopt::mps_parser::mps_data_model_t<int, F_TYPE>& mps_data_model,   \
+    pdlp_solver_settings_t<int, F_TYPE> const& settings,                      \
+    bool problem_checking,                                                    \
+    bool use_pdlp_solver_mode);                                               \
+                                                                              \
+  template optimization_problem_solution_t<int, F_TYPE> solve_lp_with_method( \
+    detail::problem_t<int, F_TYPE>& problem,                                  \
+    pdlp_solver_settings_t<int, F_TYPE> const& settings,                      \
+    const timer_t& timer,                                                     \
+    bool is_batch_mode);                                                      \
+                                                                              \
+  template optimization_problem_solution_t<int, F_TYPE> solve_lp(             \
+    raft::handle_t const* handle_ptr,                                         \
+    const data_model_view_t<int, F_TYPE>& view,                               \
+    pdlp_solver_settings_t<int, F_TYPE> const& settings,                      \
+    bool problem_checking,                                                    \
+    bool use_pdlp_solver_mode,                                                \
+    bool is_batch_mode);                                                      \
+                                                                              \
+  template optimization_problem_solution_t<int, F_TYPE> batch_pdlp_solve(     \
+    raft::handle_t const* handle_ptr,                                         \
+    const cuopt::mps_parser::mps_data_model_t<int, F_TYPE>& mps_data_model,   \
+    const std::vector<int>& fractional,                                       \
+    const std::vector<F_TYPE>& root_soln_x,                                   \
+    pdlp_solver_settings_t<int, F_TYPE> const& settings);                     \
+                                                                              \
   template void set_pdlp_solver_mode(pdlp_solver_settings_t<int, F_TYPE>& settings);
 
 #if MIP_INSTANTIATE_FLOAT
diff --git a/cpp/src/linear_programming/solver_solution.cu b/cpp/src/linear_programming/solver_solution.cu
index a256b2e91..41f52b1cd 100644
--- a/cpp/src/linear_programming/solver_solution.cu
+++ b/cpp/src/linear_programming/solver_solution.cu
@@ -646,7 +646,6 @@ optimization_problem_solution_t<i_t, f_t>::get_pdlp_warm_start_data()
 // Setters for host solution data
 //============================================================================
 
-
 //============================================================================
 // Getters for termination statistics
 //============================================================================
diff --git a/cpp/src/linear_programming/utilities/cython_solve.cu b/cpp/src/linear_programming/utilities/cython_solve.cu
index 3cd8064d9..94c8527f1 100644
--- a/cpp/src/linear_programming/utilities/cython_solve.cu
+++ b/cpp/src/linear_programming/utilities/cython_solve.cu
@@ -52,13 +52,12 @@ linear_programming_ret_t call_solve_lp(
   bool is_batch_mode)
 {
   raft::common::nvtx::range fun_scope("Call Solve");
-  
+
   // Validate that this is an LP problem (not MIP/IP)
-  cuopt_expects(
-    view.get_problem_category() == cuopt::linear_programming::problem_category_t::LP,
-    cuopt::error_type_t::ValidationError,
-    "LP solve cannot be called on a MIP problem!");
-  
+  cuopt_expects(view.get_problem_category() == cuopt::linear_programming::problem_category_t::LP,
+                cuopt::error_type_t::ValidationError,
+                "LP solve cannot be called on a MIP problem!");
+
   const bool problem_checking     = true;
   const bool use_pdlp_solver_mode = true;
 
@@ -143,7 +142,7 @@ mip_ret_t call_solve_mip(
   cuopt::linear_programming::mip_solver_settings_t<int, double>& solver_settings)
 {
   raft::common::nvtx::range fun_scope("Call Solve");
-  
+
   // Validate that this is a MIP or IP problem (not pure LP)
   cuopt_expects(
     (view.get_problem_category() == cuopt::linear_programming::problem_category_t::MIP) ||
@@ -174,7 +173,7 @@ mip_ret_t call_solve_mip(
   // Transfer solution data - either GPU or CPU depending on where it was solved
   if (solution.is_device_memory()) {
     // Local GPU solve: transfer device buffer
-    mip_ret.solution_         = std::make_unique<rmm::device_buffer>(solution.get_solution().release());
+    mip_ret.solution_ = std::make_unique<rmm::device_buffer>(solution.get_solution().release());
     mip_ret.is_device_memory_ = true;
   } else {
     // Remote solve: use host vector
@@ -191,7 +190,7 @@ std::unique_ptr<solver_ret_t> call_solve(
   bool is_batch_mode)
 {
   raft::common::nvtx::range fun_scope("Call Solve");
-  
+
   // Data from Python is always in CPU memory
   data_model->set_is_device_memory(false);
 
@@ -208,7 +207,7 @@ std::unique_ptr<solver_ret_t> call_solve(
 
   // Handle warm start data if present (only for local LP solves)
   if (!is_mip && solver_settings->get_pdlp_warm_start_data_view()
-                   .last_restart_duality_gap_dual_solution_.data() != nullptr) {
+                     .last_restart_duality_gap_dual_solution_.data() != nullptr) {
     cuopt::linear_programming::pdlp_warm_start_data_t<int, double> pdlp_warm_start_data(
       solver_settings->get_pdlp_warm_start_data_view(), handle_.get_stream());
     solver_settings->get_pdlp_settings().set_pdlp_warm_start_data(pdlp_warm_start_data);
@@ -218,7 +217,8 @@ std::unique_ptr<solver_ret_t> call_solve(
 
   if (!is_mip) {
     // LP solve
-    response.lp_ret       = call_solve_lp(handle_ptr, *data_model, solver_settings->get_pdlp_settings(), is_batch_mode);
+    response.lp_ret =
+      call_solve_lp(handle_ptr, *data_model, solver_settings->get_pdlp_settings(), is_batch_mode);
     response.problem_type = linear_programming::problem_category_t::LP;
     if (response.lp_ret.is_device_memory_) {
       // Reset stream to per-thread default as non-blocking stream is out of scope after the
@@ -240,7 +240,7 @@ std::unique_ptr<solver_ret_t> call_solve(
     }
   } else {
     // MIP solve
-    response.mip_ret      = call_solve_mip(handle_ptr, *data_model, solver_settings->get_mip_settings());
+    response.mip_ret = call_solve_mip(handle_ptr, *data_model, solver_settings->get_mip_settings());
     response.problem_type = linear_programming::problem_category_t::MIP;
     if (response.mip_ret.is_device_memory_) {
       // Reset stream to per-thread default as non-blocking stream is out of scope after the
diff --git a/cpp/src/mip/solve.cu b/cpp/src/mip/solve.cu
index a2a0d9c49..13720e24f 100644
--- a/cpp/src/mip/solve.cu
+++ b/cpp/src/mip/solve.cu
@@ -289,10 +289,8 @@ mip_solution_t<i_t, f_t> solve_mip(optimization_problem_t<i_t, f_t>& op_problem,
   }
 }
 
-
 // Note: create_view_from_mps_data_model() is in optimization_problem_conversions.hpp
 
-
 // Note: cpu_problem_data_t and copy_view_to_cpu are in optimization_problem_conversions.hpp
 
 template <typename i_t, typename f_t>

From 73c899a0f1822183383f4fbb3fde613b60170aa0 Mon Sep 17 00:00:00 2001
From: Trevor McKay <tmgithub1@gmail.com>
Date: Fri, 30 Jan 2026 08:31:08 -0500
Subject: [PATCH 21/22] Refactor C API to reuse cpu_problem_data_t, eliminating
 duplicate code

---
 cpp/src/linear_programming/cuopt_c.cpp        | 215 +++++-------------
 cpp/src/linear_programming/solver_solution.cu |   4 +-
 .../utilities/cython_solve.cu                 |  19 +-
 3 files changed, 63 insertions(+), 175 deletions(-)

diff --git a/cpp/src/linear_programming/cuopt_c.cpp b/cpp/src/linear_programming/cuopt_c.cpp
index 3485caced..d29edb221 100644
--- a/cpp/src/linear_programming/cuopt_c.cpp
+++ b/cpp/src/linear_programming/cuopt_c.cpp
@@ -9,6 +9,7 @@
 
 #include <cuopt/linear_programming/data_model_view.hpp>
 #include <cuopt/linear_programming/optimization_problem.hpp>
+#include <cuopt/linear_programming/optimization_problem_conversions.hpp>
 #include <cuopt/linear_programming/solve.hpp>
 #include <cuopt/linear_programming/solver_settings.hpp>
 #include <cuopt/linear_programming/utilities/remote_solve.hpp>
@@ -30,121 +31,9 @@
 using namespace cuopt::mps_parser;
 using namespace cuopt::linear_programming;
 
-/**
- * @brief CPU-side storage for problem data.
- *
- * This struct stores all problem data in CPU memory. At solve time, a data_model_view_t
- * is created pointing to this data, and the solve_lp/solve_mip routines handle
- * local vs remote solve automatically.
- */
-struct problem_cpu_data_t {
-  // Problem dimensions
-  cuopt_int_t num_constraints = 0;
-  cuopt_int_t num_variables   = 0;
-
-  // Objective
-  bool maximize                  = false;
-  cuopt_float_t objective_offset = 0.0;
-  std::vector<cuopt_float_t> objective_coefficients;
-
-  // Quadratic objective (optional)
-  std::vector<cuopt_float_t> Q_values;
-  std::vector<cuopt_int_t> Q_indices;
-  std::vector<cuopt_int_t> Q_offsets;
-
-  // Constraint matrix (CSR format)
-  std::vector<cuopt_float_t> A_values;
-  std::vector<cuopt_int_t> A_indices;
-  std::vector<cuopt_int_t> A_offsets;
-
-  // Constraint bounds (two representations)
-  std::vector<char> row_types;                         // '<', '>', '=' style
-  std::vector<cuopt_float_t> constraint_bounds;        // single RHS for row_types style
-  std::vector<cuopt_float_t> constraint_lower_bounds;  // ranged style
-  std::vector<cuopt_float_t> constraint_upper_bounds;  // ranged style
-  bool uses_ranged_constraints = false;
-
-  // Variable bounds
-  std::vector<cuopt_float_t> variable_lower_bounds;
-  std::vector<cuopt_float_t> variable_upper_bounds;
-
-  // Variable types
-  std::vector<char> variable_types;  // 'C' for continuous, 'I' for integer
-
-  /**
-   * @brief Create a data_model_view_t pointing to this CPU data.
-   */
-  cuopt::linear_programming::data_model_view_t<cuopt_int_t, cuopt_float_t> create_view() const
-  {
-    cuopt::linear_programming::data_model_view_t<cuopt_int_t, cuopt_float_t> view;
-
-    view.set_maximize(maximize);
-    view.set_objective_offset(objective_offset);
-
-    if (!objective_coefficients.empty()) {
-      view.set_objective_coefficients(objective_coefficients.data(), objective_coefficients.size());
-    }
-
-    if (!Q_values.empty()) {
-      view.set_quadratic_objective_matrix(Q_values.data(),
-                                          Q_values.size(),
-                                          Q_indices.data(),
-                                          Q_indices.size(),
-                                          Q_offsets.data(),
-                                          Q_offsets.size());
-    }
-
-    if (!A_values.empty()) {
-      view.set_csr_constraint_matrix(A_values.data(),
-                                     A_values.size(),
-                                     A_indices.data(),
-                                     A_indices.size(),
-                                     A_offsets.data(),
-                                     A_offsets.size());
-    }
-
-    if (uses_ranged_constraints) {
-      if (!constraint_lower_bounds.empty()) {
-        view.set_constraint_lower_bounds(constraint_lower_bounds.data(),
-                                         constraint_lower_bounds.size());
-      }
-      if (!constraint_upper_bounds.empty()) {
-        view.set_constraint_upper_bounds(constraint_upper_bounds.data(),
-                                         constraint_upper_bounds.size());
-      }
-    } else {
-      if (!row_types.empty()) { view.set_row_types(row_types.data(), row_types.size()); }
-      if (!constraint_bounds.empty()) {
-        view.set_constraint_bounds(constraint_bounds.data(), constraint_bounds.size());
-      }
-    }
-
-    if (!variable_lower_bounds.empty()) {
-      view.set_variable_lower_bounds(variable_lower_bounds.data(), variable_lower_bounds.size());
-    }
-
-    if (!variable_upper_bounds.empty()) {
-      view.set_variable_upper_bounds(variable_upper_bounds.data(), variable_upper_bounds.size());
-    }
-
-    if (!variable_types.empty()) {
-      view.set_variable_types(variable_types.data(), variable_types.size());
-    }
-
-    return view;
-  }
-
-  /**
-   * @brief Check if this is a MIP (has integer variables).
-   */
-  bool is_mip() const
-  {
-    for (char vt : variable_types) {
-      if (vt == CUOPT_INTEGER) { return true; }
-    }
-    return false;
-  }
-};
+// Type alias for the common CPU problem data structure used by C API
+// This reuses the conversion infrastructure from optimization_problem_conversions.hpp
+using problem_cpu_data_t = cpu_problem_data_t<cuopt_int_t, cuopt_float_t>;
 
 struct problem_and_stream_view_t {
   problem_and_stream_view_t() : cpu_data(nullptr), gpu_problem(nullptr), handle(nullptr) {}
@@ -167,7 +56,7 @@ struct problem_and_stream_view_t {
   /**
    * @brief Check if this is a MIP problem.
    */
-  bool is_mip() const
+  bool is_mip_problem() const
   {
     if (view.is_device_memory()) {
       // GPU path: check gpu_problem's problem category
@@ -175,9 +64,12 @@ struct problem_and_stream_view_t {
       auto cat = gpu_problem->get_problem_category();
       return (cat == problem_category_t::MIP) || (cat == problem_category_t::IP);
     } else {
-      // CPU path: check variable types in cpu_data
+      // CPU path: check variable types in cpu_data for integer variables
       if (!cpu_data) return false;
-      return cpu_data->is_mip();
+      for (char vt : cpu_data->variable_types) {
+        if (vt == CUOPT_INTEGER) { return true; }
+      }
+      return false;
     }
   }
 
@@ -324,25 +216,22 @@ cuopt_int_t cuOptReadProblem(const char* filename, cuOptOptimizationProblem* pro
     auto& cpu_data               = *problem_and_stream->cpu_data;
     const auto& mps              = *mps_data_model_ptr;
 
-    cpu_data.num_constraints =
-      static_cast<cuopt_int_t>(mps.get_constraint_matrix_offsets().size() - 1);
-    cpu_data.num_variables    = static_cast<cuopt_int_t>(mps.get_objective_coefficients().size());
-    cpu_data.maximize         = mps.get_sense();
-    cpu_data.objective_offset = mps.get_objective_offset();
+    cpu_data.maximize                 = mps.get_sense();
+    cpu_data.objective_scaling_factor = 1.0;
+    cpu_data.objective_offset         = mps.get_objective_offset();
 
     cpu_data.objective_coefficients = mps.get_objective_coefficients();
     cpu_data.A_values               = mps.get_constraint_matrix_values();
     cpu_data.A_indices              = mps.get_constraint_matrix_indices();
     cpu_data.A_offsets              = mps.get_constraint_matrix_offsets();
 
+    // Handle both ranged and non-ranged constraints
     if (!mps.get_constraint_lower_bounds().empty() || !mps.get_constraint_upper_bounds().empty()) {
-      cpu_data.uses_ranged_constraints = true;
       cpu_data.constraint_lower_bounds = mps.get_constraint_lower_bounds();
       cpu_data.constraint_upper_bounds = mps.get_constraint_upper_bounds();
     } else {
-      cpu_data.uses_ranged_constraints = false;
-      cpu_data.constraint_bounds       = mps.get_constraint_bounds();
-      const auto& mps_row_types        = mps.get_row_types();
+      cpu_data.constraint_bounds = mps.get_constraint_bounds();
+      const auto& mps_row_types  = mps.get_row_types();
       cpu_data.row_types.resize(mps_row_types.size());
       for (size_t i = 0; i < mps_row_types.size(); ++i) {
         cpu_data.row_types[i] = mps_row_types[i];
@@ -411,10 +300,9 @@ cuopt_int_t cuOptCreateProblem(cuopt_int_t num_constraints,
       problem_and_stream->cpu_data = std::make_unique<problem_cpu_data_t>();
       auto& cpu_data               = *problem_and_stream->cpu_data;
 
-      cpu_data.num_constraints  = num_constraints;
-      cpu_data.num_variables    = num_variables;
-      cpu_data.maximize         = (objective_sense == CUOPT_MAXIMIZE);
-      cpu_data.objective_offset = objective_offset;
+      cpu_data.maximize                 = (objective_sense == CUOPT_MAXIMIZE);
+      cpu_data.objective_scaling_factor = 1.0;
+      cpu_data.objective_offset         = objective_offset;
 
       cpu_data.objective_coefficients.assign(objective_coefficients,
                                              objective_coefficients + num_variables);
@@ -425,7 +313,6 @@ cuopt_int_t cuOptCreateProblem(cuopt_int_t num_constraints,
       cpu_data.A_offsets.assign(constraint_matrix_row_offsets,
                                 constraint_matrix_row_offsets + num_constraints + 1);
 
-      cpu_data.uses_ranged_constraints = false;
       cpu_data.row_types.assign(constraint_sense, constraint_sense + num_constraints);
       cpu_data.constraint_bounds.assign(rhs, rhs + num_constraints);
 
@@ -512,10 +399,9 @@ cuopt_int_t cuOptCreateRangedProblem(cuopt_int_t num_constraints,
       problem_and_stream->cpu_data = std::make_unique<problem_cpu_data_t>();
       auto& cpu_data               = *problem_and_stream->cpu_data;
 
-      cpu_data.num_constraints  = num_constraints;
-      cpu_data.num_variables    = num_variables;
-      cpu_data.maximize         = (objective_sense == CUOPT_MAXIMIZE);
-      cpu_data.objective_offset = objective_offset;
+      cpu_data.maximize                 = (objective_sense == CUOPT_MAXIMIZE);
+      cpu_data.objective_scaling_factor = 1.0;
+      cpu_data.objective_offset         = objective_offset;
 
       cpu_data.objective_coefficients.assign(objective_coefficients,
                                              objective_coefficients + num_variables);
@@ -526,7 +412,6 @@ cuopt_int_t cuOptCreateRangedProblem(cuopt_int_t num_constraints,
       cpu_data.A_offsets.assign(constraint_matrix_row_offsets,
                                 constraint_matrix_row_offsets + num_constraints + 1);
 
-      cpu_data.uses_ranged_constraints = true;
       cpu_data.constraint_lower_bounds.assign(constraint_lower_bounds,
                                               constraint_lower_bounds + num_constraints);
       cpu_data.constraint_upper_bounds.assign(constraint_upper_bounds,
@@ -622,20 +507,22 @@ cuopt_int_t cuOptCreateQuadraticProblem(
       problem_and_stream->cpu_data = std::make_unique<problem_cpu_data_t>();
       auto& cpu_data               = *problem_and_stream->cpu_data;
 
-      cpu_data.num_constraints  = num_constraints;
-      cpu_data.num_variables    = num_variables;
-      cpu_data.maximize         = (objective_sense == CUOPT_MAXIMIZE);
-      cpu_data.objective_offset = objective_offset;
+      cpu_data.maximize                 = (objective_sense == CUOPT_MAXIMIZE);
+      cpu_data.objective_scaling_factor = 1.0;
+      cpu_data.objective_offset         = objective_offset;
 
       cpu_data.objective_coefficients.assign(objective_coefficients,
                                              objective_coefficients + num_variables);
 
-      cpu_data.Q_values.assign(quadratic_objective_matrix_coefficent_values,
-                               quadratic_objective_matrix_coefficent_values + Q_nnz);
-      cpu_data.Q_indices.assign(quadratic_objective_matrix_column_indices,
-                                quadratic_objective_matrix_column_indices + Q_nnz);
-      cpu_data.Q_offsets.assign(quadratic_objective_matrix_row_offsets,
-                                quadratic_objective_matrix_row_offsets + num_variables + 1);
+      cpu_data.quadratic_objective_values.assign(
+        quadratic_objective_matrix_coefficent_values,
+        quadratic_objective_matrix_coefficent_values + Q_nnz);
+      cpu_data.quadratic_objective_indices.assign(
+        quadratic_objective_matrix_column_indices,
+        quadratic_objective_matrix_column_indices + Q_nnz);
+      cpu_data.quadratic_objective_offsets.assign(
+        quadratic_objective_matrix_row_offsets,
+        quadratic_objective_matrix_row_offsets + num_variables + 1);
 
       cpu_data.A_values.assign(constraint_matrix_coefficent_values,
                                constraint_matrix_coefficent_values + nnz);
@@ -644,7 +531,6 @@ cuopt_int_t cuOptCreateQuadraticProblem(
       cpu_data.A_offsets.assign(constraint_matrix_row_offsets,
                                 constraint_matrix_row_offsets + num_constraints + 1);
 
-      cpu_data.uses_ranged_constraints = false;
       cpu_data.row_types.assign(constraint_sense, constraint_sense + num_constraints);
       cpu_data.constraint_bounds.assign(rhs, rhs + num_constraints);
 
@@ -740,20 +626,22 @@ cuopt_int_t cuOptCreateQuadraticRangedProblem(
       problem_and_stream->cpu_data = std::make_unique<problem_cpu_data_t>();
       auto& cpu_data               = *problem_and_stream->cpu_data;
 
-      cpu_data.num_constraints  = num_constraints;
-      cpu_data.num_variables    = num_variables;
-      cpu_data.maximize         = (objective_sense == CUOPT_MAXIMIZE);
-      cpu_data.objective_offset = objective_offset;
+      cpu_data.maximize                 = (objective_sense == CUOPT_MAXIMIZE);
+      cpu_data.objective_scaling_factor = 1.0;
+      cpu_data.objective_offset         = objective_offset;
 
       cpu_data.objective_coefficients.assign(objective_coefficients,
                                              objective_coefficients + num_variables);
 
-      cpu_data.Q_values.assign(quadratic_objective_matrix_coefficent_values,
-                               quadratic_objective_matrix_coefficent_values + Q_nnz);
-      cpu_data.Q_indices.assign(quadratic_objective_matrix_column_indices,
-                                quadratic_objective_matrix_column_indices + Q_nnz);
-      cpu_data.Q_offsets.assign(quadratic_objective_matrix_row_offsets,
-                                quadratic_objective_matrix_row_offsets + num_variables + 1);
+      cpu_data.quadratic_objective_values.assign(
+        quadratic_objective_matrix_coefficent_values,
+        quadratic_objective_matrix_coefficent_values + Q_nnz);
+      cpu_data.quadratic_objective_indices.assign(
+        quadratic_objective_matrix_column_indices,
+        quadratic_objective_matrix_column_indices + Q_nnz);
+      cpu_data.quadratic_objective_offsets.assign(
+        quadratic_objective_matrix_row_offsets,
+        quadratic_objective_matrix_row_offsets + num_variables + 1);
 
       cpu_data.A_values.assign(constraint_matrix_coefficent_values,
                                constraint_matrix_coefficent_values + nnz);
@@ -762,7 +650,6 @@ cuopt_int_t cuOptCreateQuadraticRangedProblem(
       cpu_data.A_offsets.assign(constraint_matrix_row_offsets,
                                 constraint_matrix_row_offsets + num_constraints + 1);
 
-      cpu_data.uses_ranged_constraints = true;
       cpu_data.constraint_lower_bounds.assign(constraint_lower_bounds,
                                               constraint_lower_bounds + num_constraints);
       cpu_data.constraint_upper_bounds.assign(constraint_upper_bounds,
@@ -837,7 +724,8 @@ cuopt_int_t cuOptGetNumConstraints(cuOptOptimizationProblem problem,
   problem_and_stream_view_t* problem_and_stream_view =
     static_cast<problem_and_stream_view_t*>(problem);
   if (!problem_and_stream_view->view.is_device_memory()) {
-    *num_constraints_ptr = problem_and_stream_view->cpu_data->num_constraints;
+    *num_constraints_ptr =
+      static_cast<cuopt_int_t>(problem_and_stream_view->cpu_data->A_offsets.size() - 1);
   } else {
     *num_constraints_ptr = problem_and_stream_view->gpu_problem->get_n_constraints();
   }
@@ -851,7 +739,8 @@ cuopt_int_t cuOptGetNumVariables(cuOptOptimizationProblem problem, cuopt_int_t*
   problem_and_stream_view_t* problem_and_stream_view =
     static_cast<problem_and_stream_view_t*>(problem);
   if (!problem_and_stream_view->view.is_device_memory()) {
-    *num_variables_ptr = problem_and_stream_view->cpu_data->num_variables;
+    *num_variables_ptr =
+      static_cast<cuopt_int_t>(problem_and_stream_view->cpu_data->objective_coefficients.size());
   } else {
     *num_variables_ptr = problem_and_stream_view->gpu_problem->get_n_variables();
   }
@@ -1268,7 +1157,7 @@ cuopt_int_t cuOptIsMIP(cuOptOptimizationProblem problem, cuopt_int_t* is_mip_ptr
   if (is_mip_ptr == nullptr) { return CUOPT_INVALID_ARGUMENT; }
   problem_and_stream_view_t* problem_and_stream_view =
     static_cast<problem_and_stream_view_t*>(problem);
-  *is_mip_ptr = static_cast<cuopt_int_t>(problem_and_stream_view->is_mip());
+  *is_mip_ptr = static_cast<cuopt_int_t>(problem_and_stream_view->is_mip_problem());
   return CUOPT_SUCCESS;
 }
 
@@ -1287,7 +1176,7 @@ cuopt_int_t cuOptSolve(cuOptOptimizationProblem problem,
   solver_settings_t<cuopt_int_t, cuopt_float_t>* solver_settings =
     static_cast<solver_settings_t<cuopt_int_t, cuopt_float_t>*>(settings);
 
-  bool is_mip = problem_and_stream_view->is_mip();
+  bool is_mip = problem_and_stream_view->is_mip_problem();
 
   // Use the view - solve_lp/solve_mip will check is_device_memory() to determine path
   const auto& view = problem_and_stream_view->view;
diff --git a/cpp/src/linear_programming/solver_solution.cu b/cpp/src/linear_programming/solver_solution.cu
index 41f52b1cd..288497e62 100644
--- a/cpp/src/linear_programming/solver_solution.cu
+++ b/cpp/src/linear_programming/solver_solution.cu
@@ -24,12 +24,12 @@ namespace cuopt::linear_programming {
 
 template <typename i_t, typename f_t>
 optimization_problem_solution_t<i_t, f_t>::optimization_problem_solution_t(
-  pdlp_termination_status_t termination_status_, rmm::cuda_stream_view stream_view)
+  pdlp_termination_status_t termination_status, rmm::cuda_stream_view stream_view)
   : primal_solution_(std::make_unique<rmm::device_uvector<f_t>>(0, stream_view)),
     dual_solution_(std::make_unique<rmm::device_uvector<f_t>>(0, stream_view)),
     reduced_cost_(std::make_unique<rmm::device_uvector<f_t>>(0, stream_view)),
     is_device_memory_(true),
-    termination_status_{{termination_status_}},
+    termination_status_{{termination_status}},
     error_status_(cuopt::logic_error("", cuopt::error_type_t::Success))
 {
   cuopt_assert(termination_stats_.size() == termination_status_.size(),
diff --git a/cpp/src/linear_programming/utilities/cython_solve.cu b/cpp/src/linear_programming/utilities/cython_solve.cu
index 94c8527f1..abbc7ae7b 100644
--- a/cpp/src/linear_programming/utilities/cython_solve.cu
+++ b/cpp/src/linear_programming/utilities/cython_solve.cu
@@ -191,8 +191,9 @@ std::unique_ptr<solver_ret_t> call_solve(
 {
   raft::common::nvtx::range fun_scope("Call Solve");
 
-  // Data from Python is always in CPU memory
-  data_model->set_is_device_memory(false);
+  // Data from Python DataModel is always in CPU memory (DataModel.get_data_ptr only accepts numpy
+  // arrays)
+  cuopt_assert(!data_model->is_device_memory(), "Python data model must be in CPU memory");
 
   // Determine if LP or MIP based on variable types (uses cached value)
   auto problem_category = data_model->get_problem_category();
@@ -206,6 +207,11 @@ std::unique_ptr<solver_ret_t> call_solve(
   const raft::handle_t* handle_ptr = &handle_;
 
   // Handle warm start data if present (only for local LP solves)
+  // Warm start data arrives from Python as a view to host memory. For local GPU solves,
+  // we need to copy it to device memory before passing to the solver.
+  // This is done here at the Python boundary rather than in solve_lp because:
+  // 1. We have the CUDA handle/stream available here
+  // 2. Remote solves don't need the device copy (they use the host view directly)
   if (!is_mip && solver_settings->get_pdlp_warm_start_data_view()
                      .last_restart_duality_gap_dual_solution_.data() != nullptr) {
     cuopt::linear_programming::pdlp_warm_start_data_t<int, double> pdlp_warm_start_data(
@@ -313,14 +319,7 @@ std::pair<std::vector<std::unique_ptr<solver_ret_t>>, double> call_batch_solve(
   auto start_solver = std::chrono::high_resolution_clock::now();
 
   // Limit parallelism as too much stream overlap gets too slow
-  int max_thread = 1;
-  if (linear_programming::is_remote_solve_enabled()) {
-    // Cap parallelism for remote solve to avoid overwhelming the remote service.
-    constexpr std::size_t max_total = 4;
-    max_thread = static_cast<int>(std::min(std::max<std::size_t>(size, 1), max_total));
-  } else {
-    max_thread = compute_max_thread(data_models);
-  }
+  const int max_thread = compute_max_thread(data_models);
 
   if (solver_settings->get_parameter<int>(CUOPT_METHOD) == CUOPT_METHOD_CONCURRENT) {
     CUOPT_LOG_INFO("Concurrent mode not supported for batch solve. Using PDLP instead. ");

From ab14fb08b1d548d4568db28b46fd5faa820d9951 Mon Sep 17 00:00:00 2001
From: Trevor McKay <tmgithub1@gmail.com>
Date: Fri, 30 Jan 2026 12:48:38 -0500
Subject: [PATCH 22/22] Add missing include for cuopt_assert macro

---
 cpp/src/linear_programming/utilities/cython_solve.cu | 1 +
 1 file changed, 1 insertion(+)

diff --git a/cpp/src/linear_programming/utilities/cython_solve.cu b/cpp/src/linear_programming/utilities/cython_solve.cu
index abbc7ae7b..30a2a5cf7 100644
--- a/cpp/src/linear_programming/utilities/cython_solve.cu
+++ b/cpp/src/linear_programming/utilities/cython_solve.cu
@@ -17,6 +17,7 @@
 #include <mps_parser/mps_data_model.hpp>
 #include <mps_parser/writer.hpp>
 #include <utilities/copy_helpers.hpp>
+#include <utilities/macros.cuh>
 
 #include <raft/common/nvtx.hpp>
 #include <raft/core/handle.hpp>