mongodb
diff --git a/‎pymongo/asynchronous/mongo_client.py‎
Lines changed: 1 addition & 2 deletions b/‎pymongo/asynchronous/mongo_client.py‎
Lines changed: 1 addition & 2 deletions
diff --git a/‎pymongo/asynchronous/topology.py‎
Lines changed: 20 additions & 3 deletions b/‎pymongo/asynchronous/topology.py‎
Lines changed: 20 additions & 3 deletions
diff --git a/‎pymongo/server_selectors.py‎
Lines changed: 3 additions & 3 deletions b/‎pymongo/server_selectors.py‎
Lines changed: 3 additions & 3 deletions
diff --git a/‎pymongo/synchronous/mongo_client.py‎
Lines changed: 1 addition & 2 deletions b/‎pymongo/synchronous/mongo_client.py‎
Lines changed: 1 addition & 2 deletions
diff --git a/‎pymongo/synchronous/topology.py‎
Lines changed: 20 additions & 3 deletions b/‎pymongo/synchronous/topology.py‎
Lines changed: 20 additions & 3 deletions
diff --git a/‎pymongo/topology_description.py‎
Lines changed: 21 additions & 1 deletion b/‎pymongo/topology_description.py‎
Lines changed: 21 additions & 1 deletion
diff --git a/‎test/asynchronous/test_retryable_reads.py‎
Lines changed: 71 additions & 0 deletions b/‎test/asynchronous/test_retryable_reads.py‎
Lines changed: 71 additions & 0 deletions
diff --git a/‎test/asynchronous/utils_selection_tests.py‎
Lines changed: 32 additions & 7 deletions b/‎test/asynchronous/utils_selection_tests.py‎
Lines changed: 32 additions & 7 deletions
@@ -2825,8 +2825,7 @@ async def run(self) -> T:
                     if self._last_error is None:
                         self._last_error = exc
 
-                if self._client.topology_description.topology_type == TOPOLOGY_TYPE.Sharded:
-                    self._deprioritized_servers.append(self._server)
+                self._deprioritized_servers.append(self._server)
 
     def _is_not_eligible_for_retry(self) -> bool:
         """Checks if the exchange is not eligible for retry"""
 
@@ -265,6 +265,7 @@ async def select_servers(
         server_selection_timeout: Optional[float] = None,
         address: Optional[_Address] = None,
         operation_id: Optional[int] = None,
+        deprioritized_servers: Optional[list[Server]] = None,
     ) -> list[Server]:
         """Return a list of Servers matching selector, or time out.
 
@@ -292,7 +293,12 @@ async def select_servers(
 
         async with self._lock:
             server_descriptions = await self._select_servers_loop(
-                selector, server_timeout, operation, operation_id, address
+                selector,
+                server_timeout,
+                operation,
+                operation_id,
+                address,
+                deprioritized_servers=deprioritized_servers,
             )
 
             return [
@@ -306,6 +312,7 @@ async def _select_servers_loop(
         operation: str,
         operation_id: Optional[int],
         address: Optional[_Address],
+        deprioritized_servers: Optional[list[Server]] = None,
     ) -> list[ServerDescription]:
         """select_servers() guts. Hold the lock when calling this."""
         now = time.monotonic()
@@ -324,7 +331,12 @@ async def _select_servers_loop(
             )
 
         server_descriptions = self._description.apply_selector(
-            selector, address, custom_selector=self._settings.server_selector
+            selector,
+            address,
+            custom_selector=self._settings.server_selector,
+            deprioritized_servers=[server.description for server in deprioritized_servers]
+            if deprioritized_servers
+            else None,
         )
 
         while not server_descriptions:
@@ -385,7 +397,12 @@ async def _select_server(
         operation_id: Optional[int] = None,
     ) -> Server:
         servers = await self.select_servers(
-            selector, operation, server_selection_timeout, address, operation_id
+            selector,
+            operation,
+            server_selection_timeout,
+            address,
+            operation_id,
+            deprioritized_servers,
         )
         servers = _filter_servers(servers, deprioritized_servers)
         if len(servers) == 1:
 
@@ -34,16 +34,16 @@ class Selection:
 
     @classmethod
     def from_topology_description(cls, topology_description: TopologyDescription) -> Selection:
-        known_servers = topology_description.known_servers
+        candidate_servers = topology_description.candidate_servers
         primary = None
-        for sd in known_servers:
+        for sd in candidate_servers:
             if sd.server_type == SERVER_TYPE.RSPrimary:
                 primary = sd
                 break
 
         return Selection(
             topology_description,
-            topology_description.known_servers,
+            topology_description.candidate_servers,
             topology_description.common_wire_version,
             primary,
         )
 
@@ -2815,8 +2815,7 @@ def run(self) -> T:
                     if self._last_error is None:
                         self._last_error = exc
 
-                if self._client.topology_description.topology_type == TOPOLOGY_TYPE.Sharded:
-                    self._deprioritized_servers.append(self._server)
+                self._deprioritized_servers.append(self._server)
 
     def _is_not_eligible_for_retry(self) -> bool:
         """Checks if the exchange is not eligible for retry"""
 
@@ -265,6 +265,7 @@ def select_servers(
         server_selection_timeout: Optional[float] = None,
         address: Optional[_Address] = None,
         operation_id: Optional[int] = None,
+        deprioritized_servers: Optional[list[Server]] = None,
     ) -> list[Server]:
         """Return a list of Servers matching selector, or time out.
 
@@ -292,7 +293,12 @@ def select_servers(
 
         with self._lock:
             server_descriptions = self._select_servers_loop(
-                selector, server_timeout, operation, operation_id, address
+                selector,
+                server_timeout,
+                operation,
+                operation_id,
+                address,
+                deprioritized_servers=deprioritized_servers,
             )
 
             return [
@@ -306,6 +312,7 @@ def _select_servers_loop(
         operation: str,
         operation_id: Optional[int],
         address: Optional[_Address],
+        deprioritized_servers: Optional[list[Server]] = None,
     ) -> list[ServerDescription]:
         """select_servers() guts. Hold the lock when calling this."""
         now = time.monotonic()
@@ -324,7 +331,12 @@ def _select_servers_loop(
             )
 
         server_descriptions = self._description.apply_selector(
-            selector, address, custom_selector=self._settings.server_selector
+            selector,
+            address,
+            custom_selector=self._settings.server_selector,
+            deprioritized_servers=[server.description for server in deprioritized_servers]
+            if deprioritized_servers
+            else None,
         )
 
         while not server_descriptions:
@@ -385,7 +397,12 @@ def _select_server(
         operation_id: Optional[int] = None,
     ) -> Server:
         servers = self.select_servers(
-            selector, operation, server_selection_timeout, address, operation_id
+            selector,
+            operation,
+            server_selection_timeout,
+            address,
+            operation_id,
+            deprioritized_servers,
         )
         servers = _filter_servers(servers, deprioritized_servers)
         if len(servers) == 1:
 
@@ -85,6 +85,7 @@ def __init__(
         self._server_descriptions = server_descriptions
         self._max_set_version = max_set_version
         self._max_election_id = max_election_id
+        self._candidate_servers = list(self._server_descriptions.values())
 
         # The heartbeat_frequency is used in staleness estimates.
         self._topology_settings = topology_settings
@@ -248,6 +249,11 @@ def readable_servers(self) -> list[ServerDescription]:
         """List of readable Servers."""
         return [s for s in self._server_descriptions.values() if s.is_readable]
 
+    @property
+    def candidate_servers(self) -> list[ServerDescription]:
+        """List of Servers excluding deprioritized servers."""
+        return self._candidate_servers
+
     @property
     def common_wire_version(self) -> Optional[int]:
         """Minimum of all servers' max wire versions, or None."""
@@ -283,11 +289,24 @@ def _apply_local_threshold(self, selection: Optional[Selection]) -> list[ServerD
             if (cast(float, s.round_trip_time) - fastest) <= threshold
         ]
 
+    def _filter_servers(
+        self, deprioritized_servers: Optional[list[ServerDescription]] = None
+    ) -> None:
+        """Filter out deprioritized servers from a list of server candidates."""
+        if not deprioritized_servers:
+            self._candidate_servers = self.known_servers
+        else:
+            filtered = [
+                server for server in self.known_servers if server not in deprioritized_servers
+            ]
+            self._candidate_servers = filtered or self.known_servers
+
     def apply_selector(
         self,
         selector: Any,
         address: Optional[_Address] = None,
         custom_selector: Optional[_ServerSelector] = None,
+        deprioritized_servers: Optional[list[ServerDescription]] = None,
     ) -> list[ServerDescription]:
         """List of servers matching the provided selector(s).
 
@@ -324,9 +343,10 @@ def apply_selector(
             description = self.server_descriptions().get(address)
             return [description] if description and description.is_server_type_known else []
 
+        self._filter_servers(deprioritized_servers)
         # Primary selection fast path.
         if self.topology_type == TOPOLOGY_TYPE.ReplicaSetWithPrimary and type(selector) is Primary:
-            for sd in self._server_descriptions.values():
+            for sd in self._candidate_servers:
                 if sd.server_type == SERVER_TYPE.RSPrimary:
                     sds = [sd]
                     if custom_selector:
 
@@ -21,6 +21,7 @@
 import threading
 from test.asynchronous.utils import async_set_fail_point
 
+from pymongo import ReadPreference
 from pymongo.errors import OperationFailure
 
 sys.path[0:0] = [""]
@@ -182,6 +183,44 @@ async def test_retryable_reads_are_retried_on_a_different_mongos_when_one_is_ava
         #  Assert that both events occurred on different mongos.
         assert listener.failed_events[0].connection_id != listener.failed_events[1].connection_id
 
+    @async_client_context.require_replica_set
+    @async_client_context.require_failCommand_fail_point
+    async def test_retryable_reads_are_retried_on_a_different_replica_when_one_is_available(self):
+        fail_command = {
+            "configureFailPoint": "failCommand",
+            "mode": {"times": 1},
+            "data": {"failCommands": ["find"], "errorCode": 6},
+        }
+
+        replica_clients = []
+
+        for node in async_client_context.nodes:
+            client = await self.async_rs_or_single_client(*node, directConnection=True)
+            await async_set_fail_point(client, fail_command)
+            replica_clients.append(client)
+
+        listener = OvertCommandListener()
+        client = await self.async_rs_or_single_client(
+            event_listeners=[listener],
+            retryReads=True,
+            directConnection=False,
+            readPreference="secondaryPreferred",
+        )
+
+        with self.assertRaises(OperationFailure):
+            await client.t.t.find_one({})
+
+        # Disable failpoints on each node
+        for client in replica_clients:
+            fail_command["mode"] = "off"
+            await async_set_fail_point(client, fail_command)
+
+        self.assertEqual(len(listener.failed_events), 2)
+        self.assertEqual(len(listener.succeeded_events), 0)
+
+        #  Assert that both events occurred on different nodes.
+        assert listener.failed_events[0].connection_id != listener.failed_events[1].connection_id
+
     @async_client_context.require_multiple_mongoses
     @async_client_context.require_failCommand_fail_point
     async def test_retryable_reads_are_retried_on_the_same_mongos_when_no_others_are_available(
@@ -218,6 +257,38 @@ async def test_retryable_reads_are_retried_on_the_same_mongos_when_no_others_are
         #  Assert that both events occurred on the same mongos.
         assert listener.succeeded_events[0].connection_id == listener.failed_events[0].connection_id
 
+    @async_client_context.require_replica_set
+    @async_client_context.require_failCommand_fail_point
+    async def test_retryable_reads_are_retried_on_the_same_replica_when_no_others_are_available(
+        self
+    ):
+        fail_command = {
+            "configureFailPoint": "failCommand",
+            "mode": {"times": 1},
+            "data": {"failCommands": ["find"], "errorCode": 6},
+        }
+
+        node_client = await self.async_rs_or_single_client(*list(async_client_context.nodes)[0])
+        await async_set_fail_point(node_client, fail_command)
+
+        listener = OvertCommandListener()
+        client = await self.async_rs_or_single_client(
+            event_listeners=[listener],
+            retryReads=True,
+        )
+
+        await client.t.t.find_one({})
+
+        # Disable failpoints
+        fail_command["mode"] = "off"
+        await async_set_fail_point(node_client, fail_command)
+
+        self.assertEqual(len(listener.failed_events), 1)
+        self.assertEqual(len(listener.succeeded_events), 1)
+
+        #  Assert that both events occurred on the same node.
+        assert listener.succeeded_events[0].connection_id == listener.failed_events[0].connection_id
+
     @async_client_context.require_failCommand_fail_point
     async def test_retryable_reads_are_retried_on_the_same_implicit_session(self):
         listener = OvertCommandListener()
 
@@ -35,7 +35,7 @@
 from bson import json_util
 from pymongo.asynchronous.settings import TopologySettings
 from pymongo.asynchronous.topology import Topology
-from pymongo.common import HEARTBEAT_FREQUENCY
+from pymongo.common import HEARTBEAT_FREQUENCY, clean_node
 from pymongo.errors import AutoReconnect, ConfigurationError
 from pymongo.operations import _Op
 from pymongo.server_selectors import writable_server_selector
@@ -95,12 +95,21 @@ async def run_scenario(self):
         # "Eligible servers" is defined in the server selection spec as
         # the set of servers matching both the ReadPreference's mode
         # and tag sets.
-        top_latency = await create_topology(scenario_def)
+        top_suitable = await create_topology(scenario_def, local_threshold_ms=1000000)
 
         # "In latency window" is defined in the server selection
         # spec as the subset of suitable_servers that falls within the
         # allowable latency window.
-        top_suitable = await create_topology(scenario_def, local_threshold_ms=1000000)
+        top_latency = await create_topology(scenario_def)
+
+        top_suitable_deprioritized_servers = [
+            top_suitable.get_server_by_address(clean_node(server["address"]))
+            for server in scenario_def.get("deprioritized_servers", [])
+        ]
+        top_latency_deprioritized_servers = [
+            top_latency.get_server_by_address(clean_node(server["address"]))
+            for server in scenario_def.get("deprioritized_servers", [])
+        ]
 
         # Create server selector.
         if scenario_def.get("operation") == "write":
@@ -120,21 +129,37 @@ async def run_scenario(self):
         # Select servers.
         if not scenario_def.get("suitable_servers"):
             with self.assertRaises(AutoReconnect):
-                await top_suitable.select_server(pref, _Op.TEST, server_selection_timeout=0)
+                await top_suitable.select_server(
+                    pref,
+                    _Op.TEST,
+                    server_selection_timeout=0,
+                    deprioritized_servers=top_suitable_deprioritized_servers,
+                )
 
             return
 
         if not scenario_def["in_latency_window"]:
             with self.assertRaises(AutoReconnect):
-                await top_latency.select_server(pref, _Op.TEST, server_selection_timeout=0)
+                await top_latency.select_server(
+                    pref,
+                    _Op.TEST,
+                    server_selection_timeout=0,
+                    deprioritized_servers=top_latency_deprioritized_servers,
+                )
 
             return
 
         actual_suitable_s = await top_suitable.select_servers(
-            pref, _Op.TEST, server_selection_timeout=0
+            pref,
+            _Op.TEST,
+            server_selection_timeout=0,
+            deprioritized_servers=top_suitable_deprioritized_servers,
         )
         actual_latency_s = await top_latency.select_servers(
-            pref, _Op.TEST, server_selection_timeout=0
+            pref,
+            _Op.TEST,
+            server_selection_timeout=0,
+            deprioritized_servers=top_latency_deprioritized_servers,
         )
 
         expected_suitable_servers = {}