fix: typings

MichaelSolati · MichaelSolati · commit 009c4f0aa7ef · 2025-06-03T12:37:38.000-07:00
diff --git a/src/inworld_sdk/http_client.py b/src/inworld_sdk/http_client.py
@@ -51,7 +51,7 @@ async def request(
         path: str,
         data: Optional[dict] = None,
         stream: bool = False,
-    ) -> Union[dict | ResponseWrapper]:
+    ) -> Union[dict, ResponseWrapper]:
         requestData = (
             json.dumps(data) if method != "get" and data and len(data.keys()) > 0 else None
         )
diff --git a/src/inworld_sdk/tts.py b/src/inworld_sdk/tts.py
@@ -1,9 +1,10 @@
 import base64
 import io
 import json
-from typing import AsyncGenerator, Optional
+from typing import Any, AsyncGenerator, cast, Dict, List, Optional
 
 from .http_client import HttpClient
+from .http_client import ResponseWrapper
 from .typings.tts import AudioConfig
 from .typings.tts import TTSLanguageCodes
 from .typings.tts import TTSVoices
@@ -29,7 +30,7 @@ def __init__(
         self.__voice = voice or "Emma"
 
     @property
-    def audioConfig(self) -> AudioConfig:
+    def audioConfig(self) -> Optional[AudioConfig]:
         """Get default audio config"""
         return self.__audioConfig
 
@@ -49,7 +50,7 @@ def languageCode(self, languageCode: TTSLanguageCodes):
         self.__languageCode = languageCode
 
     @property
-    def modelId(self) -> str:
+    def modelId(self) -> Optional[str]:
         """Get default model ID"""
         return self.__modelId
 
@@ -75,7 +76,7 @@ async def synthesizeSpeech(
         languageCode: Optional[TTSLanguageCodes] = None,
         modelId: Optional[str] = None,
         audioConfig: Optional[AudioConfig] = None,
-    ) -> dict:
+    ) -> Dict[str, Any]:
         """Synthesize speech"""
         data = {
             "input": {"text": input},
@@ -91,11 +92,12 @@ async def synthesizeSpeech(
         if modelId or self.__modelId:
             data["modelId"] = modelId or self.__modelId
 
-        return await self.__client.request(
+        response = await self.__client.request(
             "post",
             "/tts/v1alpha/text:synthesize-sync",
             data=data,
         )
+        return cast(Dict[str, Any], response)
 
     async def synthesizeSpeechAsWav(
         self,
@@ -117,7 +119,10 @@ async def synthesizeSpeechAsWav(
             audioConfig=audioConfig,
         )
 
-        decoded_audio = base64.b64decode(response.get("audioContent"))
+        audio_content = response.get("audioContent")
+        if not audio_content:
+            raise ValueError("No audio content in response")
+        decoded_audio = base64.b64decode(audio_content)
 
         return io.BytesIO(decoded_audio)
 
@@ -128,7 +133,7 @@ async def synthesizeSpeechStream(
         languageCode: Optional[TTSLanguageCodes] = None,
         modelId: Optional[str] = None,
         audioConfig: Optional[AudioConfig] = None,
-    ) -> AsyncGenerator[dict, None]:
+    ) -> AsyncGenerator[Dict[str, Any], None]:
         """Synthesize speech as a stream"""
         data = {
             "input": {"text": input},
@@ -144,13 +149,16 @@ async def synthesizeSpeechStream(
         if modelId or self.__modelId:
             data["modelId"] = modelId or self.__modelId
 
-        response = None
+        response: Optional[ResponseWrapper] = None
         try:
-            response = await self.__client.request(
-                "post",
-                "/tts/v1alpha/text:synthesize",
-                data=data,
-                stream=True,
+            response = cast(
+                ResponseWrapper,
+                await self.__client.request(
+                    "post",
+                    "/tts/v1alpha/text:synthesize",
+                    data=data,
+                    stream=True,
+                ),
             )
 
             async for chunk in response.content:
@@ -184,8 +192,9 @@ async def synthesizeSpeechStreamAsWav(
                 languageCode=languageCode,
                 audioConfig=audioConfig,
             ):
-                if chunk and chunk.get("audioContent") is not None:
-                    decoded_audio = base64.b64decode(chunk.get("audioContent"))
+                audio_content = chunk.get("audioContent")
+                if audio_content is not None:
+                    decoded_audio = base64.b64decode(audio_content)
                     yield io.BytesIO(decoded_audio)
         except Exception:
             raise
@@ -194,13 +203,14 @@ async def voices(
         self,
         languageCode: Optional[TTSLanguageCodes] = None,
         modelId: Optional[str] = None,
-    ) -> list[VoiceResponse]:
+    ) -> List[VoiceResponse]:
         """Get voices"""
-        data = {}
+        data: Dict[str, Any] = {}
         if languageCode:
             data["languageCode"] = languageCode
         if modelId:
             data["modelId"] = modelId
 
         response = await self.__client.request("get", "/tts/v1alpha/voices", data=data)
-        return response.get("voices")
+        voices = response.get("voices", [])
+        return cast(List[VoiceResponse], voices)

Original file line number	Diff line number	Diff line change
`@@ -51,7 +51,7 @@ async def request(`
`51`	`51`	`path: str,`
`52`	`52`	`data: Optional[dict] = None,`
`53`	`53`	`stream: bool = False,`
`54`		`- ) -> Union[dict \| ResponseWrapper]:`
	`54`	`+ ) -> Union[dict, ResponseWrapper]:`
`55`	`55`	`requestData = (`
`56`	`56`	`json.dumps(data) if method != "get" and data and len(data.keys()) > 0 else None`
`57`	`57`	`)`