Uni-TTS/api.py at master · X-T-E-R/Uni-TTS · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
# 在开头加入路径
import os, sys
import importlib

# 尝试清空含有GPT_SoVITS的路径
for path in sys.path:
    if path.find(r"GPT_SoVITS") != -1:
        sys.path.remove(path)

now_dir = os.getcwd()
sys.path.append(now_dir)
# sys.path.append(os.path.join(now_dir, "GPT_SoVITS"))
sys.path.append(os.path.dirname(os.path.abspath(__file__)))

__version__ = "0.1.0"

print(f"Backend Version: {__version__}")

import soundfile as sf
from fastapi import FastAPI, Request, HTTPException
from fastapi.responses import JSONResponse, FileResponse, StreamingResponse
from fastapi.middleware.cors import CORSMiddleware
import tempfile
import uvicorn
import json

# 将当前文件所在的目录添加到 sys.path

from src.api_config_manager import api_config
from Adapters.base import Base_TTS_Task, Base_TTS_Instance

enabled_adapters = api_config.enabled_adapters
default_adapter = api_config.default_adapter

if len(enabled_adapters) > 1:
    tts_instance_dict:dict[str, Base_TTS_Instance] = {}
    for adapter in enabled_adapters:
        module = importlib.import_module(f"Adapters.{adapter}")
        tts_instance_dict[adapter] = getattr(module, "TTS_Instance")()
else:
    module = importlib.import_module(f"Adapters.{default_adapter}")
    tts_instance:Base_TTS_Instance = getattr(module, "TTS_Instance")()

# 存储临时文件的字典
temp_files = {}

app = FastAPI()

# 设置CORS
app.add_middleware(
    CORSMiddleware,
    allow_origins=["*"],
    allow_credentials=True,
    allow_methods=["*"],
    allow_headers=["*"],
)

@app.get('/character_list')
async def character_list(request: Request):
    if len(enabled_adapters) > 1:
        adapter = request.query_params.get("adapter", default_adapter)
        tts_instance = tts_instance_dict[adapter]
    res = JSONResponse(tts_instance.get_characters())
    return res

@app.get('/voice/speakers')
async def speakers(request: Request):
    if len(enabled_adapters) > 1:
        adapter = request.query_params.get("adapter", default_adapter)
        tts_instance = tts_instance_dict[adapter]
    speaker_dict = tts_instance.get_characters()
    name_list = list(speaker_dict.keys())
    speaker_list = [{"id": i, "name": name_list[i], "lang":["zh","en","ja"]} for i in range(len(name_list))]
    res = {
        "VITS": speaker_list,
        "GSVI": speaker_list,
        "GPT-SOVITS": speaker_list
    }
    return JSONResponse(res)

def generate_task(task: Base_TTS_Task):
    if task.task_type == "text" and task.text.strip() == "":
        return HTTPException(status_code=400, detail="Text is empty")
    elif task.task_type == "ssml" and task.ssml.strip() == "":
        return HTTPException(status_code=400, detail="SSML is empty")
    format = task.format
    save_temp = task.save_temp
    request_hash = None if not save_temp else task.md5()
    stream = task.stream

    if task.task_type == "text":
        gen = tts_instance.generate_from_text(task)
    elif task.task_type == "ssml":
        # 还不支持 stream
        audio_path = tts_instance.generate_from_ssml(task)
        if audio_path is None:
            return HTTPException(status_code=400, detail="SSML is invalid")
        return FileResponse(audio_path, media_type=f"audio/{format}", filename=f"audio.{format}")

    if stream == False:
        # TODO: use SQL instead of dict
        if save_temp and request_hash in temp_files:
            return FileResponse(path=temp_files[request_hash], media_type=f'audio/{format}')
        else:
            # 假设 gen 是你的音频生成器
            try:
                sampling_rate, audio_data = next(gen)
            except StopIteration:
                raise HTTPException(status_code=404, detail="Generator is empty or error occurred")
            # 创建一个临时文件
            with tempfile.NamedTemporaryFile(delete=False, suffix=f'.{format}') as tmp_file:
                # 尝试写入用户指定的格式，如果失败则回退到 WAV 格式
                try:
                    sf.write(tmp_file, audio_data, sampling_rate, format=format)
                except Exception as e:
                    # 如果指定的格式无法写入，则回退到 WAV 格式
                    sf.write(tmp_file, audio_data, sampling_rate, format='wav')
                    format = 'wav'  # 更新格式为 wav

                tmp_file_path = tmp_file.name
                task.audio_path = tmp_file_path
                if save_temp:
                    temp_files[request_hash] = tmp_file_path
            # 返回文件响应，FileResponse 会负责将文件发送给客户端
            return FileResponse(tmp_file_path, media_type=f"audio/{format}", filename=f"audio.{format}")
    else:
        return StreamingResponse(gen,  media_type='audio/wav')


# route 由 json 文件配置
async def tts(request: Request):
    if len(enabled_adapters) > 1:
        adapter = request.query_params.get("adapter", default_adapter)
        tts_instance = tts_instance_dict[adapter]
    # 尝试从JSON中获取数据，如果不是JSON，则从查询参数中获取
    if request.method == "GET":
        data = request.query_params
    else:
        data = await request.json()
    return_type = "audio"
    # 认定一个请求只有一个任务
    if data.get("textType", None) is not None:
        task = tts_instance.ms_like_analyser(data)
        return_type = "json"
    else:
        task = tts_instance.params_analyser(data)

    print(task)
    if return_type == "audio":
        return generate_task(task)
    else:
        # TODO: return json
        return generate_task(task)
        pass

routes = ['/tts']

# 注册路由
for path in routes:
    app.api_route(path, methods=['GET', 'POST'])(tts)

# 便于小白理解
def print_ipv4_ip(host = "127.0.0.1", port = 5000):
    import socket

    def get_internal_ip():
        """获取内部IP地址"""
        s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
        try:
            # 这不会发送真正的数据包
            s.connect(('10.253.156.219', 1))
            IP = s.getsockname()[0]
        except Exception:
            IP = '127.0.0.1'
        finally:
            s.close()
        return IP

    if host == "0.0.0.0":
        display_hostname = get_internal_ip()
        if display_hostname != "127.0.0.1":
            print(f"Please use http://{display_hostname}:{port} to access the service.")

tts_host = api_config.tts_host
tts_port = api_config.tts_port

if __name__ == "__main__":
    print_ipv4_ip(tts_host, tts_port)
    uvicorn.run(app, host=tts_host, port=tts_port)