voice-changer/server/voice_changer/SoVitsSvc40v2/SoVitsSvc40v2.py

import sys
import os
if sys.platform.startswith('darwin'):
    baseDir = [x for x in sys.path if x.endswith("Contents/MacOS")]
    if len(baseDir) != 1:
        print("baseDir should be only one ", baseDir)
        sys.exit()
    modulePath = os.path.join(baseDir[0], "so-vits-svc-40v2")
    sys.path.append(modulePath)
else:
    sys.path.append("so-vits-svc-40v2")

import io
from dataclasses import dataclass, asdict
from functools import reduce
import numpy as np
import torch
import onnxruntime
import pyworld as pw

from models import SynthesizerTrn
import cluster
import utils
from fairseq import checkpoint_utils
import librosa
providers = ['OpenVINOExecutionProvider', "CUDAExecutionProvider", "DmlExecutionProvider", "CPUExecutionProvider"]


@dataclass
class SoVitsSvc40v2Settings():
    gpu: int = 0
    dstId: int = 0

    f0Detector: str = "dio"  # dio or harvest
    tran: int = 20
    noiceScale: float = 0.3
    predictF0: int = 0  # 0:False, 1:True
    silentThreshold: float = 0.00001
    extraConvertSize: int = 1024 * 32
    clusterInferRatio: float = 0.1

    framework: str = "PyTorch"  # PyTorch or ONNX
    pyTorchModelFile: str = ""
    onnxModelFile: str = ""
    configFile: str = ""

    # ↓mutableな物だけ列挙
    intData = ["gpu", "dstId", "tran", "predictF0", "extraConvertSize"]
    floatData = ["noiceScale", "silentThreshold", "clusterInferRatio"]
    strData = ["framework", "f0Detector"]


class SoVitsSvc40v2:
    def __init__(self):
        self.settings = SoVitsSvc40v2Settings()
        self.net_g = None
        self.onnx_session = None

        self.raw_path = io.BytesIO()
        self.gpu_num = torch.cuda.device_count()
        self.prevVol = 0

    def loadModel(self, config: str, pyTorch_model_file: str = None, onnx_model_file: str = None, clusterTorchModel: str = None, hubertTorchModel: str = None):
        # !! 注意 !! hubertTorchModelは固定値で上書きされるため、設定しても効果ない。

        self.settings.configFile = config
        self.hps = utils.get_hparams_from_file(config)

        # hubert model
        try:
            # vec_path = hubertTorchModel
            vec_path = "hubert/checkpoint_best_legacy_500.pt"
            print("hubert 1 ", hubertTorchModel)
            models, saved_cfg, task = checkpoint_utils.load_model_ensemble_and_task(
                [vec_path],
                suffix="",
            )
            print("hubert 2 ", hubertTorchModel)
            model = models[0]
            print("hubert 3 ", hubertTorchModel)
            model.eval()
            print("hubert 4 ", hubertTorchModel)
            self.hubert_model = model.cpu()
            print("hubert 5 ", hubertTorchModel)
        except Exception as e:
            print("EXCEPTION1", e)

        # cluster
        try:
            if os.path.exists(clusterTorchModel):
                print("load kmean11", clusterTorchModel)
                self.cluster_model = cluster.get_cluster_model(clusterTorchModel)
                print("load kmean12", clusterTorchModel)
            else:
                print("load kmean21", clusterTorchModel)
                self.cluster_model = None
                print("load kmean22", clusterTorchModel)
        except Exception as e:
            print("EXCEPTION2", e)

        if pyTorch_model_file != None:
            self.settings.pyTorchModelFile = pyTorch_model_file
        if onnx_model_file:
            self.settings.onnxModelFile = onnx_model_file

        # PyTorchモデル生成
        if pyTorch_model_file != None:
            self.net_g = SynthesizerTrn(
                self.hps
            )
            self.net_g.eval()
            utils.load_checkpoint(pyTorch_model_file, self.net_g, None)

        # # ONNXモデル生成
        # if onnx_model_file != None:
        #     ort_options = onnxruntime.SessionOptions()
        #     ort_options.intra_op_num_threads = 8
        #     self.onnx_session = onnxruntime.InferenceSession(
        #         onnx_model_file,
        #         providers=providers
        #     )
        return self.get_info()

    def update_setteings(self, key: str, val: any):
        if key == "onnxExecutionProvider" and self.onnx_session != None:
            if val == "CUDAExecutionProvider":
                if self.settings.gpu < 0 or self.settings.gpu >= self.gpu_num:
                    self.settings.gpu = 0
                provider_options = [{'device_id': self.settings.gpu}]
                self.onnx_session.set_providers(providers=[val], provider_options=provider_options)
            else:
                self.onnx_session.set_providers(providers=[val])
        elif key in self.settings.intData:
            setattr(self.settings, key, int(val))
            if key == "gpu" and val >= 0 and val < self.gpu_num and self.onnx_session != None:
                providers = self.onnx_session.get_providers()
                print("Providers:", providers)
                if "CUDAExecutionProvider" in providers:
                    provider_options = [{'device_id': self.settings.gpu}]
                    self.onnx_session.set_providers(providers=["CUDAExecutionProvider"], provider_options=provider_options)
        elif key in self.settings.floatData:
            setattr(self.settings, key, float(val))
        elif key in self.settings.strData:
            setattr(self.settings, key, str(val))
        else:
            return False

        return True

    def get_info(self):
        data = asdict(self.settings)

        data["onnxExecutionProviders"] = self.onnx_session.get_providers() if self.onnx_session != None else []
        files = ["configFile", "pyTorchModelFile", "onnxModelFile"]
        for f in files:
            if data[f] != None and os.path.exists(data[f]):
                data[f] = os.path.basename(data[f])
            else:
                data[f] = ""

        return data

    def get_processing_sampling_rate(self):
        return self.hps.data.sampling_rate

    def get_unit_f0(self, audio_buffer, tran):
        wav_44k = audio_buffer
        # f0 = utils.compute_f0_parselmouth(wav, sampling_rate=self.target_sample, hop_length=self.hop_size)
        f0 = utils.compute_f0_dio(wav_44k, sampling_rate=self.hps.data.sampling_rate, hop_length=self.hps.data.hop_length)
        if wav_44k.shape[0] % self.hps.data.hop_length != 0:
            print(f" !!! !!! !!! wav size not multiple of hopsize: {wav_44k.shape[0] / self.hps.data.hop_length}")

        f0, uv = utils.interpolate_f0(f0)
        f0 = torch.FloatTensor(f0)
        uv = torch.FloatTensor(uv)
        f0 = f0 * 2 ** (tran / 12)
        f0 = f0.unsqueeze(0)
        uv = uv.unsqueeze(0)

        # wav16k = librosa.resample(audio_buffer, orig_sr=24000, target_sr=16000)
        wav16k = librosa.resample(audio_buffer, orig_sr=self.hps.data.sampling_rate, target_sr=16000)
        wav16k = torch.from_numpy(wav16k)
        c = utils.get_hubert_content(self.hubert_model, wav_16k_tensor=wav16k)
        c = utils.repeat_expand_2d(c.squeeze(0), f0.shape[1])

        if self.settings.clusterInferRatio != 0 and self.cluster_model != None:
            # self.hsp.spk.tsukuyomi
            cluster_c = cluster.get_cluster_center_result(self.cluster_model, c.cpu().numpy().T, "tsukuyomi").T
            # cluster_c = cluster.get_cluster_center_result(self.cluster_model, c.cpu().numpy().T, self.settings.dstId).T
            cluster_c = torch.FloatTensor(cluster_c).cpu()
            c = self.settings.clusterInferRatio * cluster_c + (1 - self.settings.clusterInferRatio) * c

        c = c.unsqueeze(0)
        return c, f0, uv

    def generate_input(self, newData: any, inputSize: int, crossfadeSize: int):
        newData = newData.astype(np.float32) / self.hps.data.max_wav_value

        if hasattr(self, "audio_buffer"):
            self.audio_buffer = np.concatenate([self.audio_buffer, newData], 0)  # 過去のデータに連結
        else:
            self.audio_buffer = newData

        convertSize = inputSize + crossfadeSize + self.settings.extraConvertSize

        if convertSize % self.hps.data.hop_length != 0:  # モデルの出力のホップサイズで切り捨てが発生するので補う。
            convertSize = convertSize + (self.hps.data.hop_length - (convertSize % self.hps.data.hop_length))

        self.audio_buffer = self.audio_buffer[-1 * convertSize:]  # 変換対象の部分だけ抽出

        crop = self.audio_buffer[-1 * (inputSize + crossfadeSize):-1 * (crossfadeSize)]

        rms = np.sqrt(np.square(crop).mean(axis=0))
        vol = max(rms, self.prevVol * 0.0)
        self.prevVol = vol

        c, f0, uv = self.get_unit_f0(self.audio_buffer, self.settings.tran)
        return (c, f0, uv, convertSize, vol)

    def _onnx_inference(self, data):
        pass

    def _pyTorch_inference(self, data):
        if hasattr(self, "net_g") == False or self.net_g == None:
            print("[Voice Changer] No pyTorch session.")
            return np.zeros(1).astype(np.int16)

        if self.settings.gpu < 0 or self.gpu_num == 0:
            dev = torch.device("cpu")
        else:
            dev = torch.device("cuda", index=self.settings.gpu)

        convertSize = data[3]
        vol = data[4]
        data = (data[0], data[1], data[2],)

        if vol < self.settings.silentThreshold:
            return np.zeros(convertSize).astype(np.int16)

        with torch.no_grad():
            c, f0, uv = [x.to(dev)for x in data]
            sid_target = torch.LongTensor([self.settings.dstId]).to(dev)
            self.net_g.to(dev)
            # audio1 = self.net_g.infer(c, f0=f0, g=sid_target, uv=uv, predict_f0=True, noice_scale=0.1)[0][0, 0].data.float()
            predict_f0_flag = True if self.settings.predictF0 == 1 else False
            audio1 = self.net_g.infer(c, f0=f0, g=sid_target, uv=uv, predict_f0=predict_f0_flag,
                                      noice_scale=self.settings.noiceScale)[0][0, 0].data.float()
            audio1 = audio1 * self.hps.data.max_wav_value

            audio1 = audio1 * vol

            result = audio1.float().cpu().numpy()

            # result = infer_tool.pad_array(result, length)
        return result

    def inference(self, data):
        if self.settings.framework == "ONNX":
            audio = self._onnx_inference(data)
        else:
            audio = self._pyTorch_inference(data)
        return audio

    def destroy(self):
        del self.net_g
        del self.onnx_session
WIP: add so-vits-svc 2023-03-10 19:56:10 +03:00			`import sys`
			`import os`
			`if sys.platform.startswith('darwin'):`
			`baseDir = [x for x in sys.path if x.endswith("Contents/MacOS")]`
			`if len(baseDir) != 1:`
			`print("baseDir should be only one ", baseDir)`
			`sys.exit()`
			`modulePath = os.path.join(baseDir[0], "so-vits-svc-40v2")`
			`sys.path.append(modulePath)`
			`else:`
			`sys.path.append("so-vits-svc-40v2")`

			`import io`
			`from dataclasses import dataclass, asdict`
			`from functools import reduce`
			`import numpy as np`
			`import torch`
			`import onnxruntime`
			`import pyworld as pw`

			`from models import SynthesizerTrn`
WIP: support so-vits-svc 40v2. can not store content vec in indexeddb. 2023-03-13 23:18:37 +03:00			`import cluster`
WIP: add so-vits-svc 2023-03-10 19:56:10 +03:00			`import utils`
			`from fairseq import checkpoint_utils`
			`import librosa`
			`providers = ['OpenVINOExecutionProvider', "CUDAExecutionProvider", "DmlExecutionProvider", "CPUExecutionProvider"]`


			`@dataclass`
			`class SoVitsSvc40v2Settings():`
			`gpu: int = 0`
WIP: support so-vits-svc, debug dstid 2023-03-10 22:50:59 +03:00			`dstId: int = 0`
WIP: add so-vits-svc 2023-03-10 19:56:10 +03:00
			`f0Detector: str = "dio" # dio or harvest`
WIP: support so-vits-svc, suppress log 2 2023-03-10 22:30:44 +03:00			`tran: int = 20`
WIP: support so-vits-svc, suppress log, update setting parameter 2023-03-10 22:19:59 +03:00			`noiceScale: float = 0.3`
			`predictF0: int = 0 # 0:False, 1:True`
			`silentThreshold: float = 0.00001`
WIP: so-vits-svc 40v2, alpha (refactoring2) 2023-03-12 20:06:39 +03:00			`extraConvertSize: int = 1024 * 32`
WIP: support so-vits-svc 40v2. can not store content vec in indexeddb. 2023-03-13 23:18:37 +03:00			`clusterInferRatio: float = 0.1`
WIP: add so-vits-svc 2023-03-10 19:56:10 +03:00
			`framework: str = "PyTorch" # PyTorch or ONNX`
			`pyTorchModelFile: str = ""`
			`onnxModelFile: str = ""`
			`configFile: str = ""`

			`# ↓mutableな物だけ列挙`
WIP: so-vits-svc 40v2, alpha (refactoring2) 2023-03-12 20:06:39 +03:00			`intData = ["gpu", "dstId", "tran", "predictF0", "extraConvertSize"]`
WIP: support so-vits-svc 40v2. can not store content vec in indexeddb. 2023-03-13 23:18:37 +03:00			`floatData = ["noiceScale", "silentThreshold", "clusterInferRatio"]`
WIP: add so-vits-svc 2023-03-10 19:56:10 +03:00			`strData = ["framework", "f0Detector"]`


			`class SoVitsSvc40v2:`
			`def __init__(self):`
			`self.settings = SoVitsSvc40v2Settings()`
			`self.net_g = None`
			`self.onnx_session = None`

			`self.raw_path = io.BytesIO()`
			`self.gpu_num = torch.cuda.device_count()`
			`self.prevVol = 0`

WIP: support so-vits-svc 40v2. change policy to load hubert model from local. 2023-03-14 03:57:52 +03:00			`def loadModel(self, config: str, pyTorch_model_file: str = None, onnx_model_file: str = None, clusterTorchModel: str = None, hubertTorchModel: str = None):`
			`# !! 注意 !! hubertTorchModelは固定値で上書きされるため、設定しても効果ない。`

WIP: add so-vits-svc 2023-03-10 19:56:10 +03:00			`self.settings.configFile = config`
			`self.hps = utils.get_hparams_from_file(config)`

			`# hubert model`
WIP: support so-vits-svc 40v2. can not store content vec in indexeddb. 2023-03-13 23:18:37 +03:00			`try:`
WIP: support so-vits-svc 40v2. change policy to load hubert model from local. 2023-03-14 03:57:52 +03:00			`# vec_path = hubertTorchModel`
			`vec_path = "hubert/checkpoint_best_legacy_500.pt"`
WIP: support so-vits-svc 40v2. can not store content vec in indexeddb. 2023-03-13 23:18:37 +03:00			`print("hubert 1 ", hubertTorchModel)`
			`models, saved_cfg, task = checkpoint_utils.load_model_ensemble_and_task(`
			`[vec_path],`
			`suffix="",`
			`)`
			`print("hubert 2 ", hubertTorchModel)`
			`model = models[0]`
			`print("hubert 3 ", hubertTorchModel)`
			`model.eval()`
			`print("hubert 4 ", hubertTorchModel)`
			`self.hubert_model = model.cpu()`
			`print("hubert 5 ", hubertTorchModel)`
			`except Exception as e:`
			`print("EXCEPTION1", e)`

			`# cluster`
			`try:`
			`if os.path.exists(clusterTorchModel):`
			`print("load kmean11", clusterTorchModel)`
			`self.cluster_model = cluster.get_cluster_model(clusterTorchModel)`
			`print("load kmean12", clusterTorchModel)`
			`else:`
			`print("load kmean21", clusterTorchModel)`
			`self.cluster_model = None`
			`print("load kmean22", clusterTorchModel)`
			`except Exception as e:`
			`print("EXCEPTION2", e)`
WIP: add so-vits-svc 2023-03-10 19:56:10 +03:00
			`if pyTorch_model_file != None:`
			`self.settings.pyTorchModelFile = pyTorch_model_file`
			`if onnx_model_file:`
			`self.settings.onnxModelFile = onnx_model_file`

			`# PyTorchモデル生成`
			`if pyTorch_model_file != None:`
			`self.net_g = SynthesizerTrn(`
			`self.hps`
			`)`
			`self.net_g.eval()`
			`utils.load_checkpoint(pyTorch_model_file, self.net_g, None)`

			`# # ONNXモデル生成`
			`# if onnx_model_file != None:`
			`# ort_options = onnxruntime.SessionOptions()`
			`# ort_options.intra_op_num_threads = 8`
			`# self.onnx_session = onnxruntime.InferenceSession(`
			`# onnx_model_file,`
			`# providers=providers`
			`# )`
			`return self.get_info()`

			`def update_setteings(self, key: str, val: any):`
			`if key == "onnxExecutionProvider" and self.onnx_session != None:`
			`if val == "CUDAExecutionProvider":`
			`if self.settings.gpu < 0 or self.settings.gpu >= self.gpu_num:`
			`self.settings.gpu = 0`
			`provider_options = [{'device_id': self.settings.gpu}]`
			`self.onnx_session.set_providers(providers=[val], provider_options=provider_options)`
			`else:`
			`self.onnx_session.set_providers(providers=[val])`
			`elif key in self.settings.intData:`
			`setattr(self.settings, key, int(val))`
			`if key == "gpu" and val >= 0 and val < self.gpu_num and self.onnx_session != None:`
			`providers = self.onnx_session.get_providers()`
			`print("Providers:", providers)`
			`if "CUDAExecutionProvider" in providers:`
			`provider_options = [{'device_id': self.settings.gpu}]`
			`self.onnx_session.set_providers(providers=["CUDAExecutionProvider"], provider_options=provider_options)`
			`elif key in self.settings.floatData:`
			`setattr(self.settings, key, float(val))`
			`elif key in self.settings.strData:`
			`setattr(self.settings, key, str(val))`
			`else:`
			`return False`

			`return True`

			`def get_info(self):`
			`data = asdict(self.settings)`

			`data["onnxExecutionProviders"] = self.onnx_session.get_providers() if self.onnx_session != None else []`
			`files = ["configFile", "pyTorchModelFile", "onnxModelFile"]`
			`for f in files:`
			`if data[f] != None and os.path.exists(data[f]):`
			`data[f] = os.path.basename(data[f])`
			`else:`
			`data[f] = ""`

			`return data`

			`def get_processing_sampling_rate(self):`
			`return self.hps.data.sampling_rate`

			`def get_unit_f0(self, audio_buffer, tran):`
			`wav_44k = audio_buffer`
			`# f0 = utils.compute_f0_parselmouth(wav, sampling_rate=self.target_sample, hop_length=self.hop_size)`
			`f0 = utils.compute_f0_dio(wav_44k, sampling_rate=self.hps.data.sampling_rate, hop_length=self.hps.data.hop_length)`
WIP: support so-vits-svc, message impruvement 2023-03-10 21:59:03 +03:00			`if wav_44k.shape[0] % self.hps.data.hop_length != 0:`
			`print(f" !!! !!! !!! wav size not multiple of hopsize: {wav_44k.shape[0] / self.hps.data.hop_length}")`
WIP: add so-vits-svc 2023-03-10 19:56:10 +03:00
			`f0, uv = utils.interpolate_f0(f0)`
			`f0 = torch.FloatTensor(f0)`
			`uv = torch.FloatTensor(uv)`
			`f0 = f0 * 2 ** (tran / 12)`
			`f0 = f0.unsqueeze(0)`
			`uv = uv.unsqueeze(0)`

			`# wav16k = librosa.resample(audio_buffer, orig_sr=24000, target_sr=16000)`
			`wav16k = librosa.resample(audio_buffer, orig_sr=self.hps.data.sampling_rate, target_sr=16000)`
			`wav16k = torch.from_numpy(wav16k)`
			`c = utils.get_hubert_content(self.hubert_model, wav_16k_tensor=wav16k)`
			`c = utils.repeat_expand_2d(c.squeeze(0), f0.shape[1])`
WIP: support so-vits-svc 40v2. can not store content vec in indexeddb. 2023-03-13 23:18:37 +03:00
			`if self.settings.clusterInferRatio != 0 and self.cluster_model != None:`
			`# self.hsp.spk.tsukuyomi`
			`cluster_c = cluster.get_cluster_center_result(self.cluster_model, c.cpu().numpy().T, "tsukuyomi").T`
			`# cluster_c = cluster.get_cluster_center_result(self.cluster_model, c.cpu().numpy().T, self.settings.dstId).T`
			`cluster_c = torch.FloatTensor(cluster_c).cpu()`
			`c = self.settings.clusterInferRatio * cluster_c + (1 - self.settings.clusterInferRatio) * c`

WIP: add so-vits-svc 2023-03-10 19:56:10 +03:00			`c = c.unsqueeze(0)`
			`return c, f0, uv`

WIP: so-vits-svc 40v2, alpha (refactoring) 2023-03-12 19:36:14 +03:00			`def generate_input(self, newData: any, inputSize: int, crossfadeSize: int):`
WIP: add so-vits-svc 2023-03-10 19:56:10 +03:00			`newData = newData.astype(np.float32) / self.hps.data.max_wav_value`

			`if hasattr(self, "audio_buffer"):`
			`self.audio_buffer = np.concatenate([self.audio_buffer, newData], 0) # 過去のデータに連結`
			`else:`
			`self.audio_buffer = newData`

WIP: so-vits-svc 40v2, alpha (refactoring2) 2023-03-12 20:06:39 +03:00			`convertSize = inputSize + crossfadeSize + self.settings.extraConvertSize`
WIP: add so-vits-svc 2023-03-10 19:56:10 +03:00
WIP: so-vits-svc 40v2, alpha (refactoring) 2023-03-12 19:36:14 +03:00			`if convertSize % self.hps.data.hop_length != 0: # モデルの出力のホップサイズで切り捨てが発生するので補う。`
			`convertSize = convertSize + (self.hps.data.hop_length - (convertSize % self.hps.data.hop_length))`

			`self.audio_buffer = self.audio_buffer[-1 * convertSize:] # 変換対象の部分だけ抽出`

			`crop = self.audio_buffer[-1 * (inputSize + crossfadeSize):-1 * (crossfadeSize)]`
WIP: add so-vits-svc 2023-03-10 19:56:10 +03:00
			`rms = np.sqrt(np.square(crop).mean(axis=0))`
update 2023-03-11 03:53:10 +03:00			`vol = max(rms, self.prevVol * 0.0)`
WIP: add so-vits-svc 2023-03-10 19:56:10 +03:00			`self.prevVol = vol`

WIP: support so-vits-svc, suppress log, update setting parameter 2023-03-10 22:19:59 +03:00			`c, f0, uv = self.get_unit_f0(self.audio_buffer, self.settings.tran)`
WIP: add so-vits-svc 2023-03-10 19:56:10 +03:00			`return (c, f0, uv, convertSize, vol)`

			`def _onnx_inference(self, data):`
			`pass`

			`def _pyTorch_inference(self, data):`
			`if hasattr(self, "net_g") == False or self.net_g == None:`
			`print("[Voice Changer] No pyTorch session.")`
			`return np.zeros(1).astype(np.int16)`

			`if self.settings.gpu < 0 or self.gpu_num == 0:`
			`dev = torch.device("cpu")`
			`else:`
			`dev = torch.device("cuda", index=self.settings.gpu)`

			`convertSize = data[3]`
			`vol = data[4]`
			`data = (data[0], data[1], data[2],)`

WIP: support so-vits-svc, suppress log, update setting parameter 2023-03-10 22:19:59 +03:00			`if vol < self.settings.silentThreshold:`
			`return np.zeros(convertSize).astype(np.int16)`
WIP: add so-vits-svc 2023-03-10 19:56:10 +03:00
			`with torch.no_grad():`
			`c, f0, uv = [x.to(dev)for x in data]`
WIP: support so-vits-svc, suppress log, update setting parameter 2023-03-10 22:19:59 +03:00			`sid_target = torch.LongTensor([self.settings.dstId]).to(dev)`
WIP: add so-vits-svc 2023-03-10 19:56:10 +03:00			`self.net_g.to(dev)`
			`# audio1 = self.net_g.infer(c, f0=f0, g=sid_target, uv=uv, predict_f0=True, noice_scale=0.1)[0][0, 0].data.float()`
WIP: support so-vits-svc, suppress log, update setting parameter 2023-03-10 22:19:59 +03:00			`predict_f0_flag = True if self.settings.predictF0 == 1 else False`
			`audio1 = self.net_g.infer(c, f0=f0, g=sid_target, uv=uv, predict_f0=predict_f0_flag,`
			`noice_scale=self.settings.noiceScale)[0][0, 0].data.float()`
WIP: add so-vits-svc 2023-03-10 19:56:10 +03:00			`audio1 = audio1 * self.hps.data.max_wav_value`

gain cotrol 2023-03-12 21:32:21 +03:00			`audio1 = audio1 * vol`

WIP: add so-vits-svc 2023-03-10 19:56:10 +03:00			`result = audio1.float().cpu().numpy()`

			`# result = infer_tool.pad_array(result, length)`
			`return result`

			`def inference(self, data):`
			`if self.settings.framework == "ONNX":`
			`audio = self._onnx_inference(data)`
			`else:`
			`audio = self._pyTorch_inference(data)`
			`return audio`

			`def destroy(self):`
			`del self.net_g`
			`del self.onnx_session`