voice-changer/server/voice_changer/VoiceChangerManager.py

import numpy as np
import threading
from data.ModelSample import ModelSamples
from data.ModelSlot import ModelSlots, loadSlotInfo
from utils.downloader.SampleDownloader import downloadSample, getSampleInfos
from voice_changer.Local.AudioDeviceList import ServerAudioDevice, list_audio_device
from voice_changer.Local.ServerDevice import ServerDevice
from voice_changer.RVC.ModelSlotGenerator import setSlotAsRVC

from voice_changer.VoiceChanger import VoiceChanger
from const import MAX_SLOT_NUM, VoiceChangerType
from voice_changer.utils.VoiceChangerModel import AudioInOut
from voice_changer.utils.VoiceChangerParams import VoiceChangerParams

from dataclasses import dataclass, asdict, field
import torch
import json


@dataclass()
class GPUInfo:
    id: int
    name: str
    memory: int


@dataclass()
class VoiceChangerManagerSettings:
    slotIndex: int

    intData: list[str] = field(default_factory=lambda: ["slotIndex"])


class VoiceChangerManager(object):
    _instance = None

    def __init__(self, params: VoiceChangerParams):
        self.voiceChanger: VoiceChanger = None
        self.settings: VoiceChangerManagerSettings = VoiceChangerManagerSettings(slotIndex=0)
        self.params: VoiceChangerParams = params

        self.serverDevice = ServerDevice()

        # スタティックな情報を収集
        self.sampleModels: list[ModelSamples] = getSampleInfos(self.params.sample_mode)
        self.gpus: list[GPUInfo] = self._get_gpuInfos()

        audioinput, audiooutput = list_audio_device()
        self.serverAudioInputDevices: list[ServerAudioDevice] = audioinput
        self.serverAudioOutputDevices: list[ServerAudioDevice] = audiooutput

        # ServerDevice
        thread = threading.Thread(target=self.serverDevice.serverLocal, args=(self,))
        thread.start()

    def _get_gpuInfos(self):
        devCount = torch.cuda.device_count()
        gpus = []
        for id in range(devCount):
            name = torch.cuda.get_device_name(id)
            memory = torch.cuda.get_device_properties(id).total_memory
            gpu = {"id": id, "name": name, "memory": memory}
            gpus.append(gpu)
        return gpus

    @classmethod
    def get_instance(cls, params: VoiceChangerParams):
        if cls._instance is None:
            cls._instance = cls(params)

            gpu_num = torch.cuda.device_count()
            mps_enabled: bool = getattr(torch.backends, "mps", None) is not None and torch.backends.mps.is_available()
            print(f"VoiceChanger Initialized (GPU_NUM:{gpu_num}, mps_enabled:{mps_enabled})")

            cls._instance.voiceChanger = VoiceChanger(params, cls._instance.settings.slotIndex)
            cls._instance.voiceChanger.prepareModel()
        return cls._instance

    def loadModel(self, slot: int, voiceChangerType: VoiceChangerType, params: str):
        print(slot, voiceChangerType, params)
        paramDict = json.loads(params)
        if voiceChangerType == "RVC":
            if "sampleId" in paramDict and len(paramDict["sampleId"]) > 0:
                print("[Voice Canger]: Download RVC sample.")
                downloadSample(self.params.sample_mode, paramDict["sampleId"], self.params.model_dir, slot, {"useIndex": paramDict["rvcIndexDownload"]})
            else:
                print("[Voice Canger]: Set uploaded RVC model to slot.")
                setSlotAsRVC(self.params.model_dir, slot, paramDict)

        return self.get_info()

    def get_slotInfos(self):
        slotInfos: list[ModelSlots] = []
        for slotIndex in range(MAX_SLOT_NUM):
            slotInfo = loadSlotInfo(self.params.model_dir, slotIndex)
            slotInfos.append(slotInfo)
        return slotInfos

    def get_info(self):
        data = asdict(self.settings)
        slotInfos = self.get_slotInfos()
        data["slotInfos"] = slotInfos
        data["gpus"] = self.gpus
        data["sampleModels"] = self.sampleModels
        data["serverAudioInputDevices"] = self.serverAudioInputDevices
        data["serverAudioOutputDevices"] = self.serverAudioOutputDevices

        data["status"] = "OK"
        if hasattr(self, "voiceChanger"):
            info = self.voiceChanger.get_info()
            data.update(info)
            return data
        else:
            return {"status": "ERROR", "msg": "no model loaded"}

    def get_performance(self):
        if hasattr(self, "voiceChanger"):
            info = self.voiceChanger.get_performance()
            return info
        else:
            return {"status": "ERROR", "msg": "no model loaded"}

    def update_settings(self, key: str, val: str | int | float):
        if key in self.settings.intData:
            setattr(self.settings, key, int(val))
            if key == "slotIndex":
                val = val % 1000  # Quick hack for same slot is selected
                setattr(self.settings, key, int(val))

                newVoiceChanger = VoiceChanger(self.params, self.settings.slotIndex)
                newVoiceChanger.prepareModel()
                self.serverDevice.serverLocal(newVoiceChanger)
                del self.voiceChanger
                self.voiceChanger = newVoiceChanger
        elif hasattr(self, "voiceChanger"):
            self.voiceChanger.update_settings(key, val)
        else:
            print(f"[Voice Changer] update is not handled. ({key}:{val})")
        return self.get_info()

    def changeVoice(self, receivedData: AudioInOut):
        if hasattr(self, "voiceChanger") is True:
            return self.voiceChanger.on_request(receivedData)
        else:
            print("Voice Change is not loaded. Did you load a correct model?")
            return np.zeros(1).astype(np.int16), []

    def export2onnx(self):
        return self.voiceChanger.export2onnx()

    def merge_models(self, request: str):
        return self.voiceChanger.merge_models(request)

    def update_model_default(self):
        return self.voiceChanger.update_model_default()

    def update_model_info(self, newData: str):
        return self.voiceChanger.update_model_info(newData)

    def upload_model_assets(self, params: str):
        return self.voiceChanger.upload_model_assets(params)
separate sio 2022-12-31 10:02:53 +03:00			`import numpy as np`
WIP: refactoring 2023-06-15 18:56:18 +03:00			`import threading`
			`from data.ModelSample import ModelSamples`
			`from data.ModelSlot import ModelSlots, loadSlotInfo`
			`from utils.downloader.SampleDownloader import downloadSample, getSampleInfos`
WIP:refactoring 2023-06-15 19:49:49 +03:00			`from voice_changer.Local.AudioDeviceList import ServerAudioDevice, list_audio_device`
WIP: refactoring 2023-06-15 18:56:18 +03:00			`from voice_changer.Local.ServerDevice import ServerDevice`
			`from voice_changer.RVC.ModelSlotGenerator import setSlotAsRVC`

separate log control 2022-12-31 10:08:14 +03:00			`from voice_changer.VoiceChanger import VoiceChanger`
WIP: refactoring 2023-06-15 18:56:18 +03:00			`from const import MAX_SLOT_NUM, VoiceChangerType`
WIP: refactoring 2023-04-28 00:39:51 +03:00			`from voice_changer.utils.VoiceChangerModel import AudioInOut`
refactoring 2023-04-27 17:38:25 +03:00			`from voice_changer.utils.VoiceChangerParams import VoiceChangerParams`
separate sio 2022-12-31 10:02:53 +03:00
WIP: refactoring 2023-06-15 18:56:18 +03:00			`from dataclasses import dataclass, asdict, field`
			`import torch`
			`import json`


			`@dataclass()`
			`class GPUInfo:`
			`id: int`
			`name: str`
			`memory: int`


			`@dataclass()`
			`class VoiceChangerManagerSettings:`
			`slotIndex: int`
WIP:refactoring 2023-06-15 19:49:49 +03:00
WIP: refactoring 2023-06-15 18:56:18 +03:00			`intData: list[str] = field(default_factory=lambda: ["slotIndex"])`

WIP: store stting 1 2023-01-29 03:42:45 +03:00
refactoring 2023-04-27 17:38:25 +03:00			`class VoiceChangerManager(object):`
			`_instance = None`
WIP: refactoring 2023-06-15 18:56:18 +03:00
			`def __init__(self, params: VoiceChangerParams):`
			`self.voiceChanger: VoiceChanger = None`
			`self.settings: VoiceChangerManagerSettings = VoiceChangerManagerSettings(slotIndex=0)`
			`self.params: VoiceChangerParams = params`

			`self.serverDevice = ServerDevice()`

			`# スタティックな情報を収集`
			`self.sampleModels: list[ModelSamples] = getSampleInfos(self.params.sample_mode)`
			`self.gpus: list[GPUInfo] = self._get_gpuInfos()`

WIP:refactoring 2023-06-15 19:49:49 +03:00			`audioinput, audiooutput = list_audio_device()`
			`self.serverAudioInputDevices: list[ServerAudioDevice] = audioinput`
			`self.serverAudioOutputDevices: list[ServerAudioDevice] = audiooutput`

			`# ServerDevice`
			`thread = threading.Thread(target=self.serverDevice.serverLocal, args=(self,))`
			`thread.start()`

WIP: refactoring 2023-06-15 18:56:18 +03:00			`def _get_gpuInfos(self):`
			`devCount = torch.cuda.device_count()`
			`gpus = []`
			`for id in range(devCount):`
			`name = torch.cuda.get_device_name(id)`
			`memory = torch.cuda.get_device_properties(id).total_memory`
			`gpu = {"id": id, "name": name, "memory": memory}`
			`gpus.append(gpu)`
			`return gpus`
refactoring 2023-04-27 17:38:25 +03:00
separate sio 2022-12-31 10:02:53 +03:00			`@classmethod`
refactoring 2023-04-27 17:38:25 +03:00			`def get_instance(cls, params: VoiceChangerParams):`
			`if cls._instance is None:`
WIP: refactoring 2023-06-15 18:56:18 +03:00			`cls._instance = cls(params)`

			`gpu_num = torch.cuda.device_count()`
			`mps_enabled: bool = getattr(torch.backends, "mps", None) is not None and torch.backends.mps.is_available()`
			`print(f"VoiceChanger Initialized (GPU_NUM:{gpu_num}, mps_enabled:{mps_enabled})")`

			`cls._instance.voiceChanger = VoiceChanger(params, cls._instance.settings.slotIndex)`
			`cls._instance.voiceChanger.prepareModel()`
separate sio 2022-12-31 10:02:53 +03:00			`return cls._instance`

WIP: refactoring 2023-06-15 18:56:18 +03:00			`def loadModel(self, slot: int, voiceChangerType: VoiceChangerType, params: str):`
			`print(slot, voiceChangerType, params)`
			`paramDict = json.loads(params)`
			`if voiceChangerType == "RVC":`
			`if "sampleId" in paramDict and len(paramDict["sampleId"]) > 0:`
			`print("[Voice Canger]: Download RVC sample.")`
			`downloadSample(self.params.sample_mode, paramDict["sampleId"], self.params.model_dir, slot, {"useIndex": paramDict["rvcIndexDownload"]})`
			`else:`
			`print("[Voice Canger]: Set uploaded RVC model to slot.")`
			`setSlotAsRVC(self.params.model_dir, slot, paramDict)`

			`return self.get_info()`

			`def get_slotInfos(self):`
			`slotInfos: list[ModelSlots] = []`
			`for slotIndex in range(MAX_SLOT_NUM):`
			`slotInfo = loadSlotInfo(self.params.model_dir, slotIndex)`
			`slotInfos.append(slotInfo)`
			`return slotInfos`
separate sio 2022-12-31 10:02:53 +03:00
wip:model upload, set provider 2023-01-07 18:25:21 +03:00			`def get_info(self):`
WIP: refactoring 2023-06-15 18:56:18 +03:00			`data = asdict(self.settings)`
			`slotInfos = self.get_slotInfos()`
			`data["slotInfos"] = slotInfos`
			`data["gpus"] = self.gpus`
			`data["sampleModels"] = self.sampleModels`
WIP:refactoring 2023-06-15 19:49:49 +03:00			`data["serverAudioInputDevices"] = self.serverAudioInputDevices`
			`data["serverAudioOutputDevices"] = self.serverAudioOutputDevices`
WIP: refactoring 2023-06-15 18:56:18 +03:00
			`data["status"] = "OK"`
refactoring 2023-04-27 17:38:25 +03:00			`if hasattr(self, "voiceChanger"):`
api return info 2023-01-10 16:49:16 +03:00			`info = self.voiceChanger.get_info()`
WIP: refactoring 2023-06-15 18:56:18 +03:00			`data.update(info)`
			`return data`
wip:model upload, set provider 2023-01-07 18:25:21 +03:00			`else:`
WIP: store stting 1 2023-01-29 03:42:45 +03:00			`return {"status": "ERROR", "msg": "no model loaded"}`
server audio 2023-05-06 22:18:18 +03:00
			`def get_performance(self):`
			`if hasattr(self, "voiceChanger"):`
			`info = self.voiceChanger.get_performance()`
			`return info`
			`else:`
			`return {"status": "ERROR", "msg": "no model loaded"}`
wip:model upload, set provider 2023-01-07 18:25:21 +03:00
WIP: refactoring 2023-04-28 00:39:51 +03:00			`def update_settings(self, key: str, val: str \| int \| float):`
WIP: refactoring 2023-06-15 18:56:18 +03:00			`if key in self.settings.intData:`
			`setattr(self.settings, key, int(val))`
			`if key == "slotIndex":`
			`val = val % 1000 # Quick hack for same slot is selected`
			`setattr(self.settings, key, int(val))`

			`newVoiceChanger = VoiceChanger(self.params, self.settings.slotIndex)`
			`newVoiceChanger.prepareModel()`
			`self.serverDevice.serverLocal(newVoiceChanger)`
			`del self.voiceChanger`
			`self.voiceChanger = newVoiceChanger`
			`elif hasattr(self, "voiceChanger"):`
			`self.voiceChanger.update_settings(key, val)`
wip:model upload, set provider 2023-01-07 18:25:21 +03:00			`else:`
WIP: refactoring 2023-06-15 18:56:18 +03:00			`print(f"[Voice Changer] update is not handled. ({key}:{val})")`
			`return self.get_info()`
gui temp 2023-01-08 10:18:20 +03:00
WIP: refactoring 2023-04-28 00:39:51 +03:00			`def changeVoice(self, receivedData: AudioInOut):`
refactoring 2023-04-27 17:38:25 +03:00			`if hasattr(self, "voiceChanger") is True:`
WIP: refactor, break down generate input 2023-03-07 17:14:14 +03:00			`return self.voiceChanger.on_request(receivedData)`
WIP:client work v000 2023-01-04 20:28:36 +03:00			`else:`
			`print("Voice Change is not loaded. Did you load a correct model?")`
update 2023-02-20 22:07:43 +03:00			`return np.zeros(1).astype(np.int16), []`
WIP:VC select 2023-04-10 18:21:17 +03:00
support onnx generater 2023-04-13 02:00:28 +03:00			`def export2onnx(self):`
			`return self.voiceChanger.export2onnx()`
merge models 2023-04-30 20:34:01 +03:00
			`def merge_models(self, request: str):`
			`return self.voiceChanger.merge_models(request)`
support rvc v2 onnx 2023-05-20 22:21:54 +03:00
			`def update_model_default(self):`
			`return self.voiceChanger.update_model_default()`
WIP: slot manager 2023-06-07 21:08:59 +03:00
			`def update_model_info(self, newData: str):`
			`return self.voiceChanger.update_model_info(newData)`

			`def upload_model_assets(self, params: str):`
			`return self.voiceChanger.upload_model_assets(params)`