voice-changer/server/voice_changer/RVC/export2onnx.py

import json
import torch
from onnxsim import simplify
import onnx

from voice_changer.RVC.onnx.SynthesizerTrnMs256NSFsid_ONNX import (
    SynthesizerTrnMs256NSFsid_ONNX,
)
from voice_changer.RVC.onnx.SynthesizerTrnMs256NSFsid_nono_ONNX import (
    SynthesizerTrnMs256NSFsid_nono_ONNX,
)
from voice_changer.RVC.onnx.SynthesizerTrnMsNSFsidNono_webui_ONNX import (
    SynthesizerTrnMsNSFsidNono_webui_ONNX,
)
from voice_changer.RVC.onnx.SynthesizerTrnMsNSFsid_webui_ONNX import (
    SynthesizerTrnMsNSFsid_webui_ONNX,
)
from .const import RVC_MODEL_TYPE_RVC, RVC_MODEL_TYPE_WEBUI


def export2onnx(input_model, output_model, output_model_simple, is_half, metadata):
    cpt = torch.load(input_model, map_location="cpu")
    if is_half:
        dev = torch.device("cuda", index=0)
    else:
        dev = torch.device("cpu")

    if metadata["f0"] is True and metadata["modelType"] == RVC_MODEL_TYPE_RVC:
        net_g_onnx = SynthesizerTrnMs256NSFsid_ONNX(*cpt["config"], is_half=is_half)
    elif metadata["f0"] is True and metadata["modelType"] == RVC_MODEL_TYPE_WEBUI:
        net_g_onnx = SynthesizerTrnMsNSFsid_webui_ONNX(**cpt["params"], is_half=is_half)
    elif metadata["f0"] is False and metadata["modelType"] == RVC_MODEL_TYPE_RVC:
        net_g_onnx = SynthesizerTrnMs256NSFsid_nono_ONNX(*cpt["config"])
    elif metadata["f0"] is False and metadata["modelType"] == RVC_MODEL_TYPE_WEBUI:
        net_g_onnx = SynthesizerTrnMsNSFsidNono_webui_ONNX(**cpt["params"])

    net_g_onnx.eval().to(dev)
    net_g_onnx.load_state_dict(cpt["weight"], strict=False)
    if is_half:
        net_g_onnx = net_g_onnx.half()

    if is_half:
        feats = torch.HalfTensor(1, 2192, metadata["embChannels"]).to(dev)
    else:
        feats = torch.FloatTensor(1, 2192, metadata["embChannels"]).to(dev)
    p_len = torch.LongTensor([2192]).to(dev)
    sid = torch.LongTensor([0]).to(dev)

    if metadata["f0"] is True:
        pitch = torch.zeros(1, 2192, dtype=torch.int64).to(dev)
        pitchf = torch.FloatTensor(1, 2192).to(dev)
        input_names = ["feats", "p_len", "pitch", "pitchf", "sid"]
        inputs = (
            feats,
            p_len,
            pitch,
            pitchf,
            sid,
        )

    else:
        input_names = ["feats", "p_len", "sid"]
        inputs = (
            feats,
            p_len,
            sid,
        )

    output_names = [
        "audio",
    ]

    torch.onnx.export(
        net_g_onnx,
        inputs,
        output_model,
        dynamic_axes={
            "feats": [1],
            "pitch": [1],
            "pitchf": [1],
        },
        do_constant_folding=False,
        opset_version=17,
        verbose=False,
        input_names=input_names,
        output_names=output_names,
    )

    model_onnx2 = onnx.load(output_model)
    model_simp, check = simplify(model_onnx2)
    meta = model_simp.metadata_props.add()
    meta.key = "metadata"
    meta.value = json.dumps(metadata)
    onnx.save(model_simp, output_model_simple)
WIP: support rvc-webui, pitch-less is not support yet 2023-04-23 23:54:36 +03:00			`import json`
support onnx generater 2023-04-13 02:00:28 +03:00			`import torch`
			`from onnxsim import simplify`
			`import onnx`

WIP: refactoring 2023-04-28 02:46:34 +03:00			`from voice_changer.RVC.onnx.SynthesizerTrnMs256NSFsid_ONNX import (`
			`SynthesizerTrnMs256NSFsid_ONNX,`
			`)`
			`from voice_changer.RVC.onnx.SynthesizerTrnMs256NSFsid_nono_ONNX import (`
			`SynthesizerTrnMs256NSFsid_nono_ONNX,`
			`)`
			`from voice_changer.RVC.onnx.SynthesizerTrnMsNSFsidNono_webui_ONNX import (`
			`SynthesizerTrnMsNSFsidNono_webui_ONNX,`
			`)`
			`from voice_changer.RVC.onnx.SynthesizerTrnMsNSFsid_webui_ONNX import (`
			`SynthesizerTrnMsNSFsid_webui_ONNX,`
			`)`
WIP: support rvc-webui, refactoring 2023-04-24 11:39:31 +03:00			`from .const import RVC_MODEL_TYPE_RVC, RVC_MODEL_TYPE_WEBUI`
support onnx generater 2023-04-13 02:00:28 +03:00

WIP: support rvc-webui, pitch-less is not support yet 2023-04-23 23:54:36 +03:00			`def export2onnx(input_model, output_model, output_model_simple, is_half, metadata):`
support onnx generater 2023-04-13 02:00:28 +03:00			`cpt = torch.load(input_model, map_location="cpu")`
			`if is_half:`
			`dev = torch.device("cuda", index=0)`
			`else:`
			`dev = torch.device("cpu")`

WIP: refactoring 2023-04-28 02:46:34 +03:00			`if metadata["f0"] is True and metadata["modelType"] == RVC_MODEL_TYPE_RVC:`
WIP: support rvc-webui, pitch-less is not support yet 2023-04-23 23:54:36 +03:00			`net_g_onnx = SynthesizerTrnMs256NSFsid_ONNX(*cpt["config"], is_half=is_half)`
WIP: refactoring 2023-04-28 02:46:34 +03:00			`elif metadata["f0"] is True and metadata["modelType"] == RVC_MODEL_TYPE_WEBUI:`
WIP: support rvc-webui, refactoring 2023-04-24 11:39:31 +03:00			`net_g_onnx = SynthesizerTrnMsNSFsid_webui_ONNX(**cpt["params"], is_half=is_half)`
WIP: refactoring 2023-04-28 02:46:34 +03:00			`elif metadata["f0"] is False and metadata["modelType"] == RVC_MODEL_TYPE_RVC:`
WIP: support rvc-webui, pitch-less is not support yet 2023-04-23 23:54:36 +03:00			`net_g_onnx = SynthesizerTrnMs256NSFsid_nono_ONNX(*cpt["config"])`
WIP: refactoring 2023-04-28 02:46:34 +03:00			`elif metadata["f0"] is False and metadata["modelType"] == RVC_MODEL_TYPE_WEBUI:`
WIP: support rvc-webui, refactoring 2023-04-24 11:39:31 +03:00			`net_g_onnx = SynthesizerTrnMsNSFsidNono_webui_ONNX(**cpt["params"])`
WIP: support rvc-webui, pitch-less is not support yet 2023-04-23 23:54:36 +03:00
update 2023-04-14 09:25:52 +03:00			`net_g_onnx.eval().to(dev)`
support onnx generater 2023-04-13 02:00:28 +03:00			`net_g_onnx.load_state_dict(cpt["weight"], strict=False)`
			`if is_half:`
			`net_g_onnx = net_g_onnx.half()`

			`if is_half:`
WIP: support rvc-webui, refactoring 2023-04-24 11:39:31 +03:00			`feats = torch.HalfTensor(1, 2192, metadata["embChannels"]).to(dev)`
support onnx generater 2023-04-13 02:00:28 +03:00			`else:`
WIP: support rvc-webui, refactoring 2023-04-24 11:39:31 +03:00			`feats = torch.FloatTensor(1, 2192, metadata["embChannels"]).to(dev)`
support onnx generater 2023-04-13 02:00:28 +03:00			`p_len = torch.LongTensor([2192]).to(dev)`
			`sid = torch.LongTensor([0]).to(dev)`

WIP: refactoring 2023-04-28 02:46:34 +03:00			`if metadata["f0"] is True:`
WIP: support rvc-webui, pitch-less is not support yet 2023-04-23 23:54:36 +03:00			`pitch = torch.zeros(1, 2192, dtype=torch.int64).to(dev)`
			`pitchf = torch.FloatTensor(1, 2192).to(dev)`
			`input_names = ["feats", "p_len", "pitch", "pitchf", "sid"]`
WIP: refactoring 2023-04-28 02:46:34 +03:00			`inputs = (`
			`feats,`
			`p_len,`
			`pitch,`
			`pitchf,`
			`sid,`
			`)`
WIP: support rvc-webui, pitch-less is not support yet 2023-04-23 23:54:36 +03:00
			`else:`
			`input_names = ["feats", "p_len", "sid"]`
WIP: refactoring 2023-04-28 02:46:34 +03:00			`inputs = (`
			`feats,`
			`p_len,`
			`sid,`
			`)`

			`output_names = [`
			`"audio",`
			`]`

			`torch.onnx.export(`
			`net_g_onnx,`
			`inputs,`
			`output_model,`
			`dynamic_axes={`
			`"feats": [1],`
			`"pitch": [1],`
			`"pitchf": [1],`
			`},`
			`do_constant_folding=False,`
			`opset_version=17,`
			`verbose=False,`
			`input_names=input_names,`
			`output_names=output_names,`
			`)`
support onnx generater 2023-04-13 02:00:28 +03:00
			`model_onnx2 = onnx.load(output_model)`
			`model_simp, check = simplify(model_onnx2)`
WIP: support rvc-webui, pitch-less is not support yet 2023-04-23 23:54:36 +03:00			`meta = model_simp.metadata_props.add()`
			`meta.key = "metadata"`
			`meta.value = json.dumps(metadata)`
support onnx generater 2023-04-13 02:00:28 +03:00			`onnx.save(model_simp, output_model_simple)`