speakerの自動検知

2025-01-23 21:45:00 +03:00 · 2023-07-04 06:50:58 +09:00 · 2023-07-04 06:50:58 +09:00 · d0224a5e50
commit d0224a5e50
parent 70956fafeb
2 changed files with 5 additions and 1 deletions
--- a/server/voice_changer/RVC/RVC.py
+++ b/server/voice_changer/RVC/RVC.py
@ -144,7 +144,7 @@ class RVC(VoiceChangerModel):

        audio = torchaudio.functional.resample(audio, self.slotInfo.samplingRate, 16000, rolloff=0.99)
        repeat = 1 if self.settings.rvcQuality else 0
-        sid = 0
+        sid = self.settings.dstId
        f0_up_key = self.settings.tran
        index_rate = self.settings.indexRatio
        protect = self.settings.protect
--- a/server/voice_changer/RVC/RVCModelSlotGenerator.py
+++ b/server/voice_changer/RVC/RVCModelSlotGenerator.py
@ -100,6 +100,10 @@ class RVCModelSlotGenerator(ModelSlotGenerator):
            if slot.embedder.endswith("768"):
                slot.embedder = slot.embedder[:-3]

+            if "speaker_info" in cpt.keys():
+                for k, v in cpt["speaker_info"].items():
+                    slot.speakers[int(k)] = str(v)
+
            # if slot.embedder == EnumEmbedderTypes.hubert.value:
            #     slot.embedder = EnumEmbedderTypes.hubert
            # elif slot.embedder == EnumEmbedderTypes.contentvec.value: