Merge pull request #392 from nadare881/autospeaker

speakerの自動検知
2025-01-23 21:45:00 +03:00 · 2023-07-04 17:08:32 +09:00 · 2023-07-04 17:08:32 +09:00 · adb8371089
commit adb8371089
parent fa07de80fb d0224a5e50
2 changed files with 5 additions and 1 deletions
--- a/server/voice_changer/RVC/RVC.py
+++ b/server/voice_changer/RVC/RVC.py
@ -162,7 +162,7 @@ class RVC(VoiceChangerModel):
        audio = torch.from_numpy(audio).to(device=device, dtype=torch.float32)
        audio = torchaudio.functional.resample(audio, self.slotInfo.samplingRate, 16000, rolloff=0.99)
        repeat = 1 if self.settings.rvcQuality else 0
-        sid = 0
+        sid = self.settings.dstId
        f0_up_key = self.settings.tran
        index_rate = self.settings.indexRatio
        protect = self.settings.protect
--- a/server/voice_changer/RVC/RVCModelSlotGenerator.py
+++ b/server/voice_changer/RVC/RVCModelSlotGenerator.py
@ -100,6 +100,10 @@ class RVCModelSlotGenerator(ModelSlotGenerator):
            if slot.embedder.endswith("768"):
                slot.embedder = slot.embedder[:-3]

+            if "speaker_info" in cpt.keys():
+                for k, v in cpt["speaker_info"].items():
+                    slot.speakers[int(k)] = str(v)
+
            # if slot.embedder == EnumEmbedderTypes.hubert.value:
            #     slot.embedder = EnumEmbedderTypes.hubert
            # elif slot.embedder == EnumEmbedderTypes.contentvec.value: