リアルタイムボイスチェンジャー Realtime Voice Changer
Go to file
2023-01-11 18:15:35 +09:00
client client/demo 2023-01-11 15:46:31 +09:00
docker fin v.1.3.0 2023-01-11 18:07:59 +09:00
docker_onnx WIP refactoring 2023-01-07 20:07:39 +09:00
docs update 2022-11-12 09:26:28 +09:00
script refactoring 2023-01-06 01:37:29 +09:00
server update 2023-01-11 17:51:41 +09:00
.gitignore WIP:Docker 2023-01-11 05:17:29 +09:00
LICENSE add license 2022-08-24 09:50:45 +09:00
MMVCTrainerFrontendDemo.ipynb Colaboratory を使用して作成しました 2022-12-11 09:15:57 +09:00
package-lock.json update 2022-08-27 11:43:55 +09:00
package.json WIP refactoring 2023-01-07 20:07:39 +09:00
README.md update 2022-12-11 07:42:11 +09:00
SoftVcDemo.ipynb Colaboratory を使用して作成しました 2022-10-29 09:56:28 +09:00
start2.sh additional commit 2023-01-11 18:14:52 +09:00
start_v0.1.sh update 2022-10-30 00:58:21 +09:00
VoiceChangerDemo_Simple.ipynb Colaboratory を使用して作成しました 2022-12-10 14:53:12 +09:00
VoiceChangerDemo.ipynb Colaboratory を使用して作成しました 2022-12-10 15:10:01 +09:00
VoiceRecorder.ipynb Colaboratory を使用して作成しました 2022-11-09 04:12:09 +09:00

Voice Changer Trainer and Player

News

2022/12/09: Anacondaに対応しました(β版)。以下の構成に対応します。動作確認状況はWikiをご確認ください。

# os middle
1 Windows Anaconda
2 Windows(WSL2) Docker
3 Windows(WSL2) Anaconda
4 Mac(Intel) Anaconda
5 Mac(M1) Anaconda
6 Linux Docker
7 Linux Anaconda
8 Colab Notebook

概要

AIを使ったリアルタイムボイスチェンジャーMMVCのヘルパーアプリケーションです。

MMVCで必要となる一連の作業トレーニング用の音声の録音、トレーニング、ボイスチェンジャをお手軽に実行できます。 image

このアプリケーションを用いることで、以下のことを簡単に行うことができます。

  • MMVCトレーニング用の音声録音 (GithubPages (ローカル環境構築不要))
  • MMVCのモデルのトレーニング (Dockerを強く推奨、その他構成Colabでも可)
  • MMVCモデルを用いたリアルタイムボイスチェンジャー
    • リアルタイム話者切り替え
    • CPU/GPU切り替え
    • リアルタイム/ニアリアルタイム声質変換

本アプリケーションのリアルタイムボイスチェンジャーは、サーバ・クライアント構成で動きます。MMVCのサーバを別のPC上で動かすことで、ゲーム実況など他の負荷の高い処理への影響を抑えながら動かすことができます。

image

使用方法

以下では、使用方法のダイジェストのみ記載します。詳細な使用方法等はwikiをご参照ください。

レコーダー(トレーニング用音声録音アプリ)

MMVCトレーニング用の音声を簡単に録音できるアプリです。 Github Pages上で実行できるため、Dockerの準備は不要です。

録音アプリ on Github Pages

録音したデータは、ブラウザ上に保存されます。外部に一切漏れることはありません。

トレーナー(トレーニング用アプリ)

MMVCのトレーニングを行うアプリです。 Dockerでの実行を強く推奨します。

Colaboratoryでの実行を行う場合は、次のートから実行できます。

Colaboratoryで実行する場合は、Colabの制約により途中切断が発生する可能性があります。Web上では各種対策が示されていますので、必要に応じて各自でご対応をお願いします。また、途中切断に備え、こまめなモデルのダウンロードをお勧めします。

プレイヤー(ボイスチェンジャーアプリ)

MMVCでボイチェンを行うためのアプリです。 お手元のPCでの使用を推奨します。一部ユーザ体験が劣化しますが、次のートでColaboratoryでの実行も可能です。

説明動画

No タイトル リンク
01 ざっくり説明編 youtube
02 ユーザー音声の録音編 youtube
03 トレーニング編 作成中
04a Colabでボイチェン編 youtube
04b PCでボイチェン編 欠番(ex1, ex2, 04aの内容と被るため)
ex1 番外編WSL2とDockerのインストール youtube
ex2 番外編WSL2とAnacondaのインストール youtube

リアルタイム性

GPUを使用すると100msec強の遅延で変換することが可能です。

https://user-images.githubusercontent.com/48346627/199807082-9d2ca75b-3a05-463d-b32e-14e663603626.mp4

CPUでも最近のであればそれなりの速度で変換可能。

https://user-images.githubusercontent.com/48346627/199855821-596f0874-8f69-4354-b226-4a755e9763bc.mp4

古いCPU( i7-4770)だと、1000msecくらいかかってしまう。

Misc

簡易デモ(soft-vc)

soft-vcを用いたボイスチェンジャです。

コラボのノート

説明動画

Acknowledgments