リアルタイムボイスチェンジャー Realtime Voice Changer
Go to file
2022-11-12 10:56:53 +09:00
demo update 2022-11-12 10:27:34 +09:00
docker update 2022-11-12 10:56:53 +09:00
docs update 2022-11-12 09:26:28 +09:00
frontend/dist update 2022-11-12 09:26:28 +09:00
script beta01 2022-08-23 06:37:18 +09:00
template update 2022-11-04 07:08:23 +09:00
work_dir update 2022-11-09 04:22:54 +09:00
.gitignore update 2022-08-27 11:43:55 +09:00
LICENSE add license 2022-08-24 09:50:45 +09:00
MMVCTrainerFrontendDemo.ipynb Colaboratory を使用して作成しました 2022-11-08 21:04:56 +09:00
package-lock.json update 2022-08-27 11:43:55 +09:00
package.json update to ver.2.0.0 2022-11-11 02:06:54 +09:00
README.md update 2022-11-11 16:40:15 +09:00
SoftVcDemo.ipynb Colaboratory を使用して作成しました 2022-10-29 09:56:28 +09:00
start2.sh update 2022-11-12 10:56:53 +09:00
start_v0.1.sh update 2022-10-30 00:58:21 +09:00
VoiceChangerDemo_Simple.ipynb Colaboratory を使用して作成しました 2022-11-04 07:27:14 +09:00
VoiceChangerDemo.ipynb Colaboratory を使用して作成しました 2022-11-04 07:34:37 +09:00
VoiceRecorder.ipynb Colaboratory を使用して作成しました 2022-11-09 04:12:09 +09:00

Voice Changer Trainer and Player Container

概要

AIを使ったリアルタイムボイスチェンジャーMMVCのヘルパーアプリケーションです。

MMVCで必要となる一連の作業トレーニング用の音声の録音、トレーニング、ボイスチェンジャをお手軽に実行できます。 image

Dockerを前提としたアプリケーションですが、Github PagesとGoogle Colaboratory上での実行も可能です。Google Colaboratoryの制約により使用感が一部悪いです。 image

このアプリケーションを用いることで、以下のことを簡単に行うことができます。

  • MMVCトレーニング用の音声録音 (GithubPages (Docker不要))
  • MMVCのモデルのトレーニング (Dockerを強く推奨、Colabでも可)
  • MMVCモデルを用いたリアルタイムボイスチェンジャーDocker推奨、Colabでも可
    • リアルタイム話者切り替え
    • CPU/GPU切り替え
    • リアルタイム/ニアリアルタイム声質変換

本アプリケーションのリアルタイムボイスチェンジャーは、サーバ・クライアント構成で動きます。MMVCのサーバを別のPC上で動かすことで、ゲーム実況など他の負荷の高い処理への影響を抑えながら動かすことができます。MacのChromeからも利用できます image

使用方法

詳細な使用方法等はwikiをご参照ください。

トレーニング用音声録音アプリ

MMVCトレーニング用の音声を簡単に録音できるアプリです。 Github Pages上で実行できるため、Dockerの準備は不要です。

録音アプリ on Github Pages

録音したデータは、ブラウザ上に保存されます。外部に一切漏れることはありません。

詳細な使用方法はwikiをご覧ください。

トレーニング用アプリ

MMVCのトレーニングを行うアプリです。 Dockerでの実行を強く推奨します。

詳細な使用方法等はwikiをご参照ください。

Colaboratoryでの実行を行う場合は、次のートから実行できます。

Colaboratoryで実行する場合は、Colabの制約により途中切断が発生する可能性があります。Web上では各種対策が示されていますので、必要に応じて各自でご対応をお願いします。また、途中切断に備え、こまめなモデルのダウンロードをお勧めします。

ボイスチェンジャーアプリ

Dockerでの使用を推奨します。一部ユーザ体験が劣化しますが、次のートでColaboratoryでの実行も可能です。

説明動画

動画との差分

  • サーバの起動完了のメッセージは、「Debuggerほにゃらら」ではなく「Application startup complete.」です。
  • プロキシにアクセスする際に、index.htmlを追加する必要はありません。

詳細な使用方法等はwikiをご参照ください。

デモ動画

リアルタイム性

GPUを使用すると100msec強の遅延で変換することが可能です。

https://user-images.githubusercontent.com/48346627/199807082-9d2ca75b-3a05-463d-b32e-14e663603626.mp4

CPUでも最近のであればそれなりの速度で変換可能。

https://user-images.githubusercontent.com/48346627/199855821-596f0874-8f69-4354-b226-4a755e9763bc.mp4

古いCPU( i7-4770)だと、1000msecくらいかかってしまう。

Misc

簡易デモ(soft-vc)

soft-vcを用いたボイスチェンジャです。

コラボのノート

説明動画

Acknowledgments