voice-changer/README.md
2022-12-04 21:42:02 +09:00

5.1 KiB
Raw Blame History

Voice Changer Trainer and Player

概要

AIを使ったリアルタイムボイスチェンジャーMMVCのヘルパーアプリケーションです。

MMVCで必要となる一連の作業トレーニング用の音声の録音、トレーニング、ボイスチェンジャをお手軽に実行できます。 image

このアプリケーションを用いることで、以下のことを簡単に行うことができます。

  • MMVCトレーニング用の音声録音 (GithubPages (Docker不要))
  • MMVCのモデルのトレーニング (Dockerを強く推奨、Colabでも可)
  • MMVCモデルを用いたリアルタイムボイスチェンジャーDocker推奨、Colabでも可
    • リアルタイム話者切り替え
    • CPU/GPU切り替え
    • リアルタイム/ニアリアルタイム声質変換

本アプリケーションのリアルタイムボイスチェンジャーは、サーバ・クライアント構成で動きます。MMVCのサーバを別のPC上で動かすことで、ゲーム実況など他の負荷の高い処理への影響を抑えながら動かすことができます。MacのChromeからも利用できます image

使用方法

以下では、使用方法のダイジェストのみ記載します。詳細な使用方法等はwikiをご参照ください。

レコーダー(トレーニング用音声録音アプリ)

MMVCトレーニング用の音声を簡単に録音できるアプリです。 Github Pages上で実行できるため、Dockerの準備は不要です。

録音アプリ on Github Pages

録音したデータは、ブラウザ上に保存されます。外部に一切漏れることはありません。

トレーナー(トレーニング用アプリ)

MMVCのトレーニングを行うアプリです。 Dockerでの実行を強く推奨します。

Colaboratoryでの実行を行う場合は、次のートから実行できます。

Colaboratoryで実行する場合は、Colabの制約により途中切断が発生する可能性があります。Web上では各種対策が示されていますので、必要に応じて各自でご対応をお願いします。また、途中切断に備え、こまめなモデルのダウンロードをお勧めします。

プレイヤー(ボイスチェンジャーアプリ)

MMVCでボイチェンを行うためのアプリです。 Dockerで起動する場合は Dockerでの使用を推奨します。一部ユーザ体験が劣化しますが、次のートでColaboratoryでの実行も可能です。

説明動画

動画との差分

  • サーバの起動完了のメッセージは、「Debuggerほにゃらら」ではなく「Application startup complete.」です。
  • プロキシにアクセスする際に、index.htmlを追加する必要はありません。

詳細な使用方法等はwikiをご参照ください。

説明動画

No タイトル リンク
01 ざっくり説明編 youtube
02 ユーザー音声の録音編 youtube
03 トレーニング編 作成中
04a Colabでボイチェン編 作成中
04b PCでボイチェン編 作成中

リアルタイム性

GPUを使用すると100msec強の遅延で変換することが可能です。

https://user-images.githubusercontent.com/48346627/199807082-9d2ca75b-3a05-463d-b32e-14e663603626.mp4

CPUでも最近のであればそれなりの速度で変換可能。

https://user-images.githubusercontent.com/48346627/199855821-596f0874-8f69-4354-b226-4a755e9763bc.mp4

古いCPU( i7-4770)だと、1000msecくらいかかってしまう。

Misc

簡易デモ(soft-vc)

soft-vcを用いたボイスチェンジャです。

コラボのノート

説明動画

Acknowledgments