リアルタイムボイスチェンジャー Realtime Voice Changer
Go to file
2022-10-03 02:36:48 +09:00
dataset init 2022-08-22 16:08:49 +09:00
demo update 2022-10-03 00:16:46 +09:00
docs update 2022-09-14 07:42:47 +09:00
exp init 2022-08-22 16:08:49 +09:00
frontend/dist update 2022-09-19 04:41:21 +09:00
script beta01 2022-08-23 06:37:18 +09:00
template update 2022-09-23 17:40:51 +09:00
trainer update 2022-10-03 00:25:07 +09:00
vc_resources beta01 2022-08-23 06:37:18 +09:00
.gitignore update 2022-08-27 11:43:55 +09:00
LICENSE add license 2022-08-24 09:50:45 +09:00
package-lock.json update 2022-08-27 11:43:55 +09:00
package.json update 2022-09-06 03:03:43 +09:00
README.md update 2022-10-03 02:36:48 +09:00
SoftVcDemo.ipynb Colaboratory を使用して作成しました 2022-09-19 07:31:05 +09:00
start2.sh update 2022-10-03 00:25:07 +09:00
template.sh WIP: merge with frontend 2022-08-23 03:57:54 +09:00
VoiceChangerDemo.ipynb Colaboratory を使用して作成しました 2022-09-19 06:30:05 +09:00
VoiceRecorder.ipynb Colaboratory を使用して作成しました 2022-09-14 09:03:09 +09:00

Voice Changer Trainer and Player Container

概要

AIを使ったリアルタイムボイスチェンジャーMMVCのトレーニングと実行を簡単にするためのヘルパーDockerコンテナです。 このコンテナを用いることで、以下のことを簡単に行うことができます。

  • MMVCトレーニング用の音声録音
  • MMVCのモデルのトレーニング
  • MMVCモデルを用いたリアルタイム声質変換ボイスチェンジャ
    • リアルタイム話者切り替え
    • CPU/GPU切り替え
    • リアルタイム/ニアリアルタイム声質変換

ボイスチェンジャは、サーバ・クライアント構成で動いています。MMVCのサーバを別のPC上で動かすことで、ゲーム実況など他の不可の高い処理への影響を抑えながら動かすことができます。MacのChromeからも利用できます image

使用方法

使用方法等はwikiをご参照ください。

MMVCのトレーニング用音声データと、実行時の音声入力の考え方

なお、「MMVCトレーニング用の音声録音」と「MMVCモデルを用いたリアルタイム声質変換」では同一のイズキャンセル技術が使用されています。 一般にMMVCなどのAI/機械学習を用いたアプリケーションでは、学習データと似たデータをボイスチェンジャに入力することが望ましいとされます。「MMVCトレーニング用の音声録音」と「MMVCモデルを用いたリアルタイム声質変換」を本コンテナに統一することで、実行時の精度が向上する可能性があります。

image

関連技術

本レポジトリでは、関連するボイスチェンジャとしてsoft-vcに注目しています。soft-vcにもリアルタイムでボイスチェンジできるようにしています。下記の「Docker不要な実行方法」のセクションからご利用ください。

Docker不要な実行方法

本コンテナの一部の機能は、Google ColabやGithub Pagesを利用することで、ローカルPCにDockerの環境を用意することなく利用可能になっています。

お気軽に利用することが可能ですので、試しに使用してみてください。

トレーニング用音声録音アプリ

MMVCトレーニング用の音声を簡単に録音できるアプリです。 Github Pagesにおいてあります。下記リンクにアクセスすることで利用可能です。

録音アプリ on Github Pages

録音したデータは、ブラウザ上に保存されます。外部に一切漏れることはありません。

また、Google Colab上にサーバを立てて利用することもできます。 こちらを使うと、録音データをGoogle Drive上に保存することができるようになります。MMVCのトレーニングをColab上で行う場合は、こちらを使用すると多少の手間が省けます。 コラボのノート

使用方法はwikiをご覧ください。

簡易デモ(MMVC)

MMVCを用いたボイスチェンジャです。

コラボのノート

説明動画

動画との差分

  • サーバの起動完了のメッセージは、「Debuggerほにゃらら」ではなく「Application startup complete.」です。
  • プロキシにアクセスする際に、index.htmlを追加する必要はありません。

簡易デモ(soft-vc)

soft-vcを用いたボイスチェンジャです。

コラボのノート

説明動画