This commit is contained in:
wataru 2022-11-11 03:04:56 +09:00
parent 6d34987604
commit f289c5b634

View File

@ -1,56 +1,59 @@
Voice Changer Trainer and Player Container
----
# 概要
AIを使ったリアルタイムボイスチェンジャー[MMVC](https://github.com/isletennos/MMVC_Trainer)のトレーニングと実行を簡単にするためのヘルパーDockerコンテナです。
このコンテナを用いることで、以下のことを簡単に行うことができます。
AIを使ったリアルタイムボイスチェンジャー[MMVC](https://github.com/isletennos/MMVC_Trainer)のヘルパーアプリケーションです。
- MMVCトレーニング用の音声録音
- MMVCのモデルのトレーニング
- MMVCモデルを用いたリアルタイム声質変換ボイスチェンジャ
MMVCで必要となる一連の作業トレーニング用の音声の録音、トレーニング、ボイスチェンジャをお手軽に実行できます。
![image](https://user-images.githubusercontent.com/48346627/201169523-836e0f9e-2aca-4023-887c-52ecc219bcca.png)
基本的にはDockerを前提としたアプリケーションですが、Github PagesとGoogle Colaboratory上での実行も可能です。Google Colaboratoryの制約により使用感が一部悪いです。
![image](https://user-images.githubusercontent.com/48346627/201169876-36c33af9-f2d4-4746-9ddb-21186b94f6fc.png)
このアプリケーションを用いることで、以下のことを簡単に行うことができます。
- MMVCトレーニング用の音声録音 (GithubPages (Docker不要))
- MMVCのモデルのトレーニング (Dockerを強く推奨、Colabでも可)
- MMVCモデルを用いたリアルタイムボイスチェンジャーDocker推奨、Colabでも可
- リアルタイム話者切り替え
- CPU/GPU切り替え
- リアルタイム/ニアリアルタイム声質変換
このコンテナのボイスチェンジャは、サーバ・クライアント構成で動きます。MMVCのサーバを別のPC上で動かすことで、ゲーム実況など他の負荷の高い処理への影響を抑えながら動かすことができます。MacのChromeからも利用できます
![image](https://user-images.githubusercontent.com/48346627/193464403-ca981f72-6186-4eda-b715-55abdf236b17.png)
本アプリケーションのリアルタイムボイスチェンジャーは、サーバ・クライアント構成で動きます。MMVCのサーバを別のPC上で動かすことで、ゲーム実況など他の負荷の高い処理への影響を抑えながら動かすことができます。MacのChromeからも利用できます
![image](https://user-images.githubusercontent.com/48346627/201170195-88114174-0237-4610-b828-4fe08fe212e9.png)
## 使用方法
# 使用方法
使用方法等は[wiki](https://github.com/w-okada/voice-changer/wiki)をご参照ください。
詳細な使用方法等は[wiki](https://github.com/w-okada/voice-changer/wiki)をご参照ください。
## MMVCのトレーニング用音声データと、実行時の音声入力の考え方
なお、「MMVCトレーニング用の音声録音」と「MMVCモデルを用いたリアルタイム声質変換」では同一のイズキャンセル技術が使用されています。
一般にMMVCなどのAI/機械学習を用いたアプリケーションでは、学習データと似たデータをボイスチェンジャに入力することが望ましいとされます。「MMVCトレーニング用の音声録音」と「MMVCモデルを用いたリアルタイム声質変換」を本コンテナに統一することで、実行時の精度が向上する可能性があります。
![image](https://user-images.githubusercontent.com/48346627/191024059-9c90dfbc-8098-4a81-a905-2a8aa51662ba.png)
# Docker不要な実行方法
本コンテナの一部の機能は、Google ColabやGithub Pagesを利用することで、ローカルPCにDockerの環境を用意することなく利用可能になっています。
お気軽に利用することが可能ですので、試しに使用してみてください。
## トレーニング用音声録音アプリ
MMVCトレーニング用の音声を簡単に録音できるアプリです。
Github Pagesにおいてあります。下記リンクにアクセスすることで利用可能です。
Github Pages上で実行できるため、Dockerの準備は不要です。
[録音アプリ on Github Pages](https://w-okada.github.io/voice-changer/)
録音したデータは、ブラウザ上に保存されます。外部に一切漏れることはありません。
また、Google Colab上にサーバを立てて利用することもできます。
こちらを使うと、録音データをGoogle Drive上に保存することができるようになります。MMVCのトレーニングをColab上で行う場合は、こちらを使用すると多少の手間が省けます。
[コラボのノート](https://github.com/w-okada/voice-changer/blob/master/VoiceRecorder.ipynb)
詳細な使用方法は[wiki](https://github.com/w-okada/voice-changer/wiki/500_%E3%83%AC%E3%82%B3%E3%83%BC%E3%83%80%E3%83%BC)をご覧ください。
使用方法は[wiki](https://github.com/w-okada/voice-changer/wiki/500_%E3%83%AC%E3%82%B3%E3%83%BC%E3%83%80%E3%83%BC)をご覧ください。
## トレーニング用アプリ
MMVCのトレーニングを行うアプリです。
Dockerでの実行を強く推奨します。
詳細な使用方法等は[wiki](https://github.com/w-okada/voice-changer/wiki)をご参照ください。
## 簡易デモ(MMVC)
Colabを用いてデモ版を動かすことができます。
Colaboratoryでの実行を行う場合は、次のートから実行できます。
- [Colab ノート](https://github.com/w-okada/voice-changer/blob/master/MMVCTrainerFrontendDemo.ipynb)
Colaboratoryで実行する場合は、Colabの制約により途中切断が発生する可能性があります。Web上では各種対策が示されていますので、必要に応じて各自でご対応をお願いします。また、途中切断に備え、こまめなモデルのダウンロードをお勧めします。
## ボイスチェンジャーアプリ
Dockerでの使用を推奨します。一部ユーザ体験が劣化しますが、次のートでColaboratoryでの実行も可能です。
- [簡単バージョン](https://github.com/w-okada/voice-changer/blob/master/VoiceChangerDemo_Simple.ipynb): 事前設定なしでColabから実行できます。
- [詳細バージョン](https://github.com/w-okada/voice-changer/blob/master/VoiceChangerDemo.ipynb): Google Driveと連携してモデルを読み込むことができます。
@ -61,6 +64,9 @@ Colabを用いてデモ版を動かすことができます。
- サーバの起動完了のメッセージは、「Debuggerほにゃらら」ではなく「Application startup complete.」です。
- プロキシにアクセスする際に、index.htmlを追加する必要はありません。
詳細な使用方法等は[wiki](https://github.com/w-okada/voice-changer/wiki)をご参照ください。
# Misc
## 簡易デモ(soft-vc)
soft-vcを用いたボイスチェンジャです。
@ -70,3 +76,7 @@ soft-vcを用いたボイスチェンジャです。
)
# Acknowledgments
- 立ちずんだもん素材https://seiga.nicovideo.jp/seiga/im10792934
- いらすとやhttps://www.irasutoya.com/