2022-08-23 05:17:51 +03:00
|
|
|
|
Voice Changer Trainer and Player Container
|
2022-08-22 21:57:54 +03:00
|
|
|
|
----
|
2022-09-19 16:08:13 +03:00
|
|
|
|
# 概要
|
2022-08-23 05:17:51 +03:00
|
|
|
|
AIを使ったリアルタイムボイスチェンジャー[MMVC](https://github.com/isletennos/MMVC_Trainer)のトレーニングと実行を簡単にするためのヘルパーDockerコンテナです。
|
|
|
|
|
このコンテナを用いることで、以下のことを簡単に行うことができます。
|
2022-08-22 21:57:54 +03:00
|
|
|
|
|
2022-09-05 21:25:04 +03:00
|
|
|
|
- MMVCトレーニング用の音声録音
|
2022-08-23 05:17:51 +03:00
|
|
|
|
- MMVCのモデルのトレーニング
|
|
|
|
|
- MMVCモデルを用いたリアルタイム声質変換(ボイスチェンジャ)
|
|
|
|
|
- リアルタイム話者切り替え
|
|
|
|
|
- CPU/GPU切り替え
|
|
|
|
|
- リアルタイム/ニアリアルタイム声質変換
|
|
|
|
|
|
2022-09-23 08:35:32 +03:00
|
|
|
|
## 使用方法
|
|
|
|
|
|
2022-08-23 05:45:16 +03:00
|
|
|
|
使用方法等は[wiki](https://github.com/w-okada/voice-changer/wiki)をご参照ください。
|
2022-08-31 10:22:06 +03:00
|
|
|
|
|
2022-09-19 16:08:13 +03:00
|
|
|
|
## MMVCのトレーニング用音声データと、実行時の音声入力の考え方
|
|
|
|
|
なお、「MMVCトレーニング用の音声録音」と「MMVCモデルを用いたリアルタイム声質変換」では同一のノイズキャンセル技術が使用されています。
|
|
|
|
|
一般にMMVCなどのAI/機械学習を用いたアプリケーションでは、学習データと似たデータをボイスチェンジャに入力することが望ましいとされます。「MMVCトレーニング用の音声録音」と「MMVCモデルを用いたリアルタイム声質変換」を本コンテナに統一することで、実行時の精度が向上する可能性があります。
|
|
|
|
|
|
|
|
|
|
![image](https://user-images.githubusercontent.com/48346627/191024059-9c90dfbc-8098-4a81-a905-2a8aa51662ba.png)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
## 関連技術
|
2022-09-23 08:35:32 +03:00
|
|
|
|
本レポジトリでは、関連するボイスチェンジャとして[soft-vc](https://github.com/bshall/soft-vc)に注目しています。soft-vcにもリアルタイムでボイスチェンジできるようにしています。下記の「Docker不要な実行方法」のセクションからご利用ください。
|
2022-09-19 16:08:13 +03:00
|
|
|
|
|
|
|
|
|
|
|
|
|
|
# Docker不要な実行方法
|
|
|
|
|
|
|
|
|
|
本コンテナの一部の機能は、Google ColabやGithub Pagesを利用することで、ローカルPCにDockerの環境を用意することなく利用可能になっています。
|
|
|
|
|
|
|
|
|
|
お気軽に利用することが可能ですので、試しに使用してみてください。
|
|
|
|
|
|
2022-09-05 21:25:04 +03:00
|
|
|
|
## トレーニング用音声録音アプリ
|
2022-09-05 21:17:10 +03:00
|
|
|
|
|
|
|
|
|
MMVCトレーニング用の音声を簡単に録音できるアプリです。
|
2022-09-19 16:08:13 +03:00
|
|
|
|
Github Pagesにおいてあります。下記リンクにアクセスすることで利用可能です。
|
2022-09-05 21:25:04 +03:00
|
|
|
|
|
2022-09-19 16:08:13 +03:00
|
|
|
|
[録音アプリ on Github Pages](https://w-okada.github.io/voice-changer/)
|
2022-09-05 21:17:10 +03:00
|
|
|
|
|
2022-09-19 16:08:13 +03:00
|
|
|
|
録音したデータは、ブラウザ上に保存されます。外部に一切漏れることはありません。
|
2022-09-05 21:25:04 +03:00
|
|
|
|
|
|
|
|
|
|
2022-09-19 16:08:13 +03:00
|
|
|
|
また、Google Colab上にサーバを立てて利用することもできます。
|
|
|
|
|
こちらを使うと、録音データをGoogle Drive上に保存することができるようになります。MMVCのトレーニングをColab上で行う場合は、こちらを使用すると多少の手間が省けます。
|
2022-09-19 01:54:10 +03:00
|
|
|
|
[コラボのノート](https://github.com/w-okada/voice-changer/blob/master/VoiceRecorder.ipynb)
|
2022-09-05 21:31:50 +03:00
|
|
|
|
|
2022-09-19 16:08:13 +03:00
|
|
|
|
|
|
|
|
|
使用方法は[wiki](https://github.com/w-okada/voice-changer/wiki/500_%E3%83%AC%E3%82%B3%E3%83%BC%E3%83%80%E3%83%BC)をご覧ください。
|
|
|
|
|
|
|
|
|
|
|
2022-09-19 01:50:12 +03:00
|
|
|
|
## 簡易デモ(MMVC)
|
2022-09-19 16:08:13 +03:00
|
|
|
|
MMVCを用いたボイスチェンジャです。
|
|
|
|
|
|
|
|
|
|
[コラボのノート](https://github.com/w-okada/voice-changer/blob/dev/VoiceChangerDemo.ipynb)
|
2022-09-05 21:34:21 +03:00
|
|
|
|
|
2022-09-19 01:01:56 +03:00
|
|
|
|
[説明動画](https://twitter.com/DannadoriYellow/status/1564897136999022592)
|
2022-09-05 21:34:21 +03:00
|
|
|
|
|
2022-09-19 01:01:56 +03:00
|
|
|
|
動画との差分
|
|
|
|
|
|
|
|
|
|
- サーバの起動完了のメッセージは、「Debuggerほにゃらら」ではなく「Application startup complete.」です。
|
|
|
|
|
- プロキシにアクセスする際に、index.htmlを追加する必要はありません。
|
2022-09-19 01:50:12 +03:00
|
|
|
|
|
|
|
|
|
## 簡易デモ(soft-vc)
|
2022-09-19 16:08:13 +03:00
|
|
|
|
soft-vcを用いたボイスチェンジャです。
|
2022-09-19 01:50:12 +03:00
|
|
|
|
|
2022-09-19 16:08:13 +03:00
|
|
|
|
[コラボのノート](https://github.com/w-okada/voice-changer/blob/master/SoftVcDemo.ipynb)
|
|
|
|
|
|
|
|
|
|
[説明動画](https://user-images.githubusercontent.com/48346627/191019809-e7ae7c86-4b44-45f3-9dc3-3dc668992db4.mp4
|
|
|
|
|
)
|
2022-09-19 01:50:12 +03:00
|
|
|
|
|
|
|
|
|
|