voice-changer/README.md

74 lines
4.0 KiB
Markdown
Raw Normal View History

2022-08-23 05:17:51 +03:00
Voice Changer Trainer and Player Container
2022-08-22 21:57:54 +03:00
----
2022-09-19 16:08:13 +03:00
# 概要
2022-08-23 05:17:51 +03:00
AIを使ったリアルタイムボイスチェンジャー[MMVC](https://github.com/isletennos/MMVC_Trainer)のトレーニングと実行を簡単にするためのヘルパーDockerコンテナです。
このコンテナを用いることで、以下のことを簡単に行うことができます。
2022-08-22 21:57:54 +03:00
2022-09-05 21:25:04 +03:00
- MMVCトレーニング用の音声録音
2022-08-23 05:17:51 +03:00
- MMVCのモデルのトレーニング
- MMVCモデルを用いたリアルタイム声質変換ボイスチェンジャ
- リアルタイム話者切り替え
- CPU/GPU切り替え
- リアルタイム/ニアリアルタイム声質変換
2022-09-23 08:35:32 +03:00
## 使用方法
2022-08-23 05:45:16 +03:00
使用方法等は[wiki](https://github.com/w-okada/voice-changer/wiki)をご参照ください。
2022-08-31 10:22:06 +03:00
2022-09-19 16:08:13 +03:00
## MMVCのトレーニング用音声データと、実行時の音声入力の考え方
なお、「MMVCトレーニング用の音声録音」と「MMVCモデルを用いたリアルタイム声質変換」では同一のイズキャンセル技術が使用されています。
一般にMMVCなどのAI/機械学習を用いたアプリケーションでは、学習データと似たデータをボイスチェンジャに入力することが望ましいとされます。「MMVCトレーニング用の音声録音」と「MMVCモデルを用いたリアルタイム声質変換」を本コンテナに統一することで、実行時の精度が向上する可能性があります。
![image](https://user-images.githubusercontent.com/48346627/191024059-9c90dfbc-8098-4a81-a905-2a8aa51662ba.png)
## 関連技術
2022-09-23 08:35:32 +03:00
本レポジトリでは、関連するボイスチェンジャとして[soft-vc](https://github.com/bshall/soft-vc)に注目しています。soft-vcにもリアルタイムでボイスチェンジできるようにしています。下記の「Docker不要な実行方法」のセクションからご利用ください。
2022-09-19 16:08:13 +03:00
# Docker不要な実行方法
本コンテナの一部の機能は、Google ColabやGithub Pagesを利用することで、ローカルPCにDockerの環境を用意することなく利用可能になっています。
お気軽に利用することが可能ですので、試しに使用してみてください。
2022-09-05 21:25:04 +03:00
## トレーニング用音声録音アプリ
2022-09-05 21:17:10 +03:00
MMVCトレーニング用の音声を簡単に録音できるアプリです。
2022-09-19 16:08:13 +03:00
Github Pagesにおいてあります。下記リンクにアクセスすることで利用可能です。
2022-09-05 21:25:04 +03:00
2022-09-19 16:08:13 +03:00
[録音アプリ on Github Pages](https://w-okada.github.io/voice-changer/)
2022-09-05 21:17:10 +03:00
2022-09-19 16:08:13 +03:00
録音したデータは、ブラウザ上に保存されます。外部に一切漏れることはありません。
2022-09-05 21:25:04 +03:00
2022-09-19 16:08:13 +03:00
また、Google Colab上にサーバを立てて利用することもできます。
こちらを使うと、録音データをGoogle Drive上に保存することができるようになります。MMVCのトレーニングをColab上で行う場合は、こちらを使用すると多少の手間が省けます。
2022-09-19 01:54:10 +03:00
[コラボのノート](https://github.com/w-okada/voice-changer/blob/master/VoiceRecorder.ipynb)
2022-09-05 21:31:50 +03:00
2022-09-19 16:08:13 +03:00
使用方法は[wiki](https://github.com/w-okada/voice-changer/wiki/500_%E3%83%AC%E3%82%B3%E3%83%BC%E3%83%80%E3%83%BC)をご覧ください。
2022-09-19 01:50:12 +03:00
## 簡易デモ(MMVC)
2022-09-19 16:08:13 +03:00
MMVCを用いたボイスチェンジャです。
[コラボのノート](https://github.com/w-okada/voice-changer/blob/dev/VoiceChangerDemo.ipynb)
2022-09-05 21:34:21 +03:00
2022-09-19 01:01:56 +03:00
[説明動画](https://twitter.com/DannadoriYellow/status/1564897136999022592)
2022-09-05 21:34:21 +03:00
2022-09-19 01:01:56 +03:00
動画との差分
- サーバの起動完了のメッセージは、「Debuggerほにゃらら」ではなく「Application startup complete.」です。
- プロキシにアクセスする際に、index.htmlを追加する必要はありません。
2022-09-19 01:50:12 +03:00
## 簡易デモ(soft-vc)
2022-09-19 16:08:13 +03:00
soft-vcを用いたボイスチェンジャです。
2022-09-19 01:50:12 +03:00
2022-09-19 16:08:13 +03:00
[コラボのノート](https://github.com/w-okada/voice-changer/blob/master/SoftVcDemo.ipynb)
[説明動画](https://user-images.githubusercontent.com/48346627/191019809-e7ae7c86-4b44-45f3-9dc3-3dc668992db4.mp4
)
2022-09-19 01:50:12 +03:00