update reademe

This commit is contained in:
wataru 2023-01-16 00:56:25 +09:00
parent 21407fbb54
commit 62c5d7a2f6

View File

@ -4,6 +4,7 @@ Voice Changer Trainer and Player
# 概要 # 概要
AIを使ったリアルタイムボイスチェンジャー[MMVC](https://github.com/isletennos/MMVC_Trainer)のヘルパーアプリケーションです。 AIを使ったリアルタイムボイスチェンジャー[MMVC](https://github.com/isletennos/MMVC_Trainer)のヘルパーアプリケーションです。
[解説動画](https://youtu.be/MOPqnDPqhAU)
MMVCで必要となる一連の作業トレーニング用の音声の録音、トレーニング、ボイスチェンジャの中で、音声の録音とボイスチェンジャを各種プラットフォームでお手軽に実行できます。 MMVCで必要となる一連の作業トレーニング用の音声の録音、トレーニング、ボイスチェンジャの中で、音声の録音とボイスチェンジャを各種プラットフォームでお手軽に実行できます。
@ -13,7 +14,7 @@ MMVCで必要となる一連の作業トレーニング用の音声の録音
このアプリケーションを用いることで、以下のことを簡単に行うことができます。 このアプリケーションを用いることで、以下のことを簡単に行うことができます。
- MMVCトレーニング用の音声録音 (GithubPages (ローカル環境構築不要)) - MMVCトレーニング用の音声録音
- MMVCモデルを用いたリアルタイムボイスチェンジャー - MMVCモデルを用いたリアルタイムボイスチェンジャー
- リアルタイム話者切り替え - リアルタイム話者切り替え
- CPU/GPU切り替え - CPU/GPU切り替え
@ -27,47 +28,69 @@ MMVCで必要となる一連の作業トレーニング用の音声の録音
# 使用方法 # 使用方法
**v.1.3.x(2023/01/10~)でボイスチェンジャーの大幅な変更を行っています。** **v.1.3.x(2023/01/10~)でボイスチェンジャーの大幅な変更を行っています。**
## レコーダー(トレーニング用音声録音アプリ) # (1) レコーダー(トレーニング用音声録音アプリ)
MMVCトレーニング用の音声を簡単に録音できるアプリです。 MMVCトレーニング用の音声を簡単に録音できるアプリです。
Github Pages上で実行できるため、ブラウザのみあれば様々なプラットフォームからご利用可能です。 Github Pages上で実行できるため、ブラウザのみあれば様々なプラットフォームからご利用可能です。
録音したデータは、ブラウザ上に保存されます。外部に一切漏れることはありません。
[録音アプリ on Github Pages](https://w-okada.github.io/voice-changer/) [録音アプリ on Github Pages](https://w-okada.github.io/voice-changer/)
録音したデータは、ブラウザ上に保存されます。外部に一切漏れることはありません。 [解説動画](https://youtu.be/s_GirFEGvaA)
詳細については引き続き[wiki](https://github.com/w-okada/voice-changer/wiki)をご確認ください。
## プレイヤー(ボイスチェンジャーアプリ) 詳細については[wiki](https://github.com/w-okada/voice-changer/wiki)をご確認ください。
# (2) プレイヤー(ボイスチェンジャーアプリ)
MMVCでボイチェンを行うためのアプリです。 MMVCでボイチェンを行うためのアプリです。
お手元のPCでの使用を推奨します。一部ユーザ体験が劣化しますが、次のートでColaboratoryでの実行も可能です。
大きく3つの方法でご利用できます。難易度順に次の通りです。
- Google Colaboratoryでの利用
- 事前ビルド済みのBinaryでの利用
- DockerやAnacondaなど環境構築を行った上での利用
本ソフトウェアやMMVCになじみの薄い方は上から徐々に慣れていくとよいと思います。
## (2-1) Google Colaboratoryでの利用
Googleが提供している機械学習プラットフォームColaboratory上で実行できます。
MMVCのモデルをトレーニングが完了している場合、既にColaboratoryを利用していると思いますので、事前準備は必要ありません。ただし、ネットワーク環境やColaboratoryの状況によってボイスチェンジャのタイムラグが大きくなる傾向があります。
- [超簡単バージョン](https://github.com/w-okada/voice-changer/blob/master/VoiceChangerDemo_Simple.ipynb): 事前設定なしでColabから実行できます。 - [超簡単バージョン](https://github.com/w-okada/voice-changer/blob/master/VoiceChangerDemo_Simple.ipynb): 事前設定なしでColabから実行できます。
- [普通バージョン](https://github.com/w-okada/voice-changer/blob/master/VoiceChangerDemo.ipynb): Google Driveと連携してモデルを読み込むことができます。 - [普通バージョン](https://github.com/w-okada/voice-changer/blob/master/VoiceChangerDemo.ipynb): Google Driveと連携してモデルを読み込むことができます。
また、バイナリ(α版)の配布も行っています。 [解説動画](https://youtu.be/TogfMzXH1T0)
** M1 Mac版は、ダウンロード後、ターミナルで実行権限を付与して実行してください。 ## (2-2) 事前ビルド済みのBinaryでの利用
実行形式のバイナリをダウンロードして実行することができます。
Windows版とMac版を提供しています。事前準備は必要ありません。
** win版はcuda設定ができている場合はnocudaで実行可能なケースが多いです。環境によってcudaが認識されない場合はcudaの方をお試しください。 ・Mac版はダウンロードした後、実行権限を付与してください。
- ・Windows版は、directML版とGPU版を提供しています。
- [M1 Mac v.1.3.5α](https://drive.google.com/file/d/1UJhitp0uZAhcQmcdve-iirDws4iMfD74/view?usp=sharing) ・NvidiaのGPUをお持ちの方はonnxgpuが含まれるファイルをご利用ください。多くの場合はonnxgpu_nocudaの方で動きます。環境によってはgpuが認識されない場合が稀にあります。その場合はonnxgpu_cudaの方をご利用ください。サイズが大きく違います。起動時間も遅くなります
- [Win onnxgpu-nocuda(軽量)](https://drive.google.com/file/d/1bbEGOpm3JiU0G7RaLIlJkBvSE5EieNOi/view?usp=sharing) ・NvidiaのGPUをお持ちでない方はonnxdirectMLが含まれるファイルをご利用ください。多くの場合は、onnxdirectML_nocudavの方で動きます。環境によってはgpuが認識されない場合が稀にあります。その場合はonnxgpu_cudaの方をご利用ください。サイズが大きく違います。起動時間も遅くなります
- [Win onnxgpu-cuda(フル)](https://drive.google.com/file/d/1ZQlfoiZy2Npo3d9t9c4FwMEPG3QZnyBd/view?usp=sharing)
- [MMVCServerSIO_mac_onnxcpu_v.1.3.6.0](https://drive.google.com/file/d/1Jfxz4NbjK-jt3yMIdC1Jhec9H47RxK6P/view?usp=sharing) 107MB
- [MMVCServerSIO_win_onnxdirectML_cudav.1.3.6.0.exe](https://drive.google.com/file/d/13ojs8VRconmARDGMoQapCVg3H9AG6PAz/view?usp=sharing) 1864MB
- [MMVCServerSIO_win_onnxdirectML_nocudav.1.3.6.0.exe](https://drive.google.com/file/d/1MHJv2sx_AKxG8YrHvHTeksxGO1zsMTZl/view?usp=sharing) 171MB
- [MMVCServerSIO_win_onnxgpu_cudav.1.3.6.0.exe](https://drive.google.com/file/d/1BWNbIliP0hqB4M3lFpTrFtKHPn6z3KNf/view?usp=sharing) 1948MB
- [MMVCServerSIO_win_onnxgpu_nocudav.1.3.6.0.exe](https://drive.google.com/file/d/1IPaZI53KOhl3eVktP4x0GwyqBngFGViS/view?usp=sharing) 255MB
https://user-images.githubusercontent.com/48346627/212490839-9727daff-8629-4bd7-a885-39b9058a7eba.mp4 https://user-images.githubusercontent.com/48346627/212490839-9727daff-8629-4bd7-a885-39b9058a7eba.mp4
詳細は、こちらの[Blog](https://zenn.dev/wok/articles/s01_vc001_top)をご確認ください。 詳細は、こちらの[Blog](https://zenn.dev/wok/articles/s01_vc001_top)をご確認ください。
(古いボイスチェンジャについては、引き続き[wiki](https://github.com/w-okada/voice-changer/wiki)をご確認ください。) (古いボイスチェンジャについては、引き続き[wiki](https://github.com/w-okada/voice-changer/wiki)をご確認ください。)
## (2-3) DockerやAnacondaなど環境構築を行った上での利用
本リポジトリをクローンして利用します。WindowsではWSL2の環境構築が必須になります。また、WSL2上でDockerもしくはAnacondaなどの仮想環境の構築が必要となります。MacではAnacondaなどのPythonの仮想環境の構築が必要となります。事前準備が必要となりますが、多くの環境においてこの方法が一番高速で動きます。
[WSL2とDockerのインストールの解説動画](https://youtu.be/POo_Cg0eFMU)
[WSL2とAnacondaのインストールの解説動画](https://youtu.be/fba9Zhsukqw)
# 説明動画 # 説明動画
| No | タイトル | リンク | | No | タイトル | リンク |