From 62c5d7a2f66f8bf7054d5af6b6a4a41d8ef99ed1 Mon Sep 17 00:00:00 2001 From: wataru Date: Mon, 16 Jan 2023 00:56:25 +0900 Subject: [PATCH] update reademe --- README.md | 55 +++++++++++++++++++++++++++++++++++++++---------------- 1 file changed, 39 insertions(+), 16 deletions(-) diff --git a/README.md b/README.md index 15fdaff0..90b19b1f 100644 --- a/README.md +++ b/README.md @@ -4,6 +4,7 @@ Voice Changer Trainer and Player # 概要 AIを使ったリアルタイムボイスチェンジャー[MMVC](https://github.com/isletennos/MMVC_Trainer)のヘルパーアプリケーションです。 +[解説動画](https://youtu.be/MOPqnDPqhAU) MMVCで必要となる一連の作業(トレーニング用の音声の録音、トレーニング、ボイスチェンジャ)の中で、音声の録音とボイスチェンジャを各種プラットフォームでお手軽に実行できます。 @@ -13,7 +14,7 @@ MMVCで必要となる一連の作業(トレーニング用の音声の録音 このアプリケーションを用いることで、以下のことを簡単に行うことができます。 -- MMVCトレーニング用の音声録音 (GithubPages (ローカル環境構築不要)) +- MMVCトレーニング用の音声録音 - MMVCモデルを用いたリアルタイムボイスチェンジャー - リアルタイム話者切り替え - CPU/GPU切り替え @@ -27,47 +28,69 @@ MMVCで必要となる一連の作業(トレーニング用の音声の録音 # 使用方法 **v.1.3.x(2023/01/10~)でボイスチェンジャーの大幅な変更を行っています。** -## レコーダー(トレーニング用音声録音アプリ) - +# (1) レコーダー(トレーニング用音声録音アプリ) MMVCトレーニング用の音声を簡単に録音できるアプリです。 Github Pages上で実行できるため、ブラウザのみあれば様々なプラットフォームからご利用可能です。 +録音したデータは、ブラウザ上に保存されます。外部に一切漏れることはありません。 [録音アプリ on Github Pages](https://w-okada.github.io/voice-changer/) -録音したデータは、ブラウザ上に保存されます。外部に一切漏れることはありません。 - -詳細については引き続き[wiki](https://github.com/w-okada/voice-changer/wiki)をご確認ください。 +[解説動画](https://youtu.be/s_GirFEGvaA) -## プレイヤー(ボイスチェンジャーアプリ) +詳細については[wiki](https://github.com/w-okada/voice-changer/wiki)をご確認ください。 + + +# (2) プレイヤー(ボイスチェンジャーアプリ) MMVCでボイチェンを行うためのアプリです。 -お手元のPCでの使用を推奨します。一部ユーザ体験が劣化しますが、次のノートでColaboratoryでの実行も可能です。 + +大きく3つの方法でご利用できます。難易度順に次の通りです。 +- Google Colaboratoryでの利用 +- 事前ビルド済みのBinaryでの利用 +- DockerやAnacondaなど環境構築を行った上での利用 + +本ソフトウェアやMMVCになじみの薄い方は上から徐々に慣れていくとよいと思います。 + +## (2-1) Google Colaboratoryでの利用 +Googleが提供している機械学習プラットフォームColaboratory上で実行できます。 +MMVCのモデルをトレーニングが完了している場合、既にColaboratoryを利用していると思いますので、事前準備は必要ありません。ただし、ネットワーク環境やColaboratoryの状況によってボイスチェンジャのタイムラグが大きくなる傾向があります。 + - [超簡単バージョン](https://github.com/w-okada/voice-changer/blob/master/VoiceChangerDemo_Simple.ipynb): 事前設定なしでColabから実行できます。 - [普通バージョン](https://github.com/w-okada/voice-changer/blob/master/VoiceChangerDemo.ipynb): Google Driveと連携してモデルを読み込むことができます。 -また、バイナリ(α版)の配布も行っています。 +[解説動画](https://youtu.be/TogfMzXH1T0) -** M1 Mac版は、ダウンロード後、ターミナルで実行権限を付与して実行してください。 +## (2-2) 事前ビルド済みのBinaryでの利用 +実行形式のバイナリをダウンロードして実行することができます。 +Windows版とMac版を提供しています。事前準備は必要ありません。 -** win版はcuda設定ができている場合はnocudaで実行可能なケースが多いです。環境によってcudaが認識されない場合はcudaの方をお試しください。 +・Mac版はダウンロードした後、実行権限を付与してください。 -- +・Windows版は、directML版とGPU版を提供しています。 -- [M1 Mac v.1.3.5α](https://drive.google.com/file/d/1UJhitp0uZAhcQmcdve-iirDws4iMfD74/view?usp=sharing) +・NvidiaのGPUをお持ちの方はonnxgpuが含まれるファイルをご利用ください。多くの場合はonnxgpu_nocudaの方で動きます。環境によってはgpuが認識されない場合が稀にあります。その場合はonnxgpu_cudaの方をご利用ください。(サイズが大きく違います。起動時間も遅くなります) -- [Win onnxgpu-nocuda(軽量)](https://drive.google.com/file/d/1bbEGOpm3JiU0G7RaLIlJkBvSE5EieNOi/view?usp=sharing) +・NvidiaのGPUをお持ちでない方はonnxdirectMLが含まれるファイルをご利用ください。多くの場合は、onnxdirectML_nocudavの方で動きます。環境によってはgpuが認識されない場合が稀にあります。その場合はonnxgpu_cudaの方をご利用ください。(サイズが大きく違います。起動時間も遅くなります) -- [Win onnxgpu-cuda(フル)](https://drive.google.com/file/d/1ZQlfoiZy2Npo3d9t9c4FwMEPG3QZnyBd/view?usp=sharing) +- [MMVCServerSIO_mac_onnxcpu_v.1.3.6.0](https://drive.google.com/file/d/1Jfxz4NbjK-jt3yMIdC1Jhec9H47RxK6P/view?usp=sharing) 107MB +- [MMVCServerSIO_win_onnxdirectML_cudav.1.3.6.0.exe](https://drive.google.com/file/d/13ojs8VRconmARDGMoQapCVg3H9AG6PAz/view?usp=sharing) 1864MB +- [MMVCServerSIO_win_onnxdirectML_nocudav.1.3.6.0.exe](https://drive.google.com/file/d/1MHJv2sx_AKxG8YrHvHTeksxGO1zsMTZl/view?usp=sharing) 171MB +- [MMVCServerSIO_win_onnxgpu_cudav.1.3.6.0.exe](https://drive.google.com/file/d/1BWNbIliP0hqB4M3lFpTrFtKHPn6z3KNf/view?usp=sharing) 1948MB +- [MMVCServerSIO_win_onnxgpu_nocudav.1.3.6.0.exe](https://drive.google.com/file/d/1IPaZI53KOhl3eVktP4x0GwyqBngFGViS/view?usp=sharing) 255MB https://user-images.githubusercontent.com/48346627/212490839-9727daff-8629-4bd7-a885-39b9058a7eba.mp4 - 詳細は、こちらの[Blog](https://zenn.dev/wok/articles/s01_vc001_top)をご確認ください。 (古いボイスチェンジャについては、引き続き[wiki](https://github.com/w-okada/voice-changer/wiki)をご確認ください。) +## (2-3) DockerやAnacondaなど環境構築を行った上での利用 +本リポジトリをクローンして利用します。WindowsではWSL2の環境構築が必須になります。また、WSL2上でDockerもしくはAnacondaなどの仮想環境の構築が必要となります。MacではAnacondaなどのPythonの仮想環境の構築が必要となります。事前準備が必要となりますが、多くの環境においてこの方法が一番高速で動きます。 +[WSL2とDockerのインストールの解説動画](https://youtu.be/POo_Cg0eFMU) + +[WSL2とAnacondaのインストールの解説動画](https://youtu.be/fba9Zhsukqw) # 説明動画 | No | タイトル | リンク |