diff --git a/README.md b/README.md index 1c677660..27ab0bb6 100644 --- a/README.md +++ b/README.md @@ -3,107 +3,16 @@ [English](/README_en.md) [Korean](/README_ko.md) ## What's New! -- v.2.0.45-alpha - - bugfix - - 音量調整 -- v.2.0.44-alpha - - bugfix - - モデル削除後の不安定動作の改善 -- v.2.0.42-alpha - - Feature - - Beatrice v2 カスタムモデルのアップロード - - Improvement - - RVC音質向上 - - RVC変換速度向上 - - Bugfix - - パススルー - - オーディオデバイスリロード -- v.2.0.40-alpha - - 改善 - - 音量対応 - - ASIO対応 - - webフォルダ公開 - - `web_front\assets\i18n\\translation.json`を作成し、`web_front\assets\gui_settings\GUI.json`の`lang`に追加すれば言語対応を拡張できます。 -- v.2.0.36-alpha - - バグフィックス - - RVCの音が割れる問題の対策 - - vcclient v1で作成したDDPN版RVCのonnxの読み込み失敗の対策 -- v.2.0.32-alpha Colab版 リリース。⇒[こちら](./w_okada's_Voice_Changer_version_2_x.ipynb) - - ngrokフリーになりました。ngrokのアカウントなしで利用可能です。 -- v.2.0.27-alpha - - Feature - - Beatrice v2 alpha2対応:formant変更、品質向上 - - ログ強化 - - ダウンロードボタン追加 - - 改善 - - アップロードの2度押し回避 - - アップロード中の表示 - - paththrough -> passthrough - - バグフィックス - - performance monitorにundefinedが返ってきたときの対応追加 - -- v.2.0.24-alpha Colab版 リリース。⇒[こちら](./w_okada's_Voice_Changer_version_2_x.ipynb) -- v.2.0.24-alpha +- Beatrice V2 トレーニングコード公開!!! + - [トレーニングコードリポジトリ](https://huggingface.co/fierce-cats/beatrice-trainer) + - [コラボ版](https://github.com/w-okada/beatrice-trainer-colab) +- v.2.0.47-alpha + - feature: + - extra frameを拡大 - bugfix: - - モード切替をしたときに音が出なくなる問題を対策 - - その他: - - loggerの強化 - - エラー画面の強化 - -- v.2.0.23-alpha - - エディションを再整理 - - win_std: 一般的なwinユーザ向け。onnxモデル, torchモデルともに、DirectMLによりGPUのハードウェアアクセラレーションが可能です。 - - win_cuda:NvidiaのGPU所有者向け。onnxモデル, torchモデルともに、cudaによりNvidiaのGPUのハードウェアアクセラレーションが可能です。要cuda12.4~。 - - mac: AppleSilicon(M1等)ユーザ向け。 - - feature - - クライアントモードでの動作時のアウトプットバッファの調整機能を追加 - - bugfix: - - RVCのtorchモデルをonnxモデルにエクスポートする際にindex, iconを引き継ぐように修正 - - その他: - - loggerの強化 - -- v.2.0.20-alpha - - torch-cudaに対応。エディションの説明は[こちら](docs/01_basic_v2.0.z.md)。 - - bugfix: - - ファイルエンコーディングをUTF-8に統一 - -- v.2.0.16-alpha - - torch-dmlに対応(実験的なバージョン)。エディションの説明は[こちら](docs/01_basic_v2.0.z.md)。 - - bugfix: - - rvc file uploadの際、pthとindexの両方をアップできない不具合の対策。 - -- v.2.0.13-alpha - - onnxruntime-gpuに対応。cudaエディションのリリース。エディションの説明は[こちら](docs/01_basic_v2.0.z.md)。 - - bugfix: - - onnxcrepeの不具合対策 - - Beatrice v2 APIのID選択不具合対策 - - その他: - - loggerの強化 - - -- v.2.0.6-alpha - - 新規 - - M1系 Macに対応しました。 - - M1 MBA(monterey), M2 Pro MBP(venture)での動作実績あります。 - - sonomaでのレポートお待ちしております。 - - bugfix: - - beatriceのスピーカー選択でpitchが元に戻ってしまうバグに対応。 - - その他: - - 不具合解析用の情報取得強化 - -- v.2.0.5-alpha - - VCClientがセカンドバージョンとしてリブートしました。 - - 大幅なソフトウェア構造変更により拡張容易性を高めました。 - - REST APIを提供することでサードパーティによるクライアント開発を容易化しました。 - - エディション体系を刷新しました。 - - スタンダードエディション(win)はgpuの有無にかかわらず、onnxモデルでの実行を基本としてます。torchモデルはonnxモデルに変換してから使用してください。gpuをお持ちの方はonnxモデルでのみハードウェアアクセラレーションが有効となります。 - - cudaエディション(win)は、NvidiaのGPUに特化したチューニングがされています。スタンダードエディションと比較してさらなる高速化が可能です。onnxモデルでのみハードウェアアクセラレーションが有効となります。 - - torchモデルはpytorchのモデルもハードウェアアクセラレートできます。 - - macエディションはApple Silicon搭載のMacユーザ向けです。 - - linuxユーザやpythonの知識がある方はリポジトリをcloneして実行することもできます。 - - 現在のalpha versionではスタンダードエディションのみの提供となっています。 - - + - beatrice のデフォルト話者IDの変更 + - モデルファイル名が長いときのエラー対策 + - モニターデバイスをnoneにしたときの対応。 # VC Client とは 1. 各種音声変換 AI(VC, Voice Conversion)を用いてリアルタイム音声変換を行うためのクライアントソフトウェアです。サポートしている音声変換 AI は次のものになります。 diff --git a/README_en.md b/README_en.md index 2f2453af..35bb0b53 100644 --- a/README_en.md +++ b/README_en.md @@ -3,102 +3,19 @@ [Japanese](/README.md) [Korean](/README_ko.md) ## What's New! +- Beatrice V2 Training Code Released!!! + - [Training Code Repository](https://huggingface.co/fierce-cats/beatrice-trainer) + - [Colab Version](https://github.com/w-okada/beatrice-trainer-colab) +- v.2.0.47-alpha + - feature: + - Expanded extra frame + - bugfix: + - Changed the default speaker ID for Beatrice + - Fixed errors when model file names are too long + - Handled situation when monitor device is set to none. - v.2.0.45-alpha - bugfix - volume control -- v.2.0.44-alpha - - bugfix - - Improvements for Unstable Behavior After Model Deletion -- v2.0.42-alpha - - Feature - - Upload of Beatrice v2 custom model - - Improvement - - Improved RVC sound quality - - Enhanced RVC conversion speed - - Bugfix - - Pass-through - - Audio device reload -- v.2.0.40-alpha - - Improvements - - Volume support - - ASIO support - - Web folder publishing - - You can extend language support by creating `web_front\assets\i18n\\translation.json` and adding it to `lang` in `web_front\assets\gui_settings\GUI.json`. -- v.2.0.36-alpha - - Bug Fixes - - Countermeasure for sound clipping issue in RVC - - Countermeasure for failure to load DDPN version of RVC onnx created with vcclient v1 -- v.2.0.32-alpha Colab version released. ⇒ [Here](./w_okada's_Voice_Changer_version_2_x.ipynb) - - ngrok is no longer needed. You can use it without a ngrok account. -- v.2.0.27-alpha - - Feature - - Support for Beatrice v2 alpha2: formant changes, improved quality - - Logging enhancement - - Added download button - - Improvements - - Prevent double-clicking on upload - - Display during upload - - Fixed typo: paththrough -> passthrough - - Bug fixes - - Added handling for when undefined is returned in the performance monitor -- v.2.0.24-alpha Colab version released. ⇒ [Here](./w_okada's_Voice_Changer_version_2_x.ipynb) -- v.2.0.24-alpha - - Bugfix: - - Addressed the issue where sound stops when switching modes - - Others: - - Enhanced logger - - Improved error screen -- v.2.0.23-alpha - - Reorganizing Editions - - win_std: For typical Windows users. Hardware acceleration via DirectML is available for both ONNX and torch models. - - win_cuda: For Nvidia GPU owners. Hardware acceleration via CUDA is available for both ONNX and torch models. Requires CUDA 12.4 or later. - - mac: For Apple Silicon (e.g., M1) users. - - feature - - Added the capability to adjust the output buffer when operating in client mode - - bugfix: - - Fixed the issue of retaining index and icon when exporting RVC's torch model to onnx model - - Other: - - Enhanced logger - -- v.2.0.20-alpha - - Support for torch-cuda. See the edition description [here](docs/01_basic_v2.0.z.md). - - Bugfix: - - Unified file encoding to UTF-8 - - -- v.2.0.16-alpha - - Added support for experimental version of torch-dml. For a description of the edition, refer to [here](docs/01_basic_v2.0.z.md). - - Bugfix: - - Fixed the issue where both pth and index files could not be uploaded simultaneously during rvc file upload. - - -- v.2.0.13-alpha - - Added support for onnxruntime-gpu. Release of the CUDA edition. - - Bugfix: - - Addressed issues with onnxcrepe - - Fixed ID selection issue in Beatrice v2 API - - Others: - - Enhanced logger - -- v.2.0.6-alpha - - New - - Now compatible with M1 series Macs. - - Confirmed to work on M1 MBA (Monterey) and M2 Pro MBP (Ventura). - - Looking for reports on performance with Sonoma. - - Bugfix: - - Fixed a bug where the pitch would revert when selecting a speaker in Beatrice. - - Others: - - Enhanced information gathering for debugging purposes. - -- v.2.0.5-alpha - - VCClient has been rebooted as a second version. - - Major software structure changes have been made to improve extensibility. - - Providing REST API to facilitate client development by third parties. - - Edition system has been completely revamped. - - The Standard Edition (win) runs on ONNX models by default regardless of the presence of a GPU. Please convert Torch models to ONNX models before use. Hardware acceleration is only effective with ONNX models for users with a GPU. - - The CUDA Edition (win) is optimized specifically for Nvidia GPUs. It offers further speed enhancements compared to the Standard Edition. Hardware acceleration is only effective with ONNX models. - - Torch models can also be hardware accelerated using PyTorch models. - - The Mac Edition is for Mac users with Apple Silicon. - - Linux users or those with knowledge of Python can clone the repository and run it. - - Currently, only the Standard Edition is available in the Alpha version. # What is VC Client diff --git a/README_ko.md b/README_ko.md index 73ffd7e7..6435e1e8 100644 --- a/README_ko.md +++ b/README_ko.md @@ -3,100 +3,19 @@ [English](/README_en.md) [Japanese](/README.md) ## What's New! +- Beatrice V2 훈련 코드 공개!!! + - [훈련 코드 리포지토리](https://huggingface.co/fierce-cats/beatrice-trainer) + - [Colab 버전](https://github.com/w-okada/beatrice-trainer-colab) +- v.2.0.47-alpha + - 기능: + - 추가 프레임 확장 + - 버그 수정: + - Beatrice의 기본 화자 ID 변경 + - 모델 파일 이름이 너무 길 때의 오류 수정 + - 모니터 장치를 none으로 설정했을 때의 처리. - v.2.0.45-alpha - bugfix - 음량 조절 -- v.2.0.44-alpha - - bugfix - - 모델 삭제 후 불안정한 동작 개선 -- v2.0.42-alpha - - 기능 - - Beatrice v2 커스텀 모델 업로드 - - 개선 - - RVC 음질 향상 - - RVC 변환 속도 향상 - - 버그 수정 - - 패스스루 - - 오디오 장치 다시 로드 -- v.2.0.40-alpha - - 개선 사항 - - 볼륨 지원 - - ASIO 지원 - - 웹 폴더 공개 - - `web_front\assets\i18n\\translation.json` 파일을 생성하고 `web_front\assets\gui_settings\GUI.json`의 `lang`에 추가하면 언어 지원을 확장할 수 있습니다. -- v.2.0.36-alpha - - 버그 수정 - - RVC의 음이 왜곡되는 문제 대책 - - vcclient v1로 생성된 DDPN 버전 RVC onnx 로드 실패 문제 대책 -- v.2.0.32-alpha Colab 버전 출시. ⇒ [여기](./w_okada's_Voice_Changer_version_2_x.ipynb) - - ngrok 없이도 사용 가능합니다. ngrok 계정이 없어도 이용할 수 있습니다. -- v.2.0.27-alpha - - 기능 - - Beatrice v2 alpha2 지원: 포먼트 변경, 품질 향상 - - 로그 강화 - - 다운로드 버튼 추가 - - 개선 사항 - - 업로드 중 두 번 클릭 방지 - - 업로드 중 표시 - - 오타 수정: paththrough -> passthrough - - 버그 수정 - - 성능 모니터에서 undefined가 반환될 때의 처리 추가 -- v.2.0.24-alpha Colab 버전 릴리스. ⇒ [여기](./w_okada's_Voice_Changer_version_2_x.ipynb) -- v.2.0.24-alpha - - 버그 수정: - - 모드 전환 시 소리가 나지 않는 문제를 해결 - - 기타: - - 로거 강화 - - 에러 화면 강화 -- v.2.0.23-alpha - - 에디션 재정리 - - win_std: 일반적인 윈도우 사용자 대상. DirectML을 통한 하드웨어 가속이 ONNX 모델과 torch 모델 모두에서 가능합니다. - - win_cuda: Nvidia GPU 소유자 대상. CUDA를 통한 하드웨어 가속이 ONNX 모델과 torch 모델 모두에서 가능합니다. CUDA 12.4 이상 필요. - - mac: AppleSilicon(M1 등) 사용자 대상. - - 기능 - - 클라이언트 모드에서 동작 시 출력 버퍼를 조정하는 기능 추가 - - 버그 수정: - - RVC의 torch 모델을 onnx 모델로 내보낼 때 index와 icon을 유지하는 문제 수정 - - 기타: - - 로거 강화 - -- v.2.0.20-alpha - - Support for torch-cuda. See the edition description [here](docs/01_basic_v2.0.z.md). - - Bugfix: - - Unified file encoding to UTF-8 -- v.2.0.16-alpha - - torch-dml 실험적 버전을 지원. 에디션에 대한 설명은 [여기](docs/01_basic_v2.0.z.md)를 참조. - - 버그 수정: - - rvc 파일 업로드 시 pth와 index 파일을 동시에 업로드할 수 없는 문제를 해결. - -- v.2.0.13-alpha - - onnxruntime-gpu 지원 추가. CUDA 에디션 릴리스. - - 버그 수정: - - onnxcrepe 관련 문제 해결 - - Beatrice v2 API의 ID 선택 문제 수정 - - 기타: - - 로거 강화 -- v. 2.0.6-alpha - - 신규: - - M1 계열 Mac에 대응했습니다. - - M1 MBA(monterey), M2 Pro MBP(venture)에서의 동작 실적이 있습니다. - - sonoma에서의 보고를 기다리고 있습니다. - - 버그 수정: - - Beatrice의 스피커 선택 시 pitch가 원래대로 돌아가는 버그를 수정했습니다. - - 기타: - - 오류 분석을 위한 정보 획득 강화 - -- v.2.0.5-alpha - - VCClient가 두 번째 버전으로 리부트 되었습니다. - - 대폭적인 소프트웨어 구조 변경으로 확장 용이성을 높였습니다. - - REST API를 제공하여 서드파티에서 클라이언트 개발을 용이하게 했습니다. - - 에디션 체계를 새롭게 개편했습니다. - - 스탠다드 에디션(win)은 GPU 유무와 상관없이 onnx 모델로 실행되는 것이 기본입니다. torch 모델은 onnx 모델로 변환한 후 사용하십시오. GPU를 소유한 사용자는 onnx 모델에서만 하드웨어 가속이 유효합니다. - - cuda 에디션(win)은 Nvidia GPU에 특화된 튜닝이 되어 있습니다. 스탠다드 에디션에 비해 더욱 빠른 속도가 가능합니다. onnx 모델에서만 하드웨어 가속이 유효합니다. - - torch 모델은 pytorch 모델도 하드웨어 가속을 지원합니다. - - mac 에디션은 Apple Silicon을 탑재한 Mac 사용자들을 위한 것입니다. - - linux 사용자나 python에 대한 지식이 있는 분들은 리포지토리를 클론하여 실행할 수도 있습니다. - - 현재 Alpha 버전에서는 스탠다드 에디션만 제공됩니다. # VC Client란