voice-changer/tutorials/tutorial_rvc_ja_latest.md

# Realtime Voice Changer Client for RVC チュートリアル(v.1.5.3.7)

[English](/tutorials/tutorial_rvc_en_latest.md)

# はじめに

本アプリケーションは、各種音声変換 AI(VC, Voice Conversion)を用いてリアルタイム音声変換を行うためのクライアントソフトウェアです。RVC, MMVCv13, MMVCv15, So-vits-svcv40 などのモデルに対応していますが本ドキュメントでは[RVC(Retrieval-based-Voice-Conversion)](https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI)を題材に音声変換のためのチュートリアルを行います。基本的な操作は大きく変わりません。

以下、本家の[Retrieval-based-Voice-Conversion-WebUI](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI)を本家 RVC と表記し、ddPn08 氏の作成した[RVC-WebUI](https://github.com/ddPn08/rvc-webui)を ddPn08RVC と記載します。

## 注意事項

- 学習については別途行う必要があります。
  - 自身で学習を行う場合は[本家 RVC](https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI)または[ddPn08RVC](https://github.com/ddPn08/rvc-webui)で行ってください。
  - ブラウザ上で学習用の音声を用意するには[録音アプリ on Github Pages](https://w-okada.github.io/voice-changer/)が便利です。
    - [解説動画](https://youtu.be/s_GirFEGvaA)
  - [training の TIPS](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs/training_tips_ja.md)が公開されているので参照してください。

# 起動まで

## GUI の起動

### Windows 版、

ダウンロードした zip ファイルを解凍して、`start_http.bat`を実行してください。

### Mac 版

ダウンロードファイルを解凍したのちに、`startHttp.command`を実行してください。開発元を検証できない旨が示される場合は、再度コントロールキーを押してクリックして実行してください(or 右クリックから実行してください)。

### リモート接続時の注意

リモートから接続する場合は、`.bat`ファイル(win)、`.command`ファイル(mac)の http が https に置き換わっているものを使用してください。

### コンソール表示

`.bat`ファイル(win)や`.command`ファイル(mac)を実行すると、次のような画面が表示され、初回起動時には各種データをインターネットからダウンロードします。
お使いの環境によりますが、多くの場合１～２分かかります。
![image](https://github.com/w-okada/voice-changer/assets/48346627/88a30097-2fb3-4c50-8bf1-19c41f27c481)

### GUI 表示

起動に必要なデータのダウンロードが完了すると下記のような ダイアログが表示されます。よろしければ黄色いアイコンを押して開発者にコーヒーをご馳走してあげてください。スタートボタンを押すとダイアログが消えます。

![image](https://github.com/w-okada/voice-changer/assets/48346627/a8d12b5c-d1e8-4ca6-aed0-72cee6bb97c1)

# GUI

下記のような画面が出れば成功です。

![image](https://github.com/w-okada/voice-changer/assets/48346627/27add00d-5059-4cbf-a732-9deb6dc309ff)

# クイックスタート

## 操作方法

起動時にダウンロードしたデータを用いて、すぐに音声変換を行うことができます。

(1) モデル選択エリアから使いたいモデルをクリックします。モデルがロードされるとモデルに設定されているキャラクタの画像が画面に表示されます。

(2) 使用するマイク(input)とスピーカー(output)を選択します。慣れていない方は、client を選択して、マイクとスピーカーを選択することを推奨します。（server との違いは後述します。）

(3) スタートボタンを押すと、数秒のデータロードの後に音声変換が開始されます。マイクに何かしゃべってみてください。スピーカーから変換後の音声が聞こえてくると思います。

![image](https://github.com/w-okada/voice-changer/assets/48346627/883b296e-e5ca-4571-8fed-dcf7495ebb92)

## クイックスタートにおける FAQ

Q1. 音がとぎれとぎれになってしまう。

A1. PC の性能が十分ではない可能性があります。CHUNK の値を大きくしてみてください(下図(A))。(1024 など)。また F0 Det を dio にしてみてください(下図(B))。

![image](https://github.com/w-okada/voice-changer/assets/48346627/3c485d9b-53be-47c1-85d9-8663363b06f9)

Q2. 音声が変換されない。

A2. [こちら](https://github.com/w-okada/voice-changer/blob/master/tutorials/trouble_shoot_communication_ja.md)を参照して問題点の場所を明らかにして、対応を検討してください。

Q3. 音程がおかしい

A3. クイックスタートでは説明しませんでしたが、Pitch 変更可能なモデルであれば TUNE で変更できます。後述の詳細説明をご確認ください。

# GUI の詳細

## タイトルエリア

![image](https://github.com/w-okada/voice-changer/assets/48346627/bb813fbb-4ea1-4c3b-87b0-da75b7eaac5e)

タイトル下のアイコンはリンクになっています。

| アイコン                                                                                                                                     | リンク                           |
| :------------------------------------------------------------------------------------------------------------------------------------------- | :------------------------------- |
| <img src="https://github.com/w-okada/rvc-trainer-docker/assets/48346627/97c18ca5-eee5-4be2-92a7-8092fff960f2" width="32"> Octocat            | github のリポジトリへのリンク    |
| <img src="https://github.com/w-okada/rvc-trainer-docker/assets/48346627/751164e4-7b7d-4d7e-b49c-1ad660bf7439" width="32"> クエスションマーク | マニュアル へのリンク            |
| <img src="https://github.com/w-okada/rvc-trainer-docker/assets/48346627/7bc188db-3aae-43eb-98a1-34aacc16173d" width="32"> スパナ             | 各種便利ツールへのリンク         |
| <img src="https://github.com/w-okada/rvc-trainer-docker/assets/48346627/5db16acc-e901-40d2-8fc2-1fb9fd67f59c" width="32"> コーヒー           | 開発者へ**寄付**するためのリンク |

### claer setting

設定を初期化します。

## モデル選択エリア

![image](https://github.com/w-okada/voice-changer/assets/48346627/503eb581-a560-42b2-985b-d229d186eac8)

使用するモデルを選択します。

編集ボタンを押すと、モデル一覧（モデルスロット）を編集することができます。詳細はモデルスロット編集画面をご確認ください。

## メインコントロールエリア

![image](https://github.com/w-okada/voice-changer/assets/48346627/5a8dcf64-29d3-49cd-92f1-db7b539bfb3d)

左側にロードされたモデルのキャラクタ画像が表示されます。キャラクタ画像の左上にリアルタイム変換の状況がオーバレイ表示されます。

右側のボタンやスライダーで各種コントロールを行います。

### リアルタイム変換の状況

声を出してから変換までのラグは`buf + res秒`です。調整の際は buf の時間が res よりも長くなるように調整してください。

なお、デバイスを server device モードで使用している場合は buf の表示は行われません。CHUNK に表示されている値を目安に調整してください。

#### vol

音声変換後の音量です。

#### buf

音声を切り取る一回の区間の長さ(ms)です。CHUNK を短くするとこの数値が減ります。

#### res

CHUNK と EXTRA を足したデータを変換にかかる時間です。CHUNK と EXTRA のいずれでも短くすると数値が減ります。

### コントロール

#### start/stop ボタン

start で音声変換を開始、stop で音声変換を停止します

#### GAIN

- in: モデルへの入力音声の音量の大きさを変化させます。

- out: 変換後の音声の音量の大きさを変化させます。

#### TUNE

声のピッチをどれくらい変換するかの値を入れます。推論中に変換もできます。以下は設定の目安です。

- 男声 → 女声　の変換では+12
- 女声 → 男声　の変換では-12

#### INDEX (RVC のみ)

学習で使用した特徴量に寄せる比率を指定します。index ファイルが登録されているモデルのみ有効です。
0 で HuBERT の出力をそのまま使う、1 で元の特徴量にすべて寄せます。
index ratio が 0 より大きいと検索に時間がかかる場合があります。

#### Voice

音声変換先の話者を設定します。

#### 設定保存ボタン

設定した内容を保存します。モデルを再度呼び出したときに設定内容が反映されます。（一部のぞく）

#### ONNX 出力 (RVC のみ)

PyTorch のモデルを ONNX に変換して出力します。ロードされているモデルが RVC の PyTorch モデルである場合のみ有効です。

#### その他

使用する音声変換 AI モデルにより設定可能な内容が増減します。モデル開発元のサイトなどで機能等をご確認ください。

## 詳細設定エリア

![image](https://github.com/w-okada/voice-changer/assets/48346627/cd04ba9f-f7e8-4a7e-8c93-cda3c81f3c1a)

動作設定や変換処理の内容を確認することができます。

#### NOISE

ノイズ除去機能の ON/OFF を切り替えられます。Client Device モードでのみ有効です。

- Echo: エコーキャンセル機能
- Sup1, Sup2: ノイズ抑制機能です

#### F0 Det (F0 Estimator)

ピッチを抽出するためのアルゴリズムを選びます。次の中から選べます。

- 軽量な`dio`
- 高精度な`harvest`
- GPU を使用する `crepe`

#### S. Thresh (Noise Gate)

音声変換を行う音量の閾地です。この値より小さい rms の時は音声変換をせず無音を返します。
（この場合、変換処理がスキップされるので、あまり負荷がかかりません。）

#### CHUNK (Input Chunk Num)

一度の変換でどれくらいの長さを切り取って変換するかを決めます。これが大きいほど効率的に変換できますが、buf の値が大きくなり変換が開始されるまでの最大の時間が伸びます。 buff: におよその時間が表示されます。

#### EXTRA (Extra Data Length)

音声を変換する際、入力にどれくらいの長さの過去の音声を入れるかを決めます。過去の音声が長く入っているほど変換の精度はよくなりますが、その分計算に時間がかかるため res が長くなります。
(おそらく Transformer がネックなので、これの長さの 2 乗で計算時間は増えます)

詳細は[こちらの資料](https://github.com/w-okada/voice-changer/issues/154#issuecomment-1502534841)をご覧ください。

#### GPU

onnxgpu 版では使用する GPU を選択することができます。

onnxdirectML 版では GPU の ON/OFF を切り替えることができます。

#### AUDIO

使用するオーディオデバイスのタイプを選びます。詳細は[こちらの文書](./tutorial_device_mode.md)をご確認ください。

- client: ノイズ抑制機能など GUI(chrome)の機能を活用してマイク入力、スピーカー出力を行うことができます。
- server: VCClient が直接マイクとスピーカーを操作します。遅延を抑えることができます。

#### input

マイク入力など音声入力デバイスを選択できます。音声ファイルからのインプットも可能です(サイズ上限あり)。

#### output

スピーカー出力など音声出力デバイスを選択できます。

#### monitor

モニター用にスピーカー出力など音声出力デバイスを選択できます。server device モードの場合のみ有効です。

詳細は[こちらの文書](./tutorial_monitor_consept_ja.md)をご確認ください。

#### REC.

変換後の音声をファイル出力します。

### ServerIO Analizer

音声変換 AI に入力される音声と音声変換 AI から出力される音声を録音し、確認することができます。

大まかな考え方は[こちらの文書](trouble_shoot_communication_ja.md)を確認ください。

#### SIO rec.

音声変換 AI に入力される音声と音声変換 AI から出力される音声を録音を開始/停止します。

#### output

録音した音声を再生するスピーカーを設定します。

#### in

音声変換 AI に入力される音声を再生します。

#### out

音声変換 AI から出力された音声を再生します。

### more...

より高度な操作を行うことができます。

#### Merge Lab

モデルの合成を行うことができます。

#### Advanced Setting

より高度な設定を行うことができます。

#### Server Info

現在のサーバの設定を確認することができます。
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								# Realtime Voice Changer Client for RVC チュートリアル(v.1.5.3.7)
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-06-18 11:42:12 +03:00
+								[English](/tutorials/tutorial_rvc_en_latest.md)
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
+								# はじめに
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								本アプリケーションは、各種音声変換 AI(VC, Voice Conversion)を用いてリアルタイム音声変換を行うためのクライアントソフトウェアです。RVC, MMVCv13, MMVCv15, So-vits-svcv40 などのモデルに対応していますが本ドキュメントでは[RVC(Retrieval-based-Voice-Conversion)](https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI)を題材に音声変換のためのチュートリアルを行います。基本的な操作は大きく変わりません。
-												v.1.5.2.5用チュートリアルの更新(日本語のみ)

											
										
										
											2023-04-26 17:34:12 +03:00
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
+								以下、本家の[Retrieval-based-Voice-Conversion-WebUI](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI)を本家 RVC と表記し、ddPn08 氏の作成した[RVC-WebUI](https://github.com/ddPn08/rvc-webui)を ddPn08RVC と記載します。
-												v.1.5.2.5用チュートリアルの更新(日本語のみ)

											
										
										
											2023-04-26 17:34:12 +03:00
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
+								## 注意事項
 								- 学習については別途行う必要があります。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
+								  - 自身で学習を行う場合は[本家 RVC](https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI)または[ddPn08RVC](https://github.com/ddPn08/rvc-webui)で行ってください。
-												英語版チュートリアルの追加

											
										
										
											2023-04-25 16:03:16 +03:00
+								  - ブラウザ上で学習用の音声を用意するには[録音アプリ on Github Pages](https://w-okada.github.io/voice-changer/)が便利です。
 								    - [解説動画](https://youtu.be/s_GirFEGvaA)
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
+								  - [training の TIPS](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs/training_tips_ja.md)が公開されているので参照してください。
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
 								# 起動まで
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
+								## GUI の起動
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
+								### Windows 版、
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
+								ダウンロードした zip ファイルを解凍して、`start_http.bat`を実行してください。
 								### Mac 版
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
+								ダウンロードファイルを解凍したのちに、`startHttp.command`を実行してください。開発元を検証できない旨が示される場合は、再度コントロールキーを押してクリックして実行してください(or 右クリックから実行してください)。
 								### リモート接続時の注意
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
+								リモートから接続する場合は、`.bat`ファイル(win)、`.command`ファイル(mac)の http が https に置き換わっているものを使用してください。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
+								### コンソール表示
 								`.bat`ファイル(win)や`.command`ファイル(mac)を実行すると、次のような画面が表示され、初回起動時には各種データをインターネットからダウンロードします。
 								お使いの環境によりますが、多くの場合１～２分かかります。
 								![image](https://github.com/w-okada/voice-changer/assets/48346627/88a30097-2fb3-4c50-8bf1-19c41f27c481)
 								### GUI 表示
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								起動に必要なデータのダウンロードが完了すると下記のような ダイアログが表示されます。よろしければ黄色いアイコンを押して開発者にコーヒーをご馳走してあげてください。スタートボタンを押すとダイアログが消えます。
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								![image](https://github.com/w-okada/voice-changer/assets/48346627/a8d12b5c-d1e8-4ca6-aed0-72cee6bb97c1)
-												指摘事項の修正

											
										
										
											2023-04-28 14:07:58 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								# GUI
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								下記のような画面が出れば成功です。
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								![image](https://github.com/w-okada/voice-changer/assets/48346627/27add00d-5059-4cbf-a732-9deb6dc309ff)
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
 								# クイックスタート
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								## 操作方法
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
+								起動時にダウンロードしたデータを用いて、すぐに音声変換を行うことができます。
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								(1) モデル選択エリアから使いたいモデルをクリックします。モデルがロードされるとモデルに設定されているキャラクタの画像が画面に表示されます。
 								(2) 使用するマイク(input)とスピーカー(output)を選択します。慣れていない方は、client を選択して、マイクとスピーカーを選択することを推奨します。（server との違いは後述します。）
 								(3) スタートボタンを押すと、数秒のデータロードの後に音声変換が開始されます。マイクに何かしゃべってみてください。スピーカーから変換後の音声が聞こえてくると思います。
 								![image](https://github.com/w-okada/voice-changer/assets/48346627/883b296e-e5ca-4571-8fed-dcf7495ebb92)
 								## クイックスタートにおける FAQ
 								Q1. 音がとぎれとぎれになってしまう。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								A1. PC の性能が十分ではない可能性があります。CHUNK の値を大きくしてみてください(下図(A))。(1024 など)。また F0 Det を dio にしてみてください(下図(B))。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								![image](https://github.com/w-okada/voice-changer/assets/48346627/3c485d9b-53be-47c1-85d9-8663363b06f9)
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								Q2. 音声が変換されない。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-04 04:20:54 +03:00
+								A2. [こちら](https://github.com/w-okada/voice-changer/blob/master/tutorials/trouble_shoot_communication_ja.md)を参照して問題点の場所を明らかにして、対応を検討してください。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								Q3. 音程がおかしい
-												updat

											
										
										
											2023-05-19 05:30:38 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								A3. クイックスタートでは説明しませんでしたが、Pitch 変更可能なモデルであれば TUNE で変更できます。後述の詳細説明をご確認ください。
-												updat

											
										
										
											2023-05-19 05:30:38 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								# GUI の詳細
 								## タイトルエリア
 								![image](https://github.com/w-okada/voice-changer/assets/48346627/bb813fbb-4ea1-4c3b-87b0-da75b7eaac5e)
 								タイトル下のアイコンはリンクになっています。
-												updat

											
										
										
											2023-05-19 05:30:38 +03:00
 								| アイコン                                                                                                                                     | リンク                           |
 								| :------------------------------------------------------------------------------------------------------------------------------------------- | :------------------------------- |
 								| <img src="https://github.com/w-okada/rvc-trainer-docker/assets/48346627/97c18ca5-eee5-4be2-92a7-8092fff960f2" width="32"> Octocat            | github のリポジトリへのリンク    |
 								| <img src="https://github.com/w-okada/rvc-trainer-docker/assets/48346627/751164e4-7b7d-4d7e-b49c-1ad660bf7439" width="32"> クエスションマーク | マニュアル へのリンク            |
 								| <img src="https://github.com/w-okada/rvc-trainer-docker/assets/48346627/7bc188db-3aae-43eb-98a1-34aacc16173d" width="32"> スパナ             | 各種便利ツールへのリンク         |
 								| <img src="https://github.com/w-okada/rvc-trainer-docker/assets/48346627/5db16acc-e901-40d2-8fc2-1fb9fd67f59c" width="32"> コーヒー           | 開発者へ**寄付**するためのリンク |
 								### claer setting
 								設定を初期化します。
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								## モデル選択エリア
-												updat

											
										
										
											2023-05-19 05:30:38 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								![image](https://github.com/w-okada/voice-changer/assets/48346627/503eb581-a560-42b2-985b-d229d186eac8)
-												updat

											
										
										
											2023-05-19 05:30:38 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								使用するモデルを選択します。
-												updat

											
										
										
											2023-05-19 05:30:38 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								編集ボタンを押すと、モデル一覧（モデルスロット）を編集することができます。詳細はモデルスロット編集画面をご確認ください。
-												updat

											
										
										
											2023-05-19 05:30:38 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								## メインコントロールエリア
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								![image](https://github.com/w-okada/voice-changer/assets/48346627/5a8dcf64-29d3-49cd-92f1-db7b539bfb3d)
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								左側にロードされたモデルのキャラクタ画像が表示されます。キャラクタ画像の左上にリアルタイム変換の状況がオーバレイ表示されます。
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								右側のボタンやスライダーで各種コントロールを行います。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								### リアルタイム変換の状況
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
+								声を出してから変換までのラグは`buf + res秒`です。調整の際は buf の時間が res よりも長くなるように調整してください。
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								なお、デバイスを server device モードで使用している場合は buf の表示は行われません。CHUNK に表示されている値を目安に調整してください。
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
 								#### vol
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
+								音声変換後の音量です。
 								#### buf
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								音声を切り取る一回の区間の長さ(ms)です。CHUNK を短くするとこの数値が減ります。
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
 								#### res
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								CHUNK と EXTRA を足したデータを変換にかかる時間です。CHUNK と EXTRA のいずれでも短くすると数値が減ります。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								### コントロール
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								#### start/stop ボタン
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								start で音声変換を開始、stop で音声変換を停止します
-												v.1.5.2.5用チュートリアルの更新(日本語のみ)

											
										
										
											2023-04-26 17:34:12 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								#### GAIN
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								- in: モデルへの入力音声の音量の大きさを変化させます。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								- out: 変換後の音声の音量の大きさを変化させます。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								#### TUNE
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								声のピッチをどれくらい変換するかの値を入れます。推論中に変換もできます。以下は設定の目安です。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								- 男声 → 女声　の変換では+12
 								- 女声 → 男声　の変換では-12
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								#### INDEX (RVC のみ)
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								学習で使用した特徴量に寄せる比率を指定します。index ファイルが登録されているモデルのみ有効です。
 で HuBERT の出力をそのまま使う、1 で元の特徴量にすべて寄せます。
 								index ratio が 0 より大きいと検索に時間がかかる場合があります。
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								#### Voice
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								音声変換先の話者を設定します。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								#### 設定保存ボタン
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								設定した内容を保存します。モデルを再度呼び出したときに設定内容が反映されます。（一部のぞく）
-												英語版アップデートとreadmeからのリンクの張替え

											
										
										
											2023-04-29 01:34:01 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								#### ONNX 出力 (RVC のみ)
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								PyTorch のモデルを ONNX に変換して出力します。ロードされているモデルが RVC の PyTorch モデルである場合のみ有効です。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								#### その他
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								使用する音声変換 AI モデルにより設定可能な内容が増減します。モデル開発元のサイトなどで機能等をご確認ください。
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								## 詳細設定エリア
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								![image](https://github.com/w-okada/voice-changer/assets/48346627/cd04ba9f-f7e8-4a7e-8c93-cda3c81f3c1a)
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								動作設定や変換処理の内容を確認することができます。
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								#### NOISE
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								ノイズ除去機能の ON/OFF を切り替えられます。Client Device モードでのみ有効です。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								- Echo: エコーキャンセル機能
 								- Sup1, Sup2: ノイズ抑制機能です
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								#### F0 Det (F0 Estimator)
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								ピッチを抽出するためのアルゴリズムを選びます。次の中から選べます。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								- 軽量な`dio`
 								- 高精度な`harvest`
 								- GPU を使用する `crepe`
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								#### S. Thresh (Noise Gate)
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								音声変換を行う音量の閾地です。この値より小さい rms の時は音声変換をせず無音を返します。
 								（この場合、変換処理がスキップされるので、あまり負荷がかかりません。）
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								#### CHUNK (Input Chunk Num)
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								一度の変換でどれくらいの長さを切り取って変換するかを決めます。これが大きいほど効率的に変換できますが、buf の値が大きくなり変換が開始されるまでの最大の時間が伸びます。 buff: におよその時間が表示されます。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								#### EXTRA (Extra Data Length)
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								音声を変換する際、入力にどれくらいの長さの過去の音声を入れるかを決めます。過去の音声が長く入っているほど変換の精度はよくなりますが、その分計算に時間がかかるため res が長くなります。
 								(おそらく Transformer がネックなので、これの長さの 2 乗で計算時間は増えます)
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								詳細は[こちらの資料](https://github.com/w-okada/voice-changer/issues/154#issuecomment-1502534841)をご覧ください。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								#### GPU
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								onnxgpu 版では使用する GPU を選択することができます。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								onnxdirectML 版では GPU の ON/OFF を切り替えることができます。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								#### AUDIO
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								使用するオーディオデバイスのタイプを選びます。詳細は[こちらの文書](./tutorial_device_mode.md)をご確認ください。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								- client: ノイズ抑制機能など GUI(chrome)の機能を活用してマイク入力、スピーカー出力を行うことができます。
 								- server: VCClient が直接マイクとスピーカーを操作します。遅延を抑えることができます。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								#### input
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								マイク入力など音声入力デバイスを選択できます。音声ファイルからのインプットも可能です(サイズ上限あり)。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								#### output
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								スピーカー出力など音声出力デバイスを選択できます。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								#### monitor
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								モニター用にスピーカー出力など音声出力デバイスを選択できます。server device モードの場合のみ有効です。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 22:17:50 +03:00
+								詳細は[こちらの文書](./tutorial_monitor_consept_ja.md)をご確認ください。
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								#### REC.
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								変換後の音声をファイル出力します。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								### ServerIO Analizer
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								音声変換 AI に入力される音声と音声変換 AI から出力される音声を録音し、確認することができます。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								大まかな考え方は[こちらの文書](trouble_shoot_communication_ja.md)を確認ください。
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								#### SIO rec.
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								音声変換 AI に入力される音声と音声変換 AI から出力される音声を録音を開始/停止します。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								#### output
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								録音した音声を再生するスピーカーを設定します。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												Bugfix:
 - server device mode: filter for monitor is not work

											
										
										
											2023-07-01 21:03:33 +03:00
+								#### in
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								音声変換 AI に入力される音声を再生します。
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								#### out
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								音声変換 AI から出力された音声を再生します。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								### more...
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								より高度な操作を行うことができます。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								#### Merge Lab
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								モデルの合成を行うことができます。
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								#### Advanced Setting
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								より高度な設定を行うことができます。
-												tutorial in japanese

画像の修正

											
										
										
											2023-04-24 03:06:28 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								#### Server Info
-												update

											
										
										
											2023-05-18 18:59:13 +03:00
-												update

											
										
										
											2023-07-01 20:01:38 +03:00
+								現在のサーバの設定を確認することができます。