2023-07-01 20:01:38 +03:00
|
|
|
|
# Realtime Voice Changer Client for RVC チュートリアル(v.1.5.3.7)
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-06-18 11:42:12 +03:00
|
|
|
|
[English](/tutorials/tutorial_rvc_en_latest.md)
|
|
|
|
|
|
2023-04-24 03:06:28 +03:00
|
|
|
|
# はじめに
|
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
本アプリケーションは、各種音声変換 AI(VC, Voice Conversion)を用いてリアルタイム音声変換を行うためのクライアントソフトウェアです。RVC, MMVCv13, MMVCv15, So-vits-svcv40 などのモデルに対応していますが本ドキュメントでは[RVC(Retrieval-based-Voice-Conversion)](https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI)を題材に音声変換のためのチュートリアルを行います。基本的な操作は大きく変わりません。
|
2023-04-26 17:34:12 +03:00
|
|
|
|
|
2023-05-18 18:59:13 +03:00
|
|
|
|
以下、本家の[Retrieval-based-Voice-Conversion-WebUI](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI)を本家 RVC と表記し、ddPn08 氏の作成した[RVC-WebUI](https://github.com/ddPn08/rvc-webui)を ddPn08RVC と記載します。
|
2023-04-26 17:34:12 +03:00
|
|
|
|
|
2023-04-24 03:06:28 +03:00
|
|
|
|
## 注意事項
|
|
|
|
|
|
|
|
|
|
- 学習については別途行う必要があります。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
- 自身で学習を行う場合は[本家 RVC](https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI)または[ddPn08RVC](https://github.com/ddPn08/rvc-webui)で行ってください。
|
2023-04-25 16:03:16 +03:00
|
|
|
|
- ブラウザ上で学習用の音声を用意するには[録音アプリ on Github Pages](https://w-okada.github.io/voice-changer/)が便利です。
|
|
|
|
|
- [解説動画](https://youtu.be/s_GirFEGvaA)
|
2023-05-18 18:59:13 +03:00
|
|
|
|
- [training の TIPS](https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs/training_tips_ja.md)が公開されているので参照してください。
|
2023-04-24 03:06:28 +03:00
|
|
|
|
|
|
|
|
|
# 起動まで
|
|
|
|
|
|
2023-05-18 18:59:13 +03:00
|
|
|
|
## GUI の起動
|
|
|
|
|
|
2023-04-24 03:06:28 +03:00
|
|
|
|
### Windows 版、
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-04-24 03:06:28 +03:00
|
|
|
|
ダウンロードした zip ファイルを解凍して、`start_http.bat`を実行してください。
|
|
|
|
|
|
|
|
|
|
### Mac 版
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-04-24 03:06:28 +03:00
|
|
|
|
ダウンロードファイルを解凍したのちに、`startHttp.command`を実行してください。開発元を検証できない旨が示される場合は、再度コントロールキーを押してクリックして実行してください(or 右クリックから実行してください)。
|
|
|
|
|
|
|
|
|
|
### リモート接続時の注意
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-04-24 03:06:28 +03:00
|
|
|
|
リモートから接続する場合は、`.bat`ファイル(win)、`.command`ファイル(mac)の http が https に置き換わっているものを使用してください。
|
|
|
|
|
|
2023-05-18 18:59:13 +03:00
|
|
|
|
### コンソール表示
|
|
|
|
|
|
|
|
|
|
`.bat`ファイル(win)や`.command`ファイル(mac)を実行すると、次のような画面が表示され、初回起動時には各種データをインターネットからダウンロードします。
|
|
|
|
|
お使いの環境によりますが、多くの場合1~2分かかります。
|
|
|
|
|
![image](https://github.com/w-okada/voice-changer/assets/48346627/88a30097-2fb3-4c50-8bf1-19c41f27c481)
|
|
|
|
|
|
|
|
|
|
### GUI 表示
|
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
起動に必要なデータのダウンロードが完了すると下記のような ダイアログが表示されます。よろしければ黄色いアイコンを押して開発者にコーヒーをご馳走してあげてください。スタートボタンを押すとダイアログが消えます。
|
2023-04-24 03:06:28 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
![image](https://github.com/w-okada/voice-changer/assets/48346627/a8d12b5c-d1e8-4ca6-aed0-72cee6bb97c1)
|
2023-04-28 14:07:58 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
# GUI
|
2023-04-24 03:06:28 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
下記のような画面が出れば成功です。
|
2023-04-24 03:06:28 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
![image](https://github.com/w-okada/voice-changer/assets/48346627/27add00d-5059-4cbf-a732-9deb6dc309ff)
|
2023-04-24 03:06:28 +03:00
|
|
|
|
|
|
|
|
|
# クイックスタート
|
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
## 操作方法
|
|
|
|
|
|
2023-05-18 18:59:13 +03:00
|
|
|
|
起動時にダウンロードしたデータを用いて、すぐに音声変換を行うことができます。
|
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
(1) モデル選択エリアから使いたいモデルをクリックします。モデルがロードされるとモデルに設定されているキャラクタの画像が画面に表示されます。
|
|
|
|
|
|
|
|
|
|
(2) 使用するマイク(input)とスピーカー(output)を選択します。慣れていない方は、client を選択して、マイクとスピーカーを選択することを推奨します。(server との違いは後述します。)
|
|
|
|
|
|
|
|
|
|
(3) スタートボタンを押すと、数秒のデータロードの後に音声変換が開始されます。マイクに何かしゃべってみてください。スピーカーから変換後の音声が聞こえてくると思います。
|
|
|
|
|
|
|
|
|
|
![image](https://github.com/w-okada/voice-changer/assets/48346627/883b296e-e5ca-4571-8fed-dcf7495ebb92)
|
|
|
|
|
|
|
|
|
|
## クイックスタートにおける FAQ
|
|
|
|
|
|
|
|
|
|
Q1. 音がとぎれとぎれになってしまう。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
A1. PC の性能が十分ではない可能性があります。CHUNK の値を大きくしてみてください(下図(A))。(1024 など)。また F0 Det を dio にしてみてください(下図(B))。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
![image](https://github.com/w-okada/voice-changer/assets/48346627/3c485d9b-53be-47c1-85d9-8663363b06f9)
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
Q2. 音声が変換されない。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-04 04:20:54 +03:00
|
|
|
|
A2. [こちら](https://github.com/w-okada/voice-changer/blob/master/tutorials/trouble_shoot_communication_ja.md)を参照して問題点の場所を明らかにして、対応を検討してください。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
Q3. 音程がおかしい
|
2023-05-19 05:30:38 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
A3. クイックスタートでは説明しませんでしたが、Pitch 変更可能なモデルであれば TUNE で変更できます。後述の詳細説明をご確認ください。
|
2023-05-19 05:30:38 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
# GUI の詳細
|
|
|
|
|
|
|
|
|
|
## タイトルエリア
|
|
|
|
|
|
|
|
|
|
![image](https://github.com/w-okada/voice-changer/assets/48346627/bb813fbb-4ea1-4c3b-87b0-da75b7eaac5e)
|
|
|
|
|
|
|
|
|
|
タイトル下のアイコンはリンクになっています。
|
2023-05-19 05:30:38 +03:00
|
|
|
|
|
|
|
|
|
| アイコン | リンク |
|
|
|
|
|
| :------------------------------------------------------------------------------------------------------------------------------------------- | :------------------------------- |
|
|
|
|
|
| <img src="https://github.com/w-okada/rvc-trainer-docker/assets/48346627/97c18ca5-eee5-4be2-92a7-8092fff960f2" width="32"> Octocat | github のリポジトリへのリンク |
|
|
|
|
|
| <img src="https://github.com/w-okada/rvc-trainer-docker/assets/48346627/751164e4-7b7d-4d7e-b49c-1ad660bf7439" width="32"> クエスションマーク | マニュアル へのリンク |
|
|
|
|
|
| <img src="https://github.com/w-okada/rvc-trainer-docker/assets/48346627/7bc188db-3aae-43eb-98a1-34aacc16173d" width="32"> スパナ | 各種便利ツールへのリンク |
|
|
|
|
|
| <img src="https://github.com/w-okada/rvc-trainer-docker/assets/48346627/5db16acc-e901-40d2-8fc2-1fb9fd67f59c" width="32"> コーヒー | 開発者へ**寄付**するためのリンク |
|
|
|
|
|
|
|
|
|
|
### claer setting
|
|
|
|
|
|
|
|
|
|
設定を初期化します。
|
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
## モデル選択エリア
|
2023-05-19 05:30:38 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
![image](https://github.com/w-okada/voice-changer/assets/48346627/503eb581-a560-42b2-985b-d229d186eac8)
|
2023-05-19 05:30:38 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
使用するモデルを選択します。
|
2023-05-19 05:30:38 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
編集ボタンを押すと、モデル一覧(モデルスロット)を編集することができます。詳細はモデルスロット編集画面をご確認ください。
|
2023-05-19 05:30:38 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
## メインコントロールエリア
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
![image](https://github.com/w-okada/voice-changer/assets/48346627/5a8dcf64-29d3-49cd-92f1-db7b539bfb3d)
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
左側にロードされたモデルのキャラクタ画像が表示されます。キャラクタ画像の左上にリアルタイム変換の状況がオーバレイ表示されます。
|
2023-04-24 03:06:28 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
右側のボタンやスライダーで各種コントロールを行います。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
### リアルタイム変換の状況
|
2023-04-24 03:06:28 +03:00
|
|
|
|
|
2023-05-18 18:59:13 +03:00
|
|
|
|
声を出してから変換までのラグは`buf + res秒`です。調整の際は buf の時間が res よりも長くなるように調整してください。
|
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
なお、デバイスを server device モードで使用している場合は buf の表示は行われません。CHUNK に表示されている値を目安に調整してください。
|
2023-04-24 03:06:28 +03:00
|
|
|
|
|
|
|
|
|
#### vol
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-04-24 03:06:28 +03:00
|
|
|
|
音声変換後の音量です。
|
|
|
|
|
|
|
|
|
|
#### buf
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
音声を切り取る一回の区間の長さ(ms)です。CHUNK を短くするとこの数値が減ります。
|
2023-04-24 03:06:28 +03:00
|
|
|
|
|
|
|
|
|
#### res
|
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
CHUNK と EXTRA を足したデータを変換にかかる時間です。CHUNK と EXTRA のいずれでも短くすると数値が減ります。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
### コントロール
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
#### start/stop ボタン
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
start で音声変換を開始、stop で音声変換を停止します
|
2023-04-26 17:34:12 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
#### GAIN
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
- in: モデルへの入力音声の音量の大きさを変化させます。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
- out: 変換後の音声の音量の大きさを変化させます。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
#### TUNE
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
声のピッチをどれくらい変換するかの値を入れます。推論中に変換もできます。以下は設定の目安です。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
- 男声 → 女声 の変換では+12
|
|
|
|
|
- 女声 → 男声 の変換では-12
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
#### INDEX (RVC のみ)
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
学習で使用した特徴量に寄せる比率を指定します。index ファイルが登録されているモデルのみ有効です。
|
|
|
|
|
0 で HuBERT の出力をそのまま使う、1 で元の特徴量にすべて寄せます。
|
|
|
|
|
index ratio が 0 より大きいと検索に時間がかかる場合があります。
|
2023-04-24 03:06:28 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
#### Voice
|
2023-04-24 03:06:28 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
音声変換先の話者を設定します。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
#### 設定保存ボタン
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
設定した内容を保存します。モデルを再度呼び出したときに設定内容が反映されます。(一部のぞく)
|
2023-04-29 01:34:01 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
#### ONNX 出力 (RVC のみ)
|
2023-04-24 03:06:28 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
PyTorch のモデルを ONNX に変換して出力します。ロードされているモデルが RVC の PyTorch モデルである場合のみ有効です。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
#### その他
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
使用する音声変換 AI モデルにより設定可能な内容が増減します。モデル開発元のサイトなどで機能等をご確認ください。
|
2023-04-24 03:06:28 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
## 詳細設定エリア
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
![image](https://github.com/w-okada/voice-changer/assets/48346627/cd04ba9f-f7e8-4a7e-8c93-cda3c81f3c1a)
|
2023-04-24 03:06:28 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
動作設定や変換処理の内容を確認することができます。
|
2023-04-24 03:06:28 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
#### NOISE
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
ノイズ除去機能の ON/OFF を切り替えられます。Client Device モードでのみ有効です。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
- Echo: エコーキャンセル機能
|
|
|
|
|
- Sup1, Sup2: ノイズ抑制機能です
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
#### F0 Det (F0 Estimator)
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
ピッチを抽出するためのアルゴリズムを選びます。次の中から選べます。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
- 軽量な`dio`
|
|
|
|
|
- 高精度な`harvest`
|
|
|
|
|
- GPU を使用する `crepe`
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
#### S. Thresh (Noise Gate)
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
音声変換を行う音量の閾地です。この値より小さい rms の時は音声変換をせず無音を返します。
|
|
|
|
|
(この場合、変換処理がスキップされるので、あまり負荷がかかりません。)
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
#### CHUNK (Input Chunk Num)
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
一度の変換でどれくらいの長さを切り取って変換するかを決めます。これが大きいほど効率的に変換できますが、buf の値が大きくなり変換が開始されるまでの最大の時間が伸びます。 buff: におよその時間が表示されます。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
#### EXTRA (Extra Data Length)
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
音声を変換する際、入力にどれくらいの長さの過去の音声を入れるかを決めます。過去の音声が長く入っているほど変換の精度はよくなりますが、その分計算に時間がかかるため res が長くなります。
|
|
|
|
|
(おそらく Transformer がネックなので、これの長さの 2 乗で計算時間は増えます)
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
詳細は[こちらの資料](https://github.com/w-okada/voice-changer/issues/154#issuecomment-1502534841)をご覧ください。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
#### GPU
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
onnxgpu 版では使用する GPU を選択することができます。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
onnxdirectML 版では GPU の ON/OFF を切り替えることができます。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
#### AUDIO
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
使用するオーディオデバイスのタイプを選びます。詳細は[こちらの文書](./tutorial_device_mode.md)をご確認ください。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
- client: ノイズ抑制機能など GUI(chrome)の機能を活用してマイク入力、スピーカー出力を行うことができます。
|
|
|
|
|
- server: VCClient が直接マイクとスピーカーを操作します。遅延を抑えることができます。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
#### input
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
マイク入力など音声入力デバイスを選択できます。音声ファイルからのインプットも可能です(サイズ上限あり)。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
#### output
|
2023-04-24 03:06:28 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
スピーカー出力など音声出力デバイスを選択できます。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
#### monitor
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
モニター用にスピーカー出力など音声出力デバイスを選択できます。server device モードの場合のみ有効です。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 22:17:50 +03:00
|
|
|
|
詳細は[こちらの文書](./tutorial_monitor_consept_ja.md)をご確認ください。
|
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
#### REC.
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
変換後の音声をファイル出力します。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
### ServerIO Analizer
|
2023-04-24 03:06:28 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
音声変換 AI に入力される音声と音声変換 AI から出力される音声を録音し、確認することができます。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
大まかな考え方は[こちらの文書](trouble_shoot_communication_ja.md)を確認ください。
|
2023-04-24 03:06:28 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
#### SIO rec.
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
音声変換 AI に入力される音声と音声変換 AI から出力される音声を録音を開始/停止します。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
#### output
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
録音した音声を再生するスピーカーを設定します。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 21:03:33 +03:00
|
|
|
|
#### in
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
音声変換 AI に入力される音声を再生します。
|
2023-04-24 03:06:28 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
#### out
|
2023-04-24 03:06:28 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
音声変換 AI から出力された音声を再生します。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
### more...
|
2023-04-24 03:06:28 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
より高度な操作を行うことができます。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
#### Merge Lab
|
2023-04-24 03:06:28 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
モデルの合成を行うことができます。
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
#### Advanced Setting
|
2023-04-24 03:06:28 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
より高度な設定を行うことができます。
|
2023-04-24 03:06:28 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
#### Server Info
|
2023-05-18 18:59:13 +03:00
|
|
|
|
|
2023-07-01 20:01:38 +03:00
|
|
|
|
現在のサーバの設定を確認することができます。
|