add trouble shoot communication

This commit is contained in:
wataru 2023-05-02 08:59:09 +09:00
parent c58c93856c
commit 4faee09aa1
2 changed files with 39 additions and 0 deletions

View File

@ -118,6 +118,10 @@ Docker での実行は、[Docker を使用する](docker_vcclient/README.md)を
Anaconda の仮想環境上での実行は、[サーバ開発者向けのページ](README_dev_ja.md)を参考にサーバを起動してください。
# トラブルシュート
- [通信編](tutorials/trouble_shoot_communication_ja.md)
# リアルタイム性MMVC
GPU を使用するとほとんどタイムラグなく変換可能です。

View File

@ -0,0 +1,35 @@
## トラブルシュート 通信編
音声が全く変換されない場合や、変換後の音声が変な状態になっている場合、音声変換プロセスの中のどこで問題が起こっているかを切り分ける必要があります。
ここでは、どの部分で問題が起こっているかを大まかに切り分ける方法を説明します。
## VC Client の構成と問題の切り分け
<img src="https://user-images.githubusercontent.com/48346627/235551041-6eed4035-5542-47d1-bbd3-31fa7842011b.png" width="720">
VC Client は、図のように GUI(クライアント)が音声をマイクから拾い、サーバで変換を行う構成となっています。
VC Client は図中の3か所で音声がどのような状態になっているかを確認することができます。
正常な状態の音声が録音されている場合は、そこまでの処理はうまくいっていたということになり、それ以降のところで問題を探せばよいことになります(問題の切り分けといいます)。
## 音声の状態の確認方法
### (1)(2)での音声の状態について確認
<img src="https://user-images.githubusercontent.com/48346627/235551159-907a8cbd-a3a7-4183-8d6f-31f235879eb9.png" width="720">
Analyzer の Sampling を start させた状態で音声変換を開始してください。ある程度音声を入力した後に Sampling をストップすると in/out に再生ボタンが表示されます。
- in には前述の図の(1)の音声が録音されています。マイクから入力された音声がそのままサーバで録音されているはずなので、ユーザの音声が録音されていれば OK です。
- out には前述の図の(2)の音声が録音されています。AI による変換後の音声が録音されているはずです。
### (3)での音声の状態について確認
<img src="https://user-images.githubusercontent.com/48346627/235551182-f6bc172c-0225-44fd-a8a8-d5c0fce933b7.png" width="720">
AudioOutput の output record を start させた状態で音声変換を開始してください。ある程度音声を入力した後に stop すると.wav ファイルがダウンロードされます。この.wav ファイルはサーバから受信した変換後の音声が録音されているはずです。
## 音声の状態の確認後
前述の図の(1)~(3)のどこまで想定された音声が録音されているかを把握したら、想定された音声が録音された場所以降で問題がないかを検討してください。