init

2025-02-02 16:23:58 +03:00 · 2022-08-22 16:08:49 +09:00 · 2022-08-22 16:08:49 +09:00 · e6e33a8d02
commit e6e33a8d02
parent 2d3a59e453
9 changed files with 278 additions and 0 deletions
--- a/.gitignore
+++ b/.gitignore
@ -0,0 +1 @@
 dummy
--- a/README.md
+++ b/README.md
@ -0,0 +1,86 @@
 # 使用方法
 ## 前提
 ## Docker
 Dockerを使えるようにしておいてください。
 WindowsはWSL2上で使えるようにしておいてください。
 トレーニング時にはGPUを見えるようにしておいてください。
 ```
 $ docker run --gpus all --rm nvidia/cuda nvidia-smi
 ```
 を実行して
 ```
 Sun Sep 15 22:40:52 2019       
 +-----------------------------------------------------------------------------+
 | NVIDIA-SMI 430.26       Driver Version: 430.26       CUDA Version: 10.2     |
 |-------------------------------+----------------------+----------------------+
 | GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
 | Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
 |===============================+======================+======================|
 |   0  GeForce GTX 106...  Off  | 00000000:01:00.0  On |                  N/A |
 | 38%   32C    P8     6W / 120W |      2MiB /  3016MiB |      0%      Default |
 +-------------------------------+----------------------+----------------------+
 +-----------------------------------------------------------------------------+
 | Processes:                                                       GPU Memory |
 |  GPU       PID   Type   Process name                             Usage      |
 |=============================================================================|
 |  No running processes found                                                 |
 +-----------------------------------------------------------------------------+
 ```
 こんな感じの出力が出ればOKです。
 ボイスチェンジ時にはGPUは必須ではありません。あればより高速にぼいちぇんできるかもしれません。
 ## トレーニングデータの準備
 ### Datasetの中身
 ```
 $ ls dataset -l
 合計 1656692
 drwxr-xr-x 4 wataru wataru      4096  8月 22 14:31 00_myvoice
 -rwx------ 1 wataru wataru  57620200  8月 22 14:18 1225_zundamon.zip
 -rwx------ 1 wataru wataru  72992810  8月 22 14:18 344_tsumugi.zip
 -rwx------ 1 wataru wataru  55275760  8月 22 14:18 459_methane.zip
 -rwx------ 1 wataru wataru  72295236  8月 22 14:18 912_sora.zip
 $ ls dataset/00_myvoice/ -l
 合計 40
 drwxr-xr-x 2 wataru wataru 20480  8月 22 14:32 text
 drwxr-xr-x 2 wataru wataru 20480  8月 22 14:31 wav
 ```
 ## 起動と実行
 ```
 # 変数設定
 $ EXP_NAME=001_exp
 # テスト用フォルダ作成
 $ sh template.sh $EXP_NAME
 $ docker run -it --gpus all --shm-size=2g \
  -v `pwd`/exp/${EXP_NAME}/dataset:/MMVC_Trainer/dataset \
  -v `pwd`/exp/${EXP_NAME}/logs:/MMVC_Trainer/logs \
  -v `pwd`/exp/${EXP_NAME}/filelists:/MMVC_Trainer/filelists \
  -p 6008:6006  mmvc_trainer_docker
 ```
 # ビルド
 ## 前提
 このリポジトリではnodeを使っていませんが、ビルドスクリプト呼び出しにnpmを使用しています。
 npmをインストールしておいてください。
 https://nodejs.org/ja/download/
 ## Docker
 Dockerを使えるようにしておいてください。
 WindowsはWSL2上で使えるようにしておいてください。
 ## ビルド実行
 ```
 $ npm run build:docker
 ```
--- a/dataset/.gitignore
+++ b/dataset/.gitignore
@ -0,0 +1,2 @@
 *
 !.gitignore
--- a/exp/.gitignore
+++ b/exp/.gitignore
@ -0,0 +1,2 @@
 *
 !.gitignore
--- a/package.json
+++ b/package.json
@ -0,0 +1,21 @@
 {
  "name": "voice-changer",
  "version": "1.0.0",
  "description": "",
  "main": "index.js",
  "scripts": {
    "build:docker": "date +%Y%m%d%H%M%S > trainer/dummy && DOCKER_BUILDKIT=1 docker build --ssh default -f trainer/Dockerfile trainer/ -t mmvc_trainer_docker",
    "test": "echo \"Error: no test specified\" && exit 1"
  },
  "repository": {
    "type": "git",
    "url": "git+https://github.com/w-okada/voice-changer.git"
  },
  "keywords": [],
  "author": "",
  "license": "ISC",
  "bugs": {
    "url": "https://github.com/w-okada/voice-changer/issues"
  },
  "homepage": "https://github.com/w-okada/voice-changer#readme"
 }
--- a/template.sh
+++ b/template.sh
@ -0,0 +1,54 @@
 #!/bin/bash
 ## 005_expより複数話者対応。myvoiceのフォルダ階層を一つ深くする。
 EXP_NAME=$1
 echo $EXP_NAME
 # (A)
 mkdir -p exp/${EXP_NAME}/logs
 mkdir -p exp/${EXP_NAME}/filelists
 mkdir -p exp/${EXP_NAME}/dataset
 echo "00_myvoice|107"          >  exp/${EXP_NAME}/dataset/multi_speaker_correspondence.txt
 echo "01_target_zundamon|100"  >> exp/${EXP_NAME}/dataset/multi_speaker_correspondence.txt
 echo "02_target_tsumugi|103"  >> exp/${EXP_NAME}/dataset/multi_speaker_correspondence.txt
 echo "03_target_metan|102"  >> exp/${EXP_NAME}/dataset/multi_speaker_correspondence.txt
 echo "04_target_ksora|101"  >> exp/${EXP_NAME}/dataset/multi_speaker_correspondence.txt
 # (B) トレーニングデータ作成
 # (B-0) my voice
 mkdir -p exp/${EXP_NAME}/dataset/textful/00_myvoice/text
 mkdir -p exp/${EXP_NAME}/dataset/textful/00_myvoice/wav
 cp dataset/00_myvoice/wav/*   exp/${EXP_NAME}/dataset/textful/00_myvoice/wav/
 cp dataset/00_myvoice/text/*  exp/${EXP_NAME}/dataset/textful/00_myvoice/text/
 # (B-1) ずんだもん
 mkdir -p exp/${EXP_NAME}/dataset/textful/01_target_zundamon/
 unzip -j dataset/1225_zundamon.zip 1225_zundamon/wav/* -d exp/${EXP_NAME}/dataset/textful/01_target_zundamon/wav/
 unzip -j dataset/1225_zundamon.zip 1225_zundamon/text/* -d exp/${EXP_NAME}/dataset/textful/01_target_zundamon/text/
 # (B-2) 春日部つむぎ
 mkdir -p exp/${EXP_NAME}/dataset/textful/02_target_tsumugi/
 unzip -j dataset/344_tsumugi.zip 344_tsumugi/wav/* -d exp/${EXP_NAME}/dataset/textful/02_target_tsumugi/wav/
 unzip -j dataset/344_tsumugi.zip 344_tsumugi/text/* -d exp/${EXP_NAME}/dataset/textful/02_target_tsumugi/text/
 # (B-3) 四国めたん
 mkdir -p exp/${EXP_NAME}/dataset/textful/03_target_metan/
 unzip -j dataset/459_methane.zip 459_methane/wav/* -d exp/${EXP_NAME}/dataset/textful/03_target_metan/wav/
 unzip -j dataset/459_methane.zip 459_methane/text/* -d exp/${EXP_NAME}/dataset/textful/03_target_metan/text/
 # (B-4) 九州そら
 mkdir -p exp/${EXP_NAME}/dataset/textful/04_target_ksora/
 unzip -j dataset/912_sora.zip 912_sora/wav/* -d exp/${EXP_NAME}/dataset/textful/04_target_ksora/wav/
 unzip -j dataset/912_sora.zip 912_sora/text/* -d exp/${EXP_NAME}/dataset/textful/04_target_ksora/text/
 ## 004_expまで。
 # echo $1
 # mkdir -p ${EXP_NAME}/00_myvoice/text
 # mkdir -p ${EXP_NAME}/00_myvoice/wav
 # mkdir -p ${EXP_NAME}/logs
 # mkdir -p ${EXP_NAME}/filelists
--- a/trainer/Dockerfile
+++ b/trainer/Dockerfile
@ -0,0 +1,90 @@
 FROM debian:bullseye-slim as base
 ARG DEBIAN_FRONTEND=noninteractive
 RUN apt-get update 
 RUN apt-get install -y python3-pip git
 RUN apt-get install -y espeak
 RUN apt-get install -y cmake
 RUN git clone --depth 1 https://github.com/isletennos/MMVC_Trainer.git -b v1.3.1.0
 RUN pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113
 RUN pip install Cython==0.29.32
 RUN pip install numpy==1.22.4 
 RUN pip install scipy==1.9.0
 RUN pip install librosa==0.9.2
 RUN pip install phonemizer==3.2.1
 RUN pip install Unidecode==1.3.4
 RUN pip install resampy==0.4.0
 RUN pip install tqdm==4.64.0
 RUN pip install retry==0.9.2
 RUN pip install psutil==5.9.1
 RUN pip install python-socketio==5.7.1
 RUN pip install eventlet==0.33.1
 RUN pip install pyopenjtalk==0.2.0
 RUN pip install tensorboard==2.10.0
 RUN pip install matplotlib==3.5.3
 WORKDIR /MMVC_Trainer/monotonic_align
 RUN cythonize -3 -i core.pyx \
 && mv core.cpython-39-x86_64-linux-gnu.so monotonic_align/
 FROM debian:bullseye-slim
 RUN apt-get update \
        && apt-get install -y python3-pip espeak\
        && apt-get clean \
        && rm -rf /var/lib/apt/lists/*
 COPY --from=base /usr/local/lib/python3.9/dist-packages /usr/local/lib/python3.9/dist-packages
 COPY --from=base /MMVC_Trainer /MMVC_Trainer
 COPY fine_model/G_180000.pth /MMVC_Trainer/fine_model/G_180000.pth
 COPY fine_model/D_180000.pth /MMVC_Trainer/fine_model/D_180000.pth
 WORKDIR /MMVC_Trainer
 ADD /setup.sh  /MMVC_Trainer/
 # ENTRYPOINT ["/bin/bash", "setup.sh"]
 # CMD [ "8", "false"]
 # FROM ubuntu:focal-20220531 as base
 # ARG DEBIAN_FRONTEND=noninteractive
 # RUN apt-get update && apt-get install -y libfreetype6-dev g++ cmake sox libsndfile1-dev ffmpeg flac python3-pip
 # RUN apt-get install -y git emacs mlocate curl wget unzip
 # RUN git clone https://github.com/isletennos/MMVC_Trainer.git
 # RUN wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh && \
 #     sh Miniconda3-latest-Linux-x86_64.sh -b -p /opt/miniconda3 && \
 #     rm -r Miniconda3-latest-Linux-x86_64.sh
 # ENV PATH /opt/miniconda3/bin:$PATH
 # RUN pip install --upgrade pip && \
 #      conda update conda  && \
 #      conda create -n mmvc -c defaults python=3.7 &&  \
 #      conda init && \
 #      echo "conda activate mmvc" >> ~/.bashrc 
 # SHELL ["conda", "run", "-n", "mmvc", "/bin/bash", "-c"]
 # ENV CONDA_DEFAULT_ENV mmvc && \
 #     PATH /opt/conda/envs/mmvc/bin:$PATH
 # RUN pip install pyopenjtalk
 # RUN pip install Cython==0.29.21 librosa==0.8.0 matplotlib==3.3.1 numpy phonemizer==2.2.1 scipy==1.5.2 tensorboard  Unidecode==1.1.1 retry tqdm resampy==0.2.2
 # RUN pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113
 # RUN pip install  psutil
 # COPY fine_model/G_180000.pth /MMVC_Trainer/fine_model/G_180000.pth
 # COPY fine_model/D_180000.pth /MMVC_Trainer/fine_model/D_180000.pth
 # WORKDIR /MMVC_Trainer
--- a/trainer/fine_model/.gitignore
+++ b/trainer/fine_model/.gitignore
@ -0,0 +1,2 @@
 *
 !.gitignore
--- a/trainer/setup.sh
+++ b/trainer/setup.sh
@ -0,0 +1,20 @@
 #!/bin/bash
 BATCH_SIZE=$1
 RESUME=$2
 echo batch:${BATCH_SIZE}
 echo resume:${RESUME}
 python3 create_dataset_jtalk.py -f train_config -s 24000 -m dataset/multi_speaker_correspondence.txt
 sed -ie 's/80000/8000/' train_ms.py
 sed -ie "s/\"batch_size\": 10/\"batch_size\": $BATCH_SIZE/" configs/train_config.json
 # cd monotonic_align/ \
 #  && cythonize -3 -i core.pyx \
 #  && mv core.cpython-39-x86_64-linux-gnu.so monotonic_align/ \
 #  && cd -
 python3 -m tensorboard.main --logdir logs --port 6006 --host 0.0.0.0 &
 python3 train_ms.py -c configs/train_config.json -m 20220306_24000 -fg fine_model/G_180000.pth -fd fine_model/D_180000.pth