config.py

import argparse

def parse_args(mode="train", use_phonemes=False):
    parser = argparse.ArgumentParser()

    if use_phonemes:
        parser.add_argument(
            '--step_shift', nargs="?", default=0, type=int,
            help="Number of steps by which the phonemes should be left-shifted by.")
        parser.add_argument(
            '--lyr_dir', nargs="?", default="lyrics", type=str,
            help="Directory that contains lyrics corresponding to the train wav files.")
        if mode == "train":
            parser.add_argument(
                '--lyr_valid_dir', nargs="?", default="val_lyrics", type=str,
                help="Directory that contains lyrics corresponding to the val wav files.")

    if mode == "train":
        parser.add_argument(
            '--checkpoint_dir', nargs="?", default="vrnn_checkpoints", type=str,
            help="Directory to store checkpoints.")
        parser.add_argument(
            '--train_dir', nargs="?", default="train_dir", type=str,
            help="Directory that contains train wav files to train.")
        parser.add_argument(
            '--valid_dir', nargs="?", default=None,
            help="Directory that contains validation wav files.")
        parser.add_argument(
            '--num_epochs', nargs="?", default=50, type=int,
            help="Number of epochs")
        parser.add_argument(
            '--save_every', nargs="?", default=5, type=int,
            help="Save the model every save_every number of epochs.")
        parser.add_argument('--learning_rate', nargs="?", default=0.001, type=float,
            help="Learning rate of the Adam optimizer.")
        parser.add_argument('--clip_grad', nargs="?", default=5.0, type=float,
            help="Clip the value of gradients above clip_grad to clip_grad")
    elif mode in ["predict", "generate"]:
        parser.add_argument(
            '--wav_dir', nargs="?", type=str,
            help="Directory that contains wav files for prediction.")
        parser.add_argument(
            '--model', nargs="?", type=str, help="Path to the trained model")
        parser.add_argument(
            '--write_dir', nargs="?", default="write_dir", type=str,
            help="Directory that the true and predicted wav files will be written to.")

        if mode == "generate":
            parser.add_argument(
                '--num_gen', nargs="?", default=1, type=int,
                help="Number of audio clips to generate.")

    parser.add_argument(
        '--lstm_size', nargs="?", default=1000, type=int,
        help="Number of hidden lstm units.")
    parser.add_argument(
        '--num_steps', nargs="?", default=40, type=int,
        help="Number of lstm time-steps.")
    parser.add_argument(
        '--wav_dim', nargs="?", default=200, type=int,
        help="Dimension of the input waveform.")
    parser.add_argument('--z_dim', nargs="?", default=100, type=int,
        help="Latent size dimensions.")
    parser.add_argument('--batch_size', nargs="?", default=32, type=int,
        help="Batch size.")
    parser.add_argument('--fc_dim', nargs="?", default=400, type=int,
        help="Dimension of the input fully-connected layer before providing as "
        "input to LSTM")
    return parser.parse_args()