Skip to content

A personal toy project to apply reinforcement learning theory to a "connect four" game.

Notifications You must be signed in to change notification settings

TaveConnectX/DeepLearning

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

71 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Connect X

Connect 4 agent with Reinforcement Learning Connect4 게임을 강화학습을 이용해서 학습시키는 프로젝트 백엔드 및 안드로이드와 결합해서 어플로 구현시키는 것이 목표이다.

  • agent_structure.py: 여러 agent의 구조 클래스 파일

  • config.json: 모델을 학습할 때 변경할 파라미터 파일

  • env.py: Connect 4 게임 환경을 구현한 클래스

  • evaluate_alphazero.py: 알파제로 및 알파고의 성능 측정을 위한 파일

  • evaluate_model.py: 그 외 모델의 성능 측정을 위한 파일

  • find_play_param_alphazero.py: 알파제로의 C, num_search 의 하이퍼파라미터 샘플링을 위한 파일

  • functions.py: 여러 함수들을 모아놓은 파일

  • model_comparison.py: 두 모델의 성능을 비교하기 위한 파일

  • models.py: 모델의 구조를 나타내는 파일

  • play_game.py 주어진 모델로 Connect 4를 플레이할 수 있는 파일

  • ReplayBuffer.py: DQN의 리플레이 버퍼를 이용하기 위한 클래스 파일

  • requirement.txt: 파일 실행을 위한 모듈 모음

  • test_alphago.py: 알파고 모델의 작동 테스트를 확인하기 위한 파일

  • test_alpha_model.py: 알파제로 모델의 작동 테스트를 확인하기 위한 파일

  • test_model.py: 그 외 모델의 작동 테스트를 확인하기 위한 파일

  • test_value_net.py: 알파고에 사용되는 value network 모델의 작동 테스트를 확인하기 위한 파일

  • train_AZ.py: 알파제로를 학습하는 파일

  • train.py: 그 외 모델을 학습하는 파일

  • train_PS.py: DQN 계열 모델의 하이퍼파라미터 샘플링을 하기 위한 파일

  • train_ValueNetwork.py: 알파고에 사용되는 Value network를 학습하는 파일

  • alphazero_new.py: agent_structure.py와 병합

  • AlphaZeroenv.py: env.py 와 병합

  • for_DJ.py: train_value_net.py 와 병합

  • json2excel.py: train_PS.py 와 병합

  • selfplay.py: train.py와 병합

About

A personal toy project to apply reinforcement learning theory to a "connect four" game.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages