Connect X

Connect 4 agent with Reinforcement Learning Connect4 게임을 강화학습을 이용해서 학습시키는 프로젝트 백엔드 및 안드로이드와 결합해서 어플로 구현시키는 것이 목표이다.

agent_structure.py: 여러 agent의 구조 클래스 파일
config.json: 모델을 학습할 때 변경할 파라미터 파일
env.py: Connect 4 게임 환경을 구현한 클래스
evaluate_alphazero.py: 알파제로 및 알파고의 성능 측정을 위한 파일
evaluate_model.py: 그 외 모델의 성능 측정을 위한 파일
find_play_param_alphazero.py: 알파제로의 C, num_search 의 하이퍼파라미터 샘플링을 위한 파일
functions.py: 여러 함수들을 모아놓은 파일
model_comparison.py: 두 모델의 성능을 비교하기 위한 파일
models.py: 모델의 구조를 나타내는 파일
play_game.py 주어진 모델로 Connect 4를 플레이할 수 있는 파일
ReplayBuffer.py: DQN의 리플레이 버퍼를 이용하기 위한 클래스 파일
requirement.txt: 파일 실행을 위한 모듈 모음
test_alphago.py: 알파고 모델의 작동 테스트를 확인하기 위한 파일
test_alpha_model.py: 알파제로 모델의 작동 테스트를 확인하기 위한 파일
test_model.py: 그 외 모델의 작동 테스트를 확인하기 위한 파일
test_value_net.py: 알파고에 사용되는 value network 모델의 작동 테스트를 확인하기 위한 파일
train_AZ.py: 알파제로를 학습하는 파일
train.py: 그 외 모델을 학습하는 파일
train_PS.py: DQN 계열 모델의 하이퍼파라미터 샘플링을 하기 위한 파일
train_ValueNetwork.py: 알파고에 사용되는 Value network를 학습하는 파일
alphazero_new.py: agent_structure.py와 병합
AlphaZeroenv.py: env.py 와 병합
for_DJ.py: train_value_net.py 와 병합
json2excel.py: train_PS.py 와 병합
selfplay.py: train.py와 병합

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Connect X

About

Releases

Packages

Contributors 2

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 71 Commits
loss_plot		loss_plot
model		model
.gitignore		.gitignore
AlphaZeroenv.py		AlphaZeroenv.py
README.md		README.md
ReplayBuffer.py		ReplayBuffer.py
agent_structure.py		agent_structure.py
alphazero_new.py		alphazero_new.py
config.json		config.json
env.py		env.py
evaluate_alphazero.py		evaluate_alphazero.py
evaluate_model.py		evaluate_model.py
find_play_param_alphazero.py		find_play_param_alphazero.py
for_DJ.py		for_DJ.py
functions.py		functions.py
json2excel.py		json2excel.py
model_comparison.py		model_comparison.py
models.py		models.py
play_game.py		play_game.py
requirements.txt		requirements.txt
selfplay.py		selfplay.py
test_alpha_model.py		test_alpha_model.py
test_alphago.py		test_alphago.py
test_model.py		test_model.py
test_value_net.py		test_value_net.py
train.py		train.py
train_AZ.py		train_AZ.py
train_PS.py		train_PS.py
train_ValueNetwork.py		train_ValueNetwork.py

TaveConnectX/DeepLearning

Folders and files

Latest commit

History

Repository files navigation

Connect X

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages