Skip to content

euxcet/Holdem

Repository files navigation

Holdem

使用强化学习训练德州扑克的智能体。

部署

PDM

项目采用PDM构建,这是个类似于poetry的包管理器。

Linux/Mac 安装命令

curl -sSL https://pdm-project.org/install-pdm.py | python3 -
brew install pdm
pip install --user pdm

Windows 安装命令

(Invoke-WebRequest -Uri https://pdm-project.org/install-pdm.py -UseBasicParsing).Content | python -

安装

本项目Python 3.11 或更高版本,可使用conda创建环境:

conda create -n [YOUR_ENV_NAME] python=3.11

在虚拟环境中安装本库:

pdm build
pdm install

在构建时需要在虚拟环境中安装包,可使用国内镜像:

pdm config pypi.url https://pypi.tuna.tsinghua.edu.cn/simple/

在dist文件夹中会生成whl文件,可在其他环境中使用pip安装:

pip install --force-reinstall dist/alphaholdem-*-py3-none-any.whl

如果需要做开发,建议使用编辑模式来导入项目:

# pip
pip install -e PATH_TO_THIS_FOLDER
# pdm
pdm add --dev -e PATH_TO_THIS_FOLDER

请不要将包提交到公开pypi server

使用

训练

pdm run train

TODO

  • kuhn, leduc, texas游戏环境
  • wandb训练可视化
  • self play训练
  • deepstack监督学习
  • 完善test
  • 改进前端(选board牌、过滤不可能combo)
  • 多人德州

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published