[00274359]一种不完美信息扩展式博弈中计算最佳反应策略的方法
交易价格:
面议
所属行业:
分析仪器
类型:
发明专利
技术成熟度:
正在研发
专利所属地:中国
专利号:CN201310568689.3
交易方式:
技术转让
技术转让
技术入股
联系人:
南京大学
进入空间
所在地:江苏南京市
- 服务承诺
- 产权明晰
-
资料保密
对所交付的所有资料进行保密
- 如实描述
技术详细介绍
本发明公开了一种不完美信息扩展式博弈中计算最佳反应策略的方法,包括如下步骤:(1)初始化策略、所有信息集的虚拟价值和虚拟遗憾值;(2)根据当前策略,与对手进行一次博弈,并记录博弈结果;(3)对于在本次博弈中每一个被访问的信息集,根据博弈结果计算出该信息集的虚拟价值;(4)根据步骤(3)所得到的各个信息集的虚拟价值,计算出每个信息集上每一个动作的虚拟遗憾值;(5)在每一个被访问的信息集上执行遗憾值匹配过程,更新该信息集上的策略;(6)返回步骤(2),直至不再有博弈进行。本发明避免了对手策略动态变化所带来的误差,同时也提高了计算效率。
本发明公开了一种不完美信息扩展式博弈中计算最佳反应策略的方法,包括如下步骤:(1)初始化策略、所有信息集的虚拟价值和虚拟遗憾值;(2)根据当前策略,与对手进行一次博弈,并记录博弈结果;(3)对于在本次博弈中每一个被访问的信息集,根据博弈结果计算出该信息集的虚拟价值;(4)根据步骤(3)所得到的各个信息集的虚拟价值,计算出每个信息集上每一个动作的虚拟遗憾值;(5)在每一个被访问的信息集上执行遗憾值匹配过程,更新该信息集上的策略;(6)返回步骤(2),直至不再有博弈进行。本发明避免了对手策略动态变化所带来的误差,同时也提高了计算效率。