600字范文 > 人机对战初体验—四子棋游戏

人机对战初体验—四子棋游戏

时间：2021-08-12 03:39:10

相关推荐

人机对战初体验—四子棋游戏

继去年3月人机大战引发全球瞩目以来，围棋AI（人工智能）再度引发跨领域的关注：一个叫Master的围棋AI，几天时间，面对中日韩顶尖职业围棋选手，已取得60胜0败的恐怖战绩，展现出的围棋技艺已经到了人类理解不了的程度。这可以视为人工智能在围棋领域的一次“大征服”，而在此之外的意义则是，告诉了我们人工智能在征服一项领域或职业时，究竟速度有多快。理解这一点，对于人类，乃至每一个人，都非常重要。通过本实验的学习，可以对人机对战有初步了解。

一、实验介绍

1.1 实验内容

实验利用Python模拟AI和玩家进行四子棋游戏，利用游戏实验Pygame库，为游戏提供界面和操作支持。AI算法借用蒙特卡洛搜索树思想。通过设置AI的难度系数，即AI所能考虑到的未来棋子的可能走向，从而选择出最佳的方案和玩家对抗。难度系数越大，AI搜索范围越广，它所能做出的决定越明智。

游戏最终效果截图：

1.2 实验知识点

Pygame的基础操作蒙特卡洛搜索树

1.3 实验环境

Python2.7gedit

1.4 适合人群

本课程难度一般，属于初级课程，适合具有Python基础并对Pygame有所了解的用户学习。

1.5 代码获取

你可以通过下面命令将代码下载到实验楼环境中，作为参照对比进行学习。

$ wget http://labfile./courses/746/fourinrow.py

二、四子棋游戏

四子棋游戏是在7*6的格子中。轮流从格子最上方落下棋子。棋子会落在该列格子中最下面的空格子里。先将四个棋子连成一条线（水平直线，竖直直线，或倾斜直线）者获胜，游戏结束。

三、项目文件结构

四、实验步骤

4.1 开发准备

在Code目录下进行创建工程文件Fourinrow，在终端执行命令

cd Code && mkdir Fourinrow

下载本次实验所需的图片资源到Fourinrow文件下

$ cd Fourinrow$ wget http://labfile./courses/746/images.zip$ unzip images.zip

安装依赖包

$ sudo apt-get update$ sudo apt-get install python-pygame

4.2 游戏流程

4.3 初始化变量

用到的变量包括，棋盘的宽度，长度（可以修改，设计不同规格的棋盘），难度系数，棋子大小以及一些设计坐标变量的设定。

在FourinRow.py文件中输入如下代码：

import random, copy, sys, pygamefrom pygame.locals import *BOARDWIDTH = 7 # 棋子盘的宽度栏数 BOARDHEIGHT = 6 # 棋子盘的高度栏数 assert BOARDWIDTH >= 4 and BOARDHEIGHT >= 4, 'Board must be at least 4x4.' #python assert断言是声明其布尔值必须为真的判定，如果发生异常就说明表达示为假。 #可以理解assert断言语句为raise-if-not，用来测试表示式，其返回值为假，就会触发异常。 DIFFICULTY = 2 # 难度系数，计算机能够考虑的移动级别 #这里2表示，考虑对手走棋的7种可能性及如何应对对手的7种走法 SPACESIZE = 50 # 棋子的大小 FPS = 30 # 屏幕的更新频率，即30/s WINDOWWIDTH = 640 # 游戏屏幕的宽度像素 WINDOWHEIGHT = 480 # 游戏屏幕的高度像素 XMARGIN = int((WINDOWWIDTH - BOARDWIDTH * SPACESIZE) / 2)#X边缘坐标量，即格子栏的最左边 YMARGIN = int((WINDOWHEIGHT - BOARDHEIGHT * SPACESIZE) / 2)#Y边缘坐标量，即格子栏的最上边 BRIGHTBLUE = (0, 50, 255)#蓝色 WHITE = (255, 255, 255)#白色 BGCOLOR = BRIGHTBLUE TEXTCOLOR = WHITE RED = 'red' BLACK = 'black' EMPTY = None HUMAN = 'human' COMPUTER = 'computer'

除此之外我们还需要定义一些pygame的全局变量。这些全局变量在之后的各个模块中会被多次调用。其中很多是存储载入图片的变量，准备工作有点长，请大家耐心一点哦。

#初始化pygame的各个模块pygame.init()#初始化了一个Clock对象FPSCLOCK = pygame.time.Clock()#创建游戏窗口DISPLAYSURF = pygame.display.set_mode((WINDOWWIDTH, WINDOWHEIGHT))#游戏窗口标题pygame.display.set_caption(u'four in row') #Rect(left,top,width,height)用来定义位置和宽高 REDPILERECT = pygame.Rect(int(SPACESIZE / 2), WINDOWHEIGHT - int(3 * SPACESIZE / 2), SPACESIZE, SPACESIZE) #这里创建的是窗口中左下角和右下角的棋子 BLACKPILERECT = pygame.Rect(WINDOWWIDTH - int(3 * SPACESIZE / 2), WINDOWHEIGHT - int(3 * SPACESIZE / 2), SPACESIZE, SPACESIZE) #载入红色棋子图片 REDTOKENIMG = pygame.image.load('4row_red.png') #将红色棋子图片缩放为SPACESIZE REDTOKENIMG = pygame.transform.smoothscale(REDTOKENIMG, (SPACESIZE, SPACESIZE)) #载入黑色棋子图片 BLACKTOKENIMG = pygame.image.load('4row_black.png') #将黑色棋子图片缩放为SPACESIZE BLACKTOKENIMG = pygame.transform.smoothscale(BLACKTOKENIMG, (SPACESIZE, SPACESIZE)) #载入棋子面板图片 BOARDIMG = pygame.image.load('4row_board.png') #将棋子面板图片缩放为SPACESIZE BOARDIMG = pygame.transform.smoothscale(BOARDIMG, (SPACESIZE, SPACESIZE)) #载入人胜利时图片 HUMANWINNERIMG = pygame.image.load('4row_humanwinner.png') #载入AI胜时图片 COMPUTERWINNERIMG = pygame.image.load('4row_computerwinner.png') #载入平局提示图片 TIEWINNERIMG = pygame.image.load('4row_tie.png') #返回一个Rect实例 WINNERRECT = HUMANWINNERIMG.get_rect() #游戏窗口中间位置坐标 WINNERRECT.center = (int(WINDOWWIDTH / 2), int(WINDOWHEIGHT / 2)) #载入操作提示图片 ARROWIMG = pygame.image.load('4row_arrow.png') #返回一个Rect实例 ARROWRECT = ARROWIMG.get_rect() #操作提示的左位置 ARROWRECT.left = REDPILERECT.right + 10 #将操作提示与下方红色棋子实例在纵向对齐 ARROWRECT.centery = REDPILERECT.centery

至此我们完成了前期的准备工作。

4.4 棋盘设计

初始时，将棋盘二维列表清空，然后根据玩家和AI的走法将棋盘相应位置设定颜色。

def drawBoard(board, extraToken=None):#DISPLAYSURF 是我们的界面，在初始化变量模块中有定义 DISPLAYSURF.fill(BGCOLOR)#将游戏窗口背景色填充为蓝色 spaceRect = pygame.Rect(0, 0, SPACESIZE, SPACESIZE)#创建Rect实例 for x in range(BOARDWIDTH): #确定每一列中每一行中的格子的左上角的位置坐标 for y in range(BOARDHEIGHT): spaceRect.topleft = (XMARGIN + (x * SPACESIZE), YMARGIN + (y * SPACESIZE)) #x =0,y =0时，即第一列第一行的格子。 if board[x][y] == RED:#如果格子值为红色 #则在在游戏窗口的spaceRect中画红色棋子 DISPLAYSURF.blit(REDTOKENIMG, spaceRect) elif board[x][y] == BLACK: #否则画黑色棋子 DISPLAYSURF.blit(BLACKTOKENIMG, spaceRect) # extraToken 是包含了位置信息和颜色信息的变量 # 用来显示指定的棋子 if extraToken != None: if extraToken['color'] == RED: DISPLAYSURF.blit(REDTOKENIMG,(extraToken['x'], extraToken['y'], SPACESIZE, SPACESIZE)) elif extraToken['color'] == BLACK: DISPLAYSURF.blit(BLACKTOKENIMG, (extraToken['x'], extraToken['y'], SPACESIZE, SPACESIZE)) # 画棋子面板 for x in range(BOARDWIDTH): for y in range(BOARDHEIGHT): spaceRect.topleft = (XMARGIN + (x * SPACESIZE), YMARGIN + (y * SPACESIZE)) DISPLAYSURF.blit(BOARDIMG, spaceRect) # 画游戏窗口中左下角和右下角的棋子 DISPLAYSURF.blit(REDTOKENIMG, REDPILERECT) # 左边的红色棋子 DISPLAYSURF.blit(BLACKTOKENIMG, BLACKPILERECT) # 右边的黑色棋子 def getNewBoard(): board = [] for x in range(BOARDWIDTH): board.append([EMPTY] * BOARDHEIGHT) return board #返回board列表，其值为BOARDHEIGHT数量的None

4.5 AI获取最佳移动算法

简单介绍一下蒙特卡洛搜索树的思想：

利用一维中的掷点法完成对围棋盘面的评估。具体来讲,当我们给定某一个棋盘局面时,程序在当前局面的所有可下点中随机选择一个点摆上棋子,并不断重复这个随机选择可下点(掷点)的过程,直到双方都没有可下点(即对弈结束),再把这个最终状态的胜负结果反馈回去,作为评估当前局面的依据。

在该实验当中AI通过不断选择不同的栏，然后考虑双方的获胜结果进行评估，AI最终会选择评估较高的策略。

在浏览下面图片和文字之前请先看一下后面的代码，然后在对应讲解内容。

观察下面图示中AI和player的对决

实验中有些变量可以直观反映了AI棋子操作的过程：

PotentialMoves：返回一个列表，表示AI将棋子移动到列表中任一栏时获胜的可能性大小，其数值为-7~0的随机数，数值为负数时表示AI将棋子移动到这一栏时，玩家可能会在接下来两步取胜，数值越小表示玩家获胜可能性越大。为0，表示玩家不会获胜，并且AI也不可能获胜，为1表示AI可以获胜。

bestMoveFitness：适应度是选取PotentialMoves中最大的数值

bestMoves：如果PotentialMoves中有多个最大值，则表示AI将棋子移动到这些值所在的栏时，玩家获胜的几率都是最小的。所以将这些栏重新添加到列表bestMoves中。

column：当bestMoves为多个值时随机选择bestMoves中的一栏作为AI的移动。若是唯一值，则column为这个唯一值。

实验中通过打印这些 bestMoveFitness ,bestMoves , column ,potentialMoves得出在上图中AI的每一步参数：

AI moves:

通过第三步AI的选择，更加细致地了解算法的原理：

下图是部分AI走法示意图，该图显示了如果AI将棋子落在第一格中，Player的可能选择，以及AI接下来的一步对player获胜产生的影响，正是通过这种搜索，迭代AI可以判定在接下来两步中对手和自己的获胜情况，从而做出抉择。

下图是计算AI适应度值的流程图，实验中难度系数为2，需考虑7 ^ 4=2041次：

通过以上流程图，不难发现。AI的第一步棋子，若为0，1，2，4，5，6。则Player总有可能将剩下的两个棋子全部放在3，从而获胜。以AI=0为例，若player =0,即红色的第1枚棋子不在3，第2枚红色棋子不论在哪，都不可能获胜，为方便表述，用序列表示各种组合，序列第一个表是AI第一步，第二个数表示Player的回应，第三个数表示AI的回应。X表示任意有效移动。所以[0,0,x]=0，推理得，当序列为[0,x<>3,x]，player都不能获胜。只有当player的第2枚棋子为3时，AI的第二枚在不为3的情况下都能获胜，所以[0,x=3,x<>3] =-1。共有6种情况。最终的结果为（0+0+…(43个)-1*6）/7 =-1 同理对于其他的四种，结果都为-1。当AI第一步就在3的话，Player就不可能获胜，并且AI也不能获胜，所以为0。AI会选择最高适应度值来走，即会在第3列落下棋子。

同理可以分析接下来AI的选择。归纳起来便是，如果AI的一步使得Player获胜的可能性越大，AI的适应度值越低，AI也选择适应度较高的，即按照阻止Player获胜的走法进行。当然，如果它自己能够获胜，它会优先将自己获胜的走法设置最高适应度。

def getPotentialMoves(board, tile, lookAhead):if lookAhead == 0 or isBoardFull(board): ''' 如果难度系数为0，或格子已满则返回列表值全为0,即此时适应度值和列的潜在移动值相等。此时AI将随机降落棋子，失去智能 ''' return [0] * BOARDWIDTH #确定对手棋子颜色 if tile == RED: enemyTile = BLACK else: enemyTile = RED potentialMoves = [0] * BOARDWIDTH #初始一个潜在的移动列表，其数值全部为0 for firstMove in range(BOARDWIDTH): #对每一栏进行遍历，将双方中的任一方的移动称为firstMove #则另外一方的移动就称为对手，counterMove。 #这里我们的firstMove为AI，对手为玩家。 dupeBoard = copy.deepcopy(board) #这里用深复制是为了让board和dupeBoard不互相影响 if not isValidMove(dupeBoard, firstMove): #如果在dupeBoard中黑色棋子移到firstMove栏无效 continue #则继续下一个firstMove makeMove(dupeBoard, tile, firstMove) #如果是有效移动，则设置相应的格子颜色 if isWinner(dupeBoard, tile): #如果获胜 potentialMoves[firstMove] = 1 #获胜的棋子自动获得一个很高的数值来表示其获胜的几率 #数值越大，获胜可能性越大，对手获胜可能性越小。 break #不要干扰计算其他的移动 else: if isBoardFull(dupeBoard): #如果dupeBoard中没有空格 potentialMoves[firstMove] = 0 #无法移动 else: for counterMove in range(BOARDWIDTH): #考虑对手的移动 dupeBoard2 = copy.deepcopy(dupeBoard) if not isValidMove(dupeBoard2, counterMove): continue makeMove(dupeBoard2, enemyTile, counterMove) if isWinner(dupeBoard2, enemyTile): potentialMoves[firstMove] = -1 #如果玩家获胜，则AI的在此栏值最低 break else: # 递归调用getPotentialMoves results = getPotentialMoves(dupeBoard2, tile, lookAhead - 1) potentialMoves[firstMove] += (sum(results) / BOARDWIDTH) / BOARDWIDTH return potentialMoves

4.6 玩家操作

拖拽棋子，判断棋子所在位置的格子，验证棋子的有效性，调用棋子下落函数，完成操作。

def getHumanMove(board, isFirstMove):draggingToken = False tokenx, tokeny = None, None while True: # pygame.event.get()来处理所有的事件 for event in pygame.event.get(): if event.type == QUIT:#停止，退出 pygame.quit() sys.exit() elif event.type == MOUSEBUTTONDOWN and not draggingToken and REDPILERECT.collidepoint(event.pos): #如果事件类型为鼠标按下，notdraggingToken为True，鼠标点击的位置在REDPILERECT里面 draggingToken = True tokenx, tokeny = event.pos elif event.type == MOUSEMOTION and draggingToken:#如果开始拖动了红色棋子 tokenx, tokeny = event.pos #更新被拖拽的棋子的位置 elif event.type == MOUSEBUTTONUP and draggingToken: #如果鼠标松开，并且棋子被拖拽 #如果棋子被拖拽在board的正上方 if tokeny < YMARGIN and tokenx > XMARGIN and tokenx < WINDOWWIDTH - XMARGIN: column = int((tokenx - XMARGIN) / SPACESIZE)#根据棋子的x坐标确定棋子会落的列（0,1...6) if isValidMove(board, column):#如果棋子移动有效 """ 掉落在相应的空格子中，这里只是显示一个掉落的效果不用这个函数也能通过下面的代码实现棋子填充空格 """ animateDroppingToken(board, column, RED) #将空格中最下面的格子设为红色 board[column][getLowestEmptySpace(board, column)] = RED drawBoard(board)#在落入的格子中画红色棋子 pygame.display.update()#窗口更新 return tokenx, tokeny = None, None draggingToken = False if tokenx != None and tokeny != None:#如果拖动了棋子,则显示拖动的棋子 drawBoard(board, {'x':tokenx - int(SPACESIZE / 2), 'y':tokeny - int(SPACESIZE / 2), 'color':RED}) #并且通过调整x,y的坐标使拖动时，鼠标始终位于棋子的中心位置。 else: drawBoard(board)#当为无效移动时，鼠标松开后，因为此时board中所有格子的值均为none #调用drawBoard时，进行的操作是显示下面的两个棋子，相当于棋子回到到开始拖动的地方。 if isFirstMove: DISPLAYSURF.blit(ARROWIMG, ARROWRECT)#AI先走，显示提示操作图片 pygame.display.update() FPSCLOCK.tick()

4.7 AI操作

实现AI棋子自动移动并降落到相应位置的函数。

def animateComputerMoving(board, column):x = BLACKPILERECT.left#下面黑色棋子的左坐标 y = BLACKPILERECT.top #下面黑色棋子的上坐标 speed = 1.0 while y > (YMARGIN - SPACESIZE):#当y的值较大，即棋子位于窗口下方时 y -= int(speed)#y不断减小，即棋子不断上移 speed += 0.5#减小的速度增加 drawBoard(board, {'x':x, 'y':y, 'color':BLACK}) #y不断变化，不断绘制红色棋子，形成不断上升的效果 pygame.display.update() FPSCLOCK.tick() #当棋子上升到borad顶端时 y = YMARGIN - SPACESIZE#y重新赋值，此时棋子的最下边和board的最上边相切 speed = 1.0 while x > (XMARGIN + column * SPACESIZE):#当x值大于需要移到的列的x坐标时 x -= int(speed)#x值不断减小，即左移 speed += 0.5 drawBoard(board, {'x':x, 'y':y, 'color':BLACK}) #此时y坐标已经不变，即从board上端向左平移到所在列。 pygame.display.update() FPSCLOCK.tick() #黑色棋子降落到计算得到的空格 animateDroppingToken(board, column, BLACK)

通过返回的potentialMoves，选择其列表中最高的数字作为适应度值，并从这些适应度高栏中随机选择作为最后的移动目标。

def getComputerMove(board):potentialMoves = getPotentialMoves(board, BLACK, DIFFICULTY)#潜在的移动，是一个含BOARDWIDTH个值的列表。。 print potentialMoves #列表值与设置的难度系数有关 bestMoves = [] bestMoveFitness =max(potentialMoves) print bestMoveFitness #建立bestMoves空列表 for i in range(len(potentialMoves)): if potentialMoves[i] == bestMoveFitness and isValidMove(board, i): bestMoves.append(i) #列出所有可以移动到的列，该列表可能为空，可能只有一个值，也可能有多个值 print bestMoves return random.choice(bestMoves)#从可以移动到的列中，随机选择一个作为移动到的目标

4.8 棋子移动操作

通过不断改变棋子的相应坐标，实现下落的动画效果。

def getLowestEmptySpace(board, column):# 返回最一列中最下面的空格 for y in range(BOARDHEIGHT-1, -1, -1): if board[column][y] == EMPTY: return y return -1 def makeMove(board, player, column): lowest = getLowestEmptySpace(board, column)#返回一栏中 if lowest != -1:#如果格子中的有空格 board[column][lowest] = player '''则将player(red/black)赋值给一栏中的最low的一个空格因为，棋子是落在一栏当中所有空格的最下面一个空格即认定这个格子中的颜色 ''' def animateDroppingToken(board, column, color): x = XMARGIN + column * SPACESIZE #x坐标 y = YMARGIN - SPACESIZE #y坐标 dropSpeed = 1.0#棋子降落的速度 lowestEmptySpace = getLowestEmptySpace(board, column)#一列的空格当中最下面的一个空格 while True: y += int(dropSpeed)#y的坐标以dropSpeed叠加 dropSpeed += 0.5#dropSpeed也在加速，即棋子下落的加速度为0.5 if int((y - YMARGIN) / SPACESIZE) >= lowestEmptySpace:#判断到达最下面的空格 return drawBoard(board, {'x':x, 'y':y, 'color':color})#y不断变化，不断绘制红色棋子，形成不断降落的效果 pygame.display.update() FPSCLOCK.tick()

4.9 一些判断函数

判断棋子的移动是否有效，判断棋盘是否还有空格

def isValidMove(board, column):#判断棋子移动有效性 if column < 0 or column >= (BOARDWIDTH) or board[column][0] != EMPTY: #如果列<0,或>BOARDWIDTH,或列中没有空格子 return False #则为无效的移动，否则有效 return True def isBoardFull(board): #如果格子中没有空余，则返回True for x in range(BOARDWIDTH): for y in range(BOARDHEIGHT): if board[x][y] == EMPTY: return False return True

4.10 获胜条件判断

几张示意图方便了解，获胜的四种情况。图中所示是x，y取极值时所对应的位置。

def isWinner(board, tile):# 检查水平方向棋子情况 for x in range(BOARDWIDTH - 3):#x的取值为0,1,2,3 for y in range(BOARDHEIGHT):#遍历所有行 #如果x=0,则看第y行前4个棋子否都是相同的棋子，以此类推可以遍历所有的水平棋子四子相连情况.只要有一个x，y成立就可以判定获胜 if board[x][y] == tile and board[x+1][y] == tile and board[x+2][y] == tile and board[x+3][y] == tile: return True # 检查竖直方向棋子情况，与水平情况类似 for x in range(BOARDWIDTH): for y in range(BOARDHEIGHT - 3): if board[x][y] == tile and board[x][y+1] == tile and board[x][y+2] == tile and board[x][y+3] == tile: return True # 检查左倾斜方向棋子情况 for x in range(BOARDWIDTH - 3):#x取值0,1,2,3 for y in range(3, BOARDHEIGHT):#因为左倾斜连成四子时，最坐下面的棋子至少为列中距离最上面四个格子，即y>=3 if board[x][y] == tile and board[x+1][y-1] == tile and board[x+2][y-2] == tile and board[x+3][y-3] == tile:#判定左倾斜四子同色 return True # 检查右倾斜方向棋子情况，与左倾斜类似 for x in range(BOARDWIDTH - 3): for y in range(BOARDHEIGHT - 3): if board[x][y] == tile and board[x+1][y+1] == tile and board[x+2][y+2] == tile and board[x+3][y+3] == tile: return True return False

4.11 程序运行

def main():isFirstGame = True #初始isFirstGame while True: #使游戏一直能够运行下去 runGame(isFirstGame) isFirstGame = False def runGame(isFirstGame): if isFirstGame: # 刚刚启动游戏第一局时 #让AI先走第一步棋子，以便玩家可以观察到游戏是怎么玩的 turn = COMPUTER showHelp = True else: # 从第二剧开始，随机分配 if random.randint(0, 1) == 0: turn = COMPUTER else: turn = HUMAN showHelp = False

五、实验总结

基于蒙特卡洛搜索树算法，利用Pygame模块使用Python代码实现了，人工自由选择棋子，AI通过算法智能跳到的人机大战效果。整个实验，让我们熟悉了pygame创建实例和移动的基础知识，也初步了解了蒙特卡洛算法的具体应用。

六、参考资料

/info-detail-1261189.html
蒙特卡洛搜索树介绍：/posts//09/intro-to-monte-carlo-tree-search/

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。