赌徒破产问题
问题
从前有一个赌徒,他热衷赌博,每次赌博会有a的概率输掉一枚金币,有1-a的概率赢一枚金币,他只会在输掉所有金币或赢得P枚金币后收手,现在给出他的初始金币数h,目标金币数P,概率a,求结束的期望步数
题解
经典的赌徒破产问题
设f[i]为有i枚金币是的结束期望
显而易见,f[P]=0,f[0]=0
有f[i]=a*f[i-1]+(1-a)f[i+1]+1
由于f[P]=0,则易得f[P-1]可表示成关于f[P-2]的式子
则f[i]=k[i]f[i-1]+b[i]
代入得f[i]=af[i-1]+(1-a)(k[i+1]f[i]+b[i+1)+1
则f[i](1-(1-a)k[i+1])=af[i-1]+(1-a)*b[i+1]+1
则可得k,b的递推式
推至1,由于f[0]=0,f[1]=b[1]
再反推求出f[h]即可