python 实现大语言模型中的概率论:两人轮流出手对决时取胜概率的推导

最新推荐文章于 2025-08-03 11:03:56 发布

原创

最新推荐文章于 2025-08-03 11:03:56 发布 · 1.2k 阅读

21 ·

CC 4.0 BY-SA版权

文章标签：

#语言模型 #概率论 #人工智能

假设你跟朋友通过打赌投篮来打赌一万块。你们找到一个篮球框，然后约定轮流投篮，谁先投进谁赢。假设你投进的概率是 p，也就是投不进的概率是 1-p，你对手投进的概率是 q,投不进的概率是 1-q，如果由你先投，那么你取胜的概率是多少。

在上面问题中我们把事情进行了理想化假设。也就是你和对手的准度不会变，不管你们投了 10 次还是 100 次，你们状态都保持一致，投入的概率永远不变。这个问题涉及到概率论中一个大类问题，那就是成功率为 p 的情况下，我们需要执行多少次试验才能获得第一次成功。要解决这个问题，我们首先需要了解几何不等式：

假设 |r| < 1，那么有：
请添加图片描述
假设你在第 n 次投篮时，你投进获得了胜利，我们看基于 n 如何推导出取胜的规律来。如果 n=1，这意味着你第一次投就成功，对应的概率就是 p，如果 n=2，那意味着你投第一次不中概率为 1-p，然后对手投第一次同样不中，概率为 1-q，然后你投第二次结果中了，概率为 p，此时对应的概率就是(1-p)(1-q)p，如果我们这里用字符 r 替代(1-p)(1-q)，那么对应概率就简化为 rp，如果 n=3，那说明你前两次不中，概率就是(1-p) ^ 2,对方前两次也不中，概率为(1-q) ^ 2,然后你第三次中了，于是概率就是(1-p) ^ 2 * (1-q) ^ 2 * p ，由于我们使用 r 代替(1-p)(1-q),因此(1-p) ^ 2 * (1-q) ^ 2 就可以简化为 r ^ 2,于是概率就是 r ^2 * p，由此我们就能推而广之，那就是当你在第 n 次投篮时成功对应的概率就是 r ^( n-1) * p。