校招算法笔面试 | 校招笔面试真题-抽牌

题目

题目链接

解题思路

这是一个动态规划问题,需要计算期望值。游戏规则如下:

  1. n n n 张牌从上到下编号 1 1 1 n n n,每张牌上有一个数字 a i a_i ai
  2. 两人轮流取牌,每次只能取最上面或最下面的牌
  3. 小明先手,以概率 p p p 取上面的牌,概率 1 − p 1-p 1p 取下面的牌
  4. 小方后手,以概率 q q q 取上面的牌,概率 1 − q 1-q 1q 取下面的牌
  5. 求小明获得的数字之和的期望值

解决方案:

  1. 使用区间DP, d p [ i ] [ j ] dp[i][j] dp[i][j] 表示区间 [ i , j ] [i,j] [i,j] 的期望值
  2. 初始化单张牌和相邻两张牌的情况
  3. 按照区间长度递推,考虑所有可能的取牌情况

代码

#include <bits/stdc++.h>
using namespace std;

int main() {
    int n, P, Q;
    scanf("%d%d%d", &n, &P, &Q);
    
    // 读入牌面值
    int a[n];
    for(int i = 0; i < n; i++)
        scanf("%d", &a[i]);
    
    // 转换概率值
    double p = P/100.0, q = Q/100.0;
    double dp[n][n];
    memset(dp, 0, sizeof(dp));
    
    // 初始化单张牌和相邻两张牌的情况
    for(int i = 0; i < n; i++) {
        dp[i][i] = a[i];
        if(i < n-1)
            dp[i][i+1] = p*a[i] + (1-p)*a[i+1];
    }
    
    // 区间DP
    for(int k = 2; k < n; k++) {
        for(int i = 0; i < n-k; i++) {
            int j = i + k;
            // 小明取上面的牌时的期望
            double px = a[i] + q*dp[i+2][j] + (1-q)*dp[i+1][j-1];
            // 小明取下面的牌时的期望
            double py = a[j] + q*dp[i+1][j-1] + (1-q)*dp[i][j-2];
            // 综合两种情况
            dp[i][j] = p*px + (1-p)*py;
        }
    }
    
    printf("%.3f\n", dp[0][n-1]);
    return 0;
}
import java.util.*;

public class Main {
    public static void main(String[] args) {
        Scanner sc = new Scanner(System.in);
        int n = sc.nextInt();
        int P = sc.nextInt();
        int Q = sc.nextInt();
        
        // 读入牌面值
        int[] a = new int[n];
        for(int i = 0; i < n; i++) {
            a[i] = sc.nextInt();
        }
        
        // 转换概率值
        double p = P/100.0, q = Q/100.0;
        double[][] dp = new double[n][n];
        
        // 初始化单张牌和相邻两张牌的情况
        for(int i = 0; i < n; i++) {
            dp[i][i] = a[i];
            if(i < n-1)
                dp[i][i+1] = p*a[i] + (1-p)*a[i+1];
        }
        
        // 区间DP
        for(int k = 2; k < n; k++) {
            for(int i = 0; i < n-k; i++) {
                int j = i + k;
                // 小明取上面的牌时的期望
                double px = a[i] + q*dp[i+2][j] + (1-q)*dp[i+1][j-1];
                // 小明取下面的牌时的期望
                double py = a[j] + q*dp[i+1][j-1] + (1-q)*dp[i][j-2];
                // 综合两种情况
                dp[i][j] = p*px + (1-p)*py;
            }
        }
        
        System.out.printf("%.3f\n", dp[0][n-1]);
    }
}
def solve():
    n, P, Q = map(int, input().split())
    a = list(map(int, input().split()))
    
    # 转换概率值
    p, q = P/100.0, Q/100.0
    
    # 初始化DP数组
    dp = [[0.0] * n for _ in range(n)]
    
    # 初始化单张牌和相邻两张牌的情况
    for i in range(n):
        dp[i][i] = a[i]
        if i < n-1:
            dp[i][i+1] = p*a[i] + (1-p)*a[i+1]
    
    # 区间DP
    for k in range(2, n):
        for i in range(n-k):
            j = i + k
            # 小明取上面的牌时的期望
            px = a[i] + q*dp[i+2][j] + (1-q)*dp[i+1][j-1]
            # 小明取下面的牌时的期望
            py = a[j] + q*dp[i+1][j-1] + (1-q)*dp[i][j-2]
            # 综合两种情况
            dp[i][j] = p*px + (1-p)*py
    
    print(f"{dp[0][n-1]:.3f}")

solve()

算法及复杂度

  • 算法:区间动态规划
  • 时间复杂度: O ( n 2 ) \mathcal{O}(n^2) O(n2) - 需要计算所有可能的区间
  • 空间复杂度: O ( n 2 ) \mathcal{O}(n^2) O(n2) - 需要存储所有状态的期望值
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值