poj 3233 Matrix Power Series (构造分块矩阵)

本文介绍了一种利用分块矩阵进行快速求和的算法,适用于处理大规模数据集的求和问题。通过构造特定的矩阵并运用矩阵乘法,可以在较短时间内计算出目标序列的求和结果。代码示例使用C++实现,展示了如何通过递归矩阵幂运算来加速计算过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目链接:哆啦A梦传送门

题意:自己看。

参考博客:神犇

题解:分块矩阵:分块矩阵可以构造求和。

例如:我们可以这样构造,

S1=\begin{bmatrix} A &{\color{Red} E} \\ 0& E \end{bmatrix},S2=\begin{bmatrix} A^2 &{\color{Red} A+E} \\ 0&E \end{bmatrix},...,S(k+1)=\begin{bmatrix} A^k & {\color{Red} A^k+A^(k-1)+...+A+E}\\ 0& E \end{bmatrix}

还需注意一点的是:算完S(k+1),取出右上角矩阵分块后,还需减掉单位矩阵E。

 

代码不是我写的,我就按自己习惯改了下变量,主要是博主写的太溜了,不搬都对不起他:

#include<cstdio>
#include<algorithm>
#include<cstring>

using namespace std;
typedef long long LL;
LL mod;
int n,k;

struct mat{
    LL a[70][70];
    mat(){ memset(a,0,sizeof(a));}

    mat operator * (const mat y)
    {
        mat ans;
        for(int i=1;i<=n;i++)
            for(int j=1;j<=n;j++)
            for(int k=1;k<=n;k++)
            ans.a[i][j]=(ans.a[i][j]+a[i][k]*y.a[k][j])%mod;
        return ans;
    }

    mat operator + (const mat y)
    {
        mat ans;
        for(int i=1;i<=n;i++)
            for(int j=1;j<=n;j++)
            ans.a[i][j]=(ans.a[i][j]+y.a[i][j])%mod;
        return ans;
    }

};

mat mat_pow(mat x,int k)
{
    mat ans;
    for(int i=1;i<=n;i++) ans.a[i][i]=1;

    while(k)
    {
        if(k&1) ans=ans*x;
        x=x*x;
        k>>=1;
    }
    return ans;
}

int main()
{

    while(~scanf("%d%d%lld",&n,&k,&mod))
    {

        mat p;

        for(int i=1;i<=n;i++)
        {
            for(int j=1;j<=n;j++){
                scanf("%lld",&p.a[i][j]); ///左上角矩阵
                p.a[i][j]%mod;
            }
            p.a[i+n][i+n]=1; ///构造右下角单位阵
            p.a[i][i+n]=1;///构造左上角单位阵
        }

        n<<=1;
        mat item=mat_pow(p,k+1);
        n>>=1;

        mat ans;
        for(int i=1;i<=n;i++)
            for(int j=n+1;j<=n*2;j++) ///把右上角的矩阵分块取出
            ans.a[i][j-n]=item.a[i][j];

        for(int i=1;i<=n;i++){
            ans.a[i][i]--; ///减去单位矩阵
            if(ans.a[i][i]<0) ans.a[i][i]+=mod;
        }

        for(int i=1;i<=n;i++) ///输出
        {
            for(int j=1;j<=n;j++)
                printf("%lld ",ans.a[i][j]);
            puts("");
        }
    }
    return 0;
}


我的标签:做个有情怀的程序员。

<think>好的,我现在要处理用户关于Android 12中RKNN开发配置和使用教程的问题。首先,我需要回顾用户提供的引用内容,看看是否有相关的信息。 用户提供了三个引用。引用1提到了RKNN Model Zoo和RKNN Toolkit2的环境配置,包括安装Miniconda3。引用2是关于系统镜像下载,特别是Ubuntu 22.04版本和导出ONNX模型。引用3讨论了RV1808/1126使用RKNN作为MediaPipe推理后端的步骤,包括配置参数如use_rga、use_mmap和data_type的设置,以及反量化的处理。 用户的问题集中在Android 12上,所以需要将引用中的信息与Android系统关联起来。引用3提到了MediaPipe和RKNN的集成,这可能适用于Android开发,但需要确认是否支持Android 12。此外,RKNN Toolkit2的环境配置可能在不同平台上有所不同,用户可能需要针对Android进行调整。 接下来,我需要考虑Android开发中RKNN的一般步骤,比如环境准备、模型转换、集成到Android应用、配置参数和性能优化。结合引用中的信息,模型转换部分可以参考引用2提到的导出ONNX模型,然后使用RKNN Toolkit转换为RKNN格式。引用3中的配置参数(如use_rga、use_mmap、data_type)可能在Android中同样适用,但需要查阅相关文档确认。 可能还需要指导用户如何将RKNN库集成到Android项目中,比如添加依赖项或NDK配置。此外,性能优化方面,引用3提到的反量化处理可能需要特别注意,尤其是在Android设备上的实现。 最后,确保回答结构清晰,分步骤说明,并引用提供的资料。需要验证引用中的信息是否适用于Android 12,例如系统镜像是否支持,或者是否有特定版本的要求。如果某些步骤在引用中没有明确说明,可能需要提示用户参考官方文档或社区资源。</think>### Android 12 RKNN 开发配置与使用教程 #### 1. **环境准备** - **系统镜像与工具链**: 根据引用[2],建议使用Ubuntu 22.04作为开发环境,并下载Orange Pi 5 Pro等支持RKNN的硬件镜像。对于Android 12开发,需确保RKNN Toolkit2适配Android NDK版本(推荐NDK 21+)[^2]。 - **安装RKNN Toolkit2**: 参考引用[1],通过Miniconda3配置Python环境(建议Python 3.8),并安装RKNN Toolkit2以支持模型转换与推理。命令示例: ```bash pip install rknn_toolkit2 ``` #### 2. **模型转换(ONNX转RKNN)** - **导出ONNX模型**: 使用PyTorch或TensorFlow等框架导出模型为ONNX格式(引用[2])。 - **转换为RKNN格式**: 编写RKNN配置文件(`config.yml`),指定输入尺寸、量化方式等参数。示例代码: ```python from rknn.api import RKNN rknn = RKNN() rknn.config(target_platform='rk3568', mean_values=[[127.5]], std_values=[[127.5]]) rknn.load_onnx(model="model.onnx") rknn.build(do_quantization=True, dataset="dataset.txt") rknn.export_rknn("model.rknn") ``` #### 3. **Android项目集成** - **添加RKNN库依赖**: 将编译好的RKNN动态库(`librknnrt.so`)和模型文件(`model.rknn`)放入Android项目的`jniLibs`目录。 - **JNI接口开发**: 通过JNI调用RKNN的C/C++ API实现推理。关键配置参考引用[3]: ```cpp #include <rknn/rknn_runtime.h> rknn_context ctx; int ret = rknn_init(&ctx, model_path, 0, 0, nullptr); ret = rknn_inputs_set(ctx, input_num, input_attrs); ret = rknn_run(ctx, nullptr); ret = rknn_outputs_get(ctx, output_num, output_attrs, nullptr); ``` #### 4. **关键配置参数** - **use_rga与use_mmap**: 根据引用[3],若Android设备不支持硬件加速(如RGA),需将`use_rga`和`use_mmap`设为`false`。 - **数据量化类型**: `data_type`可选`uint8`或`fp32`。若选`uint8`,需手动实现反量化;若选`fp32`,RKNN会自动处理[^3]。 #### 5. **性能优化** - **多线程推理**: 利用Android的`ThreadPoolExecutor`并行处理输入数据。 - **内存优化**: 启用`use_mmap`(若支持)减少内存拷贝开销,或通过零拷贝技术直接操作物理内存。 #### 6. **调试与验证** - **日志输出**: 启用RKNN的调试模式(`RKNN_LOG_LEVEL=DEBUG`)查看详细运行信息。 - **性能分析**: 使用`rknn.query(RKNN_QUERY_PERF_DETAIL)`获取各层耗时,针对性优化模型结构。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值