- 博客(19)
- 收藏
- 关注
原创 论文阅读:CacheGen: KV Cache Compression and Streaming for Fast LargeLanguage Model Serving
CacheGen通过创新性地将视频编码思想迁移至LLM服务场景,成功解决了长上下文处理中的网络传输瓶颈。其核心技术——基于差分与分组的KV压缩、带宽自适应的流式传输——在多个维度上超越现有方法,压缩率提升3.5倍以上,TTFT降低至2秒级,同时保持生成质量损失小于2%。实验表明,CacheGen具备优异的动态适应能力与系统兼容性,可广泛应用于法律助手、金融分析、多轮对话等场景。未来,结合增量传输与智能缓存策略,有望推动LLM在实时交互、边缘计算等领域的规模化落地,为AI服务的效率革命提供关键技术支持。
2025-05-20 16:34:45
1197
1
原创 印章/公章识别:PaddleX下的“Seal-Recognition”模型
Seal-Recognition”模型是PaddleX旗下的一款模型(PaddleX 是基于飞桨框架构建的低代码开发工具,它集成了众多开箱即用的预训练模型,可以实现模型从训练到推理的全流程开发,支持国内外多款主流硬件,助力AI 开发者进行产业实践。模型丰富一键调用:将覆盖文本图像智能分析、OCR、目标检测、时序预测等多个关键领域的 200+ 飞桨模型整合为 19 条模型产线,通过极简的 Python API 一键调用,快速体验模型效果。同时支持 20+ 单功能模块,方便开发者进行模型组合使用)。
2025-03-14 12:09:37
3629
3
原创 论文阅读:Large Language Models AreZero-Shot Time Series Forecasters,有学术汇报PPT(组会必备)
概要:提出一种名为 LLMTIME 的方法,利用LLMs进行时序预测。它将时间序列数据编码为数字字符串,将预测问题转化为文本中的下一个词预测任务。它 在多个基准数据集上取得了与专业时序模型相当甚至更好的性能,且是零样本学习,无需微调。标记、重缩放 连续概率密度建模。
2024-12-12 15:28:32
365
1
原创 闵帆老师《论文写作》学习心得
摘要要简短全面。要写明已有工作及局限性、本文的工作、本文的创新点或贡献、实验的设置和结果。10句写完摘要。本次的学习心得虽是本门课程的结业作业,也是对论文写作课的知识点总结,希望以后在写作过程中,能随时翻看闵帆老师的博客,避免不必要的错误。
2024-10-31 21:55:12
654
1
原创 数据结构与算法题目集(中文)6-1 单链表逆转 C语言
其中List/* 存储结点数据 *//* 指向下一个结点的指针 *//* 定义单链表类型 */L是给定单链表,函数Reverse要返回被逆转后的链表。数据结构与算法题目集(中文)6-1 单链表逆转 C语言
2024-03-28 14:28:03
537
原创 PTA基础编程题目集 7-29 删除字符串中的子串 C语言
输入2个字符串S1和S2,要求删除字符串S1中出现的所有子串S2,即结果字符串中不能包含S2。PTA基础编程题目集 7-29 删除字符串中的子串 C语言
2024-03-27 17:34:13
1472
3
原创 PTA基础编程题目集 7-28 猴子选大王(约瑟夫环问题) C语言
一群猴子要选新猴王。新猴王的选择方法是:让N只候选猴子围成一圈,从某位置起顺序编号为1~N号。从第1号开始报数,每轮从1报到3,凡报到3的猴子即退出圈子,接着又从紧邻的下一只猴子开始同样的报数。如此不断循环,最后剩下的一只猴子就选为猴王。请问是原来第几号猴子当选猴王?PTA基础编程题目集 7-28 猴子选大王(约瑟夫环问题) C语言
2024-03-26 21:03:23
691
原创 PTA基础编程题目集 6-10 阶乘计算升级版
其中N是用户传入的参数,其值不超过1000。如果N是非负整数,则该函数必须在一行中打印出N!的值,否则打印“Invalid input”。PTA基础编程题目集 6-10 阶乘计算升级版
2024-03-26 14:23:12
584
原创 PAT乙级 1074 宇宙无敌加法器 C语言
地球人习惯使用十进制数,并且默认一个数字的每一位都是十进制的。而在 PAT 星人开挂的世界里,每个数字的每一位都是不同进制的,这种神奇的数字称为“PAT数”。每个 PAT 星人都必须熟记各位数字的进制表,例如“……0527”就表示最低位是 7 进制数、第 2 位是 2 进制数、第 3 位是 5 进制数、第 4 位是 10 进制数,等等。每一位的进制 d 或者是 0(表示十进制)、或者是 [2,9] 区间内的整数。PAT乙级 1074 宇宙无敌加法器 C语言
2024-03-25 20:01:34
517
1
原创 PAT乙级 1072 开学寄语 C语言
下图是上海某校的新学期开学寄语:天将降大任于斯人也,必先删其微博,卸其 QQ,封其电脑,夺其手机,收其 ipad,断其 wifi,使其百无聊赖,然后,净面、理发、整衣,然后思过、读书、锻炼、明智、开悟、精进。而后必成大器也!本题要求你写个程序帮助这所学校的老师检查所有学生的物品,以助其成大器。PAT乙级 1072 开学寄语 C语言
2024-03-25 11:44:36
494
1
原创 PAT乙级 1070 结绳 C语言
给定一段一段的绳子,你需要把它们串成一条绳。每次串连的时候,是把两段绳子对折,再如下图所示套接在一起。这样得到的绳子又被当成是另一段绳子,可以再次对折去跟另一段绳子串连。每次串连后,原来两段绳子的长度就会减半。给定 N 段绳子的长度,你需要找出它们能串成的绳子的最大长度。PAT乙级 1070 结绳 C语言
2024-03-24 21:32:51
471
1
原创 PAT乙级 1068 万绿丛中一点红 C语言
对于计算机而言,颜色不过是像素点对应的一个 24 位的数值。现给定一幅分辨率为 M×N 的画,要求你找出万绿丛中的一点红,即有独一无二颜色的那个像素点,并且该点的颜色与其周围 8 个相邻像素的颜色差充分大。PAT乙级 1068 万绿丛中一点红 C语言
2024-03-24 15:25:17
582
1
原创 PAT乙级 1067 试密码 C语言
输入在第一行给出一个密码(长度不超过 20 的、不包含空格、Tab、回车的非空字符串)和一个正整数 N(≤ 10),分别是正确的密码和系统允许尝试的次数。PAT乙级 1067 试密码 C语言
2024-03-23 22:59:06
407
原创 PAT乙级 1062 最简分数 C语言
一个分数一般写成两个整数相除的形式:N/M,其中 M 不为0。最简分数是指分子和分母没有公约数的分数表示形式。现给定两个不相等的正分数 N1/M1 和 N2/M2,要求你按从小到大的顺序列出它们之间分母为 K 的最简分数。PAT乙级 1062 最简分数 C语言
2024-03-23 10:33:41
711
原创 PAT乙级 1059 C语言竞赛 C语言
C 语言竞赛是浙江大学计算机学院主持的一个欢乐的竞赛。给定比赛的最终排名以及一系列参赛者的 ID,你要给出这些参赛者应该获得的奖品。PAT乙级 1059 C语言竞赛 C语言
2024-03-22 20:24:58
354
1
原创 PAT乙级 1055 集体照 C语言
拍集体照时队形很重要,这里对给定的 N 个人 K 排的队形设计排队规则如下:每排人数为 N/K(向下取整),多出来的人全部站在最后一排;后排所有人的个子都不比前排任何人矮;每排中最高者站中间(中间位置为 m/2+1,其中 m 为该排人数,除法向下取整);每排其他人以中间人为轴,按身高非增序,先右后左交替入队站在中间人的两侧(例如5人身高为190、188、186、175、170,则队形为175、188、190、186、170。这里假设你面对拍照者,所以你的左边是中间人的右边);PAT乙级 1055 集体照 C
2024-03-22 16:11:44
1105
1
原创 PAT乙级 1054 求平均值 C语言
本题的基本要求非常简单:给定 N 个实数,计算它们的平均值。但复杂的是有些输入数据可能是非法的。一个“合法”的输入是 [−1000,1000] 区间内的实数,并且最多精确到小数点后 2 位。当你计算平均值的时候,不能把那些非法的数据算在内。PAT乙级 1054 求平均值 C语言
2024-03-21 22:15:14
897
1
Large Language Models AreZero-Shot Time Series Forecasters汇报PPT
2024-12-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅