自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

上一步保存

qq_41685627的博客

ZhangTao_zata

博客等级

码龄7年

127
原创

772
点赞

664
收藏

631
粉丝

关注

私信

分类专栏

人工智能论文阅读 1篇

最新评论

（windows ssh） windows开启ssh服务，并通过ssh登录该win主机
凯爷弟子: win11没有登录密码了
DeepSeek-NSA 论文阅读【Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention】
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读：DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读笔记
优快云-Ada助手: 你好，优快云开始提供 #论文阅读# 的列表服务了。请看：https://blog.youkuaiyun.com/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
python-函数前一行加@xxxx的含义&参数的约束条件检查装饰器
优快云-Ada助手: 推荐 Python入门技能树：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python

人工智能论文阅读

关注

文章平均质量分 96

关注数：文章数：1 文章阅读量：1298 文章收藏量：12

作者: ZhangTao_zata

这个作者很懒，什么都没留下…

展开

DeepSeek-NSA 论文阅读【Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention】

Long-context modeling is crucial for next-generation language models, yet the high computational cost of standard attention mechanisms poses significant computational challenges. 对于下一代生成式语言模型而言，长文本建模至关重要，然而标准注意力机制的高计算成本带来了显著的计算挑战。

原创 2025-02-20 15:01:52 · 1299 阅读 · 1 评论

人工智能论文阅读

作者: ZhangTao_zata

DeepSeek-NSA 论文阅读【Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention】