
知识点
文章平均质量分 83
Twilight-pending
这个作者很懒,什么都没留下…
展开
-
K8s工作流程与YAML实用指南
Kubernetes采用声明式管理方式,通过YAML文件定义期望状态。其核心流程包括:用户提交YAML→API Server处理→etcd存储→控制器监控→调度器分配→Kubelet执行→持续状态维护。标准YAML文件包含四大结构:API版本、资源类型、元数据和规格定义。示例展示了完整的Deployment配置,包括副本数量、容器镜像、资源限制和健康检查等参数。K8s会根据YAML描述自动创建和管理指定数量的Pod,并在出现故障时进行自愈,确保应用始终处于期望状态。原创 2025-05-30 15:54:13 · 531 阅读 · 0 评论 -
Transformer架构核心流程解析
Transformer的核心流程。原创 2025-05-29 11:01:22 · 622 阅读 · 0 评论 -
DeepEP简介
为了与 DeepSeek-V3 论文中提出的 group-limited gating 算法保持一致,DeepEP 提供了一套针对非对称域带宽 forwarding 进行优化的内核,例如从 NVLink 域到 RDMA 域的数据 forwarding。在生成式人工智能中,混合专家模型(MoE)是一种采用多个专业化的“专家”子模型处理不同任务的模型架构。专家并行(EP)是混合专家模型(MoE)采用的一种技术,通过让多个专家(专业化的子模型)并行处理任务的不同部分,将工作负载分布到这些专家之间。原创 2025-02-26 10:56:52 · 561 阅读 · 0 评论 -
翁丽莲 LLM Powered Autonomous Agents
大型语言模型(LLM)作为自主代理的核心控制器是一个创新概念。规划(包括任务分解和自我反思)记忆(包括短期和长期记忆)工具使用能力。这种系统通过LLM的推理能力,结合外部工具和记忆系统,可以完成复杂的认知任务。但当前这类系统仍面临上下文长度有限、长期规划困难、自然语言接口可靠性等挑战。原创 2025-02-24 11:01:48 · 877 阅读 · 0 评论 -
科研场景AI工具全景透视
2024年全球Top100高校中,61%建立AI科研协作中心,平均研发效率提升37%DeepSeek-R1在乳腺癌早期筛查中实现92.3%准确率(需配合专业影像设备)建议:建立动态评估机制,每季度更新工具组合;重要成果需通过3种以上模型交叉验证。Llama量子版成功预测23种新型超导材料结构(3篇Nature子刊待发表)原创 2025-02-20 11:31:44 · 846 阅读 · 0 评论 -
DeepSeek 新注意力架构NSA
原生稀疏注意力的两个关键优势:(1)预训练的稀疏注意力模式能够高效捕捉对复杂数学推导至关重要的长距离逻辑依赖关系;(2)该架构的硬件对齐设计保持了足够的上下文密度,以支持不断增长的推理深度,而不会出现灾难性遗忘。在不同上下文长度下的一致优势证实了稀疏注意力在原生集成到训练流程中时,对于高级推理任务的可行性。原创 2025-02-19 10:14:00 · 924 阅读 · 0 评论 -
.git/objects/pack 过大git push失败
清理.git文件夹过大出现臃肿问题:.git/objects/pack。原创 2024-09-20 16:18:44 · 231 阅读 · 0 评论 -
MVP 最简可行产品
MVP(最小可行产品)是一种产品开发策略,其主要目的是用最少的时间和资源,开发一个包含最基本必要功能的产品。这样做的目的是能够以最小的成本进入市场,获取用户反馈,再根据反馈逐步优化产品。原创 2024-09-19 20:20:12 · 1421 阅读 · 0 评论 -
推理与训练,分布式训练
在人工智能领域,训练是指让机器学习模型做出准确推理的过程。训练可能涉及反复试错的过程,或者向模型展示期望输入和输出的示例,或者两者兼而有之。原创 2024-09-11 20:04:43 · 1082 阅读 · 0 评论 -
BSP模型
Bulk Synchronous Parallelism Model,块同步并行模型,或桥接模型、整体同步并行原创 2024-08-27 11:02:04 · 1404 阅读 · 0 评论 -
互联网技术之一 Markup
Markup (标记语言) 侧重于文本的结构和显示,适用于静态内容。Scheme Markup 在 Scheme 语言中是一种抽象化的数据或程序结构表示。原创 2024-08-18 11:29:05 · 1252 阅读 · 0 评论 -
明确工作目标学习稿:计算技术体系的发展方向
C体系”狭义上指我国构建处理器生态的第三条道路及其技术体系。原创 2024-08-03 12:07:10 · 1132 阅读 · 0 评论 -
End-to-End Argument 一种系统设计指南
End-to-End Argument 在选择平台层/下层中要提供的功能时,类似于“奥卡姆剃刀”,有些功能只能在应用层“完全且正确地实现”,而在平台层(中间节点或底层系统)实现这些功能则是不可能的。虽然End-to-End原则在很多情况下是有效的,但也不是绝对的。原创 2024-08-01 11:49:32 · 877 阅读 · 0 评论 -
sloppy模型/sloppiness
sloppy模型或者sloppiness分析/算法:多参数的模型,其行为只取决于几个参数的严格组合,而参数的其它组合方式对模型预测来说并不重要。原创 2024-07-31 12:40:44 · 1403 阅读 · 0 评论