海持Alvin
头部大厂打工人、AI创业者。爱好AI、创业、游泳、钢琴。
可review简历并推荐顶级大厂如阿里、字节、微软、华为、大疆。
可咨询美股开户
展开
-
2025年2月17日民营企业座谈会参会企业和人员名单
2025年2月17日民营企业座谈会参会企业和人员名单原创 2025-02-18 11:23:00 · 555 阅读 · 0 评论 -
段永平浙大分享会-2025.1
8、谈分享:我能做到今天,很多就是对人的支持,我的分享的精神,我觉得很多人用人的时候都是要。9、谈黄峥:我非常喜欢和黄铮交流,因为我觉得他是一个看本质的人,和我一样,我觉得这是比较重。是真的有想法,真的有必要,还有就是走投无路的时候,有时候也是创业的一个好办法,因为我们当。错了你赶紧改,这一辈子你累积三十几年,四十几年,每一个决定都是基于十年,二十年以后回过头。11、谈信息差:信息差对炒股没有太大影响,除非是有那种希望买了马上卖,赚不该赚的钱的人。其实你并不需要去追求它,你到了该去的时候,你自然就去了。原创 2025-02-16 18:54:19 · 32 阅读 · 0 评论 -
国内智驾主要用的芯片以及对应厂商
国内L3自动驾驶的拍照分布,主流的智驾芯片分布,涉及英伟达、特斯拉、高通、华为升腾、地平线等。原创 2025-02-16 18:41:29 · 100 阅读 · 0 评论 -
2025年2月榜单-高新技术企业进三年收入增长率排名
2025年2月榜单-高新技术企业进三年收入增长率排名,供大家参考。原创 2025-02-13 10:33:13 · 40 阅读 · 0 评论 -
深度解析 DeepSeek 的蒸馏技术
计算资源优化:蒸馏模型的参数量大幅减少,例如DeepSeek-R1-Distill-Qwen-7B的参数量仅为7B,相比原始的DeepSeek-R1(671B参数),计算复杂度显著降低。例如,在多模态数据处理任务中,学生模型在面对复杂的图像与文本融合任务时,其推理能力往往受限于教师模型的固有模式,难以实现更深层次的创新。例如,通过监督微调(SFT)的方式,将教师模型的推理数据样本用于学生模型的训练。在机器学习中,模型蒸馏是一种优化技术,通过模仿教师模型的输出,训练一个较小的学生模型,从而实现知识的传递。原创 2025-02-07 12:01:35 · 206 阅读 · 0 评论 -
中国信通院发布《高质量大模型基础设施研究报告 2024年》
通过加速卡和存储设备的数据一跳直达,可以消除CPU处理瓶颈,极大提升数据从存储到加速卡的数据传输效率,经企业实践验证,可实现TB/s级带宽和亿级IOPS,每个机架单元的存储性能可达50GB/s以上,大幅提升集群可用度。为充分发挥大模型基础设施的赋能作用,更好支撑大模型发展,推动大模型应用落地,特编制此研究报告。报告聚焦大模型基础设施的五大核心能力领域:计算、存储、网络、开发工具链和运维管理,系统梳理了大模型发展对基础设施提出的新需求,剖析了基础设施发展的关键技术,并提出体系化评价指标。陪伴年轻人终身成长。原创 2025-02-06 10:45:10 · 48 阅读 · 0 评论