- 博客(191)
- 资源 (9)
- 问答 (1)
- 收藏
- 关注
原创 DeepSeek 开源周:FlashMLA 与 DeepEP 的突破与影响
“天都塌了!患者用 DeepSeek 查完病,直接质疑我的治疗方案,气得我赶紧重新查阅了最新指南,才发现自己竟遗漏了更新……” 近日,广东一位医学博主 “孤芳自赏” 在网上发出的这番感慨,犹如一颗石子投入平静的湖面,激起了千层浪,引发众多网友的热烈讨论。
2025-02-26 09:14:01
861
原创 DeepSeek 开源周:FlashMLA 与 DeepEP 的突破与影响
使用 FlashMLA 优化后,H800 的内存带宽利用率有望进一步提高甚至突破 H800 GPU 理论上限,在内存访问上达到极致,能让开发群体充分 “压榨” 英伟达 H 系列芯片能力,以更少的芯片实现更强的模型性能,最大化 GPU 价值。大家好,我是小码哥,本周DeepSeek 正式启动 “开源周”,2月24日、2月25日开源了FlashMLA 和 DeepEP 两个开源项目,它们不仅展现了 DeepSeek 在技术上的深厚积累,更对行业发展带来了深远影响。
2025-02-25 17:02:43
804
原创 部署 DeepSeek-R1,配置、价格与并发量全攻略!
大家好,我是小码哥,今天给大家带来的是部署 DeepSeek-R1 的详细攻略,包括硬件配置、价格以及软件环境和并发量的考虑,让你轻松上手!
2025-02-24 10:44:07
2164
1
原创 未来三年,阿里巴巴加大投入三大领域
阿里巴巴的这一战略布局,不仅展示了其对AI技术的高度重视,也反映了整个互联网行业对AI技术的迫切需求。作为普通用户,我们也将迎来一个更加智能化的生活时代。只有在技术发展的同时,注重伦理和法律的规范,才能确保AI技术的健康发展。阿里巴巴将持续提升AI应用的研发投入以及算力投入,运用AI深度改造升级各业务,把握AI时代的新发展机遇。阿里巴巴将大幅提升AI基础模型的研发投入,确保技术的先进性和行业领先地位,并推动AI原生应用的发展。这意味着阿里巴巴将构建更强大的云计算平台,为AI技术的发展提供坚实的硬件支持。
2025-02-21 09:17:22
343
原创 王炸,DeepSeek 推出NAS
2 月 18 日,DeepSeek 在社交平台 X 上搞了个大动作,发布了一篇关于 NSA 的纯技术论文报告。这 NSA 可不是啥普通玩意儿,它是一种与硬件高度适配并且能原生训练的稀疏注意力机制,牛掰之处在于能实现超高速长上下文训练与推理,简直厉害到飞起!
2025-02-19 09:52:39
897
原创 DeepSeek R1 副业创业全攻略来袭
创新点:解决家长 “决策焦虑”,比如用指令“生成小升初衔接计划,包含每日时间表及推荐书目”,太贴心了。销售与合作:将优化后的脚本出售给游戏开发公司,或与游戏开发者合作,参与游戏开发项目,获取收益。大家好,我是小码哥,今天给大家整理了一份超全的 DeepSeek R1 副业创业攻略,结合技术应用、市场需求和案例拆解,涵盖工具使用、变现路径、风险提示及未来趋势分析,全是干货,赶紧码住!:咱就是说,中小药企在 AI 落地这块儿真挺缺能力的,咱们就给他们提供数据清洗、模型微调、报告生成这些轻量级服务,绝对刚需。
2025-02-13 11:26:04
914
原创 《清华大学出手!104页DeepSeek手册,AI小白的逆袭秘籍!(附下载)》
介绍DeepSeek的核心概念、目标、功能及应用场景。DeepSeek是一家专注于通用人工智能(AGI)的中国科技公司,其开源推理模型DeepSeek-R1擅长处理复杂任务,如逻辑推理、数学计算和代码生成,且可免费商用。
2025-02-11 09:09:42
1051
原创 惊爆!DeepSeek 涨价了
API 价格相比优惠期上调了 2 - 4 倍,估计有不少企业会更倾向于本地化部署,这样一来,企业侧算力需求和容灾备份需求就迎来好时机啦。随着 DeepSeek 的火爆出圈,访问量那是相当的大,服务器压力山大,经常出现 “服务器繁忙,请稍后再试” 的情况。优惠体验期就是 DeepSeek 官方搞的市场推广小策略啦,目的就是让咱这些用户都去试试水,感受下它的强大,这不,用户基础和口碑都积累得差不多了,优惠期一过,价格就恢复 “原形” 啦。不过,除了这个,还有些其他原因哦。
2025-02-10 09:31:50
292
原创 DeepSeek R1 蒸馏法:大模型“瘦身”不“降智”
知识蒸馏(Knowledge Distillation)是一种模型压缩技术,旨在将一个大型复杂模型(教师模型)的知识转移到一个小型简单模型(学生模型)中,使学生模型在保持较小规模的同时,能够学习到教师模型的推理能力和知识表示。其核心思想是利用教师模型的输出作为软标签(soft labels),指导学生模型的训练过程,从而让学生模型学习到教师模型对数据的深层次理解和抽象表示。
2025-02-08 09:29:37
849
原创 Deepseek核心团队曝光!
DeepSeek 团队最大的特点是名校、年轻,即使是团队 Leader 级别,年纪也多在 35 岁以下。不到 140 人的团队,工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校,工作时间都不长。
2025-02-07 08:30:00
8583
原创 普通人如何借助 DeepSeek 实现财富增长?
人工智能已经深入到我们生活的方方面面,而 DeepSeek 作为一款强大的 AI 工具,为普通人提供了诸多赚钱的机会。即使你没有深厚的技术背景,只要掌握正确的方法,也能利用 DeepSeek 开启财富之门。下面将为你详细介绍几种可操作性强、可落地的通过 DeepSeek 搞钱的方法。
2025-02-06 10:52:29
18379
原创 解析DeepSeek 引发AI大地震原因:英伟达市值一夜暴跌,三大巨头紧急布局
解析DeepSeek 引发AI大地震原因:英伟达市值一夜暴跌,三大巨头紧急布局。
2025-02-05 10:54:32
891
原创 搞了3个月决定开源了,AI搞钱项目源码
本开源 AI 副业搞钱项目集成了强大功能,包括 AI 艺术二维码生成、AI 换脸、Delle3 绘画等,同时具备个人收付款、手机登录、金额充值及消费记录查询等实用特性。个人可以充分利用 AI 技术实现变现与搞钱,搭建自己的 AI 副业项目,只有有人使用,就有收益实时到账你个人微信,实现真正的躺赢。
2024-11-19 11:07:40
850
原创 ubuntu更改max_map_count
在Ubuntu系统中,max_map_count是一个内核参数,用于限制每个进程可以拥有的内存段的数量。对于Elasticsearch等需要大量内存映射的应用,可能需要增加这个值。保存并关闭文件(如果使用nano,可以通过按Ctrl + X,然后按Y,接着按Enter来保存)。请注意,这个值设置得太高可能会对系统稳定性产生影响,因此建议只在确实需要时才进行调整。你应该看到输出为新设置的值。
2024-11-11 08:49:07
499
原创 熬夜2月,终成人人可自建的AI网站
小码哥AI平台2.0版本,系统更快、更稳定,致力于服务AI爱好者、AI创作者,目前已经开发了AI绘画、AI头像制作、AI换脸、AI图生文、AI艺术二维码,个人也可以实现在线收款,真正实现躺赚。先来看看界面和功能吧。首页登录点击右上角登录即可看到所有功能,目前支持手机号登录和邮箱注册登录。AI绘画目前主要集成了MJ绘画、MJ图生文、换脸,输入中文或英文即可实现绘画,人人都是创作者。AI头像定制通过输入提示词,加上需要制作的照片,即可绘制创意的头像。图生文。
2024-09-25 08:45:00
691
原创 vue3实现图片瀑布流展示
最近在研发AI副业项目平台,然后自己设计了一个瀑布流组件,可以随意调整展示的列数、懒加载、每页滚动数量、高度、点击效果等。
2024-08-13 10:02:39
2170
原创 搭建自己的AI副业平台
大家好,我是小码哥,一名互联网创业者,自AI项目上线以来,受到很多粉丝的关注,让加快研发进度,今天dalle3绘画终于上线啦,可以获取项目源码。
2024-08-13 09:12:31
1054
原创 程序员的AI副业项目源码
程序员的AI副业项目源码:采用主流的springboot+vue3实现,可用来学习+搞钱。目前已经实现AI绘画、艺术二维码、AI换脸等功能。
2024-08-12 20:07:31
563
原创 Springboot提示Content type ‘text/plain;charset=UTF-8‘ not supported
后台提示Content type ‘text/plain;charset=UTF-8‘ not supported
2024-08-05 10:22:53
511
可直接用的大数据通用模板代码,html+css+js,实现数据可视化。
2022-02-07
maven离线安装插件
2017-08-28
sqlserver如何设置指定用户只能查看和删除自己创建的表?
2022-03-03
TA创建的收藏夹 TA关注的收藏夹
TA关注的人