自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 梁文峰署名的NSA 与 Kimi杨植麟署名的MoBA撞车,新注意力架构比拼

共同目标:降低注意力计算复杂度,支持长上下文建模,同时保持模型性能。差异路径NSA强调细粒度动态选择和硬件优化,适合通用长任务的高效训练与推理。MoBA侧重块级路由和混合训练策略,更适合超长序列(如百万 token)的场景。互补性:NSA 的细粒度选择可增强局部精度,而 MoBA 的块路由更适合极端长度的高效扩展。两者均可作为 Transformer 架构的改进方向。

2025-02-20 22:59:51 928

原创 都说Deepseek省算力,算力到底应该如何计算?

指每秒浮点运算次数,是衡量硬件性能的指标,表示计算设备每秒能够完成的浮点运算次数。指浮点运算次数,用于描述模型推理过程中需要的计算量,即模型的复杂度。MACs(乘加累积操作数):指模型中乘法和加法操作的总次数。在神经网络中,乘加操作(Multiply-Accumulate)是常见的计算模式,例如在卷积层和全连接层中。1次乘加操作通常被视为2次FLOPs。1 MFLOPS(百万次浮点运算)= 10⁶ FLOPs1 GFLOPS(十亿次浮点运算)= 10⁹ FLOPs。

2025-02-10 23:47:56 1473

原创 零基础都可以本地部署Deepseek R1

在 Chatbox 的设置中,选择使用本地模型,并将模型提供方设置为 Ollama API;对于大多数家用或工作站级别的电脑,运行 1.5b 至 7b 版本已基本满足体验需求,而更高参数的版本则适合服务器或高端工作站使用。:若需要使用模型,只需先启动 Ollama(通常在安装时会自动后台运行),然后通过命令行或图形界面调用模型。下载完成后,在同一命令行窗口中,你可以直接输入问题(例如输入“上海在哪”),若模型能够返回答案,则说明部署成功。标签,里边是思考推理的内容,比较简单的问题无需推理,所以这里为空。

2025-02-08 22:36:08 1491

原创 成本仅50美元,性能媲美Deepseek-R1,李飞飞带着S1来炸场了

李飞飞团队的 S1 模型展示了一种以极低成本实现高效推理的新路径,其核心在于利用强大的预训练基座、精挑细选的小样本数据集以及创新的测试时扩展技术(如预算强制)。这一方法不仅在实验中获得了与顶尖模型接近甚至超越的成绩,同时也为 AI 模型研发如何在成本与性能间取得平衡提供了有价值的参考。未来能否进一步推广这一方法,还需要在更大范围内验证其通用性和鲁棒性。

2025-02-08 15:01:13 1078

原创 LangChain快速加proxy代理

我们调用openai的api需要加proxy,在使用LangChain的时候同样需要。如上图所示是openai的源码,它设置了一个"OPENAI_API_BASE"。但是我感觉这种方案太麻烦了,所以去查了官方文档,它给了另一种方案。这样无需做任何其他的映射操作,只在代码里加上proxies即可。所以我之前看到的好多方案都是把自己的代理映射过去。

2024-01-21 11:59:49 2315

原创 Java函数式编程Lambda和Stream流

为什么要用函数式编程,函数式编程所用到的Lambda、Stream的原理是什么,本文做了详细介绍和实操流程

2022-08-19 14:53:01 322

原创 WebSocket和HTTP有什么不同

WebSocket和HTTP都是被用作Client-Server通信的通信协议。HTTP 协议HTTP是单向的,客户端发送请求,服务器发送响应。举个例子,当一个用户向服务器发送一个请求这个请求以HTTP或HTTPS的形式出现,在接收到一个请求服务器向客户端发送响应后,每个请求都与相应的响应相关联,在发送响应后,连接被关闭,每个HTTP或HTTPS请求每次都建立到服务器的新连接,在得到响应后,连接自动终止。HTTP是一种运行在TCP之上的无状态协议,TCP是一种面向连接的协议,它通过三向握手的方式保证数

2021-11-29 23:30:11 2326

原创 使用 Json 时出现奇怪的“nameValuePairs”键

使用 Gson 时出现奇怪的“nameValuePairs”键解决nameValuePairs问题原因解决方案JsonObject@Body结果总结解决nameValuePairs问题在使用RPC进行传值时,常规的使用了json进行传输。但是当接收端接收后进行解析时格式出现很大问题,多了一层key----nameValueParis。{ "command": "report", "content": { "status": "success", "res

2021-08-11 22:25:38 3980

原创 Flutter2.0+Dart系列(一)简介及安装

Flutter2.0+Dart系列(一)简介及安装欢迎来到Flutter2.0系列Flutter简介新的改变安装构建第一个Flutter app欢迎来到Flutter2.0系列你好! 在这个系列我将和大家一起学习讨论Google今年3月份新发布的Flutter2.0系列,以及和它对应的开发语言Dart。欢迎大家讨论交流,如果有什么我说错的地方,也欢迎大家指出,但希望维护一个和谐的讨论环境,谢谢~Flutter简介Flutter 是 Google 开源的 UI 工具包,帮助开发者通过一套代码库高效构建

2021-04-21 00:29:03 614

原创 MBP安装VMware Fusion虚拟机安装Windows10系统

MBP安装VMware虚拟机安装Windows10系统第一步安装VMware第二步下载镜像第三步安装镜像新系统遇到的黑屏和无法设置辅助功能的解决办法第一步安装VMware有很多种渠道可以下载安装,比如官网 https://www.vmware.com/cn.html或者第三方 https://www.newasp.net/soft/462096.html然后按照步骤下载第二步下载镜...

2020-04-08 23:46:34 1188

原创 Centos7配置JDK

下载jdk压缩文件将jdk-8u191-linux-x64.tar.gz文件 移动到/usr/local/解压缩,将目录jdk-8u191-linux-x64改为java编辑文件  vim /etc/profile在文件最下方增加export JAVA_HOME=/usr/local/javaexport JRE_HOME=$JAVA_HOME/jreexport CLA...

2019-01-08 11:10:31 198

原创 MySQL将主键id改为自增

alter table 表名 change id id int AUTO_INCREMENT注:id必须为主键时才可以这样使用

2019-01-07 14:28:23 17266 7

原创 基于Docker的Gitlab安装及常见问题

Docker安装查看内核uname -r安装必要的一些系统工具sudo yum install -y yum-utils device-mapper-persistent-data lvm2添加软件源信息sudo yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-...

2018-11-23 10:47:46 1661 1

原创 Linux中系统时钟与硬件时钟

使用linux的过程中,可能遇到系统时候和硬件时钟不一致。查看系统时间#date查看硬件时间#hwclock --show如果调整硬件时钟。不用重启机器,在linux系统中就能完成。# hwclock --set --date="4/28/05 11:10:05"(月/日/年 时:分:秒)# clock --set --date="07/07/06 10:19" (月/...

2018-11-13 09:21:02 1033

原创 Spring Boot的通用返回类Result

先构建一个格式确定下来的Result类public class Result<T> { private Integer code; private String msg; private T data; public Result() { super(); } public Result(Integer code...

2018-08-11 16:11:25 32246 9

原创 多文件上传

我文件上传返回的类型是通用返回类Result,也可以把它改成String,然后就可以写成return "上传成功/失败"我在另外一个博客里写了怎么构建通用返回类,地址:https://blog.youkuaiyun.com/StillTogether/article/details/81587627@ApiOperation(value = "多文件上传")@RequestMapping(va...

2018-08-11 15:54:15 420

原创 delete、drop、truncat的用法区别

delete、drop、truncat的用法区别先清楚几个概念:DDL、DML和DCLDDL:数据定义语言(Data Definition Language),对所有对象(例如database,table)进行定义和管理例如:create\alter\drop\truncate\create\dropDML:数据操作语言(Data Manipulation Language),对数...

2018-08-03 17:14:17 657

原创 谷歌浏览器上传附件失败的问题

附件上传时,火狐等浏览器可以成功上传,但是谷歌浏览器存在上传失败的情况。目前发现的问题,59版本以上,67版本以下存在可以上传docx,但是不可以上传doc;xls可以上传,但是xlsx不可以上传的情况。目前可以知道的是67版本支持doc和docx上传附一个简单的附件上传代码public class FileUtil { public static void test (byte[] fi...

2018-07-05 17:12:04 18051

原创 C3P0与QueryRunner的结合使用

依赖包         c3p0-0.9.1.2.jar        commons-dbutils-1.6.jar        mysql-connector-java-5.1.12-bin.jarC3P0的配置文件c3p0-config.xml<c3p0-config> <!-- c3p0默认配置,下面还可以配置多个数据库 --> <...

2018-07-02 10:30:06 1163

原创 git在不删除项目的基础上,想删除远程仓库多余的文件

在不删除项目的基础上,想删除远程仓库多余的文件可以先将本地多余文件删除后git commit -a -m .git push

2018-06-28 18:54:19 198

原创 Swagger使用及常见问题

Spring Boot中使用在pom.xml中注入依赖<dependency> <groupId>io.springfox</groupId> <artifactId>springfox-swagger-ui</artifactId> <version>2.7.0</version></depende

2018-06-26 14:08:23 515

甲子光年智库报告:2025DeepSeek开启AI算法变革元年

内容概要:本文由甲子光年智库发布,探讨了人工智能发展的拐点以及DeepSeek作为AI技术变革标志性产品的现状和前景。文中指出,人工智能的发展经历了从技术驱动到需求驱动的战略转变,正处于第三阶段向第四阶段过渡时期。DeepSeek通过对算力的极致优化,不仅展示了性价比极高的训练路径,还引领了算力效率的新拐点。2025年起发布的AI模型逐渐减少参数量,以支持更多场景下的高效部署,特别是移动终端和边缘计算领域。与此同时,以深度强化学习为核心的R1训练框架与非Transformer架构下的液态神经网络模型(LFM)共同开启了新一轮算法革新浪潮。 适用人群:对AI发展趋势感兴趣的行业从业者和技术爱好者。 使用场景及目标:用于了解AI技术的当前瓶颈与发展方向,把握算法创新、算力优化等方面的具体进展。适用于投资者研判行业趋势、技术人员跟进最新研究成果。 其他说明:文章详细阐述了DeepSeek的产品特点与市场反响,以及在全球AI治理框架下各国政府的态度变化。值得注意的是,DeepSeek的性价比优势促进了普惠AI的发展,使更多的中小企业和个人开发者获得了参与高水平AI项目的可能性。此外,文章还提及了美国政府内部关于AI政策的变化情况,揭示了中美两国在未来科技竞争格局下的潜在博弈态势。

2025-02-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除