- 博客(21)
- 收藏
- 关注
原创 梁文峰署名的NSA 与 Kimi杨植麟署名的MoBA撞车,新注意力架构比拼
共同目标:降低注意力计算复杂度,支持长上下文建模,同时保持模型性能。差异路径NSA强调细粒度动态选择和硬件优化,适合通用长任务的高效训练与推理。MoBA侧重块级路由和混合训练策略,更适合超长序列(如百万 token)的场景。互补性:NSA 的细粒度选择可增强局部精度,而 MoBA 的块路由更适合极端长度的高效扩展。两者均可作为 Transformer 架构的改进方向。
2025-02-20 22:59:51
928
原创 都说Deepseek省算力,算力到底应该如何计算?
指每秒浮点运算次数,是衡量硬件性能的指标,表示计算设备每秒能够完成的浮点运算次数。指浮点运算次数,用于描述模型推理过程中需要的计算量,即模型的复杂度。MACs(乘加累积操作数):指模型中乘法和加法操作的总次数。在神经网络中,乘加操作(Multiply-Accumulate)是常见的计算模式,例如在卷积层和全连接层中。1次乘加操作通常被视为2次FLOPs。1 MFLOPS(百万次浮点运算)= 10⁶ FLOPs1 GFLOPS(十亿次浮点运算)= 10⁹ FLOPs。
2025-02-10 23:47:56
1473
原创 零基础都可以本地部署Deepseek R1
在 Chatbox 的设置中,选择使用本地模型,并将模型提供方设置为 Ollama API;对于大多数家用或工作站级别的电脑,运行 1.5b 至 7b 版本已基本满足体验需求,而更高参数的版本则适合服务器或高端工作站使用。:若需要使用模型,只需先启动 Ollama(通常在安装时会自动后台运行),然后通过命令行或图形界面调用模型。下载完成后,在同一命令行窗口中,你可以直接输入问题(例如输入“上海在哪”),若模型能够返回答案,则说明部署成功。标签,里边是思考推理的内容,比较简单的问题无需推理,所以这里为空。
2025-02-08 22:36:08
1491
原创 成本仅50美元,性能媲美Deepseek-R1,李飞飞带着S1来炸场了
李飞飞团队的 S1 模型展示了一种以极低成本实现高效推理的新路径,其核心在于利用强大的预训练基座、精挑细选的小样本数据集以及创新的测试时扩展技术(如预算强制)。这一方法不仅在实验中获得了与顶尖模型接近甚至超越的成绩,同时也为 AI 模型研发如何在成本与性能间取得平衡提供了有价值的参考。未来能否进一步推广这一方法,还需要在更大范围内验证其通用性和鲁棒性。
2025-02-08 15:01:13
1078
原创 LangChain快速加proxy代理
我们调用openai的api需要加proxy,在使用LangChain的时候同样需要。如上图所示是openai的源码,它设置了一个"OPENAI_API_BASE"。但是我感觉这种方案太麻烦了,所以去查了官方文档,它给了另一种方案。这样无需做任何其他的映射操作,只在代码里加上proxies即可。所以我之前看到的好多方案都是把自己的代理映射过去。
2024-01-21 11:59:49
2315
原创 Java函数式编程Lambda和Stream流
为什么要用函数式编程,函数式编程所用到的Lambda、Stream的原理是什么,本文做了详细介绍和实操流程
2022-08-19 14:53:01
322
原创 WebSocket和HTTP有什么不同
WebSocket和HTTP都是被用作Client-Server通信的通信协议。HTTP 协议HTTP是单向的,客户端发送请求,服务器发送响应。举个例子,当一个用户向服务器发送一个请求这个请求以HTTP或HTTPS的形式出现,在接收到一个请求服务器向客户端发送响应后,每个请求都与相应的响应相关联,在发送响应后,连接被关闭,每个HTTP或HTTPS请求每次都建立到服务器的新连接,在得到响应后,连接自动终止。HTTP是一种运行在TCP之上的无状态协议,TCP是一种面向连接的协议,它通过三向握手的方式保证数
2021-11-29 23:30:11
2326
原创 使用 Json 时出现奇怪的“nameValuePairs”键
使用 Gson 时出现奇怪的“nameValuePairs”键解决nameValuePairs问题原因解决方案JsonObject@Body结果总结解决nameValuePairs问题在使用RPC进行传值时,常规的使用了json进行传输。但是当接收端接收后进行解析时格式出现很大问题,多了一层key----nameValueParis。{ "command": "report", "content": { "status": "success", "res
2021-08-11 22:25:38
3980
原创 Flutter2.0+Dart系列(一)简介及安装
Flutter2.0+Dart系列(一)简介及安装欢迎来到Flutter2.0系列Flutter简介新的改变安装构建第一个Flutter app欢迎来到Flutter2.0系列你好! 在这个系列我将和大家一起学习讨论Google今年3月份新发布的Flutter2.0系列,以及和它对应的开发语言Dart。欢迎大家讨论交流,如果有什么我说错的地方,也欢迎大家指出,但希望维护一个和谐的讨论环境,谢谢~Flutter简介Flutter 是 Google 开源的 UI 工具包,帮助开发者通过一套代码库高效构建
2021-04-21 00:29:03
614
原创 MBP安装VMware Fusion虚拟机安装Windows10系统
MBP安装VMware虚拟机安装Windows10系统第一步安装VMware第二步下载镜像第三步安装镜像新系统遇到的黑屏和无法设置辅助功能的解决办法第一步安装VMware有很多种渠道可以下载安装,比如官网 https://www.vmware.com/cn.html或者第三方 https://www.newasp.net/soft/462096.html然后按照步骤下载第二步下载镜...
2020-04-08 23:46:34
1188
原创 Centos7配置JDK
下载jdk压缩文件将jdk-8u191-linux-x64.tar.gz文件 移动到/usr/local/解压缩,将目录jdk-8u191-linux-x64改为java编辑文件 vim /etc/profile在文件最下方增加export JAVA_HOME=/usr/local/javaexport JRE_HOME=$JAVA_HOME/jreexport CLA...
2019-01-08 11:10:31
198
原创 MySQL将主键id改为自增
alter table 表名 change id id int AUTO_INCREMENT注:id必须为主键时才可以这样使用
2019-01-07 14:28:23
17266
7
原创 基于Docker的Gitlab安装及常见问题
Docker安装查看内核uname -r安装必要的一些系统工具sudo yum install -y yum-utils device-mapper-persistent-data lvm2添加软件源信息sudo yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-...
2018-11-23 10:47:46
1661
1
原创 Linux中系统时钟与硬件时钟
使用linux的过程中,可能遇到系统时候和硬件时钟不一致。查看系统时间#date查看硬件时间#hwclock --show如果调整硬件时钟。不用重启机器,在linux系统中就能完成。# hwclock --set --date="4/28/05 11:10:05"(月/日/年 时:分:秒)# clock --set --date="07/07/06 10:19" (月/...
2018-11-13 09:21:02
1033
原创 Spring Boot的通用返回类Result
先构建一个格式确定下来的Result类public class Result<T> { private Integer code; private String msg; private T data; public Result() { super(); } public Result(Integer code...
2018-08-11 16:11:25
32246
9
原创 多文件上传
我文件上传返回的类型是通用返回类Result,也可以把它改成String,然后就可以写成return "上传成功/失败"我在另外一个博客里写了怎么构建通用返回类,地址:https://blog.youkuaiyun.com/StillTogether/article/details/81587627@ApiOperation(value = "多文件上传")@RequestMapping(va...
2018-08-11 15:54:15
420
原创 delete、drop、truncat的用法区别
delete、drop、truncat的用法区别先清楚几个概念:DDL、DML和DCLDDL:数据定义语言(Data Definition Language),对所有对象(例如database,table)进行定义和管理例如:create\alter\drop\truncate\create\dropDML:数据操作语言(Data Manipulation Language),对数...
2018-08-03 17:14:17
657
原创 谷歌浏览器上传附件失败的问题
附件上传时,火狐等浏览器可以成功上传,但是谷歌浏览器存在上传失败的情况。目前发现的问题,59版本以上,67版本以下存在可以上传docx,但是不可以上传doc;xls可以上传,但是xlsx不可以上传的情况。目前可以知道的是67版本支持doc和docx上传附一个简单的附件上传代码public class FileUtil { public static void test (byte[] fi...
2018-07-05 17:12:04
18051
原创 C3P0与QueryRunner的结合使用
依赖包 c3p0-0.9.1.2.jar commons-dbutils-1.6.jar mysql-connector-java-5.1.12-bin.jarC3P0的配置文件c3p0-config.xml<c3p0-config> <!-- c3p0默认配置,下面还可以配置多个数据库 --> <...
2018-07-02 10:30:06
1163
原创 git在不删除项目的基础上,想删除远程仓库多余的文件
在不删除项目的基础上,想删除远程仓库多余的文件可以先将本地多余文件删除后git commit -a -m .git push
2018-06-28 18:54:19
198
原创 Swagger使用及常见问题
Spring Boot中使用在pom.xml中注入依赖<dependency> <groupId>io.springfox</groupId> <artifactId>springfox-swagger-ui</artifactId> <version>2.7.0</version></depende
2018-06-26 14:08:23
515
甲子光年智库报告:2025DeepSeek开启AI算法变革元年
2025-02-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人