自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

fertiland的专栏

持经达变

  • 博客(104)
  • 资源 (3)
  • 收藏
  • 关注

原创 深入浅出DeepSeek V3 技术报告

DeepSeek-V3 就像一个“会省钱的最强学霸”,在多个领域都有亮眼表现。它的创新点: ✅ 高效的。

2025-02-07 11:09:21 930

原创 深入浅出 DeepSeek V2 高效的MoE语言模型

首先,大家知道 GPT 和 BERT 是怎么工作的吧?它们每次都让所有的神经元都参与运算(简而言之,每个神经元都跑全程只让其中一部分专家参与工作,其他专家休息。你可以想象,MoE 就像是一场足球比赛,不是全员上场,而是根据不同的任务让最合适的球员上场。在训练过程中,模型根据输入数据的特性,选择几个“专家”来进行计算,这样大大提高了效率。🎯MoE 模型就像是挑选最合适的专家来处理任务,而不是让每个人都参与。优化了 MoE,使其在处理大规模数据时不仅更高效,而且还能大幅提升模型性能。应用场景。

2025-02-06 23:14:28 940

原创 深入浅出DeepSeek LLM 以长远主义拓展开源语言模型

大家想象一下,你在游戏里要打造一个超级英雄角色,选择最强的装备、技能点和升级策略。那么,DeepSeek LLM 就是 AI 界的“超级英雄养成计划”!成为更强、更聪明、更实用的 AI,帮助人类处理各种任务,比如编程、数学、推理等。(7B 指 70 亿参数,比较精炼,像 AI 界的“精英特种兵”)(67B 指 670 亿参数,更强大,像“超级AI战士”)DeepSeek 67B 在多个领域,如代码、数学和推理能力上,甚至比 LLaMA-2 70B 和 GPT-3.5 还强!🎯。

2025-02-06 21:07:37 570

原创 深入浅出 DeepSeek-Coder-V2 是如何打破闭源模型封锁的

大家好!今天我们来聊聊 DeepSeek-Coder-V2 是如何打破闭源模型封锁的! 🚀在 AI 编程助手领域,GPT-4 Turbo、Claude 3、Gemini 1.5 Pro 这样的闭源模型一直占据主导地位,开源模型很难与之匹敌。但 DeepSeek-Coder-V2 作为最新的开源代码大模型,不仅迎头赶上,甚至在某些指标上超越了这些闭源 AI!它到底是如何做到的呢?今天,我们就从 模型架构、训练数据、强化学习优化 三个方面,一步步讲解 DeepSeek-Coder-V2 如何打破封锁。

2025-02-06 17:35:56 857

原创 深入浅出 DeepSeek-R1 如何用强化学习提升 LLM 的推理能力

在 RL 训练过程中,研究人员发现 DeepSeek-R1-Zero 逐渐学会了一些。研究人员观察到 DeepSeek-R1-Zero 训练到一半时,突然出现了一个。DeepSeek-R1 的研究团队正是采用了这种方法。DeepSeek-R1 通过强化学习提升 LLM 的推理能力,主要通过。可以高效地优化 AI 的策略,让它在强化学习过程中迅速提升推理能力。DeepSeek-R1-Zero 是一个**“从零开始”为了改善 DeepSeek-R1-Zero 的。DeepSeek-R1 采用的。

2025-02-06 16:45:19 682

原创 深入浅出DeepSeek-V3 的实现原理

这是目前最强大的开源 Mixture-of-Experts (MoE) 模型之一。它在数学、编程等推理任务上达到了接近 GPT-4o 的水平,同时优化了训练效率,降低了成本。随着大语言模型(LLM)的发展,模型变得越来越庞大,计算成本也急剧上升。DeepSeek-V3 在训练过程中,采用了一系列优化策略,使其既高效又强大。为了让 DeepSeek-V3 在实际应用中更快、更稳定,团队优化了推理架构。DeepSeek-V3 在多个基准测试上表现优异,接近 GPT-4o。大家好,今天我们要学习的是。

2025-02-06 14:12:58 548

原创 深入浅出DeepSeek-R1

它是一种通过强化学习 (Reinforcement Learning, RL) 提高大模型推理能力的前沿方法。我们将从基础概念入手,一步步剖析其核心思想、技术方法以及它如何让 AI 变得更聪明!强化学习类似“训练一只狗”:如果狗做对了,就给奖励(奖励值越高,代表越接近目标);做错了,就不给奖励。首先,我们不让 AI 先学人类数据,而是直接用强化学习(RL)训练它,让它自己想办法解决问题。大型 AI 模型虽然强大,但训练成本高。,即通过人类标注数据进行训练。通过这种方式,团队推出了。

2025-02-06 14:07:50 574

原创 streamlit app demo

【代码】streamlit app demo。

2024-11-09 08:35:13 180 1

原创 用一个具体例子说明什么是提示词工程师

您好,欢迎来到面试!我是今天的面试官,非常高兴能和您进行这次交流。为了确保整个面试流程的顺利进行,我们会按照既定的环节来推进面试。首先,我想了解一下您的意向岗位是什么呢?您说:基于大模型的应用系统开发ChatGPT 说:ChatGPT好的,我已经记录了您的意向岗位是“基于大模型的应用系统开发”。接下来,您更希望由技术主管还是经理来进行这次面试呢?您说:技术主管来面试ChatGPT 说:ChatGPT明白了,您希望由技术主管来进行面试。我会按照您的意愿进行安排。

2024-08-21 15:43:00 753

原创 基于本地大模型的应用系统设计

最近从本地运行大模型中,深刻折服于本地运行大模型的种种魅力,或许GPU的开销会让你止步,但某一些应用场景,比如知识库系统或文本集中的相关任务,用cpu也可以玩起来。学习大模型, 跟人类学习使用电话,甚至电灯一类一样,门槛其实没有那么高,大模型也并不像各大培训课程,或排满数学公式的的书籍,以及试图介绍深层神经网络的科普知识等讲得那么玄乎其技。

2024-08-11 12:21:18 471

原创 云原生k8s的金箍棒

如果云原生是我们喜欢的《西游记》中孙悟空,那Autoscaling就是云原生手中的金箍棒。想象一下,没有金箍棒的孙悟空,还能到处降妖伏魔么?还能成为斗战圣佛吗?

2022-12-03 10:23:29 607

原创 云原生k8s的前世今生--Docker

没有梦想的运维和开发,人生函数不可能有诗和远方返回,只有无穷无尽的加班和根因分析(RCA)。 软件的不可修改性和幂等性就成为运维人员一直追求的梦想。Docker容器技术毫无疑问是支撑这个梦想的中流砥柱。

2022-11-26 13:25:55 1218

原创 云原生k8s的声明式哲学

把k8s看作一篇优秀的作品,我们得先领会其中心思想。如此,方可不至于,花了时间,看了热闹,而不得其神韵。 声明式的设计哲学就是k8s的中心思想。k8s是声明式的,你只需关注(what)应该发生什么,而不需要担心(how)怎样发生。what永远比how高一个层级,可惜我们常常迷失在how的浩瀚大海里......

2022-11-14 00:09:16 639

原创 云原生k8s的盘古开天辟地

云计算把原来看上去隔离的孤岛算力和存储,通过高速低延时网络把联合起来,做到了,灵活调度资源,按需分配,严控使用,降低成本。支付宝的金融风险,换做云计算就是一个富有想象空间的算力。各种体格的应用从单体拥抱了微服务,庞大的app, 复杂的架构,前端,负载均衡,网关,业务应用,公共服务,数据存储,各种缓存机制,消息队列,分布式对象存储,异地多活,高可用,高可靠,历史遗留,新旧语言更替,等等。个人用户服务无论是网络带宽,延时,时长等,都过了快速成长阶段,进入相对稳定,甚至某一些方面,舆论和政策都处于一种高压状态。

2022-11-06 22:00:18 1862 5

转载 Diameter Protocol 整理

https://www.cnblogs.com/stevensfollower/p/5556443.html

2021-04-08 14:14:32 316

原创 定期整理收藏夹

web化已经是所有应用的必然趋势,信息的快捷入口便是收藏夹。定期整理收藏夹,可以提高日常的工作效率。潜在的智能管理,也是浏览器值得投入的功能。为什么要定期管理?1. 日常工作比较忙,没有时间根据功能进行结构化的分组。2. 定期执行整理计划,是因为人容易犯拖延症,只有定期计划可以确保重要且有意义的事情得到保障。程序员的收藏夹怎样的分类比较合适?符合日常的开发流

2017-02-02 17:19:57 553

转载 Linux下Mysql的配置管理

Linux下Mysql的配置安装rmp -ivh MySQL-server-4.1.22-0.glibc23.i386.rpm --nodepsrmp -ivh MySQL-client-4.1.22-0.glibc23.i386.rpm --nodeps查看是否安装成功netstat -atln 命令看到3306端口开放说明安装成功登录mysql

2013-11-27 12:16:31 684

转载 expect自动化测试脚本

TCL/EXPECT自动化测试脚本实例一 --- telnet到目标机器  2011-02-21 16:41:01| 分类:脚本编程 |  标签:脚本编程   |字号大中小订阅这是一个简单的TCL/EXPECT脚本,完成telnet到远程设备的功能。通过这个例子,大家可以看到使用TCL/EXPECT脚本构造测试程序,是非常简洁的。   从今天开始,陆续把我所写的一些

2013-09-13 08:27:27 1292

转载 TCP异常终止

http://www.vants.org/?post=22comment:通信系统设计时,信令一般都走tcp连接或sctp连接。由于网络拥塞时,tcp连接异常终止,会导致会话建立的失败。怎样保证这条链路的健壮性呢? 作者:易隐者 发布于:2012-4-25 21:42 Wednesday 分类:我的书稿TCP异常终止(reset报文)TCP的异常终止是相对于正常释放

2013-08-24 08:29:37 1081

转载 TCP演进简述

TCP演进简述http://www.cnblogs.com/fll/一、互联网概述TCP,即传输控制协议,是目前网络上使用的最多的传输协议,我们知道,整个互联网的体系结构是以IP协议提供的无连接的端到端的报文传输服务为基础,在这种体系结构下,那么端到端的数据传输需要自己来保证数据的可靠性,TCP所作的就是这样的工作,它提供了端到端的数据可靠性的传输,当然,在互联网上没有100%的可靠性

2013-08-04 13:33:48 3211

转载 Install MongoDB on FC6

http://docs.mongodb.org/manual/tutorial/install-mongodb-on-red-hat-centos-or-fedora-linux/install MongoDB1. configure package management system(YUM)Create a /etc/yum.repos.d/10gen.

2013-06-20 00:34:42 1199

转载 Linux入门小结

********************************author:ayazero               **mail:drdos@163.com           **homepage:overflow.nease.net  **team:www.ph4nt0m.net         ********************************

2013-05-12 19:01:23 784

原创 项目经验小结

项目内容:        日志相关,为系统提供周期性的日志功能,从系统功能状态角度为评估性能和分析问题提供辅助功能。包括两部分:日志框架和功能日志。项目目的:        传统的日志,记录的是系统消息流,控制流或数据流方面的信息,尤其关注出错状态。从而为我们分析问题提供现场,得以知道问题发生的前因后果。分析日志之后,可以知道整个故事的情节:时间、地点、事件等等。

2012-10-05 13:05:03 610

转载 对称多处理系统

SMP(Symmetrical Multi-Processing)简介  平时所说的双CPU系统,实际上是对称多处理机系统中最常见的一种,通常称为2路对称多处理,它在普通  AMD Athlon 64 X2的商业、家庭应用之中并没有太多实际用途,但在专业制作,如3DMaxStudio、Photoshop等软件应用中获得了非常良好的性能表现,是组建廉价工作站的良好伙伴。随

2012-07-14 12:50:25 1906

原创 自动化测试感悟(1)

自动化测试推动自动化测试,过去很多来源那些不断重复的工作,基本可以用脚本来替代。于是,人们写了很多脚本。优点:脚本开发周期短,使用方便,缺点:学习曲线陡峭,尽管脚本并不复杂,但由于其解释的特性,掌握 并能灵活运用,通常要花费较大的开销。 为什么自动化测试从2000年左右提出,历经10铅华,仍然没有普遍地推广开来,相对而言在规模小的公司,自动化测试运用更多,在大一

2012-06-11 23:19:45 636

转载 reentrant函数与thread safe函数浅析

reentrant函数与thread safe函数浅析http://www.chinaunix.net 作者:ypxing 发表于:2008-02-23 19:46:50记得以前讨论过一个关于reentrant函数与thread safe函

2011-08-07 17:25:09 1968

转载 VxWorks FAQ 中文版

前言(Surface):随着国内使用VxWorks的用户越来越多,为了方便VxWorkers少走一些弯路,特别推出了中文FAQ,其中很多的FAQ来自comp.os.vxworks和原创。(很多FAQ都可以在该新闻组找到英文版)文档的FAQ总共分为7大类:1.入门F

2011-08-07 16:57:59 13396

转载 VxWorks下的任务监控方法及应用

VxWorks下的任务监控方法及应用1 VxWorks交叉开发模式在VxWorks下应用软件开发时采用交叉开发模式,宿主机通常是普通的PC机,目标机就是应用程序真实的 运行的硬件平台;集成开发环境Tornado位于宿主机,用户通过Tornado开发环境

2011-08-07 16:50:46 2046

转载 C++预处理指令

C++预处理指令 http://blog.youkuaiyun.com/codewarrior/archive/2006/05/29/760690.aspx#include#define#undef#pragma#import#erro

2011-08-07 16:46:56 664

转载 Reentrant Functions可重入函数

10.6 Reentrant Functions可重入函数(翻译by linxuleio)   当一个进程捕捉到信号,进程执行的正常指令流程被signal handler(自定义的信号处理函数)临时打断。这时进程转而执行signal handler里的指令。当sign

2011-08-07 16:27:24 1675 2

转载 Vxworks信号量分析(zz)

Vxworks信号量分析(zz)2010-01-27 16:38Wind内核中有二进制信号量、计数信号量和互斥信号量三种类型,为了使应用程序具有可移植性,还提供了POSIX(可移植操作系统接口)信号量。在Vxorks操作系统中,信号量是实现任务同步

2011-08-07 16:09:43 1669

转载 vxworks信号量与任务的一个例子

vxworks信号量与任务的一个例子!2010-01-27 17:12例子一:这个例子中,两个任务(taskOne 和 taskTwo)竞争修改一个全局变量 global 的值,任务 taskOne 将 Global修改为1,而任务taskTwo 则将

2011-08-07 14:59:53 2143 1

转载 R4网络中的新技术

R4网络中的新技术(2010-10-29 08:13:14)转载标签:通信技术 1.多种承载方式  基于软交换的承载和控制分离的思想,在R4的网络中应能支持多种承载方式。在Nb接口,承载可以是IP或ATM,而在Nc接口采用的BICC协议,能够完全独立于用户面的承载方式,进行呼叫控制。  欧洲和韩国的运营商会采用ATM作为承载的网络,但考虑到中国的电信网络运营的实际情况,以及未来实现向R5的平滑过渡的目的,NOKIA核心网产品,要求面向中国市场的R4系统其Nb接口应该支持IP承载。2.TrFO/TFO功能  

2011-01-30 11:11:00 1096

转载 第三代移动通信技术R4简介

第三代移动通信技术R4简介(2010-10-29 14:10:50)转载标签:通信技术 <br /> <br />第三代移动通信系统包含以下部分<br />·无线接入系统RAN<br />·核心网络系统CN,包括电路域或分组域<br />·运维和服务管理系统OSS<br />·3G业务平台<br />·专业客户服务<br />·3G终端<br /> <br />R4系统是完全着眼于未来的解决方案:实现了用户面与控制面的分离;充分利用IP骨干网作为所有业务的承载。由于系统已经初步具备了未来网络的架构,因此运营

2011-01-30 11:03:00 2035

原创 书评:《人人都是产品经理》

    学习人人都是产品经理,一个重要的观点,当今是产品的时代,以后是服务的时代。产品经理最早起源于P&G产品经理的职责范围,负责整个产品的整个生命周期,是一个需要有很强整体观念的角色。除了项目管理外,对界面设计和用户体验等,特别用户需求上的理解比其他的职能角色更强。产品经理,有可能来自应届毕业生,也可能来自项目经理,或者技术人员,销售人员,表明这个角色的对专业需要不是那么紧。商业嗅觉

2010-04-18 00:10:00 862

原创 转:无线通信原理通俗解读

第一篇——无线基础及电磁波第二篇——时分复用和频分复用第三篇——GSM系统组成第四篇——空中接口之“BCH”信道第五篇——位置区及位置更新第六篇:跳频——蹦蹦跳跳频率就够了?第七篇:分集技术之交织——也论当校长的艺术第八篇:时间提前量(TA值)第九篇:设计一个简单的SIM卡 1.gif (227.51 KB)2009-5-17 00:00 2.gif (147.1 KB)

2010-01-30 13:43:00 3159 1

原创 Unix

 It has been said that Unix is not an operating system as much as it is a way of thinking. •In The UNIX Programming Environment, Kernighan and Pike write that at the heart of the Unix philosop

2009-12-29 23:27:00 498

转载 虚拟局域网

 http://hi.baidu.com/caronation/blog/item/522e26f7763e862b720eece7.html虚拟局域网目录[隐藏]【VLAN的目的】 【VLAN的优点】 【什么是VLAN】 【组建VLAN的条件】 【VLAN的划分】 【VLAN的标准】 【划分VLAN的基本策略】 【VLAN技术简单谈】 【VLAN的定义及特点】 【VLAN的分类】

2009-11-23 21:40:00 1821

转载 GSM GPRS WCDMA

 1.        GSM和GPRSGSM(Global System for Mobile Communications)。GSM网络以7号信令为互联标准,与PSTN、ISDN等公用电信网有完备的互联互通能力。使用用户识别模块SIM(Subscriber Identify Module)卡存储注册用户的身份特征等信息。当网络在MoU基础上达成某些协议后,可以漫游。GSM系统分为

2009-11-23 21:27:00 1396

转载 GGSN - SCP 业务控制点

 scp 业务控制点scp Service Control Point业务控制点业务控制点是决定呼叫如何处理的智能网要素,它利用TCAP协议提供传输和必要的(低级)应用程序指示。对SCP的性能要求会随着应用的不同有相当大的变化,有些SCP系统会有很大的规模,比如主运营商的800号转换数据库。有些会很小,并且使用在非常专业的应用,比如,在一个分布式

2009-11-23 21:16:00 2333

用于股票预测的机器学习

用于股票预测的机器学习,介绍了机器学习是怎样用于股票预测的

2014-10-14

交易平台API

综合交易平台API技术开发指南, 介绍了主要接口的参数和部分例子

2014-10-14

模拟退火

模拟退火

2007-06-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除