自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

WindWant

工程师,社评家,观察者

  • 博客(278)
  • 资源 (1)
  • 收藏
  • 关注

原创 人工智能之强化学习【Q-Learning】

Q学习作为强化学习的经典算法,具有理论保证强、实现简单等优点,但其局限性(如维度灾难)促使了DQN、双Q学习等改进方法的发展。未来,Q学习可能结合多智能体系统、元学习等技术,在更复杂场景中发挥作用。

2025-04-02 00:09:13 953

原创 多模态联合理解:让机器像人类一样感知世界

多模态联合理解正推动人工智能从"单感官"走向"全感官"时代。随着技术的不断突破,我们正在创建能够真正理解复杂世界、具备常识推理能力的AI系统。这条探索之路不仅将重塑人机交互方式,更将为医疗、教育、制造等领域带来革命性变革。

2025-03-25 00:46:39 599

原创 人工智能之知识图谱:从数据到智能的桥梁

知识图谱是一种语义网络,用图结构表示知识。实体(Entity):表示现实世界中的对象,如“北京”、“爱因斯坦”。属性(Attribute):描述实体的特征,如“北京的人口”、“爱因斯坦的出生日期”。关系(Relation):表示实体之间的关联,如“北京是中国的首都”、“爱因斯坦提出了相对论”。头实体关系尾实体(头实体,关系,尾实体)头实体关系尾实体例如:(北京, 是, 中国的首都)(爱因斯坦, 提出, 相对论)知识图谱技术通过结构化的知识表示和推理,为人工智能提供了强大的知识支持。

2025-03-18 10:28:33 951

原创 Transformer-XL:突破长序列建模的瓶颈

Transformer-XL 通过片段级递归机制和相对位置编码,突破了标准 Transformer 在长序列建模中的瓶颈。它不仅提升了模型的长距离依赖捕捉能力,还显著提高了计算效率和内存利用率。Transformer-XL 的成功为 NLP 领域的长序列建模提供了新的思路,同时也为其他领域的序列建模任务(如时间序列分析、基因组学等)带来了启发。

2025-03-17 21:21:04 891

原创 卷积神经网络(CNN)之 EfficientNet

在深度学习领域,模型的计算效率与性能之间的平衡一直是一个核心挑战。随着卷积神经网络(CNN)在图像分类、目标检测等任务中取得显著成果,模型的复杂度和计算需求也急剧增加。2019年,Google Research 提出的 EfficientNet 通过创新的设计理念,重新定义了高效深度学习模型的范式。EfficientNet 不仅在 ImageNet 数据集上取得了最先进的性能,还大幅降低了计算成本和参数量。本文将从技术原理、架构创新、实际应用及未来发展方向四个维度,深入探讨 EfficientNet 的技术

2025-03-14 00:51:56 1049

原创 自然语言处理中的机器翻译技术:从规则到深度学习

机器翻译(Machine Translation, MT)是自然语言处理(NLP)领域的核心技术之一,旨在通过计算机自动将一种语言的文本转换为另一种语言。从早期的规则驱动到如今的深度学习,机器翻译经历了多次技术革命,极大地推动了全球化进程和人机交互的发展。:利用深度学习模型(如 RNN、LSTM、Transformer)实现端到端的翻译,直接学习源语言到目标语言的映射关系。:如 Zoom 会议的同声传译、Google 镜头(Google Lens)的即时图像翻译。

2025-03-12 10:00:00 869

原创 自然语言处理中的语音识别技术:从声波到语义的智能解码

语音识别(Automatic Speech Recognition, ASR)是自然语言处理(NLP)的关键分支,旨在将人类语音信号转化为可处理的文本信息。特征提取(MFCC)→ 2. 声学模型(HMM-GMM)→ 3. 语言模型(N-gram)→ 4. 解码输出。:联合语音、文本、图像的多模态预训练(如Microsoft i-Code)。Whisper(OpenAI):多任务训练(语音识别+翻译+语种检测)。解决方案:数据增强(添加背景噪声)、语音增强(SEGAN)。

2025-03-11 22:44:42 1190

原创 NLP文本分析之依存句法分析(理论及技术实践)

依存句法分析作为自然语言处理的基石技术,已从早期的规则驱动发展到如今的深度学习驱动。随着预训练模型与图神经网络的融合,其在多语言、多领域的适用性不断增强。未来,结合小样本学习与多模态理解,依存句法分析有望在更复杂的实际场景(如跨语言翻译、智能教育)中发挥关键作用。对于从业者而言,掌握其核心算法与工具链,将是构建高效NLP系统的必备技能。

2025-03-10 23:29:58 1202

原创 自然语言处理文本分析:从词袋模型到认知智能的进化之旅

清晨,当智能音箱准确识别出"播放周杰伦最新专辑"的模糊语音指令时;午间,企业舆情系统自动标记出十万条评论中的负面情绪;深夜,科研人员用GPT-4解析百万篇论文发现新材料线索——这些场景背后,是自然语言处理(NLP)文本分析技术构建的智能基石。本文将深入解析文本分析技术栈,揭示语言智能如何突破人类认知边界。

2025-03-10 09:30:00 1182

原创 循环神经网络(RNN):时序建模的核心引擎与演进之路

在人工智能处理序列数据的战场上,循环神经网络(RNN)如同一个能够理解时间的智者。从 2015 年谷歌神经机器翻译系统颠覆传统方法,到 2023 年 ChatGPT 实现对话连续性,这些突破都植根于 RNN 对时序建模的深刻理解。本文将深入解析 RNN 的技术原理、核心变体及现代演进,揭示其如何在时间维度上构建智能。

2025-03-09 22:54:49 1100

原创 深度学习之卷积神经网络(CNN)

卷积神经网络通过其独特的局部连接和权值共享机制,成为图像处理领域的核心工具。从LeNet到Transformer-CNN混合模型,其架构不断进化,应用场景也从简单的分类扩展到跨模态理解。未来,随着轻量化、自监督学习和可解释性技术的突破,CNN将继续推动人工智能在医疗、自动驾驶、工业检测等领域的落地。理解CNN的原理与实践,是深入计算机视觉领域的必经之路。fg。

2025-03-08 13:37:03 2154 1

原创 机器学习之强化学习

强化学习凭借其与人类学习模式的相似性(试错与反馈),已成为解决复杂决策问题的利器。尽管面临样本效率、泛化能力等挑战,随着算法创新与算力提升,其在医疗、教育、工业等领域的应用前景广阔。未来,强化学习也必将成为通用人工智能(AGI)的核心技术之一,推动机器真正理解并适应动态世界。

2025-03-07 14:18:28 853

原创 机器学习之无监督学习

无监督学习(Unsupervised Learning)是机器学习的一个重要分支,其特点是在训练过程中不使用标签数据。与有监督学习不同,无监督学习的目标是从未标记的数据中发现隐藏的结构、模式或关系。将数据划分为若干个组(簇),使得同一组内的数据点相似,而不同组之间的数据点差异较大。PCA 是一种线性降维方法,通过投影到方差最大的方向来保留数据的主要特征。将高维数据映射到低维空间,同时保留数据的主要特征。无监督学习的结果通常难以解释,尤其是在高维数据或复杂模型中。通过聚类和降维,发现数据中的潜在结构和模式。

2025-03-06 15:04:29 966

原创 机器学习之监督学习

来训练模型,使模型能够学习输入特征与输出标签之间的映射关系,从而对新的未见数据进行预测。监督学习广泛应用于分类、回归等任务。监督学习(Supervised Learning)是机器学习中最常见和广泛应用的分支之一。用于分类和回归任务,通过最大化间隔找到最优分离超平面。回归任务:均方误差(MSE)、平均绝对误差(MAE)。分类任务:准确率、精确率、召回率、F1 分数。解决方法:正则化、交叉验证、增加数据量。:用于序列数据(如文本、时间序列)。二分类:垃圾邮件分类(是/否)。多分类:手写数字识别(0-9)。

2025-03-05 22:16:12 1033

原创 神经网络为什么要用 ReLU 增加非线性?

非线性激活函数(如 ReLU、Sigmoid、Tanh)能够打破线性关系,使神经网络能够学习复杂的非线性模式。在 Sigmoid 或 Tanh 激活函数中,当输入值较大或较小时,梯度会趋近于零,导致梯度消失问题。ReLU 的计算非常简单,只需要比较和取最大值操作,计算速度远快于 Sigmoid 和 Tanh。ReLU 的梯度在正区间恒为 1,避免了梯度消失问题,使得深层网络的训练更加稳定。将 Leaky ReLU 的斜率 α 作为可学习参数,动态调整负区间的输出。其中 α 是一个小的正数(如 0.01)。

2025-03-05 10:53:25 2056

原创 神经网络:AI的网络神经

神经网络(Neural Networks)是深度学习的基础,是一种模仿生物神经系统结构和功能的计算模型。它由大量相互连接的节点(称为神经元)组成,能够通过学习数据中的模式来完成各种任务,如图像分类、语音识别、自然语言处理等。神经网络是深度学习的核心,具有强大的模式识别和特征提取能力。通过理解其基本原理和实现方法,开发者可以构建高效的深度学习模型,解决各种复杂问题。输出层的节点数取决于任务类型(如分类任务中的类别数)。隐藏层是神经网络的核心部分,负责提取数据的特征。输入数据通过神经网络,逐层计算输出。

2025-03-04 22:49:13 1695 2

原创 Transformer架构简略:DeepSeek 的底层基石

2017年,一篇名为《Attention is All You Need》的论文横空出世,提出了Transformer架构,彻底改变了自然语言处理(NLP)领域的格局。它不仅在各种NLP任务上取得了突破性进展,更成为了当今人工智能领域最具影响力的架构之一。

2025-03-03 10:50:05 551

原创 MOE技术:人工智能计算新范式

MOE技术详解:架构、原理与应用MOE(Mixture of Experts)技术是一种先进的机器学习架构,它通过整合多个专门化的子模型(专家)来处理复杂任务。本文将深入探讨MOE的技术细节,包括其核心架构、训练方法和实际应用。

2025-02-28 12:04:00 830

原创 MySql InnoDB 存储引擎表优化

适时的使用 OPTIMIZE TABLE 语句来重组表(表数据到达一定的量,或者有了较大的数据增长之后),压缩浪费的表空间。这是在其它优化技术不可用的情况下最直接的方法。OPTIMIZE TABLE 语句通过拷贝表数据并重建表索引,使得索引数据更加紧凑,减少空间碎片。语句的执行效果会因表的不同而不同。过大的表或者过大的索引及初次添加大量数据的情况下都会使得这一操作变慢。

2024-04-10 11:47:29 1226

原创 Spring Bean 的一生

就是这会儿,刚创建完实例,还没有进行相应的填充、初始化等后续操作。

2024-04-01 12:06:25 1059 1

原创 数据结构中的一棵树

遍历就是一个树的所有节点都点一遍,那么既然要点一遍,总归要遵循一个特定的顺序,不然,乱来的话总会可能漏一个,或者多一个。红黑树的黑高即为其根节点的黑高。从每个叶节点开始,一个节点一个节点往上数,数到根节点,最长的那个数就是数的高度。从根开始,一个节点一个节点往下数,数到每个叶子节点,最长的那个数就是数的深度。【前、中、后】,前为左,右为后,哪个顺序遍历,那么哪个节点就会顺序居中,其它的节点,靠左的居前。节点的巡查是从根节点出发,从上到下,从左至右巡查,每个节点及其子点巡查完毕后,再跳出到其它节点。

2024-01-12 17:32:48 1486

原创 云原生十二问

云原生是在云计算环境中构建、部署和管理现代应用程序的软件方法。现代企业希望构建高度可扩展、灵活且具有弹性的应用程序,可以快速更新以满足客户需求。为此,他们使用现代工具和技术,这些工具和技术本质上支持云基础设施上的应用程序开发。这些云原生技术支持快速、频繁地更改应用程序,而不会影响服务交付,从而为采用者提供了创新的竞争优势。云原生应用程序是由多个称为微服务的相互依赖的小型服务组成的软件程序。传统上,开发人员使用包含所有必需功能的单块结构构建整体式应用程序。

2024-01-02 12:37:18 970

原创 服务网格 Service Mesh

服务网格是一个软件层,用于处理应用程序中服务之间的所有通信。该层由容器化微服务组成。随着应用程序的扩展和微服务数量的增加,监控服务的性能变得越来越困难。为了管理服务之间的连接,服务网格提供了监控、记录、跟踪和流量控制等新功能。它独立于每项服务的代码,这使它能够跨网络边界和多个服务管理系统工作。Istio 是一个开源服务网格项目,设计为主要与 Kubernetes 配合使用。Kubernetes 是一款开源容器编排平台,用于大规模部署和管理容器化应用程序。

2023-12-27 10:27:27 1212

原创 架构中的“大象”

西方有句谚语叫做:“an elephant in the room”。用以指代那些显而易见又容易被忽视的东西。这些东西是什么呢?“an elephant”:我们可以解释为那些重要的,困难的或者棘手的。这里我们要讨论的则是架构中的"大象":业务价值。通常我们做架构评估的时候,一般会对关联系统的性能,容错弹性,业务扩展性等进行论证,但很少会考虑各个系统的业务价值以及这些业务价值和前述架构特性之间的关系。没有这些价值关联的理解,对于架构设计中的一些关键因素选择就会很难做决定。交易系统容错。

2023-11-10 12:05:04 712 1

原创 MySQL InnoDB 是怎么使用 B+ 树存数据的?

这里限定 MySQL InnoDB 存储引擎来进行阐述,避免不必要的阅读歧义。首先通过一篇文章简要了解下 B 树的相关知识:你好,我是B树 。B+ 树是在 B 树基础上的变种,主要区别包括:1、所有数据都存储在叶节点,其它几点作为索引存储。2、数据节点添加链指针,便于横向检索。数据是怎么检索的?从根节点作为起始检索点,逐层向下检索,直至找到目标数据。检索的路径复杂度度跟树...

2023-09-01 13:16:00 536

原创 浅谈双机房的那些事

为什么要有双机房?可能有几个考虑:容灾:强如阿里云、微信、唯品会等,依然避免不了机房故障问题。一次这个级别的故障,就会有一个技术头头下野。更快的响应:网络时延和物理距离成正比,用户距离服务越近,时延越友好。不同的地域,多机房多活模式,就近提供服务。

2023-07-08 14:20:00 329

原创 盘一盘高性能设计的哪些点(二)

继续上一篇文章,继续探讨高性能设计的一些点!

2023-07-07 13:26:50 88

原创 盘一盘那些高性能设计的点(一)

狭义地讲,性能是指软件在尽可能少地占用系统资源的前提下,尽可能高地提高运行速度。谈及性能,我们的关注点不再是软件或者系统的功能,而是在其实现功能过程中所表现出来的资源效率。

2023-07-04 09:25:16 99

原创 你要有自己的影响力

永远不要忽视一个人影响力的效用。它可以是你高效做事的无形助力。

2023-06-30 11:52:01 138 1

原创 你用过哪些设计模式(一)?

什么是设计模式?一些经验总结的最佳实践!是不是必须要用?并不是,但是既然已经说是最佳实践了,该用的地方,你不用,就有些违背常理了。

2023-06-29 09:09:12 71

原创 什么是能力?

所谓能力,就是解决问题的能力!问题来了,你解决掉了,你就有这种能力!问题来了,你解决不了,我就可以说你能力不足!

2023-06-26 10:07:53 89

原创 研发流程不只是一个流程

以人治天下,贤则大治,不贤则大乱。以术知天下,术高多宵小。以法治天下,法令莫不从,民生定。

2023-06-24 22:28:17 80

原创 线上出问题了,怎么办?

出了问题,不要慌!打开手机,发个朋友圈!然后,顺便打包好个人物品,抱着出去就行了!哦哦!上线前拜四阿哥,假期前拜佛祖,天灵灵地灵灵!家人们,这不是危言耸听。线上无小事,开不得玩笑的啊!一、快速恢复还是那句话,出了问题不要慌,冷静,保持冷静。首要记住一个原则:快速恢复。时至如今,有一定规模的公司,后台服务状态监控各方面都做得很完善。日志系统、监控系统什么的,一般情况下,异常...

2023-06-17 09:14:00 66

原创 从 SpringApplication 认识 Spring 应用启动过程

一、SpringApplication 是什么?Spring 应用的启动类。二、SpringApplication 执行了什么?创建 ApplicationContext 实例ApplicationContext 就是我们所说的容器实例。注册 CommandLinePropertySourceCommandLinePropertySource 的作用是将命令行参数输出为 Sp...

2023-06-15 12:03:00 123

原创 什么是高可用服务?

什么是高可用?以年为单位,一年时间为 t = 365 * 24 * 60 = 525600 分钟。服务可用性一般以实现几个9目标来评判,不目标下允许的不可用时间如下:4个9:t * (1 - 99.99%) = 52.56 分钟。5个9:t * (1 - 99.999%) = 5.256 分钟。对于一般性互联网服务比较合理的目标设置为4个9,也就是综合允许1小时左右不可用时间。那么,...

2023-06-12 17:42:00 88

原创 你是怎么学习 Java 技术的?

一、Java 语言Java 语言不只是一门语言。Java 学习不是一蹴而就就可以达成的,它是一个循序渐进,由浅入深,由表及里的过程。尤其需要注意的是不能有浅尝辄耻,不求甚解的态度。每个地方只抓一点,等于什么也没得到。每个小范畴内的学习都必须讲究系统性,完整性。二、知识的获取你是从哪里获取知识的?源码?官方 Docs?技术书籍?技术博客、社区?琅琊榜中有一段梅长苏教授庭生读书...

2023-06-07 12:05:00 53

原创 为什要微服务化?

一、大而集中式的服务从 0 到 1 的堆砌式发展一个服务承载所有,一个系统涵盖一切,这可能是大多数公司初创时的技术风貌。一切追求快速验证,快速响应,快速实现。但是,伴随着业务的膨胀发展,相应的技术支撑要求也在不断提升。从最开始的一个简单的服务,不断地添枝加叶,各种各样的功能模块相继被堆砌式添加上去。慢慢的服务开始变得臃肿,繁杂。功能模块间相互交织,耦合,混乱不堪。同一个服务模块可...

2023-06-06 10:55:00 70

原创 技术研发一天的工作是怎样的?

一、服务检查一般从早上八点开始,服务的访问量就会渐渐地升起来,初始爬坡会比较缓,大概到10点左右会走到顶峰,然后会趋向平稳波动。作为公司的后台服务研发人员,早上到公司第一件事情就是打开监控,查看服务的各项指标是否正常,及时解决各种突发状况。监控系统是 Prometheus + Grafana, Prometheus 负责监控数据层面获取处理,Grafana 负责监控数据面板展示及报警预警...

2023-06-02 09:23:00 87

原创 你问我做技术研发需要哪些能力?

要回答这个问题其实很简单,咱们把眼光投射到具体的公司上。首先先需要明确公司找一个人来是要做什么?显而易见,就是要去负责一块儿业务。那么,负责一块儿业务应该具备哪些能力呢?一、技术能力这个是基础,无需多言,厨师不配刀还叫什么厨师!不同的公司有着不同的业务,或者即便是相同的业务,在不同的公司所应用的技术栈也有不同。所以,有一点就很明确,就是你不可能学习到完美覆盖所有公司技术栈的技能。...

2023-05-31 12:35:00 163

原创 Spring Boot 自动配置一篇概览

一、什么是自动配置 bean自动配置类通过添加 @AutoConfiguration 注解实现。因为 @AutoConfiguration 注解本身是以 @Configuration 注解的,所以自动配置类可以算是一个标准的基于 @Configuration 注解的类。@Conditional 注解可以用于声明自动配置启用条件,通常,我们可以使用 @ConditionalOnClass、...

2023-05-28 23:17:00 161

Node v18.16.1 版本 mac os 系统

Node v18.16.1 版本 mac os 系统

2023-07-05

ultrEdit 文本编辑工具

这是一个非常棒的文本编辑工具,尤其是对于代码编辑使用

2014-02-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除