底层原理
文章平均质量分 86
Psycho_MrZhang
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
熵和交叉熵
交叉熵(Cross-Entropy)则是熵的延伸,直接用于评估模型预测分布与真实数据分布之间的差距,是分类任务中最常用的优化目标之一。将熵与交叉熵的公式分解为可理解的部分,通过逻辑分步和生活化类比,帮助读者掌握其数学本质与实际意义。通过具体机器学习任务,说明熵与交叉熵在模型训练和优化中的实际作用,并展示其解决实际问题的流程。明确熵与交叉熵的数学定义,通过通俗类比解释其核心思想,并说明其在机器学习中的直观意义。让读者理解熵和交叉熵在信息论与机器学习中的核心地位,并掌握其在模型优化中的实际意义。原创 2025-05-09 13:21:55 · 908 阅读 · 0 评论 -
数据归一化
在特征空间中,未归一化的数据可能导致坐标轴“拉伸”(如X轴范围0-1000,Y轴0-1),使距离计算(如欧氏距离)被大尺度特征主导。若特征尺度差异大(如“年龄”范围0-100 vs. “收入”范围0-100,000),大尺度特征会主导距离计算,导致模型失效。数据归一化(Data Normalization)是将不同量纲或尺度的特征值映射到统一数值范围(如[0,1])或分布(如均值为0、方差为1)的预处理技术。:假设特征服从正态分布(均值 μ=50,σ=15),标准化后 μ=0,σ=1。原创 2025-05-09 10:48:18 · 937 阅读 · 0 评论 -
BERT模型详解
BERT(Bidirectional Encoder Representations from Transformers)是由Google在2018年提出的一种基于Transformer架构的预训练模型。原创 2025-05-06 13:54:15 · 1512 阅读 · 0 评论 -
五种IO模型- 阻塞IO、非阻塞IO、多路复用IO、信号驱动IO以及异步IO
在操作系统中处理输入/输出(IO)操作的过程中,存在多种方式,包括阻塞IO、非阻塞IO、多路复用IO、信号驱动IO以及异步IO。这些方式在操作系统实现和应用程序编写时有着不同的适用场景和性能特征。接下来,我将逐一介绍它们的实现原理、优缺点以及应用场景,同时给出Java和Python的实验示例。原创 2024-12-24 10:53:41 · 1191 阅读 · 0 评论 -
IO多路复用
是一种同步I/O模型,它可以让单个进程能够监视多个文件描述符(如套接字),一旦某个文件描述符就绪(可读、可写或有异常条件待处理),该进程就可以无阻塞地操作这些文件描述符。这样,一个线程可以管理多个连接,提高了程序的效率和资源利用率。在Java中,可以使用NIO(New Input/Output)库来实现类似epoll的功能。模块来实现类似epoll的功能。这两个示例都是简单的TCP服务器,能够处理多个客户端连接。上述两个示例分别展示了如何使用Java的NIO库和Python的。在Python中,可以使用。原创 2024-12-24 10:04:37 · 825 阅读 · 0 评论 -
Python中的强/弱/循环引用
强引用增加对象的引用计数,对象的生命周期依赖于强引用的存在。弱引用不增加对象的引用计数,主要用于避免循环引用导致的内存泄漏。循环引用可能导致内存泄漏,但Python的垃圾回收器会周期性地检测并处理这种情况。对象的生命周期从创建开始,到引用计数降为0时结束,被垃圾回收器回收。理解这些概念有助于更好地管理Python程序中的内存,避免内存泄漏等问题。原创 2024-12-19 16:05:33 · 532 阅读 · 0 评论 -
JVM内存泄漏之ThreadLocal详解
提供了一种线程局部变量的机制,使得每个线程都有自己的变量副本,互不干扰。在多线程编程中,共享变量的使用通常需要考虑线程安全问题。在分布式系统中,事务管理需要确保每个线程的操作都是独立的。可以为每个线程分配一个独立的数据库连接,避免了线程间的竞争。可以为每个线程分配一个独立的事务上下文,确保事务的隔离性。在多线程环境下,每个线程都需要一个独立的数据库连接。在Web应用中,每个用户的请求可能由不同的线程处理。可以为每个线程提供一个独立的缓存,避免了缓存数据的竞争。在某些场景下,每个线程可能需要一个独立的缓存。原创 2024-12-18 15:27:34 · 516 阅读 · 0 评论 -
MySQL中in和exists的使用场景
在MySQL中,IN和EXISTS是用于子查询的两种常见方法,它们在不同的场景下有不同的表现和适用性。下面我将详细介绍这两种方法的使用场景、优劣,并通过实验来说明问题。原创 2024-12-18 10:21:39 · 558 阅读 · 0 评论 -
MySQL JOIN算法实现和选择
它的基本思想是使用一个外层循环遍历第一个关系中的每一行,然后在内层循环中遍历第二个关系中的每一行,以检查它们是否满足连接条件。MySQL的查询优化器会根据表的统计信息、索引的存在情况、查询的具体条件等因素来选择最合适的JOIN算法。在MySQL中,使用索引进行JOIN操作的底层实现主要涉及几种不同的算法,具体取决于查询优化器的选择和表的结构。具体的实现方式取决于查询优化器的选择和表的结构。但是,通过使用数据块的方式,减少了对外层表的 I/O 操作次数,提升了查询效率,特别是在处理大数据集时效果更明显。原创 2024-12-18 09:50:48 · 656 阅读 · 0 评论 -
常见的数据结构和应用场景
数据结构是计算机科学中的基础概念,用于组织和存储数据,以便能够高效地访问和修改。原创 2024-12-17 14:32:44 · 1449 阅读 · 0 评论 -
Python事件循环
一旦"执行栈"中的所有同步任务执行完毕,系统就会读取"任务队列",看看里面有哪些事件。因为python是单线程的,同一时间只能执行一个方法,所以当一系列的方法被依次调用的时候,python会先解析这些方法,把其中的同步任务按照执行顺序排队到一个地方,这个地方叫做执行栈。当遇到异步任务时,异步任务会被挂起,继续执行执行栈中任务,等异步任务返回结果后,再按照执行顺序排列到‘’事件队列中‘’。主线程每次将执行栈清空后,就去事件队列中检查是否有任务,如果有,就每次取出一个推到执行栈中执行,这个过程是循环往复的…原创 2024-12-03 22:37:53 · 444 阅读 · 0 评论
分享