- 博客(46)
- 收藏
- 关注
原创 网络反作弊与权威性计算的科普——《数学之美》第18章 读书笔记
如何精准高效地为用户呈现高质量、高权威性的搜索结果,成为了各大搜索引擎企业不懈探索的核心议题。以下读书笔记将从“网站反作弊策略”与“提升网站权威性路径”两个维度,科普这个领域。
2024-07-26 12:19:59
1246
原创 什么是网关
这时,网关就扮演了翻译和传递信息的角色,它能够将一种网络中的信息转换成另一种网络能够理解的格式,并确保这些信息能够准确地送达目的地。类似地,当外部用户尝试访问企业内部的一些公开服务时(如通过VPN或Web服务器),他们的请求也会首先被发送到企业的网关设备。最后,网关将响应从公网IP地址空间转换回私有IP地址空间,并将其发送回内部员工的计算机。当内部员工尝试访问互联网上的某个网站时,他们的请求首先会被发送到企业的网关设备。如果请求是合法的,网关将允许其通过,并将其转发到企业内部相应的服务器或服务上。
2024-07-25 18:14:44
806
原创 什么是系统漏洞
这些小问题平时可能看不出来,但如果有坏人(比如黑客)发现了,他们就可以通过这个小洞或者没关好的窗户溜进房子里,做一些坏事,比如偷东西(窃取你的个人信息)、搞破坏(破坏你的电脑或手机)等。:程序在处理输入数据时,未能正确验证数据长度,导致超出预定存储区域的数据溢出到相邻内存空间,从而破坏程序的正常执行流程,有可能使攻击者得以执行任意代码。:攻击者通过在输入字段中插入恶意指令,使原本预期的查询或命令被执行异常,达到非法获取数据、篡改信息或执行非授权操作的目的。对用户输入进行严格的验证和过滤,防止注入类漏洞。
2024-07-23 08:59:47
1244
原创 大数据量级科普
较KB级有显著增长,常用于存储较大的文件,如音乐文件、高清电影预告片或一些小型软件安装包。:远超TB级,能够存储极其庞大的数据量,适用于大规模数据处理和存储需求。:TB是Terabyte的缩写,即太字节,是大数据的入门级量级。:PB是Petabyte的缩写,即拍字节,是大数据的中级量级。:EB是Exabyte的缩写,即艾字节,是大数据的高级量级。:ZB是Zettabyte的缩写,即泽字节,是超大数据量级。:YB是Yottabyte的缩写,即尧字节,是极大数据量级。
2024-07-22 09:13:54
1362
原创 什么是TCP/IP协议
IP协议将HTTP请求封装成数据包,并为其分配源IP地址(你的计算机IP)和目标IP地址(http://www.example.com的服务器IP)。数据包最终被转换成适合物理网络传输的格式(如以太网帧),并通过物理介质(如网线、Wi-Fi信号)发送到目标计算机。数据在网络中被分割成小的数据包,这些数据包可以通过不同的路径独立地传输,然后在目标处重新组装。,并通过网络设备(如路由器)的协同工作,找到最佳的传输路径,将数据包从源地址传递到目标地址。浏览器使用HTTP协议与服务器建立连接,并发送HTTP请求。
2024-07-19 12:32:31
3778
2
原创 什么是区块链
新创建的区块会被网络中的其他节点验证,确保其中的交易是真实有效的。每个区块都包含前一个区块的哈希值(一种通过复杂计算得出的唯一标识符),这确保了链条的完整性和不可篡改性。网络中的节点(计算机)收集这些交易,并通过一种称为“工作量证明”(Proof of Work, PoW)或其他共识算法的过程,将交易打包成一个新的区块。由多个组织或实体共同管理的区块链,参与者通常是事先经过认证或授权的实体,如跨国企业的供应链管理。通过区块链,患者的医疗记录可以安全地存储和共享,同时保护患者的隐私和数据安全。
2024-07-17 12:17:12
682
原创 什么是虚拟机
但通过使用虚拟机技术,你可以在单台物理服务器上创建多个虚拟机,每个虚拟机运行一个服务。这时,你可以使用虚拟机技术,在单台物理计算机上创建多个虚拟机,每个虚拟机安装不同的操作系统。虚拟机管理程序(Hypervisor或VMM,Virtual Machine Monitor)负责在宿主机上创建、运行和管理虚拟机,它实现了对物理资源的虚拟化,并为每个虚拟机提供了独立的运行环境。每台虚拟机都拥有自己独立的操作系统、CPU(尽管是虚拟的)、内存、硬盘等,就像是你为不同的任务或用户准备了多台独立的计算机。
2024-07-14 16:41:56
413
原创 科普文本分类背后的数学原理——最新版《数学之美》第14、15章读书笔记
具体来说,对于任意一个的矩阵,都可以将其分解为三个特定矩阵的乘积形式:其中是的正交矩阵即矩阵的行(列)向量是单位向量且两两正交是的对角矩阵但不一定是方阵,其形状是矩形的,且对角线上的元素称为奇异值,按从大到小排列是正交矩阵的转置。又因为奇异值可作为降维的判断依据,因此可以通过只保留前个最大的奇异值及其对应的和中的列向量来进行降维,因为远小于,因此一个可能巨大的就可以巧妙地用不那么大的三个矩阵来共同表示,起到减少计算量的作用,
2024-07-09 18:47:27
2410
原创 CPU是什么?
CPU,全称Central Processing Unit,是计算机系统的核心部件,负责执行程序指令、处理数据以及控制计算机内部的其他组件。简单来说,负责进行所有的思考和计算工作。
2024-07-05 21:53:05
1123
原创 VPN是什么?
VPN,全称Virtual Private Network,,是一种在公共网络(如互联网)上建立加密、安全的连接通道的技术。
2024-07-04 18:05:24
7260
1
原创 科普地图搜索背后的数学原理-《数学之美》第12章读书笔记
有限状态机是一个特殊的有向图,它包括有限数量的状态(节点)以及连接这些状态的有向弧(边)。这些有向弧上通常带有从一个状态进入下一个状态的条件或输入。下图是一个识别中国地区地址的一个简化的有限状态机。基于概率的有限状态机(PFSM)是一种特殊的有限状态机,它结合了概率来处理具有不确定性和模糊性的输入数据。在地址识别分析中,PFSM能够处理地址描述的多样性、不完整性和歧义性,通过计算状态转移的概率来更准确地识别地址的各个组成部分。在地址识别之后,一个紧接着的问题往往是求取两个地址之间的最短距离。
2024-07-01 08:20:11
2166
原创 大数据安全经典面试题及回答(上)
目录一、大数据安全的主要挑战及应对策略二、大数据安全中的“五个V”及其影响三、在Hadoop集群中实施数据加密的步骤和注意事项四、在大数据环境中实施访问控制和身份认证五、大数据环境中数据备份和恢复的策略六、大数据处理过程中保护用户隐私的策略七、大数据环境中应对DDoS攻击的策略(一)主要挑战(二)应对策略(一)“五个V”的解释大数据安全中的“五个V”包括Volume(数据体量巨大)、Variety(数据类型繁多)、Velocity(处理速度快)、Veracity(数据准确性)和Value(数据价值)。(二)
2024-06-12 18:26:02
1649
原创 科普计算机的相关知识【上】
编程语言是人与计算机沟通的桥梁,用于编写计算机可以理解的指令。计算机网络是将地理位置不同的具有独立功能的多台计算机及其外部设备通过通信线路和通信设备连接起来,实现资源共享和信息传递的计算机系统。计算机系统由硬件和软件两部分组成,它们共同协作完成各种计算任务。硬件是计算机系统的物质基础,包括各种物理设备和部件;软件则是计算机系统的灵魂,负责管理和控制硬件资源,实现各种功能和应用。随着计算机技术的不断发展,计算机系统的性能和功能也在不断提高,为人们的生活和工作带来了极大的便利。
2024-06-10 20:57:59
1145
原创 NoSQL数据库:定义、特性、分类与应用场景的探索
NoSQL,字面意思为“不仅仅是SQL”,是指非关系型数据库的统称。与传统的关系型数据库相比,NoSQL数据库突破了结构化的数据模型限制,采用键值对、文档、列族或图等非结构化的方式存储数据。NoSQL的概念最早起源于2009年,当时由一名叫Eric Evans的程序员在博客上提出了这一概念。他观察到,随着Web 2.0的兴起,传统的关系型数据库在处理大规模、高并发的Web应用时遇到了瓶颈,因此需要一种新型的数据库来应对这些挑战。NoSQL数据库就是在这样的背景下应运而生的。
2024-06-03 13:22:05
3987
原创 带你系统学习平滑样条、局部回归、广义可加性模型-豆瓣9.6分统计学神作ISL之第七章读书笔记(下)
宝藏博主带你系统学习样条函数、局部回归、广义可加性模型。关注绝不后悔!!
2024-05-31 13:40:01
1777
原创 数据倾斜那些事儿
之前在大厂当了好几年的sqlboy,数据倾斜这个“小烦人精”确实经常在工作中出没。用简单的话来说,数据倾斜就像是“贫富差距”在数据世界里的体现——某些数据特别“富有”,而其他数据则相对“贫穷”。具体来说,数据倾斜指的是在数据集中,某个特定的特征值或某个类别的样本数量,远大于其他特征值或类别的样本数量。那么,数据倾斜会带来哪些问题呢?性能下降:由于某些节点或任务处理的数据量远大于其他节点,这些节点或任务的执行时间会更长,导致整体性能下降。资源浪费。
2024-05-27 17:43:35
659
原创 豆瓣9.6分统计学神作ISL之第七章读书笔记(上),带你系统学习多项式回归、阶梯函数、基函数和回归样条
持续关注博主,绝不后悔!!全网最认真的国外统计学神作ISL第七章读书笔记(上),带你系统学习多项式回归、阶梯函数、基函数和回归样条。
2024-05-24 10:35:33
1557
原创 豆瓣8.8高分神作《数学之美 第三版》之第四章读书笔记,带你了解分词的来龙去脉
全网最精致的《数学之美 第三版》第四章读书笔记,带你初步了解分词的来龙去脉
2024-05-21 13:58:25
1038
1
原创 豆瓣9.6分统计学神作ISL之第六章读书笔记(下),带你系统学习主成分分析与回归、偏最小二乘法回归以及对高维数据的思考
关注博主绝对不后悔!!全网最认真的豆瓣9.6分统计学神作ISL的第六章学习笔记,让你一文看到主成分分析与回归、偏最小二乘回归的内在本质。
2024-05-13 11:02:01
1370
原创 豆瓣9.6分统计学神作ISL之第六章读书笔记(上),带你系统学习向前(后)逐步筛选法、岭回归(Ridge Regression)、拉索回归(Lasso Regression)
全网最认真的豆瓣9.6分统计学高分神作ISL的第六章学习笔记,让你一文看明白模型逐步筛选法、正则化法的技术细节。看不明白算我输,关注博主绝不后悔!!
2024-05-12 08:47:24
866
原创 豆瓣8.8分高分神作《数学之美 第三版》之第二章读书笔记,带你了解自然语言处理的发展历史(持续更新中)
一位数据领域老兵的关于《数学之美 第三版》第二章的极其认真的读书笔记,带你了解自然语言处理的演变历史。关注博主,绝对不后悔!!!!
2024-05-11 08:37:12
1004
1
原创 豆瓣9.6分统计学神作ISL之第五章读书笔记,带你系统学习交叉验证(cross-validation)和自助法(bootstrap)
全网最认真的豆瓣9.6分统计学高分神作的读书笔记,带你系统学习统计学和机器学习相关知识,看不懂算我输!!关注博主,你绝对不后悔!!
2024-05-10 08:26:13
1285
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人