自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 如何简单爬取一个网页(网络爬虫)

网络爬虫是一种自动从网络上抓取数据的程序,它可以按照一定的规则和策略,从网页中提取信息并保存到本地或数据库中。以下是关于如何开始爬取一个网页的详细步骤,以及一个具体的例子——爬取一个简单的网页内容。

2025-06-24 09:08:45 2081

原创 如何写一个Java综合项目

为什么会吞我的博客?

2025-06-24 08:47:15 227

原创 如何写一个Java综合项目

如果是的。

2025-06-24 08:39:26 134

原创 如何入手写一个Java综合项目

文档应该易于理解,方便后续维护和新成员的加入。使用安全的认证机制,如JWT(JSON Web Tokens)或OAuth 2.0,确保用户身份的合法性。将项目文档(如需求文档、设计文档、开发文档、用户手册等)存储在版本控制系统中,方便团队成员查阅和更新。使用项目管理工具(如Jira、Trello)跟踪任务进度,确保团队成员之间的沟通顺畅。使用设计模式(如工厂模式、单例模式、策略模式等)来减少重复代码,提高代码的可复用性。对于耗时的操作(如发送邮件、日志记录等),使用异步处理机制,避免阻塞主线程。

2025-06-24 08:37:11 686

原创 Hadoop的历史发展和心得

2011年,Hadoop 2.0发布,这个版本引入了YARN(Yet Another Resource Negotiator),它是一个资源管理平台,允许Hadoop集群更有效地管理资源,并支持除了MapReduce之外的其他计算模型,如Apache Tez和Apache Spark。:2014年,Hadoop 3.0发布,这个版本引入了对容器化的支持,如Docker,以及对HDFS的改进,包括对Erasure Coding的支持,这可以显著减少HDFS存储的需求。

2024-12-17 14:40:27 1206

原创 数据可视化的发展历史和知识点及其心得

数据可视化的发展历史是一个跨越多个世纪的演变过程,从古代的地图绘制到现代的交互式图表,数据可视化技术经历了显著的发展。

2024-12-15 18:27:54 1490

原创 电工电子技术历史发展,知识点及其学习心得

电工电子技术的发展历史电工电子技术的发展历史可以追溯到19世纪末,当时电工技术已形成了电力和电信两大分支。进入20世纪以后,电工科技的发展更为迅速,应用电磁现象的技术门类日益增多,发展和形成了许多独立的学科,如无线电技术、电子技术、自动控制技术等等。

2024-12-15 18:09:21 1197

原创 支持向量机

`roc_auc_score`函数用于计算接收者操作特征曲线(Receiver Operating Characteristic curve,简称ROC曲线)下的面积(Area Under the Curve,简称AUC),这是一个衡量模型性能的指标,特别是在二分类问题中。这段代码的目的是预测输入数据点最有可能属于的类别。- 例如,如果SVM模型是二分类的,这个方法可能会返回一个如下的数组:`[0.2, 0.8]`,这意味着模型预测输入数据点属于第一个类别的概率是20%,属于第二个类别的概率是80%。

2024-10-21 16:14:03 1540 1

原创 《Python数据分析》知识的实践经验和学习心得

有一些基本的python基本代码:下面是对这些方法的简单描述:字符串是 Python 中用于表示文本的数据类型。以下是一些常用的字符串方法:列表是 Python 中用于存储有序集合的数据类型。以下是一些常用的列表方法:字典是 Python 中用于存储键值对集合的数据类型。以下是一些常用的字典方法:集合是 Python 中用于存储无序且不重复元素的数据类型。以下是一些常用的集合方法:当然,也有高级代码:生成器是返回迭代器的一种函数,它逐个生成值,而不是一次性生成一个值列表。这对于处理大量数据或需要按需生成值的

2024-06-18 22:26:47 674

原创 Java的学习收获与学习心得

描述:抽象类不能被实例化,它主要用于定义一些通用的属性和方法,而具体的实现则由其子类完成。接口是抽象类的扩展,它完全由抽象方法和常量组成,不能被实例化,但可以通过类来实现。

2024-06-18 18:24:50 2980

原创 MySQL数据库基础一课一得

由于直接在这里附上代码图(即带有代码的屏幕截图)并不实际,我将为你描述MySQL的基本使用并提供一些示例代码。这些代码可以在MySQL命令行工具、MySQL Workbench或其他支持MySQL的数据库管理工具中执行。

2024-06-18 15:14:23 1478

原创 Mongodb副本部署(windows)

本次操作是在同一台电脑下进行的模拟操作,相同的利用不同的端口号进行主节点、副节点的设置操作。

2024-06-16 21:14:56 561

原创 MongoDB分片(windows)

分片概述分片(Sharding)技术是开发人员用来提高数据存储和数据读写吞吐量常用的技术之一。简单的来说,分片主要是将数据进行划分后,将它们分别存放于不同机器上的过程。通过使用分片可以实现降低单个机器的压力和处理更大的数据负载功能。分片与副本集主要区别在于,分片是每个节点存储数据的不同片段,而副本集是每个节点存储数据的相同副本。分片概述所有数据库都可以进行手动分片(Manual Sharding),因此,分片并不是MongoDB特有的。

2024-06-16 20:56:46 842

原创 MongoDB简介及基本操作

/对于g r o u p 分组 i d 是必选项,选择字段 t y p e 进行分组时,字段前面要加上 group分组 id是必选项,选择字段type进行分组时,字段前面要加上group分组id是必选项,选择字段type进行分组时,字段前面要加上符号。insert()和save()方法的区别在于,若使用insert()方法插入文档时,集合中已存在该文档,则会报错。练习4:使用$min表达式,将集合陈中的文档按类型type进行分组,并计算各个分组中价格price最小值,具体命令如下。

2024-06-11 12:46:53 1886

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除