- 博客(319)
- 资源 (25)
- 收藏
- 关注

原创 欢迎访问,博客导航
欢迎访问!下面向您介绍本博客的相关内容~博客相关资源博客所有的文章和代码都是开源的,你可以在我的github和gitee找到相关的代码和文档。GithubGitee当然你也可以访问我的个人博客,查询相关文章。我的博客主要涉及到的内容深度学习图像处理机器学习数据分析绘图可视化OpenCVPythonR主要专栏YUV图像处理OpenCV实战Seaborn...
2020-05-03 17:49:54
1111
原创 [python] 使用Python实现Markdown文档格式转换
MarkItDown库是一款轻量级的Python版Markdown格式解析与渲染工具,能够将多种文件格式高效转换为Markdown格式,从而满足大语言模型(LLMs)及相关文本分析流程的需求。它专注于以Markdown格式精准保留文档的关键结构与内容,包括标题、列表、表格、链接等元素。虽然其输出结果既美观又易于人类用户阅读,但其核心设计宗旨是为文本分析工具提供支持,因此对于那些需要高保真度转换以供人类阅读的文档,它可能并非最优选择。PDFPowerPoint(按从上到下、从左到右的顺序读取内容)
2025-03-24 20:49:40
866
原创 [深度学习] 大模型学习2-提示词工程指北
2020年,OpenAI推出的GPT-3以1750亿参数的庞大体量,成为当时全球规模最大的语言模型。它广泛应用于文本生成、问答系统等自然语言处理任务,展现出强大的语言处理能力。伴随应用场景的持续拓展,精心设计的提示词在引导模型产出高质量、契合预期的输出成果上,关键作用日益凸显,进而直接促使提示词工程蓬勃兴起。2022年,ChatGPT的发布为LLM的发展带来了新的突破。它凭借简洁友好的界面和卓越的对话能力,极大地提升了LLM的公众可及性,让普通用户也能轻松上手。
2025-02-28 20:27:34
1795
原创 [论文总结] 深度学习在农业领域应用论文笔记14
简单介绍了智慧农业推进对人类食品需求和粮食变化的重要性。智慧农业通过解决疾病、杂草和害虫造成的作物损失等问题,最大限度地减少对环境的影响,同时提高土地生产力,这些问题占农业生产力的 20%-40%。通过技术创新,使用无人机或卫星图像结合深度学习进行远程监控,对于与水、营养物质和疾病症状相关的早期异常检测具有重要价值。但是,由于元素和环境不同,从图像中分析作物状况很复杂。卷积神经网络 (CNN) 由于能够处理各种数据,因此在农业中可用于疾病和害虫识别。
2025-01-28 18:06:28
1058
1
原创 [深度学习] 大模型学习1-大语言模型基础知识
LLM发展历程2022年11月30日,OpenAI推出的ChatGPT在LLM技术领域取得了创新突破,迅速引起了全球业界的广泛关注,并在短短两个月内成功吸引了超过一亿用户。作为一款基于LLM的应用,ChatGPT以其强大的文本生成、对话交互和信息提取能力,成为人工智能领域的一个重要里程碑,推动了人机交互的边界。然而,由于OpenAI未公开其底层技术并封闭源代码,这引发了全球AI开发者对开源技术的强烈需求。
2024-12-31 22:22:35
1244
原创 [python] asyncio库常见问题与实践案例
死锁(Deadlock)是并发编程中的一种常见问题,它发生在多个任务之间的资源争用中,导致所有任务都陷入无法继续执行的僵局。即使在Python中使用。
2024-11-25 12:00:17
1274
1
原创 [python] Python异步编程库asyncio使用指北
异步编程是一种非阻塞的编程范式。在这种范式中,请求和函数调用会在未来某个时刻以某种方式在后台执行。非阻塞意味着当一个请求被发出时,程序不会停下来等待该请求的结果,而是会继续执行后续的操作。当请求的结果准备好时,程序会在适当的时机处理该结果,而不会影响程序其他部分的执行。因此,调用者可以继续执行其他任务,并在结果准备好或需要时,稍后处理已发出的调用结果。异步操作指的是在程序运行时,有些任务不会立即完成,而是安排在未来某个时刻执行。与同步操作不同,后者要求任务在当前步骤中完成。异步函数调用。
2024-11-22 12:17:26
818
原创 [图像处理] 基于CleanVision库清洗图像数据集
CleanVision支持多种格式示例图片问题类型描述关键字完全重复完全相同的图像近似重复视觉上几乎相同的图像模糊图像细节模糊(焦点不实)blurry信息量低缺乏内容的图像(像素值的熵很小)过暗不规则的暗图像(曝光不足)dark过亮不规则的亮图像(曝光过度)light灰度缺乏颜色的图像grayscale异常宽高比宽高比异常的图像异常大小相比数据集中其他图像,尺寸异常的图像odd_size。
2024-10-24 10:36:25
1756
原创 [python] 基于PyOD库实现数据异常检测
PyOD作者发布了一份长达45页的预印论文,名为ADBench: Anomaly Detection Benchmark,以及提供ADBench开源仓库对30种异常检测算法在57个基准数据集上的表现进行了比较。ADBench结构图如下所示:。pyod.models.base.BaseDetector.fit():训练模型,对于无监督方法,目标变量y将被忽略。pyod.models.base.BaseDetector.decision_function():使用已训练的检测器预测输入数据的异常分数。
2024-10-01 10:50:20
1862
原创 [论文总结] 深度学习在农业领域应用论文笔记13
这篇论文的立意是从实际出发的,与很多根据卫星图像来预测产量的文章不同,该研究的目的强调了不是产量预测而是提出使用棉花种植区块产量和纤维质量(长度和微米)数据来说明作物生产数据的缩小区域观测的通用方法。在实验数据方面,采用了澳大利亚11个种植区域2年生长季节260天的生长数据,8种不同植被指数、32个协变量和棉花的产量和棉纤维微米(质量)以及总共有约25张卫星图像可用于 NNSW区域,约70 张图像可用于SNSW区域。数据量挺大的,做的内容也具有实际意义。挺好的一篇文章。
2024-09-25 09:16:52
1986
1
原创 [深度学习] 时间序列分析工具TSLiB库使用指北
任务类型定义特点应用场景示例长时预测预测时间序列在未来较长时间段内的变化趋势需要考虑长期趋势和季节性因素,使用复杂的模型来捕捉长期依赖性股票价格预测、长期能源需求预测等短时预测预测时间序列在近期的未来值通常关注短期波动,模型需要快速响应新数据短期销售预测、交通流量预测等缺失值填补填补时间序列中缺失的数据点需要保持时间序列的连续性和一致性时间序列预处理、历史数据补全等异常检测识别时间序列中的异常或离群点需要区分正常波动和异常事件网络安全监控、设备故障检测等分类。
2024-08-28 22:10:59
2376
1
原创 [python] Python并行计算库Joblib使用指北
Joblib是用于高效并行计算的Python开源库,其提供了简单易用的内存映射和并行计算的工具,以将任务分发到多个工作进程中。Joblib库特别适合用于需要进行重复计算或大规模数据处理的任务。。
2024-08-10 09:32:52
1096
1
原创 [python] 启发式算法库scikit-opt使用指北
启发式算法介绍启发式算法,顾名思义,就是一种基于直觉或经验来解决问题的算法。它不像传统算法那样一步一步地穷尽所有可能性,而是通过一些启发式的规则或策略,快速找到一个可行的解。打个比方,若开车去一个陌生的地方,没有导航仪。启发式算法就像问路一样,可以向路人询问,也可以根据路边的标志和指示牌来判断方向。虽然这种方式不能保证找到最优路线,但通常能够在较短时间内找到一个可行的路线。快速性: 启发式算法通常能够在较短时间内找到一个可行的解,特别是在面对复杂问题时。
2024-07-30 21:32:47
1022
原创 [机器学习] 低代码机器学习工具PyCaret库使用指北
PyCaret是一个开源、低代码Python机器学习库,能够自动化机器学习工作流程。它是一个端到端的机器学习和模型管理工具,极大地加快了实验周期,提高了工作效率。PyCaret本质上是围绕几个机器学习库和框架(如scikit-learn、XGBoost、LightGBM、CatBoost、spaCy、Optuna、Hyperopt、Ray等)的Python包装器,与其他开源机器学习库相比,PyCaret可以用少量代码取代数百行代码。。
2024-06-01 09:24:52
1239
原创 [python] 基于PyWaffle库绘制华夫饼图
PyWaffle库通过其Waffle类提供了一种便捷的方式来创建华夫饼图。每个类别的方格占比可以通过参数values进行设置,数据可以是列表、字典和Pandas.DataFrame结构。然后可以使用rows和columns参数来定制行数和列数。只需要指定其中一个参数,另一个参数可以根据values的总和推断出来。# 新建绘图图像rows=5,# 保存结果plt.show()如果value参数输入的是比例值,则必须设置rows和columns属性来定义值的显示方式。rows=2,
2024-04-30 21:42:59
1163
2
原创 [深度学习] 计算机视觉低代码工具Supervision库使用指北
Supervision库是一款出色的Python计算机视觉低代码工具,其设计初衷在于为用户提供一个便捷且高效的接口,用以处理数据集以及直观地展示检测结果。。Supervision库需要在Python3.8及以上版本的环境下运行。
2024-03-18 09:31:13
8544
3
原创 [随笔所想] 劳动合同法学习笔记
劳动法和劳动合同法在中国法律体系中占据重要地位。《中华人民共和国劳动法》简称劳动法,是在1994年7月5日由全国人大常委会通过,并于1995年1月1日开始实施。这部法律是在我国从计划经济向市场经济过渡时期诞生的,反映了当时劳动关系初步紧张的状态,成为20世纪中国劳动立法的标志性成果。而《中华人民共和国劳动合同法》简称劳动合同法,则是在2007年6月29日由全国人大常委通过,并于2008年1月1日开始实施。
2024-02-17 08:49:10
1336
原创 [论文总结] 深度学习在农业领域应用论文笔记12
在本研究中,我们推出了一个创新的、公开可用的基于RGB的三维斑马鱼多目标跟踪数据集——3D-ZeF。斑马鱼作为一种日益流行的实验模型生物,广泛应用于神经系统疾病、药物成瘾等领域的研究,其中行为分析是这些研究不可或缺的一环。然而,斑马鱼之间的视觉相似性、相互遮挡以及不规则运动等因素,使得实现准确的三维跟踪成为了一个充满挑战且待解决的难题。我们提供的数据集涵盖了八个视频序列,持续时间从15秒到120秒不等,每个序列包含1至10条自由活动的斑马鱼。这些视频共标注了86,400个点和边界框。
2024-02-10 08:54:34
2971
2
原创 [python] 基于RapidFuzz库实现字符串模糊匹配
是一个用于快速字符串模糊匹配的Python库,它能够快速计算两个字符串之间的相似度,并提供与和类似的接口。RapidFuzz和TheFuzz功能相似,只是提供的接口不同。RapidFuzz库是一个经过高度优化的C++实现,为用户提供了以Python编写代码的速度和灵活性。该库还提供了一个与TheFuzz和Fuzzywuzzy中所有算法兼容的API,因此强烈推荐使用RapidFuzz库进行文本模糊匹配。
2024-01-25 11:50:01
2276
原创 [python] 基于Dataset库操作数据库
dataset库是Python中一个用于操作数据库的简单库,它提供了一种简洁的方式与各种关系型数据库进行交互,例如SQLite、MySQL、PostgreSQL 等。你可以使用dataset库来执行查询、插入、更新和删除操作,而无需编写复杂的SQL语句。dataset库适用于小规模的数据存储和查询场景,相比csv和json文件只能通过编程语言来处理数据,dataset支持使用SQL语言进行查询,提供了丰富的查询功能和灵活性。
2023-12-29 18:27:30
2135
原创 [python] 基于Tablib库处理表格数据
Tablib是一个用于处理电子表格(如 Excel,CSV,JSON)的Python 库。它提供了一种简单而强大的方式来操作和处理数据。利用Tablib,我们可以轻松地读取、写入、过滤和转换各种类型的电子表格数据。Tablib 具有一致且易于使用的 API,以在不同的数据格式之间进行无缝转换。比如,Tablib可以将数据从Excel表格导入为Python对象,然后将其转换为JSON或CSV格式,并进行相应的操作和分析。此外Tablib还支持对数据进行排序、筛选和合并等常见操作。。
2023-11-30 11:53:29
1364
原创 [数据分析与可视化] 基于Python绘制简单动图
动画是一种高效的可视化工具,能够提升用户的吸引力和视觉体验,有助于以富有意义的方式呈现数据可视化。本文的主要介绍在Python中两种简单制作动图的方法。其中一种方法是使用matplotlib的Animations模块绘制动图,另一种方法是基于Pillow生成GIF动图。
2023-10-24 13:40:42
3812
4
原创 [自然语言处理] 基于pycorrector实现文本纠错
pycorrector通过加载自定义混淆集,支持用户纠正已知的错误,实际就是字符串替换。
2023-09-24 11:39:25
6051
4
原创 [编程基础] Python内置模块collections使用笔记
collections是Python标准库中的一个内置模块,它提供了一些额外的数据结构类型,用于增强Python基础类型如列表(list)、元组(tuple)和字典(dict)等。本文主要介绍这些数据类的基础使用方法,以更好地利用Python的collections模块来处理不同类型的数据。。
2023-09-05 17:34:50
604
原创 [语音识别] 基于Python构建简易的音频录制与语音识别应用
PyAudio是一个用于处理音频输入和输出的Python库,其主要变量和接口的实现依赖于C语言版本的PortAudio。PyAudio提供从麦克风或其他输入设备录制音频、保存音频文件、实时处理音频数据以及播放音频文件或实时音频流等功能。此外,PyAudio也允许通过设置采样率、位深度、声道数等参数以及支持回调函数和事件驱动机制来满足不同应用需求。PyAudio。PyAudio的安装需要Python3.7及以上环境。本文所用PyAudio版本为0.2.13。
2023-08-21 12:14:06
8499
17
原创 [数据分析与可视化] Python绘制数据地图5-MovingPandas绘图实例
MovingPandas是一个基于Python和GeoPandas的开源地理时空数据处理库,用于处理移动物体的轨迹数据。,本文主要介绍三个MovingPandas的绘图实例。。。。MovingPandas作者推荐在Python 3.8及以上环境下安装MovingPandas,并建议使用conda进行安装。由于MovingPandas的依赖环境较为复杂,所以不推荐使用pip进行安装。下面的代码展示了MovingPandas的版本信息,本文所用Python版本为Python3.10。
2023-08-11 12:16:19
1648
原创 [数据分析与可视化] Python绘制数据地图4-MovingPandas入门指北
MovingPandas是一个基于Python和GeoPandas的开源地理时空数据处理库,用于处理移动物体的轨迹数据。它提供了一组强大的工具,可以轻松地加载、分析和可视化移动物体的轨迹。通过使用MovingPandas,用户可以轻松地处理和分析移动对象数据,并从中提取有关行为、模式和趋势的见解。无论是处理交通流量数据、物流轨迹数据还是动物迁徙数据,MovingPandas都是一个强大的地理可视化工具。。。。
2023-08-03 12:23:42
1709
原创 [自然语言处理] 自然语言处理库spaCy使用指北
自然语言处理(Natural Language Processing,简称NLP)是一门研究人类语言与计算机之间交互的领域,旨在使计算机能够理解、解析、生成和处理人类语言。NLP结合了计算机科学、人工智能和语言学的知识,通过各种算法和技术来处理和分析文本数据。近年来,随着深度学习技术的发展,神经网络模型在自然语言处理(NLP)领域取得了重大的突破。其中,循环神经网络(RNN)、长短时记忆网络(LSTM)和Transformer等模型都发挥了关键作用。
2023-07-27 17:45:57
11275
原创 [数据分析与可视化] 基于matplotlib和plottable库绘制精美表格
plottable提供了ColumnDefinition类(别名ColDef)来自定义图形表格的单个列的样式。name: str,要设置绘图效果的列名title: str = None,用于覆盖列名的绘图标题width: float = 1,列的宽度,默认情况下各列的宽度为轴的宽度/列的总数textprops: Dict[str, Any] = field(default_factory=dict),提供给每个文本单元格的文本属性。
2023-07-10 17:58:54
4796
4
原创 [数据分析与可视化] 基于matplotlib-scalebar库绘制比例尺
matplotlib-scalebar是一个Python库,用于在matplotlib图形中添加比例尺。它允许用户指定比例尺的大小、位置、字体和颜色,以及比例尺的单位。该库支持不同的比例尺单位,例如米、英尺、英寸等。matplotlib-scalebar安装命令如下:pip install matplotlib-scalebar比例尺是一种用于描述图上线段长度与实际相应线段长度之间关系的方法。其基本公式为:比例尺 = 图上距离 / 实际距离。比例尺的表示方法可以分为三种:数字式,采用数字的比例形
2023-06-28 19:35:46
2845
3
原创 [数据分析与可视化] Python绘制数据地图3-GeoPandas使用要点
通过更改 ScaleBar 参数能够调整比例尺的显示效果,ScaleBar具体参数如下所示。这些参数的使用可以自行尝试。
2023-06-16 19:52:17
5177
原创 2023-05-31-[音视频处理] FFmpeg使用指北1-视频解码
在开始之前,需要先安装FFmpeg。对于Windows用户,可以参考FFmpeg + Visual studio 开发环境搭建;对于Linux用户,可以参考FFmpeg4.4编译。本文主要参考了提供的代码。值得注意的是,由于FFmpeg版本变化较大,本文所使用的FFmpeg接口和以往有所不同。如果想进一步学习FFmpeg代码的使用,可以阅读和视音频编解码技术零基础学习方法(由于作者雷霄骅不幸英年早逝,哀悼!该文主要基于旧ffmpeg版本,但是仍然有很好的学习价值)。解封装。
2023-05-31 11:51:04
1645
原创 [python] Python类型提示指北
Python也支持对自定义类进行类型提示。在上面的代码中,我们定义了一个 Person 类,它有两个属性:name 和 age。在初始函数中,我们使用类型提示指定了这两个属性的类型。接下来,我们定义了一个 say_hello 函数,这个函数的参数是一个 Person 类型的对象,并且返回值是一个字符串。
2023-05-10 19:42:33
3297
原创 [数据分析与可视化] Python绘制数据地图2-GeoPandas地图可视化
如下代码所示,绘制江苏省地级市GDP地图。# 读取2019江苏省各市GDP数据 import geopandas as gpd import matplotlib . pyplot as plt import pandas as pdplt . rcParams [ "font.family" ] = 'FZSongYi-Z13S' # 数据来自互联网 gdp = pd . read_csv("2022江苏省各市GDP.csv") gdp排行地级市2022年GDP(亿元)01苏州市。
2023-04-09 10:42:19
6561
原创 [数据分析与可视化] Python绘制数据地图1-GeoPandas入门指北
地信、计算机和遥感等领域的从业人员或多或少都会接触地理信息系统(GIS,Geographic Information System)的相关知识。所谓GIS简单来说就是一个以计算机为核心,对地理空间位置相关数据进行创建、管理、分析、绘制和展示的多功能集成信息系统。绘制地图,则需要了解GIS中的坐标参考系。本文只是简单介绍坐标参考系的相关内容。相关内容总结于以下文章,想要具体了解更多内容也可以看看这些文章。聊聊GIS中的坐标系基于geopandas的空间数据分析——坐标参考系篇前后端都要懂一点的 GIS。
2023-03-16 20:05:22
3678
原创 [论文总结] 深度学习在农业领域应用论文笔记11
本研究提出了一种基于机器视觉的岬角边界检测方法,该方法在RGB图像外引入深度信息,以提高其检测精度。我们使用基于深度学习的卷积神经网络(CNN)和循环神经网络(RNN)来进行岬角语义分割。我们还提出了一个交互式注意力模块(IAM),以自适应地融合RGB-D图像中的互补信息。在连续图像中,我们采用由一组双向卷积长短期记忆(ConvLSTMs)组成的时间序列信息处理模块(TPM)来提取相互关联的信息。我们应用图像预处理技术和基于距离的边界点聚类算法于岬角分割掩模,得到农机工作侧的边界线。
2023-02-28 12:09:48
2516
2
原创 [深度学习] 基于切片辅助超推理库SAHI优化小目标识别
AutoDetectionModel类SAHI基于AutoDetectionModel类的from_pretrained函数加载深度学习模型。目前支持YOLOv5 models, MMDetection models, Detectron2 models和HuggingFace object detection models等深度学习模型库,如果想支持新的模型库,可以参考目录下的模型文件,新建模型检测类。模型预测。
2023-01-03 20:33:49
11649
53
原创 [python] 基于paramiko库操作远程服务器
SSHClient实现了OpenSSH中ssh命令所包含的功能,用于远程连接服务器。SFTPClient实现了OpenSSH中sftp命令所包含的功能,用于远程操作文件。Paramiko没有提供scp命令的相关功能,scp和sftp功能类似,都是用于远程操作文件。不同的地方在于scp是轻量级的,scp传输速度通常比sftp快,但是sftp提供了断点续传功能。。
2023-01-01 09:50:54
1843
2
OfficeHome-Art、Clipart、Product部分数据集
2020-11-24
caffe必备文件.zip
2019-08-10
Python编程快速上手附属材料.zip
2019-07-01
使用OpenCV寻找平面图形的质心
2019-03-16
yolov3_OpenImage图像训练教程
2019-03-16
yolov3 opencv教程
2019-03-13
基于特征点匹配的视频稳像
2019-03-08
基于opencv实现透明斗篷
2019-03-06
人脸识别 – OpenCV, Dlib and Deep Learning
2019-03-05
基于深度学习识别人脸性别和年龄
2019-03-04
yuv420p基本图像处理
2018-12-11
TE田纳西-伊斯曼过程数据集
2017-11-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人