- 博客(37)
- 资源 (1)
- 收藏
- 关注
原创 跟着StatQuest学知识08-RNN与LSTM
不使用相同的反馈环连接,通过很久以前的事情和昨天的事情进行预测。当我们循环的次数越来越多的时候,这个巨大的数字会进入某些梯度,当我们循环的次数越来越多的时候,这个非常的数字会进入某些梯度,来对明天预测,一条用于长期记忆,另一条用于短期记忆。为什么通过LSTM能解决梯度爆炸和梯度消失的问题?右边模块:将短期记忆和输入结合(权重×数值),左边模块:确定这个潜在记忆中的权重。,导致寻找最佳参数困难。,导致寻找最佳参数困难。,会出现梯度爆炸问题。,会出现梯度消失问题。
2025-03-29 14:51:47
686
原创 基于OpenCV+MediaPipe手部追踪
开源计算机视觉(Library)图像/视频的(读取、裁剪、滤波、色彩转换等)特征检测(边缘、角点等)摄像头标定、目标跟踪等负责视频流的捕获(图像格式转换(最终结果的渲染显示(cv2.imshow:由Google开发的提供预训练的(如手部关键点、人脸网格、姿态估计等)专注于实时感知任务(低延迟、移动端优化)调用模型实现输出关键点坐标,并通过mpDraw可视化。
2025-03-28 19:55:08
1342
原创 力扣刷题DAY6(滑动窗口/中等+栈/简单、中等)
(用 cnt[c]-- 和 cnt[c]++ 直接调整窗口,避免窗口每次移动都重新统计字符频率。
2025-03-06 15:47:12
467
原创 库学习03-os库(持续更新)
os.walk(source_path) 会生成一个遍历器 walk,它用于循环遍历 source_path 目录及其所有子目录中的所有文件。os.path.join函数是 Python 标准库中 os 模块提供的一个非常有用的函数,用来。它的作用是将多个路径部分拼接成一个完整的路径,且能够根据不同操作系统自动使用正确的路径分隔符。os.walk() 是 Python 的一个标准库函数,用于。它会遍历指定路径(source_path)及其所有子目录,并生成一个包含。
2025-02-14 11:51:28
307
原创 NLP06-Scikit-Learn 机器学习库(鸢尾花为例)
Scikit-Learn(sklearn)是 Python 语言中最流行的机器学习库之一,提供了丰富的工具用于数据预处理、特征工程、模型训练、模型评估以及超参数调优。
2025-02-13 16:58:26
1214
原创 文件管理01-设置项目的目录路径
我们为了方便管理和访问不同的文件或文件夹,通常定义了一些常量,用于设置项目的目录路径。并把这些路径常量单独放在一个文件中,通常是为了保持代码整洁,让路径管理集中,便于维护和修改。比如,如果 constant.py 在 project\module\subfolder,那么 BASE_DIR 就是 project 这个根目录。如果 BASE_DIR 是 C:/project,那么 DATA_DIR 就是 C:/project/data。,它是基于 BASE_DIR 构建的。
2025-02-13 14:50:54
156
原创 新闻标题清洗02-提取标题关键词
提取关键词,返回前topK个关键词return ", ".join(keywords) # 用逗号连接关键词见NLP05-jieba分词将提取出的关键词用逗号(,)连接成一个字符串返回。例如,如果提取出的关键词是 ['自然语言', '处理', '机器学习'],函数将返回 "自然语言, 处理, 机器学习"。
2025-02-13 13:32:37
360
原创 NLP04-朴素贝叶斯问句分类方法(概述)
SQL查询语句:SELECT description FROM movie WHERE movie name ='英雄';例如,用户可以提问“成龙演过哪些电影”“xx电影的评分是多少”等等问题,该系统基于知识库对问句进行分类。使用训练好的朴素贝叶斯模型对新问句进行分类输出问句所属的类别。模型推理是利用己训练好的模型对新数据进行预测或分类的过程。"《英雄》的剧情是什么?"——分类为“电影剧情查询”"——分类为“演员信息查询'”自然语言问句:“《英雄》的剧情是什么?基于知识库的电影问答系统中的。
2025-02-12 16:36:32
192
原创 NLP03-NLP的三个阶段的情感分析案例
例如,如果text = "I love this product",那么text.split()的结果是["I", "love", "this", "product"](3)对于没有出现在词汇表中的词(比如 "terrible"),它会分配一个权重值(通常是 0),因为模型在训练过程中没有见过这个词。(2)对比词汇表,找到 "The", "product", "is", "quality" 等词的 TF-IDF 值。(2)计算各个 特征(单词)在每个类别下的条件概率:即某个单词在某一类别中出现的概率。
2025-02-12 14:10:43
1109
原创 NLP02-NLP的三个发展阶段概述
自然语言处理(NLP)是人工智能的重要分支,涉及计算机对人类语言的理解、生成和应用。在本文中,我们将聚焦于NLP的三个发展阶段,并探讨各阶段的特点和代表性技术。二、基于规则的自然语言处理(rule-basedNLP)。学者利用规则进行机器翻译、情感分析、文本理解和生成的阶段。三、统计自然语言处理(Statistical NLP)统计自然语言处理是基于概率和统计模型的方法,通过从大规模语料库中学习语言规律来完成各种任务。学者利用统计方法进行词性标注、句法分析、机器翻译、文本分类和信息检索等任务。
2025-02-11 20:49:05
260
原创 NLP01-概述+文本预处理
自然语言处理(NLP)是一门研究如何让计算机理解、生成和分析人类语言的学科。自然语言处理(NLP)是语言学、计算机科学、信息工程和人工智能的子领域,它关注计算机和人类(自然)语言的交互,特别是关于如何通过计算机编程来处理和分析大量的自然语言数据。
2025-02-11 20:22:15
383
原创 新闻标题清洗01-爬取新闻标题
因为它只存储数据本身,没有额外的标记或结构;,适合存储表格形式的数据(如新闻标题),每行可以存储一个新闻标题,列可以存储标题的附加信息(如发布时间、来源等)。这是因为服务器返回的 JSON 数据可能是一个嵌套结构,真正的新闻数据可能存储在。:用于发送 HTTP 请求(例如 GET、POST 等),与网站或 API 进行交互,相比于其他格式(如 JSON、XML),CSV 文件的。:用于数据处理和分析,特别适合处理结构化数据(如表格数据)。是字典中的一个键,其值是一个列表,列表中包含多个新闻条目。
2025-02-11 16:48:07
896
原创 库学习02-Pandas库
pandas 是一个功能强大且灵活的 Python 包,可让您处理标记和时间序列数据。它还提供统计方法、绘图等。pandas 的一个重要特性是它能够写入和读取 Excel、CSV 和许多其他类型的文件。read_csv() 方法等函数使您能够有效地处理文件。您可以使用它们将 pandas 对象中的数据和标签保存到文件中,然后将它们加载为 Series 或 DataFrame 实例。
2025-02-11 16:29:47
1106
原创 库学习01-Requests
自定义请求的一种常见方法是通过URL 中的查询字符串GET参数传递值。要执行此操作,您需要将数据传递给get()。例如,您可以使用 GitHub 的存储库搜索params = {"q": "language:python", # 搜索语言为 Python 的仓库"sort": "stars", # 按星标数排序"order": "desc" # 按降序排列for repo in data['items'][:5]: # 获取前 5 个仓库。
2025-02-11 14:16:34
744
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人