- 博客(18)
- 收藏
- 关注

原创 Transformer源码解读
本文将从模型原理及代码实现上讲解Transformer模型,并着重介绍代码实现。需要注意的是,由于 Transformer 源代码使用 TensorFlow 搭建,此处选择了哈佛大学 harvardnlp 团队基于 Pytorch 框架开发的 Annotated Transformer代码进行讲解,以帮助大家了解 Transformer 的实现细节。本文为 DataWhale 开源教程 thorough-pytorch 的一部分。
2023-02-11 22:20:32
1257
2
原创 Leetcode 刷题记录——数组篇
另一个难点在于较复杂规律的模拟,需要重视边界情况,全面细致,更多的是需要耐心的体力活,例如螺旋矩阵一题,找到规律并不困难,但要耐心的模拟其实是一个问题,尤其是如果笔面试碰到这类题目,在时间有限的情况下能否清晰地解出,是一个挑战。如果发现自己看了题解也无法实现代码,就认真阅读题解的代码,并理解代码的逻辑。② 重复刷题:遇见不会的题,多刷几遍,不断加深理解。基本数组操作:访问(1),查找(n),插入(append 1,insert n),改(1),删(pop 无参数 1,pop 有参数 n,remove n)
2023-09-17 15:40:26
241
原创 BERT 论文阅读
本文主要阅读并总结了论文《BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding》,分析了 BERT 的基本原理与架构,同时基于之前解读的一些自然语言处理经典论文,简要分析了 BERT 的思想沿承与开创性意义。
2023-02-12 20:34:14
462
1
原创 Linux 服务器配置selenium 爬虫
在 Linux 服务器运行爬虫有时可以取得奇效,但在 Linux 服务器环境(即无图形化界面)下配置爬虫环境、代理 IP 与常见的 Windows 环境有着较大区别。本文为对在 Linux 服务器上配置 selenium 及 Google Chrome 环境并基于代理 IP 运行爬虫的经历记录,针对一些笔者遇到的坑提供了解决方案,供读者参考。
2023-02-11 21:51:26
4943
原创 《Attention Is All You Need》(Transformer)论文阅读
2017年,Vaswani 等人在 NLP 领域顶级会议上发表了论文《Attention Is All You Need》,提出了 NLP 历史上里程碑的模型——Transformer。Transformer 创造性地抛弃了经典的 CNN、RNN 结构,仅使用 attention 机制和全连接网络搭建,在序列到序列(Seq2Seq)任务上取得了良好效果。自 Transformer 始,attention 机制取代了 RNN 的主流地位。本文阅读并总结了该经典论文,并详细介绍了 Transformer 的原理
2023-01-27 20:34:44
778
1
原创 ELMo论文阅读
本文详细阅读了ELMO论文,并对该模型的特点、模型架构和思路进行了分析,包括其BiLSTM结构特点、模型优势、模型意义以及其背后的重要思想等。
2023-01-14 14:24:51
283
1
原创 Word2Vec原论文阅读
Word2Vec 是自然语言处理、文本表示学习的典型模型,首次提出了 CBOW、Skip-gram 等目前仍在沿用的词向量学习思想。本文主要阅读并总结了 Word2Vec 原始论文《Efficient Estimation of Word Representations in Vector Space》,对该论文及其提出的 Word2Vec 模型基本原理、复杂度计算、多维语义相似度测试标准进行了一个大致介绍。
2022-11-26 21:38:17
2334
1
原创 Pytorch 可视化——Torchinfo以及TensorBoard(服务器使用)
本文章记录了Pytorch的两种可视化方法,分别为Torchinfo和TensorBoard,并分别在服务器进行了对应安装、配置和使用,针对TensorBoard,记录了服务器安装配置全过程,并记录了包括找不到命令、无法导入Mapping等问题的解决方法。
2022-11-24 18:10:55
2840
原创 基于Pytorch的中文情感分析实践
本文为学习 DataWhale 开源教程《深入浅出 Pytorch》第四章所做学习笔记,基于实战教程,实现了使用 LSTM 模型的中文微博情感分析全过程。
2022-11-21 22:30:57
2706
原创 Pytorch 基础组件介绍(Pytorch入门)
介绍了Pytorch的基本组件,包括数据读取、网络构建、损失函数、参数初始化、训练、优化器等各部分内容,参考《深入浅出Pytorch》
2022-11-18 14:34:19
669
原创 Pytorch 基础学习(数据结构、自动求导)
本文为学习 DataWhale 开源教程《深入浅出 Pytorch》第二章、第三章所做学习笔记,仅记录笔者认为价值较高且之前接触较少的知识点
2022-11-15 10:48:40
569
原创 Python动态爬虫爬取京东商品评论
Python 动态爬虫爬取京东商品评论1. 概述京东商城是Python爬虫初学者试手的经典平台,反爬虫程度较低,但评论采取了动态加载的方式,爬取京东商品评论是学习动态爬虫的一个极佳方法。动态爬虫,即针对动态加载JSON文件网页的爬虫,其原理与静态爬虫没有本质区别,只是不爬取所见的静态目标网页,而是寻找该网页所加载的JSON文件,爬取JSON文件中的内容。2.目标观察观察京东具体商品评论页面:点击商品评价页:发现商品评价翻页的url不改变,可推测出其采用动态加载的方式,同时,会发现直接获取该
2021-07-27 14:33:32
4293
2
原创 Python POST 爬虫爬取掘金用户信息
Python POST 爬虫爬取掘金用户信息1. 概述Python第三方库requests提供了两种访问http网页的函数,基于GET方式的get()函数和基于POST方式的post()函数。get函数是最为常用的爬取方式,可以获取静态HTML页面和大部分动态加载json文件,但有一些网站对部分数据文件进行了加密处理,不能使用get来获取到文件内容,此时就需要使用post函数来进行获取。例如本文中所要爬取的掘金网站的用户信息。POST方式与GET方式最主要的区别在于POST在发送请求时会附上一部分参
2021-07-21 13:10:25
2373
原创 Python初级爬虫——爬取UIBE教务处(requests+bs4)
最基础爬虫——Python requests+bs4爬取UIBE教务处1.使用工具1.Python 3.x2.第三方库 requests,bs43.浏览器2.具体思路UIBE教务处网站开放程度较高,无反爬虫措施,只需要使用最基础的爬虫手段即可。使用requests库获取网页源码,使用bs4中BeautifulSoup库进行网页解析,定位到目标元素即可。首先得到教务处网站url为:http://jwc.uibe.edu.cn/导入两个第三方库:import requestsfrom bs
2021-07-21 09:51:20
1095
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人