- 博客(2)
- 收藏
- 关注
原创 在bert的基础模型上训练自己的数据(只是过程源码解析后面更新)
1.第一步 从github上下载bert的源码链接,并且下载BERT模型链接 2.第二步 准备数据中文数据样式如图所示: (每一句话一行) 3.第三步 使用bert/create_pretraining_data.py来做数据的预处理 主要是修改改文件的FLAGS.参数即可 4.第四步 运行bert/run_pretraining.py 同样只要修改FLAGS.参数 即可 到这就可以了 ...
2020-06-19 15:32:24
4781
4
原创 模拟浏览器爬虫
模拟流浪器爬取近义词,并通过BeautifulSoup 和正则将近义词解析出来 import urllib.parse import urllib.request from bs4 import BeautifulSoup as bs url = 'http://jinyici.xpcha.com/' user_agent = 'Mozilla/5.0 (Windows NT 6.1; WOW64...
2019-05-21 11:33:49
768
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人