- 博客(14)
- 收藏
- 关注
原创 使用python+ BeautifulSoup+selenium爬取百度学术文献的引用
因为课题研究的需要,我需要爬取百度学术文献的引用,这里做一下记录。首先需要安装selenimu和beautifulsoup。这两个我都选择使用pip安装。安装完成后,下载chromedriver,并进行环境配置,这部分网上有教程,我也是根据教程完成的。安装、配置完成后就可以进行爬取了。首先在百度学术首页输入关键词,打开要爬取的页面。我们先来看,如果自己复制粘贴的过程是怎样的,第一步需要点击“&...
2020-03-19 11:30:10
1907
原创 使用TensorFlow实现多层感知机识别手写数字
这个例子仍旧是根据《TensorFlow实战》一书中敲的,使用TensorFlow搭建简单的神经网络,进行手写数字的识别。这个神经网络只有一个隐藏层,隐藏层节点数为300。下面是代码。from tensorflow.examples.tutorials.mnist import input_dataimport tensorflow as tf# 载入数据集,下载到本地更方便使用...
2020-03-02 20:44:10
555
原创 使用TensorFlow实现Softmax Regression识别手写数字
因为新冠病毒疫情,在家学习,没有带回什么书回家。今天在当当上网购的一本书《TensorFlow实战》到了,因为实验要使用BLSTM+CRF,所以先自己进行简单的学习,对照着里面的例子自己敲和理解,这里做一下记录。这个例子使用简单的Softmax Regression进行MNIST手写数字识别。将灰度图片展开为28*28=784的一维向量,识别的结果为0-9共10个结果,所以有10个分类。下面是...
2020-03-02 20:35:18
262
原创 使用BeautifulSoup和requests进行爬虫
因为课题研究需要搜集出版社名称,国外的出版社名称我打算从一个网站上获得。一共有223页,除最后一页外,其他每一页都是有10个出版社名称。Fn+F12,找到出版社名称所在的位置。然后开始进行编程!直接上代码。# coding:utf-8import osimport requestsfrom bs4 import BeautifulSoupdef getinfo(soup...
2020-03-01 18:45:44
303
转载 CRF++里的特征模板
https://blog.youkuaiyun.com/asdfsadfasdfsa/article/details/81073522
2019-09-26 21:44:05
882
原创 Examination of effective features for CRF-based bibliography extraction from reference strings
来源:IEEE 2016 Eleventh International Conference on Digital Information Management (ICDIM)(国际数字信息管理会议)题目:基于crf的参考字串书目抽取有效特征检验摘要:诸如文档的书目信息之类的元数据对于有效使用数字图书馆是必不可少的。 特别是,学术论文的参考领域包含许多书目信息,如作者姓名和文件标...
2019-09-18 20:10:33
205
原创 Machine Learning vs. Rules and Out-of-the-Box vs. Retrained
Machine Learning vs. Rules and Out-of-the-Box vs. Retrained:An Evaluation of Open-Source Bibliographic Referenceand Citation Parsers题目:机器学习与规则和开箱即用与再训练:对开源书目参考和引文解析器的评估摘要书目参考解析是指从书目参考字符串中提取机器可...
2019-09-17 10:07:28
469
原创 CRF++使用教程
论文《Examination of Effective Features for CRF-BasedBibliography Extraction from Reference Strings》中提到使用CRF++ 0.58。所以自己也想试着用一下。这里找到了一个博主的博客,讲解的还挺仔细的。原文链接https://blog.youkuaiyun.com/u010626937/article/deta...
2019-09-03 15:05:41
451
转载 Jupyter Notebook 常用快捷键
https://blog.youkuaiyun.com/qq_39973546/article/details/79777992
2019-06-26 15:37:20
438
转载 python函数——形参中的:*args和**kwargs
转载自https://www.cnblogs.com/xuyuanyuan123/p/6674645.html
2019-03-21 21:03:13
217
原创 使用JavaScript + DTD验证XML格式是否正确
一、DTD: <!ELEMENT NEWSPAPER (ARTICLE+)><!ELEMENT ARTICLE (HEADLINE,BYLINE,LEAD,BODY,NOTES)><!ELEMENT HEADLINE (#PCDATA)><!ELEMENT BYLINE (#PCDATA)><!ELEMENT LEAD (#P...
2019-03-11 19:23:33
1161
1
原创 使用Tensorboard进行可视化
上一篇博客中记录了使用Tensorflow和JupyterNotebook简单搭建一个神经网络,这篇博客在上一篇的基础上进行了修改,使用Tensorboard进行可视化。import numpy as npimport tensorflow as tfimport matplotlib.pyplot as pltdef addlayer(inputs, insize, outsize...
2019-03-06 16:01:59
331
原创 使用Tensorflow + JupyterNotebook构建简单的神经网络
import numpy as npimport tensorflow as tfimport matplotlib as pltdef addlayer(inputs, insize, outsize, activefunction=None): Weight = tf.Variable(tf.random_normal([insize, outsize])) bias...
2019-03-06 15:24:08
2351
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人