自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 使用python+ BeautifulSoup+selenium爬取百度学术文献的引用

因为课题研究的需要,我需要爬取百度学术文献的引用,这里做一下记录。首先需要安装selenimu和beautifulsoup。这两个我都选择使用pip安装。安装完成后,下载chromedriver,并进行环境配置,这部分网上有教程,我也是根据教程完成的。安装、配置完成后就可以进行爬取了。首先在百度学术首页输入关键词,打开要爬取的页面。我们先来看,如果自己复制粘贴的过程是怎样的,第一步需要点击“&...

2020-03-19 11:30:10 1907

原创 使用TensorFlow实现多层感知机识别手写数字

这个例子仍旧是根据《TensorFlow实战》一书中敲的,使用TensorFlow搭建简单的神经网络,进行手写数字的识别。这个神经网络只有一个隐藏层,隐藏层节点数为300。下面是代码。from tensorflow.examples.tutorials.mnist import input_dataimport tensorflow as tf# 载入数据集,下载到本地更方便使用...

2020-03-02 20:44:10 555

原创 使用TensorFlow实现Softmax Regression识别手写数字

因为新冠病毒疫情,在家学习,没有带回什么书回家。今天在当当上网购的一本书《TensorFlow实战》到了,因为实验要使用BLSTM+CRF,所以先自己进行简单的学习,对照着里面的例子自己敲和理解,这里做一下记录。这个例子使用简单的Softmax Regression进行MNIST手写数字识别。将灰度图片展开为28*28=784的一维向量,识别的结果为0-9共10个结果,所以有10个分类。下面是...

2020-03-02 20:35:18 262

原创 使用BeautifulSoup和requests进行爬虫

因为课题研究需要搜集出版社名称,国外的出版社名称我打算从一个网站上获得。一共有223页,除最后一页外,其他每一页都是有10个出版社名称。Fn+F12,找到出版社名称所在的位置。然后开始进行编程!直接上代码。# coding:utf-8import osimport requestsfrom bs4 import BeautifulSoupdef getinfo(soup...

2020-03-01 18:45:44 303

转载 使用CRF++实现命名实体识别(NER)

https://segmentfault.com/a/1190000019038740

2019-09-27 13:45:42 362

转载 CRF++里的特征模板

https://blog.youkuaiyun.com/asdfsadfasdfsa/article/details/81073522

2019-09-26 21:44:05 882

原创 Examination of effective features for CRF-based bibliography extraction from reference strings

来源:IEEE 2016 Eleventh International Conference on Digital Information Management (ICDIM)(国际数字信息管理会议)题目:基于crf的参考字串书目抽取有效特征检验摘要:诸如文档的书目信息之类的元数据对于有效使用数字图书馆是必不可少的。 特别是,学术论文的参考领域包含许多书目信息,如作者姓名和文件标...

2019-09-18 20:10:33 205

原创 Machine Learning vs. Rules and Out-of-the-Box vs. Retrained

Machine Learning vs. Rules and Out-of-the-Box vs. Retrained:An Evaluation of Open-Source Bibliographic Referenceand Citation Parsers题目:机器学习与规则和开箱即用与再训练:对开源书目参考和引文解析器的评估摘要书目参考解析是指从书目参考字符串中提取机器可...

2019-09-17 10:07:28 469

原创 CRF++使用教程

论文《Examination of Effective Features for CRF-BasedBibliography Extraction from Reference Strings》中提到使用CRF++ 0.58。所以自己也想试着用一下。这里找到了一个博主的博客,讲解的还挺仔细的。原文链接https://blog.youkuaiyun.com/u010626937/article/deta...

2019-09-03 15:05:41 451

转载 Jupyter Notebook 常用快捷键

https://blog.youkuaiyun.com/qq_39973546/article/details/79777992

2019-06-26 15:37:20 438

转载 python函数——形参中的:*args和**kwargs

转载自https://www.cnblogs.com/xuyuanyuan123/p/6674645.html

2019-03-21 21:03:13 217

原创 使用JavaScript + DTD验证XML格式是否正确

一、DTD: <!ELEMENT NEWSPAPER (ARTICLE+)><!ELEMENT ARTICLE (HEADLINE,BYLINE,LEAD,BODY,NOTES)><!ELEMENT HEADLINE (#PCDATA)><!ELEMENT BYLINE (#PCDATA)><!ELEMENT LEAD (#P...

2019-03-11 19:23:33 1161 1

原创 使用Tensorboard进行可视化

上一篇博客中记录了使用Tensorflow和JupyterNotebook简单搭建一个神经网络,这篇博客在上一篇的基础上进行了修改,使用Tensorboard进行可视化。import numpy as npimport tensorflow as tfimport matplotlib.pyplot as pltdef addlayer(inputs, insize, outsize...

2019-03-06 16:01:59 331

原创 使用Tensorflow + JupyterNotebook构建简单的神经网络

import numpy as npimport tensorflow as tfimport matplotlib as pltdef addlayer(inputs, insize, outsize, activefunction=None): Weight = tf.Variable(tf.random_normal([insize, outsize])) bias...

2019-03-06 15:24:08 2351 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除