- 博客(15)
- 收藏
- 关注
原创 2021-06-15
python绘制词云图1 环境准备2 数据准备3 代码实现1 环境准备import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom PIL import Image,ImageSequencefrom wordcloud import WordCloud,ImageColorGenerator2 数据准备数据为csv格式。nameval词1词频1词2词频2词3词频3
2021-06-15 10:53:49
234
原创 刘二大人-视频课程第四讲-反向传播
back propagation 反向传播第一层第二层课后作业1、推导线性模型y=w*x,损失函数loss=(ŷ-y)²下,当数据集x=2,y=4的时候,反向传播的过程2、推导线性模型 y=w*x+b,损失函数loss=(ŷ-y)²下,当数据集x=1,y=2的时候,反向传播的过程3、画出二次模型y=w1x²+w2x+b,损失函数loss=(ŷ-y)²的计算图,并且手动推导反向传播,用pytorch实现第一层第二层为了避免能够展开合并,需要加入非线性函数链式求导:计算过程第四讲代码
2021-04-20 11:40:18
484
1
原创 SQL入门day5
SQL入门1 where 过滤根据需要过滤数据过滤-模糊查询and 和 or 配合使用两个短杠是SQL里面的注释1 where 过滤根据需要过滤数据过滤-模糊查询%可以表示0-多个字符,_只能表示一个字符如果查询的结果里面本身就包含%,需要使用转义字符进行转义。通配符尽量不要放在开头。and 和 or 配合使用...
2021-04-11 10:37:07
191
原创 SQL入门-第1-3天
SQL入门-第1-3天1整体语句概览select语句演示在表格中加入一列四则运算2 展示结果3 结果排序order by用法;默认升序降序对最靠近的列名有用想要学习数据分析,第一步,熟悉SQL操作,重拾这些知识。截图来自b站视频1整体语句概览select语句演示在表格中加入一列语句用法四则运算2 展示结果3 结果排序order by用法;默认升序汉字转为gbk,才能按照拼音顺序升序。降序对最靠近的列名有用...
2021-04-11 00:41:36
70
原创 效率提升三倍的论文阅读方法
效率提升三倍的论文阅读方法1 为什么要读论文?2 读哪些论文?3 如何找论文不知道论文题目知道论文题目4 如何整理论文少量论文大量论文5 如何读论文泛读精读总结6 paper学习路径资料截图均整理自b站视频1 为什么要读论文?2 读哪些论文?3 如何找论文不知道论文题目需要怎么找论文呢?知道论文题目想要下载论文,可以通过sci-hub(下图).4 如何整理论文少量论文大量论文5 如何读论文三步,泛读-精读-总结泛读精读总结6 paper学习
2021-04-06 00:54:15
119
原创 爬虫笔记第3章
本文为系列笔记s2,希望督促自己坚持下来学习。新来的小伙伴去看s1:先看爬虫系列笔记s1哦视频第3章关于数据解析,也是爬虫的重中之重。爬虫开发-数据解析1 正则表达式需求:爬取糗事百科热图页面,保存到指定文件夹学到逐步分析页面结构和新建文件夹#!/usr/bin/env python# -*- coding: utf-8 -*-import reimport osimport requestsif __name__ == '__main__': headers = {
2021-03-31 15:26:20
330
原创 如何在CNKI中只检索C刊?
在CNKI中只检索C刊1、进入CNKI的链接首页点击下图“学术期刊”2、点击高级检索。3、勾选需要的数据来源。over is Over——Lee
2021-03-30 19:46:54
26429
原创 爬虫笔记第1、2章
爬虫笔记第1、2章第1章 爬虫开发-爬虫基础简介https加密算法第2章 爬虫开发-requests模块学习requests案例实战1 需求:爬取搜狗指定词条对应的搜索结果页面(简易网页采集器)2 需求:破解百度翻译3 爬取豆瓣电影分类排行榜中的电影详情数据4 爬取肯德基餐厅查询中指定地点的餐厅数据5 爬取国家药品监督管理总局中基于中华人民共和国化妆品生产许可证相关数据最近在学python爬虫,虽然之前断断续续学了几次,但老是坚持不下来,目前参考b站的一个视频课程,感觉讲的还不错,既有理论又有实践。链接
2021-03-29 23:54:17
456
原创 绘制作者共现和关键词共现图教学
需要的作者共现、关键词共现次数使用到的工具包括python和gephi注意:gephi的安装需要java支持。1、数据准备在对某领域的学术论文进行描述性统计时,最常需要的是统计关键词/作者出现次数/发文数,关键词/作者共现次数。数据处理方法->: 词频统计和共现分析代码见以上的链接,本节展示处理前后的结果。1.1 作者词频如上图所示,列表中一列数据为作者,每篇文章一行,一个单元格包括该文全部作者,且用英文分号隔开。运行代码之后,生成表格,手工降序排列即可。1.2 作者共现该链接
2021-03-25 16:38:13
6555
3
原创 如何得到网络图的中介中心性
1 需要将所有的主题词放在表格里如下图import xlrdimport itertoolsdata = xlrd.open_workbook("上图的表格名.xlsx")sheet_1_by_index=data.sheet_by_index(0) n_of_rows=sheet_1_by_index.nrows f1 = open(r'单词配对.txt','w',encoding = 'utf-8')for i in range(0,n_of_rows): danci = she
2021-03-21 12:56:50
932
原创 如何去做词频统计和关键词共现分析
1 对关键词的词频进行统计下面展示一些 内联代码片。# encoding=utf-8import openpyxlwb = openpyxl.Workbook()wb = openpyxl.load_workbook('copy1.xlsx') # Excel名sh = wb['all'] # sheet名'''换一种写法sheet=wb.get_sheet_by_name(xl_sheet_names[0]) # 序号
2021-03-19 00:35:58
7356
3
原创 常用python tips
python常用查操作格式化输出字符串转为集合类型排序函数正则表达式统计表格中内容出现的次数格式化输出字符串print('i am {0}, my age is {1}'.format('Tom',18))i am Tom, my age is 18转为集合类型a = [1,2,4,2,1]set(a) # result: {1,2,4}排序函数a = [1,4,2,3,1]sorted(a, reverse = Ture) # result: [4,3,2,1,1]正则
2021-03-13 21:51:00
160
原创 记录数据处理的步骤
对数据库导出的数据进行处理1、合并csv文件2、合并Excel文件3、合并txt文件1、合并csv文件前提是所有的csv表头一致# -*- coding: utf-8 -*-import unicodecsvimport pandas as pdimport osFolder_Path = r'path1' #要拼接的文件夹及其完整路径,注意不要包含中文SaveFile_Path = r'path2' #拼接后要保存的文件路径SaveFile_Name = r'name.csv' #合
2021-03-13 20:57:20
301
原创 记录LDA的操作流程
记录LDA的操作流程第一步获取论文摘要数据第二步删除无效数据第三步-nltk第四步 使用gensim中的LDA模型4.1 对文本进行处理,去除太高频和低频的词条4.2 加载数据第一步获取论文摘要数据可以通过CNKI、WOS、scopus等数据库获得文献题录数据第二步删除无效数据主要包括:1、删除缺失摘要的文献,2、统计国家信息,3、描述性统计等。第三步-nltk下面展示具体一些 代码片。import nltk #导入nltk包from nltk.stem import WordNetL
2021-03-11 16:47:07
1632
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人