- 博客(12)
- 收藏
- 关注
原创 今天七夕有感而发:用梯度下降和损失函数趣说爱情
我穿过空间想要遇见你,就像梯度下降只垂直于每条等高线用平行线之间垂线段最小的原理想要找到你虽然我知道两点之间线段最短,但是我在去寻找你的路上沟壑纵横而且荆棘密布,我无法一步到位遇见你,我在垂直于每条等高线的之间义无反顾一步跨越,可当我穿梭一条一条等高线,离你越来越近时,有种叫学习率的天意不断让我与你擦肩而过 ...
2019-08-08 00:59:06
201
原创 智能阅读模型的构建(第六届泰迪杯C题)
项目描述:构建智能阅读模型主要通过两个方法来实现,第一个是TF-IDF的变种——TFC-ICF,TFC-ICF较于TF-IDF是将一个问题的所有答案看成一个整体,类比于TF-IDF文本分类的文件夹,问题的每一个回答类比于TF-IDF的文件夹里的每个文档。TFC是每个词所在句子的频率,叫类词频,ICF类比于逆文本率,叫倒类频率。作为衡量每个词在所有句子中的一个重要程度。利用sklearn里面的t...
2018-08-07 10:39:45
2300
原创 自然语言处理
就是对龙王传说这本小,查找关键字,并且按照,权重的大小排序# coding: utf-8# In[1]:import jsonimport jiebaimport pandas as pdimport osimport codecsimport sysimport refrom sklearn.feature_extraction.text import CountVect...
2018-07-10 12:27:51
405
原创 大三上数据挖掘,银行客户流失预警
项目描述:首先用Excel对数据进行预处理,将英文字符替换成数字,对无关信息列删除,然后在Notekbook里面用pandas读取数据,数据格式和excel 是一样的。将前36列作为自变量想,37列的是否流失作为因变量y,并把原始数据按4:1分成训练集和测试集,再从sklearn.linear_model导入LogisticRegression模型,然后用fit(x,y)方法来拟合。用lr.s...
2018-07-10 12:02:59
3831
2
原创 大二用sas做的项目
项目描述:前期是将91份研究生调查问卷的信息录入到Excel表格中,每个问卷有35个选择题,在Excel表格里整理成91行35列的形式。然后将表格导入到SAS软件进行数据预处理,将选项答案的ABCD转化成1234,将缺失值找出,并重新赋值。然后通过单因素方差分析将性别与上网时间、遵守道德、是否有瘾;专业类别与解决学习问题;上网玩游戏时间比例与居住地;游戏类型与网络言论等等。将这些关系依次计算频...
2018-07-10 11:01:08
2834
1
原创 我的python爬虫处子秀
项目描述:在 pycharm 下写一个 python 脚本,通过 requests.get()请求服务器,time.sleep()设置间隔访问时间,以防止返爬取机制。然后通过BeautifulSoup 对服务器返回的网页信息进行解析。接着查看网页源代码,找出所要爬取一类信息的所有相同标题并通过 select()方法选择出来。select()返回的是一个列表。设置一个 zip 函数,将...
2018-07-10 10:38:55
281
原创 在同一个局域网和在不同的局域网,电脑之间的网络通讯原理
硬件网卡:是用来让计算机与计算机自检沟通的,是让计算机来连接网络的1.应用程序产生数据,在应用程序那一层,有一个应用程序的首部加一个用户数据封装成一个包。2.然后传给传输层,传输层是端口对端口的,点对点的的形式,在传输层以原端口目标端口和应用数据的封装。3.往下就是网络层,网络层就是在头部加一个ip 的首部,再将上一层的封装放在数据部就完成了在网络层的封装。4再往下就是在有以太网的那一层,在上一...
2018-04-23 15:07:47
16244
1
原创 百度深度学习公开课观后感
今天参加一个比赛,无意间进了这个直播,看完之后,还是颇有感触的。1.首先就是范向伟的人工智能工程师的职业规划,说现在中国的城市化,工业化都发展到了一个比较完善的程度,这方面的发展都快到达顶点,但是软件it这个行业在过去30年这个行业的产值都是呈现指数增长的,并且在未来几十年还会成倍成倍地往上翻,举个例子:以前发明一辆电动车需要运用到软件的地方不到百分之十,但是现在或者之后做出一辆电动车,百分之五十...
2018-04-21 16:26:35
1604
原创 从底层了解程序在算机的硬盘,内存,cpu中的运行过程
第一点:只要是数据(文字,视频,文件等等只要在电脑上)都是以二进制像01011这样存储的,硬盘二进制,内存二进制,cpu里面但二进制。是通过显示器显示出来是一种形象生动的形式。第二点:任何编程语言都是用来指令计算机来做事的,是和计算机沟通的语言,就像人与人之间沟通一样。第三点:计算机的的硬盘是以磁的性质来存储数据的,所以断电之后数据还会保存,永久存储下来。但是内存和cpu里面的寄存器都是用电来存储...
2018-04-21 16:25:31
3393
转载 python面试常问的基础知识
类继承 方法对象 new和initpython list和dict全局和局部变量交换两个变量的值默认方法包管理闭包性能 1、类继承有如下的一段代码:class A(object): def show(self): print 'base show'class B(A): def show(self): print 'derived show'obj = B...
2018-03-12 08:49:01
544
装anaconda遇到的错误以及解决方法的记录
jupyter kernel error 首先使用jupyter kernelspec list查看安装的内核和位置进入安装内核目录打开kernel.jason文件(要带开界面的查看文件拓展名,直接双击打开就行),查看Python编译器的路径是否正确如果不正确python -m ipykernel install --user重新安装内核,如果有多个内核,如果你使用conda create -n ...
2018-03-11 23:01:54
2550
1
原创 这是一个新的开始 复习python的基础知识 fighting!
由于受伤的原因 我在上大学前就喜欢的技术内容被耽搁了好久 现在我就要 重新捡拾起来 先从 python的基础知识开始内容如下:# -*- coding: utf-8 -*-"""Spyder EditorThis is a temporary script file."""fruits = ['pin apple','lemon','strawberry','orange','kiwi']frui...
2018-03-05 12:26:12
273
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人