- 博客(58)
- 收藏
- 关注
原创 《Class label autoencoder for zero-shot learning》阅读笔记
一、解决的问题现有的零样本学习(ZSL)方法通常在训练已知类或测试未知类中学习feature space到semantic embedding space(文本或属性空间)之间的映射关系。但是,由于多语义嵌入空间具有用于描述同一类的不同语义信息的多样性特征,在特征空间和多语义嵌入空间之间不能使用映射函数。我的理解是:在同一类别中,可能存在多个语义描述,即语义描述与类别之间是多对一的关系...
2019-07-16 10:37:26
532
原创 《Integrating Semantic Knowledge to Tackle Zero-shot Text Classification》阅读笔记
一、解决问题1、以前的一些研究使用不同的数据集进行训练和测试,但训练和测试集中的类之间存在相似性;例如,在(Dauphin et al.,2013)中,训练集中的“imdb.com”类与测试集中的“movies”类自然对应。2、针对关于文本分类的ZSL,很少有人研究三类语义知识(semantic attributes、concept ontology、semanticword em...
2019-07-13 17:30:58
945
原创 《Few-Shot and Zero-Shot Learning for Historical Text Normalization》阅读笔记
一、介绍历史文本规范化(Historical text normalization):许多历史文档是在没有标准拼写约定的情况下编写的,并且注释数据集很少且很小,由于历史文本由于拼写演化不同,导致人们不能很好的分辨其具体含义。目标:将使这些文件通过NLP models处理,转换成当今学者们可以查到的,并且外行人士也能看懂的文本。在之前关于这一主题的大量工作之后,我们将自我限制为逐字归一化,忽...
2019-07-09 23:20:56
424
原创 信息安全概述
一、信息1、信息是以信息形态为表现形式,以物理介质为载体,以适合于计算机进行表达、传输、存储或处理的表达形式来表示的知识。 信息形态是指信息的存在形式 物理介质是指信息存储、传输、展示等相关的物理设备。2、信息量3、信息来源:(1)直接信息(2)间接信息(推断法、创新法)4、信息形态:文字、语音、图形、图像5、信息特征:客观性、普遍性、可...
2019-06-20 16:34:04
4213
原创 《Semantic Autoencoder for Zero-Shot learning》阅读笔记
一、介绍由CVPR2017收录。利用语义自编码器实现zero-shot learning的工作,其主要贡献是:(1)提出了一种新的用于zero-shot learning语义自编码模型;(2)提出了模型对应的高效的学习算法;(3)算法具有扩展性,可以用于监督聚类问题(supervised clustering问题)。实验证明,该算法在多个数据集上能取得最好效果。--------...
2019-06-20 10:44:32
1048
7
原创 简单调用sklearn实现K-近邻分类
一、 读取数据使用sklearn自带的鸢尾花数据集from sklearn.datasets import load_iris data = load_iris()二、处理数据对特征进行处理,可添加或去除一定特征,由于是自带的规范数据集,没有进行处理三、分割训练集和测试集一般使用75%作为训练集,25%作为测试集 # 进行数据的分割训练集合测试集...
2019-04-02 16:30:53
542
原创 sklearn调用朴素贝叶斯.predict()报错dimension mismatch
1、报错运行sklearn包中自带的朴素贝叶斯进行预测的时候提示了ValueError:dimensionmismatchdef NaiveBayes(): """ 朴素贝叶斯进行文本分类 :return: None """ news = fetch_20newsgroups(subset='all') print(news.data)...
2019-03-29 16:33:43
7052
2
转载 数据库(四)——MySQL高级
一、视图1. 问题对于复杂的查询,往往是有多个数据表进行关联查询而得到,如果数据库因为需求等原因发生了改变,为了保证查询出来的数据与之前相同,则需要在多个地方进行修改,维护起来非常麻烦解决办法:定义视图2. 视图是什么通俗的讲,视图就是一条SELECT语句执行后返回的结果集。所以我们在创建视图的时候,主要的工作就落在创建这条SQL查询语句上。视图是对若干张基本表的引用,一张...
2019-01-23 11:22:27
338
原创 数据库(三)——MySQL与Python交互
一、准备数据创建数据表-- 创建 "京东" 数据库create database jing_dong charset=utf8;-- 使用 "京东" 数据库use jing_dong;-- 创建一个商品goods数据表create table goods( id int unsigned primary key auto_increment not null, ...
2019-01-22 16:47:49
210
原创 数据库(二)——数据库查询
一、查询创建数据库、数据表-- 创建数据库create database python_test_1 charset=utf8;-- 使用数据库use python_test_1;-- students表create table students( id int unsigned primary key auto_increment not null, n...
2019-01-17 20:00:07
474
原创 数据库(一)——数据库的基本使用
一、RDBMSRelational Database Management System通过表来表示关系型 当前主要使用两种类型的数据库:关系型数据库、非关系型数据库,本部分主要讨论关系型数据库,对于非关系型数据库会在后面学习 所谓的关系型数据库RDBMS,是建立在关系模型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据 查看数据库排名...
2019-01-17 14:57:27
21865
2
转载 python高级(四)——Python高级语法v3.1
一、GIL(全局解释器锁)GIL面试题如下描述Python GIL的概念, 以及它对python多线程的影响?编写一个多线程抓取网页的程序,并阐明多线程抓取程序是否可比单线程性能有提升,并解释原因。Guido的声明:http://www.artima.com/forums/flat.jsp?forum=106&thread=214235he language doesn...
2019-01-05 16:20:08
531
原创 python高级(三)——web服务器v3.1(五)网络通信
一、tcp-ip简介作为新时代标杆的我们,已经离不开手机、离不开网络,对于互联网大家可能耳熟能详,但是计算机网络的出现比互联网要早很多1. 什么是协议有的说英语,有的说中文,有的说德语,说同一种语言的人可以交流,不同的语言之间就不行了为了解决不同种族人之间的语言沟通障碍,现规定国际通用语言是英语,这就是一个规定,这就是协议2. 计算机网络沟通用什么现在的生活中,不同的计算机...
2019-01-03 09:47:30
347
原创 python高级(三)——web服务器v3.1(四)并发web服务器实现
一、多线程、多进程、协程实现并发web服务器(1)多线程import socketimport reimport threadingdef service_client(new_socket): """为这个客户端返回数据""" # 1 接收浏览器发送过来的请求,http请求 # GET/HTTP/1.1 # ... request = ...
2019-01-02 13:04:53
413
1
原创 python高级(三)——web服务器v3.1(三)简单的web服务器实现
一、返回固定页面的http服务器import socketdef service_client(new_socket): """为这个客户端返回数据""" # 1 接收浏览器发送过来的请求,http请求 # GET/HTTP/1.1 # ... request = new_socket.recv(1024) print(request)...
2018-12-25 16:35:07
212
转载 python高级(三)——web服务器v3.1(二)http协议
HTTP协议简介1. 使用谷歌/火狐浏览器分析在Web应用中,服务器把网页传给浏览器,实际上就是把网页的HTML代码发送给浏览器,让浏览器显示出来。而浏览器和服务器之间的传输协议是HTTP,所以: HTML是一种用来定义网页的文本,会HTML,就可以编写网页; HTTP是在网络上传输HTML的协议,用于浏览器和服务器的通信。 Chrome浏览器提供了一套完整地调试工具,...
2018-12-25 15:55:45
340
原创 python高级(三)——web服务器v3.1(一)正则表达式
正则表达式概述思考场景1:在一个文件中,查找出itcast开头的语句场景2:在一个文件中,找到含有itcast的语句场景3:在一个文件中,找到邮箱为163或者126的所有邮件地址re模块操作在Python中需要通过正则表达式对字符串进行匹配的时候,可以使用一个模块,名字为re1. re模块的使用过程 #coding=utf-8 # 导入re模块 ...
2018-12-17 13:58:08
279
原创 python高级(二)——多任务(三)协程(3)图片下载器
import urllib.requestimport geventfrom gevent import monkeymonkey.patch_all()def downloader(img_name, img_url): req = urllib.request.urlopen(img_url) img_content = req.read() with...
2018-12-17 13:29:55
212
原创 python高级(二)——多任务(三)协程(2)
协程协程,又称微线程,纤程。英文名Coroutine。协程是啥协程是python个中另外一种实现多任务的方式,只不过比线程更小占用更小执行单元(理解为需要的资源)。 为啥说它是一个执行单元,因为它自带CPU上下文。这样只要在合适的时机, 我们可以把一个协程 切换到另一个协程。 只要这个过程中保存或恢复 CPU上下文那么程序还是可以运行的。通俗的理解:在一个线程中的某个函数,可以在任...
2018-12-17 13:27:18
158
原创 python高级(二)——多任务(三)协程(1)迭代器、生成器
迭代器迭代是访问集合元素的一种方式。迭代器是一个可以记住遍历的位置的对象。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。1. 可迭代对象我们已经知道可以对list、tuple、str等类型的数据使用for...in...的循环语法从其中依次拿到数据进行使用,我们把这样的过程称为遍历,也叫迭代。但是,是否所有的数据类型都可以放到for....
2018-12-16 16:30:19
141
原创 python高级(二)——多任务(二)进程(2)文件夹拷贝器
import osimport multiprocessingdef copy_file(q, file_name, old_folder_name, new_folder_name): """完成文件复制""" old_f = open(old_folder_name + "/" + file_name) content = old_f.read() o...
2018-12-13 21:26:47
145
原创 python高级(二)——多任务(二)进程(1)
进程以及状态1. 进程程序:例如xxx.py这是程序,是一个静态的进程:一个程序运行起来后,代码+用到的资源 称之为进程,它是操作系统分配资源的基本单元。不仅可以通过线程完成多任务,进程也是可以的2. 进程的状态工作中,任务数往往大于cpu的核数,即一定有一些任务正在执行,而另外一些任务在等待cpu进行执行,因此导致了有了不同的状态 就绪态:运行的条件都已经慢去...
2018-12-13 21:24:48
171
原创 python高级(二)——多任务(一)线程(2)多线程UDP聊天器
import socketimport threadingdef recv_msg(udp_socket): # 接收数据 while True: recv_data = udp_socket.recvfrom(1024) print(recv_data)def send_msg(udp_socket, dest_ip, dest_p...
2018-12-07 10:47:28
240
2
原创 python高级(二)——多任务(一)线程(1)
多任务并发:指的是任务数多余cpu核数,通过操作系统的各种任务调度算法,实现用多个任务“一起”执行(实际上总有一些任务不在执行,因为切换任务的速度相当快,看上去一起执行而已)(假的多任务) 并行:指的是任务数小于等于cpu核数,即任务真的是一起执行的(真的多任务)一、线程python的threa...
2018-12-06 18:26:58
272
原创 python高级(一)——网络编程Socket(2)文件下载案例
1、服务器import socketdef send_file_2_client(new_client_socket, client_addr): # 1 接收客户端,需要下载的文件名 # 接收客户端发送来的请求 file_name = new_client_socket.recv(1024).decode("utf-8") print("%s 下载文件...
2018-12-05 21:09:23
240
原创 python高级(一)——网络编程Socket(1)
一、UDP1. 创建socket在 Python 中 使用socket 模块的函数 socket 就可以完成:import socketsocket.socket(AddressFamily, Type)说明:函数 socket.socket 创建一个 socket,该函数带有两个参数:Address Family:可以选择 AF_INET(用于 Internet 进...
2018-11-30 17:11:22
254
转载 IP地址分类
每一个IP地址包括两部分:网络地址和主机地址3.1 A类IP地址一个A类IP地址由1字节的网络地址和3字节主机地址组成,网络地址的最高位必须是“0”,地址范围1.0.0.1-126.255.255.254二进制表示为:00000001 00000000 00000000 00000001 - 01111110 11111111 11111111 11111110可用的...
2018-11-30 14:33:54
172
原创 python学习之飞机大战
class PlaneGame(object): ''' 飞机大战主游戏 ''' def __init__(self): print("chushihua") # (1)设置游戏窗口 self.screen = pygame.display.set_mode(SCREEN_RECT.size) # (2)创建游戏...
2018-11-30 13:59:50
365
转载 Linux学习(七)——vi编辑器
vi —— 终端中的编辑器目标 01. vi 简介1.1 学习 vi 的目的 在工作中,要对 服务器 上的文件进行 简单 的修改,可以使用 ssh 远程登录到服务器上,并且使用 vi 进行快速的编辑即可 常见需要修改的文件包括: 源程序 配置文件,例如 ssh 的配置文件 ~/.ssh/config 在没有图形界...
2018-11-25 18:52:26
189
转载 Linux学习(六)——其他命令
其他命令目标查找文件 find 软链接 ln 打包和压缩 tar 软件安装 apt-get 01. 查找文件find 命令功能非常强大,通常用来在 特定的目录下 搜索 符合条件的文件序号 命令 作用 01 find [路径] -name "*.py" 查找指定路径下扩展名是 .py 的文件,包括子目录 如果省略路径,表示在...
2018-11-25 18:26:47
115
转载 Linux学习(五)——系统信息相关命令
系统信息相关命令本节内容主要是为了方便通过远程终端维护服务器时,查看服务器上当前 系统日期和时间 / 磁盘空间占用情况 / 程序执行情况 本小结学习的终端命令基本都是查询命令,通过这些命令对系统资源的使用情况有个了解目标时间和日期 date cal 磁盘和目录空间 df du 进程信息 ps top kill 01. 时间和日期序号 命令...
2018-11-25 18:16:20
120
转载 Linux学习(四)——用户权限相关命令
用户权限相关命令01. 用户 和 权限 的基本概念1.1 基本概念用户 是 Linux 系统工作中重要的一环,用户管理包括 用户 与 组 管理 在 Linux 系统中,不论是由本机或是远程登录系统,每个系统都必须拥有一个账号,并且对于不同的系统资源拥有不同的使用权限 在 Linux 中,可以指定 每一个用户 针对 不同的文件或者目录 的 不同权限 对 文件/目录 的权限包括:序...
2018-11-22 22:06:12
150
转载 Linux学习(三)——常用的远程管理命令
远程管理常用命令目标关机/重启 shutdown 查看或配置网卡信息 ifconfig ping 远程登录和复制文件 ssh scp 01. 关机/重启序号 命令 对应英文 作用 01 shutdown 选项 时间 shutdown 关机/重新启动 1.1 shutdownshutdown 命令可以 安全 关...
2018-11-22 21:18:14
176
转载 Linux学习(二)——常用文件管理命令
一. 常用 Linux 命令的基本使用序号 命令 对应英文 作用 01 ls list 查看当前文件夹下的内容 02 pwd print wrok directory 查看当前所在文件夹 03 cd [目录名] change directory 切换文件夹 04 touch [文件名] touc...
2018-11-22 20:31:26
158
转载 Linux学习(一)——Linux 主要目录速查表
Linux 主要目录速查表/:根目录,一般根目录下只存放目录,在 linux 下有且只有一个根目录,所有的东西都是从这里开始 当在终端里输入 /home,其实是在告诉电脑,先从 /(根目录)开始,再进入到 home 目录 /bin、/usr/bin:可执行二进制文件的目录,如常用的命令 ls、tar、mv、cat 等 /boot:放置 linux 系统启动时用到的一些文件,如 li...
2018-11-22 20:26:48
158
原创 python学习(十七)——补充内置函数、使用迭代器协议实现斐波那契数列、描述符、pycharm的问题
一、补充内置函数#--------------------------isinstance/isinbclass--------------class Foo: passclass Bar(Foo): passb1=Bar()print(isinstance(b1,Bar)) # b1是否是Bar类print(isinbclass(Bar,Foo)) # Ba...
2018-10-30 16:10:59
311
原创 python学习(十六)——多态、封装、反射、、动态导入模块、类内置attr方法
一、多态# 不同的实例调用同样的方法,产生不同的结果# 多态来自继承class H2O: def __init__(self,name,temperature): self.name=name self.temperature=temperature def turn_ice(self): if self.temperatu...
2018-10-19 18:49:12
269
原创 python学习(十五)——静态、组合、继承
一、静态1、静态属性-就是数据属性# 跟实例绑定,可以访问实例属性也可以访问类属性class Room: def __init__(self,name,owner,width,length,heigh): tag = 1 self.name=name self.owner=owner self.width=widt...
2018-10-17 20:06:09
296
原创 python学习(十四)——面向对象
一、面向对象1、三种编程风格(1)面向过程编程(2)函数式编程(3)面向对象便编程2、类:把一类事物的相同特征和动作整合到一起3、对象:基于类而创建的一个具体的事物,也就是特征和动作整合到一起def school(name,addr,type): def init(name, addr, type): sch = { '...
2018-10-16 15:54:57
146
原创 python学习(十三)——模块time、random、os、sys、json、re
一、概念模块1、三种类型:(1)python标准库(2)第三方模块(3)自定义模块2、导入(1)import: 1)执行;2)调用(2)from __ import * (不推荐)(3)执行对应文件 __init__.py包调用要到模块,才能用(1)__name__:名称,路径(2)if __name = ...
2018-10-13 14:30:08
648
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人