自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(56)
  • 收藏
  • 关注

周志华机器学习笔记(一)

2 模型评估与选择2.2 评估方法2.2.1留出法留出法直接将数据集D划分为两个互斥的集合,其中一个集合作为训练集S,另一个作为测试集T。在S上训练出模型后,用T来评估其测试误差,作为对泛化误差的估计。注意:训练/测试集的划分尽可能保持数据分布的一致性,避免因数据划分过程引入额外的偏差而对最终结果产生影响。常见做法是将大约2/3~4/5的样本用于训练,剩余样本用于测试2.2.2...

2019-04-27 17:30:18 2038

翻译 吴恩达机器学习(五)

13.聚类13.1无监督学习在一个典型的监督学习中,我们有一个有标签的训练集,我们的目标是找到能够区分正样本和负样本的决策边界,我们需要拟合一个假设函数。在非监督学习中,我们的数据没有附带任何标签,我们需要找到数据的内在结构。13.2 k-均值算法k-均值是最普及的聚类算法,算法接受一个未标记的数据集,然后将数据聚类成不同的组。K-均值是一个迭代算法,假设我们想要将数据聚类成n...

2019-04-24 15:33:58 315

翻译 吴恩达机器学习(四)

12,支持向量机12.1优化目标到目前为止,你已经见过一系列不同的学习算法。在监督学习中,许多学习算法的性能都非常相似,因此,重要的不是你该选择A算法还是B算法,而更重要的是,应用这些算法时,所创建的大量数据在应用这些算法时,表现情况通常依赖于你的水平。比如:你为学习算法所设计的特征量的选择,以及如何选择正则化参数,,,还有一个更加强大的算法广泛的应用于工业界和学术界,它被称为支持向量机(...

2019-04-21 18:01:41 423

翻译 吴恩达机器学习(三)

10、应用机器学习的建议10.1 决定下一步做什么重点关注:假如你在开发一个机器学习系统,或者想试着改进一个机器学习系统的性能,你应该如何决定接下来走哪条路?获得更多的训练实例——通常是有效的,但是代价很大,下面的方法可也能有效,可考虑先下面的几种方法:1.尝试减少特征的数量2.尝试获得更多的特征3.尝试增加多项式特征4.尝试减少正则化程度

2019-04-19 18:03:27 422

翻译 吴恩达机器学习(二)

7.正则化7.1 过拟合的问题当把学习算法应用到某些特定的机器学习应用时,会遇到过拟合(over-fitting)的问题,导致它们效果很差。以及我们会谈论一种正则化(regularization)的技术,它可以改善或者减少过拟合问题。第三个模型是一个四次方的模型,过于强调拟合原始数据,而丢失了算法的本质;预测新数据。在分类问题中也存在这样的问题:就以多项式理解,x次数越...

2019-04-16 18:04:56 356

原创 吴恩达机器学习笔记(一)

1 介绍1.2 机器学习是什么?Tom定义的机器学习:一个程序被认为能从经验E中学习,解决任务T,达到性能度量值P,当且仅当,有了经验E后,经过P评判,程序在处理T时的性能有所提升。在目前存在的几种不同类型的学习算法中,主要的两种类型被我们称之为监督学习和无监督学习。监督学习:我们将教计算机如何去完成任务无监督学习:我们打算让计算机自己学习。1.3监督学习eg:房价问题...

2019-04-05 08:30:03 443 1

翻译 计算机系统漫游

操作系统管理硬件文件是对I/O设备的抽象表示,虚拟内存是对主存和磁盘I/O设备的抽象表示,进程则是对处理器、主存和I/O设备的抽象表示1.进程从一个进程到另一个进程的转换是由操作系统内核(kernel)管理的。内核是操作系统代码常驻主存的部分。当应用程序需要操作系统的某些操作时,比如读写文件,它就执行一条特殊的系统调用指令,将控制权传递给内核,然后内核执行被请求的操作并返回应用...

2019-02-01 21:47:45 163

翻译 Linux.Part3

硬件,内核与shell只要能够操作应用程序的接口都能称为shell。侠义的shell指的是命令行方面的软件,包括bash。广义的shell则包括图像界面的软件,因为图形界面其实也能够操作各种应用程序来调用内核工作。常用命令type:查看这个命令是来自于外部命令或是内置在bashecho:显示变量(变量之前加上“$")或者是${变量}export:若该变量需要在其他子进程执行...

2019-02-01 21:47:15 177

翻译 shell script

执行现有程序文件名是/A/B/shell.sh~直接命令执行:绝对路径:/A/B/shell.sh执行相对路径:假设工作目录在/A/B/,./shell.sh来执行~以bash进程来执行:bash shell.sh 或 sh shell.sh编写#!/bin/bash#Program:# this is test#History:# 2019/1/...

2019-02-01 21:46:52 229

翻译 《Python核心编程》多线程编程

线程和Python全局解释锁Python代码的执行是由Python虚拟机进行控制的。Python在设计时是这样考虑的,在主循环中同时只能有一个控制线程在执行,就像单核CPU系统中的多线程一样。内存中可以有许多程序,但是在任意给定时刻只能有一个程序在运行。同理,尽管Python解释器中可以运行多个线程,但是在任意给定时刻只有一个线程会被解释器执行。对Python虚拟机的访问是由全局解释锁...

2019-01-23 17:21:40 231

翻译 《Python核心编程》网络编程(一)

基本概念套接字:通信端点套接字是计算机网络数据结构,任何类型的通信开始之前,网络应用程序必须创建套接字,可以将它们比作电话插孔,没有他将无法通信。套接字地址:主机-端口对有效端口号范围为0~65535(尽管小于1024的端口号预留给了系统)面向连接的套接字与无法连接的套接字1.面向连接的套接字面向连接的,意味着在进行通信之前必须先建立一个连接,例如,使用电话系统给一...

2019-01-23 10:52:16 228

翻译 Scrapy框架(四):Item Pipeline的用法

当Spider解析完Response之后,Item就会传递到Item Pipeline,被定义的Item Pipeline组件会顺次调用,完成一连串的处理过程。1.核心方法process_item(item,spider)这个是必须要实现的方法,被定义的Item Pipeline会默认调用这个方法对Item进行处理。open_spider(spider)这个方法是在Spider...

2019-01-18 14:38:02 340

翻译 Scrapy框架(三):Spider Middleware的用法

Spider Middleware是介入到Scrapy的Spider处理机制的钩子框架。当Downloader生成Response之后,Response会被发送到Spider,在发送给Spider之前,Response会首先经过Spider Middleware处理,当Spider处理生成Item和Request之后,Item和Request还会经过Spider Middleware的处理...

2019-01-18 14:37:22 1311

翻译 Scrapy框架(二):Downloader Middleware的用法

Downloader Middleware即下载中间件,它是处于Scrapy的Request和Response之间的处理模块。Scheduler从队列中拿出一个Request发送给Downloader执行下载,这个过程会经过Downloader Middleware的处理。另外,当Downloader将Request下载完成得到Response返回给Spider时会再次经过Download...

2019-01-18 14:36:58 365

翻译 Scrapy框架(一):基本结构

一、安装相应的库二、创建项目scrapy startproject tutorial我们会得到一个叫tutorial的文件夹,文件夹结构如下:三、创建Spidercd tutorialscrapy genspider quotes quotes.toscrape.com执行genspider命令。第一个参数是Spider的名称,第二个参数是网站域名。执行结...

2019-01-18 14:36:26 1442

翻译 C Primer Plus笔记

整数和浮点数的存储结构按计算机的储存方式可以分为两大基本基类:整数类型和浮点数类型位,字节,字 最小的存储单元是位,可以存储0,1.位是计算机内存的基本构建快 字节(byte)是常用的计算机存储单位。1字节8位 字(word)是设计计算机时给定的自然存储单位,对于8位的微型计算机,1个字长只有8位。计算机的字长越大,其数据转移越快,允许的内存访问也更多。 ...

2019-01-03 10:05:06 206

翻译 pyquery

一、初始化字符串初始化#像Beautiful Soup 一样,初始化pyquery 的时候,也需要传入HTML 文本来初始化一个PyQue1y对象。#字符串初始化html='''<div><ul><li class="item-0">first item</li><li class="item-1">&

2018-12-31 12:56:49 177

翻译 解析库的使用XPath&Beau Soup

XPath导入 from lxml import etree 修正HTML文本 etree.tostring(html) 修正编码 tostring返回bytes类型,利用decode转成str 所有节点 html.xpath('//*') 子节点 选择li 节点的所有直接a子节点, html.xpath('//li/a') 父节点...

2018-12-31 11:37:30 261

翻译 基本库的使用——urllib&requests

一、request模块HTTP请求模块,可以用来模拟发送请求。urlopen() 实现最基本请求的发起 Request类 可以设置data,headers,method等 Opener Opener可以使用open()方法,返回类型和urlopen差不多, 利用Handler来构建 二、error模块异常处理模块URLError...

2018-12-30 16:04:06 182

翻译 CSS选择器

id 选择器id 选择器可以选择为标有特定id的HTML元素指定特定的样式,以“#”来定义(id属性只能在每个HTML文档中出现一次)类选择器类选择器以一个点号显示.center {text-align: center}所有拥有center类的HTML元素均为居中用作派生选择器.fancy td { color: #f60; background: #666...

2018-12-30 15:05:12 177

翻译 请求和响应的格式

 Name:请求的名称,一般会将URL 的最后一部分内容当作名称。Status:响应的状态码,这里显示为200 ,代表响应是正常的。Type:请求的文梢类型。这里为document ,代表我们这次请求的是一个HTML 文档,内容就是一些HTML 代码。Initiator:请求源。用来标记请求是由哪个对象或进程发起的。Size:从服务器下载的文件和请求的资源大小。如果是从缓存中取...

2018-12-17 10:39:30 702

翻译 python笔记(四)

__name__属性一个模块被另一个程序第一次引入时,其主程序将运行。如果我们想在模块被引入时,模块中的某一个程序块不执行,我们可以用__name__属性来使该程序块仅在该模块自身运行时执行说明:每个模块都有一个__name__属性,当其值时‘__main__'时,表明该模块自身在运行,否则是被引入。dir()函数,可以找到模块内定义的所有名称。以一个字符串的形式返回:生成器...

2018-12-16 10:43:07 168

翻译 python笔记(三)

Part6:面向对象一个典型的类的定义:class Student: def __init__(self,name,score): #构造方法第一个参数必须为self self.name = name #实例属性 self.score = score def say_score(self): #实例方法 print(sel...

2018-12-11 15:31:33 262

翻译 python笔记(二)

Part5:函数用法和底层分析格式:要点:(1)Python执行def时,会创建一个函数对象,并绑定到函数名变量上。(2)形式参数不需要声明类型,也不需要指定函数返回值类型内存底层分析:实际上,执行def 定义函数后,系统就创建了相应的函数对象。我们执行如下程序,然后进行解释: def print_star(n): '''根据传入的n,打印多个星号'''...

2018-12-11 11:19:04 233 1

翻译 python笔记(一)

对象Python中,一切皆对象。每个对象由:标识(identify),类型(type),value(值)组成。1.标识用于唯一标识对象,通常对应于对象在计算机内存中的地址。使用内置函数id(obj)可返回对象obj的标识2.类型用于表示对象存储的“数据”的类型。类型可以限制对象的取值范围以及可执行的操作。可以使用type(obj)获得对象的所属信息3.值表示对象所存储的数据的信息。...

2018-12-10 11:05:10 219

原创 web基础

浏览器和服务器之间的交互:交互模式是:请求-响应。 客户端先发出请求,服务器根据请求内容发送响应内容。客户端根据响应内容进行显示。请求与响应的格式:客户端发出请求的格式首先服务器的地址、端口、资源地址。 请求行 请求头 请求实体注:客户端向服务器传参,如果将参数放到请求行,即为get方式!如果将参数放到请求实体中,即为post方式!服务器受到请求内容后发送响应内容状态...

2018-12-10 11:04:45 133

翻译 JVM运行和类加载全过程

类加载全过程- 类加载机制   JVM把class文件加载到内存,并对数据进行校验、解析和初始化,最终形成JVM可以直接使用的Java类型过程。- 加载   将class文件字节码内容加载到内存中,并将这些静态数据转换成方法区中的运行时数据结构,在堆中生成一个代表这个类的Java.lang,Class对象,作为方法区类数据的访问入口。这个过程需要类加载器参与。 - 链接...

2018-12-10 11:03:42 166

转载 脚本引擎执行Javascript和字节码操作

脚本引擎介绍:- 使得Java应用程序可以通过一套固定的接口与各种脚本引擎交互,从而达到在Java平台上调用各种脚本语言的目的。- Java脚本API是连通Java平台和脚本语言的桥梁- 可以把一些复杂变异的业务逻辑交给脚本语言处理,这又大大提高了开发效率Java脚本API为开发者提供了如下功能:- 获取脚本程序输入,通过脚本引擎运行脚本并返回运行结果,这是最核心的接口。-...

2018-12-10 11:02:56 704

翻译 HQL语句

select 语句1.以Object[]形式返回选择的属性select子句中未指定返回数据类型,默认为Object[]HQL的select查询语句中,如果指定了多个查询字段,则返回的是一个Object[]数组;如果只指定了一个查询字段,则返回的是一个Object对象。public void testSelect(){ String hql="select s.nam...

2018-12-10 11:02:19 139

翻译 Java爬虫练习(二)

1.定义一个对象package Zhihu;import java.text.SimpleDateFormat;import java.util.ArrayList;import java.util.Arrays;import java.util.regex.Matcher;import java.util.regex.Pattern;public class Zhihu {...

2018-12-04 14:16:54 184

翻译 java爬虫练习(一)

1.定义一个对象存储抓取到的结果 package Zhihu;import java.util.ArrayList;import java.util.Arrays;public class Zhihu { public String question; //问题 public String zhihuUrl; //网页链接 public ArrayLis...

2018-12-04 10:07:42 227

翻译 爬虫基础

1.什么是爬虫互联网就是一张大网,爬虫遇到资源,就会抓取,取什么,有你来控制它2 浏览网页的过程在用户浏览网页的过程,就是用户输入网址之后,经过DNS服务器,找到服务器主机,向服务器发出一个请求,服务器经过解析之后,发送给用户的浏览器HTML,CSS等文件,浏览器解析出来,用户便可以看到网页内容了。用户看到的网页实质是由HTML代码构成的,爬虫爬来的便是这些内容,通过分析和过来这些...

2018-12-04 10:02:46 167

翻译 正则表达式及在Java程序中的使用

《语法》1.普通字符2.简单的转义字符\n 代表换行符 \t 制表符 \\ 代表\本身 \^ , \$ , \. , \( , \) 匹配这些字符本身 3.标准字符集合:- 能够与“多种字符”匹配的表达式- 注意区分大小写,大写是相反的意思\d 任意一个数字,0~9中的任意一个 \w 任意一个字母或数字或下划线,也就是...

2018-12-03 16:45:54 279

翻译 Maven使用笔记

(一)文件结构:src -main -java -package -test -java -package resources(二)helloworld案例step1:在main的Java文件夹下建包,并创建类:package com.imooc.maven01.model;...

2018-11-15 14:21:39 167

翻译 动态编译

动态编译应用场景:- 可以做一个浏览器端编写Java代码,上传服务器编译和运行的在线测评系统。- 服务器动态加载某些类文件进行编译两种做法:- 通过Runtime调用javac,启动新的进程去操作Runtime run = Runtime.getRuntime();Process process = run.exec("javac -cp d:/java/ hi.jav...

2018-11-13 15:56:53 127

翻译 反射机制详解

反射机制的常见作用- 动态加载类、动态获取类的信息(属性、方法、构造器)- 动态构造对象- 动态调用类和对象的任意方法、构造器- 动态调用和处理属性- 获取泛型信息- 处理注解package reflection;import java.lang.reflect.Constructor;import java.lang.reflect.Field;import...

2018-11-13 10:55:44 197

翻译 web基础知识和服务器的开发

web基础知识浏览器和服务器之间的交互:交互模式是:请求-响应。 客户端先发出请求,服务器根据请求内容发送响应内容。客户端根据响应内容进行显示。请求与响应的格式:客户端发出请求的格式首先服务器的地址、端口、资源地址。 请求行 请求头 请求实体注:客户端向服务器传参,如果将参数放到请求行,即为get方式!如果将参数放到请求实体中,即为post方式!服务器受到请求内容后发...

2018-11-13 09:33:42 385

翻译 JAVA动态性之:反射机制reflection

JAVA不是动态语言,但是可以利用反射机制、字节码操作获得类似动态语言的特性。反射机制 reflection反射机制:- 指的是可以于运行时加载、探知、使用编译期间完全未知的类- 程序在运行状态中,可以动态加载一个只有名称的类,对于任意一个已加载的类,都能够指导这个类的所有属性和方法;对于任意一个对象,都能够调用它的任意一个方法和属性;Class c = Class.forNa...

2018-11-13 09:31:16 263

翻译 Annotation注解

注解入门Annotation作用:①对程序做出解释(和注释相同)②可以被其他程序读取(注解信息处理流程)Annotation的格式:@注释名,还可以添加一些参数值,eg:@SuppressWarnings(value="unchecked".Annotation在哪里使用:可以附加在package,class,method,field等上面,相当于给它们添加了额外的辅助...

2018-11-12 15:59:45 175

原创 Re:参数传值机制&super关键字&封装细节

参数传值机制Java中,方法中所有参数都是”值传递“,也就是”传递的是值的副本“基本数据类型:传递的是值的副本引用类型参数的传递:副本和原参都指向了同一个地址,若改变所指向的地址的内容,对象也会发生变化。/** * 测试参数传值机制 * @author 高淇 * */public class User4 { int id; //id Str...

2018-11-08 14:13:13 210

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除