淘宝搜索部门要求

http://wenku.baidu.com/link?url=uss2TRNGBKnu_0NJdhDiTfci6oRHlmFq3xjNU6_FKQUXGuC4V-J9qFsmJVjdHQkzsPxdz0jMET7oTFYYskSlRoeuR_VsC0Q64eh0IxXf0F_




淘宝搜索

Java Job Model

技能面试

 

姓名:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

面试职位:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

面试时间:

 

 

 

 

 

 

 

 

 

 

 

 

 

类别

 

要点

 

程度

 

Java 

基础:

传值与传引用

, hashCode&equals, foreach&iterator,

浅拷贝

&

深拷贝

类构造顺序

序列化

反射

注解

枚举

异常

, IO, Collection&Array, NIO&JUC 

 

集合:

Arrays, Collections, ArrayList, LinkedList, HashSet, LinkedHashSet,TreeSet, HashMap, 

LinkedHashMap, TreeMap, HashTable, WeakHashMap, Vector, Stack, Queue 

 

字符串:

String, StringBuffer, StringBuilder 

 

泛型:泛型接口和方法

擦除

协变

逆变

无界通配符

 

 

内部类:私有类

嵌套类

局部类

匿名类

闭包和回调

多继承

 

 

Thread, 

Runnable, 

Synchorinzed, 

wait, 

notify, 

sleep, 

Lock, 

ThreadLocal, 

CopyOnWriteArrayList, 

BlockingQueue, 

ConcurrentMap, 

SynchronousQueue, 

Semaphore 

CountDownLatch, Executor, ExecutorService, ScheduledExecutorServices, Task, Feture 

 

Classloader

:装载

链接

校验

准备

解析

初始化

; bootstrap, extension, system 

 

GC

原理与策略:

Young GC(Serial,ParNew, PS), Full GC(Serial, P MSC, PC, CMS); OutOfMemory 

 

JVM

原理和调优:

Xms, 

Xmx, 

Xmn, 

SurvivorRatio, 

PermSize, 

MaxPermSize, 

PrintGCDetails, 

 

PrintGCDateStamps, 

DisableExplicitGC, 

UseConcMarkSweepGC, 

UseCompressedOops, 

UseCMSCompactAtFullCollection, AggressiveOpts 

 

性能监控:

Jconsole/VisualVM/jps/jstat/jstack/jmap/jhat/jmeter; OutOfMemory 

 

Java 

Web 

MVC, 

分层思想

, DNS, HTTP

, Cookie, Mail, FTP, Proxy

等协议

 

 

Java Servlet API, Velocity/JSP

等模板引擎

, JSF, JSTL, Tag 

 

主流

Web

开发框架:

Spring, Struts, JSF

 

 

Web

服务器部署和配置:

Apache, Tomcat, JBoss, Jetty

 

 

客户端代码:

HTML/CSS/JS, JS

框架

闭包

跨域

兼容性

正则

 

 

单点登录

, session

同步

基于角色的权限控制

, Spring Security 

 

Linux 

ls, pwd, cd, mkdir, cat, head, more, less, cp, mv, rm, rmdir, chmod, chown, chgrp, diff, wc, scp, 

split, tail, touch, find, grep, sort, uniq, tar, df, du, ps, top, kill, crontab, who, passwd, su, sudo, 

time, date, man, export, ifconfig, netstat, curl, wget 

 

Linux

文件系统

文件安全与权限

目录配置管理

 

 

shell

基础语法:管道符

顺序、分支、循环

参数如何传递

 

Script 

Perl, PHP, Ruby, Python, Groovy, JavaScript

等脚本

 

 

数据

 

 

JDBC, O/R Mapping, DAO, iBatis, Hibernate

 

 

Ibatis

:批量

存储过程

动态

sql, N+1

问题(

groupBy, RowHandler

, Cache

模型

 

 

Oracle, Mysql, Sql

语言

, sql

调优

 

 

Mysql

:鉴权

数据复制

, sql

优化

分表分区

 

 

搜索

 

系统

 

对搜索系统索引(倒排索引)

,

文档

,

引擎

算法的理解

开源

luncene 

 

准确性

,

召回率

,

实时性的保证

禁词

同义词

直达

分词

热门类目

智能导航

 

实时索引

索引字段

内存文档调度

内存

/

硬盘缓存调度

排序逻辑

引擎集群

 

 

性能

 

优化

 

Java

:对象空间

优化循环

局部

&

静态变量

同步

减少

IO, 

连接池

静态化

缓存

 

 

client

:页面缓存

,minfile, 

禁用特性

加载策略

, Quickling, PageCache, BigPipe 

 

类别

 

要点

 

程度

 

海量

 

服务

 

ajax, 

pagecache, 

squid, 

balanced, 

picserver, 

staticserver, 

search, 

luncene, 

webservice, 

mina,netty, memcache, datacache, connpool, dbindex, tables Zoning,

 

datacut 

 

实战

 

能力

 

一个项目或产品研发的过程中

最让你感到郁闷的事情是什么

 

 

如何保障系统代码的质量

高质量编码:单元测试

集成测试

代码重构

 

 

千万级数据量的电子商务或搜房网

, PV

为千万级别

怎样设计

用到的技术

 

 

高性能

高并发

高可用(容灾)分布式系统设计

 

 

网络

 

安全

 

网络安全知识:

DDOS, Firewall, HTTPS, 

数字签名等

 

 

常见

Web

安全问题解决方案:

XSS, CSRF 

 

OOP 

单一职责

SRP

:一个类

只能有一个引起它变化的原因

 

 

开放封闭

OCP

:软件实体应该是可以扩展的

但是不可以修改的

 

 

里氏替换

LSP

:子类型必须能够替换基类

 

 

依赖倒置

DIP

:抽象不依赖于细节

细节依赖于抽象

 

 

接口隔离

ISP

:不强迫客户依赖它们不用的接口

 

 

 

重构的时机

粒度与方法

 

 

单例

策略

模版方法

迭代器

工厂方法

抽象工厂

组合

装饰者

适配器

外观

命令

桥接

 

 

设计

 

分层的应用框架设计思想:

SOA, 

事件驱动等

 

 

分布式系统原理:

CAP, 

最终一致性

幂等操作等

 

 

大型网络应用结构:反向代理

消息中间件

缓存

负载均衡

集群技术

数据同步

, CDN 

 

高可用

可容灾分布式系统设计能力

 

 

大容量数据存储和检索系统设计能力:数据库分区

, NoSQL, 

搜索引擎等

 

 

开发

 

工具

 

编辑工具:

Eclipse, NetBeans, Vim 

 

代码管理:

SVN, Maven, Ant 

 

调试测速:

Firebug, YSlow, PageSpeed 

 

知识

 

技术

 

在研技术:

 

技术强项:

 

新技术了解:

 

评语

 

工作

 

 

 

 

 

 

 

主要从事

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

开发

总体评估:

 

优点:

 

 

 

 

缺点:

 

 

 

 

结论:

 

 

面试人


根据原作 https://pan.quark.cn/s/459657bcfd45 的源码改编 Classic-ML-Methods-Algo 引言 建立这个项目,是为了梳理和总结传统机器学习(Machine Learning)方法(methods)或者算法(algo),和各位同仁相互学习交流. 现在的深度学习本质上来自于传统的神经网络模型,很大程度上是传统机器学习的延续,同时也在不少时候需要结合传统方法来实现. 任何机器学习方法基本的流程结构都是通用的;使用的评价方法也基本通用;使用的一些数学知识也是通用的. 本文在梳理传统机器学习方法算法的同时也会顺便补充这些流程,数学上的知识以供参考. 机器学习 机器学习是人工智能(Artificial Intelligence)的一个分支,也是实现人工智能最重要的手段.区别于传统的基于规则(rule-based)的算法,机器学习可以从数据中获取知识,从而实现规定的任务[Ian Goodfellow and Yoshua Bengio and Aaron Courville的Deep Learning].这些知识可以分为四种: 总结(summarization) 预测(prediction) 估计(estimation) 假想验证(hypothesis testing) 机器学习主要关心的是预测[Varian在Big Data : New Tricks for Econometrics],预测的可以是连续性的输出变量,分类,聚类或者物品之间的有趣关联. 机器学习分类 根据数据配置(setting,是否有标签,可以是连续的也可以是离散的)和任务目标,我们可以将机器学习方法分为四种: 无监督(unsupervised) 训练数据没有给定...
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值