UML工具
1,开源的最好是StarUML,但是代码反向工程不好。
2,MagicUMLDraw是商业版本,功能很强大。
学习了数据挖掘的范围内容
数据挖掘技术:
1,引导理论性知识。
2,商务应用方面的数据挖掘。
3,在技术上:侧重统计学习,侧重机器学习,侧重模式识别。
4,特定领域上:Web数据挖掘,文献汇编,数据可视化,科学与工程,分布式数据挖掘,生物信息学,并行数据挖掘。
主要会议:
ACM SIGKDD知识发现与数据挖掘国际会议(KDD)。
IEEE数据挖掘国际会议(ICDM)
SIAM数据挖掘国际会议(SDM).
欧洲数据库中知识发现的原理与实践会议(PKDD)。
亚太知识发现与数据挖掘会议(PAKDD)。
数据挖掘的文章也可以在其他主要会议上找到。
主要期刊:
《IEEE知识与数据工程汇刊》
《数据挖掘与知识发现》 Data Mining and Knowledge Discovery
《知识与信息系统》Knowledge and Information Systems
《智能数据分析》Intelligent Data Analysis
数据挖掘注意的内容:
1,数据挖掘与统计学的区别和注意事项。
2,数据挖掘在流数据挖掘应用。
Mini high-speed data stream(分类)
Next Generation Data Mining(关联)
Clustering Data Stream(聚类)
Detecting Change in Data Stream(变化检测)
Linux的配置方式调查
1,互联网上的内容都是2.4的内容,没有全面的说明。
2,有些内容介绍。说这些内容可以配置。但是没有进行测试。
3,我记得有Linux配置文档。但是忘记在那里了。(难道在百度PPT)
4,优化配置参数有,说明是真实存在的。
最大文件数设置通过limit
硬件:
最大磁盘性能检测(sar性能检测,systap性能检测)
磁盘的性能指标主要是IOPS,提高IOPS主要指标是RAID技术。
I/O的wait参数不应该超过25%,(机器有4个CPU)
IOPS的计算公式:
(磁盘数*每块磁盘的IOPS)/(磁盘读的吞吐量+RAID因子x磁盘写的吞吐量)
http://futureinhands.iteye.com/blog/1474056
RAID1(1+0):因子是2。RAID5或者3:因子是4,RADI6:因子是6
FileChannel和NIO。
Socket NIO
主要是SelectKeys的选择。
第二个是ByteBuffer分配。ByteBuffer由两类构成。一类是JavaHeap,另外一类是DirectByteBuffer。
JavaHeap是需要用户地址空间和操作系统内核空间拷贝(HeapByteBuffer)
另外一类DirectByteBuffer,是直接内存访问。但是每次gc的时候会被收走。当传输大数据量的时候使用。
FileChannel.transferXXX,主要是文件读写提速的方法,直接从高速缓存=》用户应用缓存=》高速缓存。
FileChannel.map,主要是文件内存映射,将map数据直接映射到程序里面。用户MD5计算。
实验了Aspose的类库word
产生的word和html真的很不错,兼容性达到了99%。推荐使用。
多线程和NIO的学习
看了博客:http://lavasoft.blog.51cto.com/62575/222742
全面的复习了多线程的基础知识。
对我来说,主要变动是FOrk-JOin,锁的多样性,同部署数组和阻塞队列是以前没有关注的。
NIO主要是Socket的Select,File的FileChannel,缓存的Buffer。
http://ifeve.com/java-nio-vs-io/
BASE,CAP
C一致性,A高可用,P分片。