【实例简介】
终于重构好代码了,使用模式:模板模式、策略模式、建造者模式、单一职责,弄一个余弦定理、simhash文本查重代码,并使用二叉排序树和平衡二叉树(待测试)来优化查询。百万数据查重秒查
【实例截图】
【核心代码】
wgh-similar-02
└── wgh-similar
├── pom.xml
├── src
│ ├── main
│ │ └── java
│ │ └── cn
│ │ └── wgh
│ │ └── similar
│ │ ├── Similar.java
│ │ ├── cosine
│ │ │ └── Cosine.java
│ │ └── simhash
│ │ ├── AbstractSimHash.java
│ │ ├── HelpUtils.java
│ │ ├── SegmentationSimHash.java
│ │ ├── SimHash.java
│ │ ├── SimpleSimHash.java
│ │ ├── helper
│ │ │ └── bt
│ │ │ └── BTreeHelper.java
│ │ └── support
│ │ ├── AbstractNode.java
│ │ ├── AbstractNodeBuilder.java
│ │ ├── BuilderAdapter.java
│ │ ├── NodeBuilder.java
│ │ ├── NodeBuilderAdapter.java
│ │ ├── bbt
│ │ │ ├── BTreeHighType.java
│ │ │ ├── BTreeUnbalanceType.java
│ │ │ ├── BalanceBinaryTree.java
│ │ │ └── BalanceBinaryTreeBulder.java
│ │ ├── bst
│ │ │ ├── BinarySortTree.java
│ │ │ └── BinarySortTreeBulder.java
│ │ └── bt
│ │ ├── AbstractBTree.java
│ │ ├── BTree.java
│ │ ├── BTreeBulder.java
│ │ └── BTreeNode.java
│ └── test
│ └── java
│ └── cn
│ └── wgh
│ └── similar
│ ├── KdBTreeTest.java
│ └── SimHashTest.java
└── target
└── classes
└── META-INF
├── MANIFEST.MF
└── maven
└── cn.wgh
└── wgh-similar
├── pom.properties
└── pom.xml
26 directories, 29 files