如何识别网页中的地址信息
1、可以考虑使用状态机的识别办法。下表是一个状态转换表。可以识别大多数的地址。如果要识别更多的情况,可以丰富这个表格。
2、使用状态机可以找到一段话中地址的结束位置。
根据状态图的方法判断路的信息是否是正确。
市|县|区|镇|环路|段|路|街|道|巷|胡同|号|楼
1市
|
3,4,5,6,7,8,9,10,11,12
|
2县
|
3,4
|
3区
|
4,5,7,8,9,10,11,12,14
|
4镇
|
7,8,10,11,12
|
5环路
|
6
|
6段
|
7,13,8,21
|
7路
|
13,14,6,10,21
|
8街
|
13,14,21
|
9街道
|
13,14
|
10巷
|
13,14
|
11胡同
|
13,14
|