如何识别网页中的地址信息
1、可以考虑使用状态机的识别办法。下表是一个状态转换表。可以识别大多数的地址。如果要识别更多的情况,可以丰富这个表格。
2、使用状态机可以找到一段话中地址的结束位置。
根据状态图的方法判断路的信息是否是正确。
市|县|区|镇|环路|段|路|街|道|巷|胡同|号|楼
1市 3,4,5,6,7,8,9,10,11,12 2县 3,4 3区 4,5,7,8,9,10,11,12,14 4镇 7,8,10,11,12 5环路 6 6段 7,13,8,21 7路 13,14,6,10,21 8街 13,14,21 9街道 13,14 10巷 13,14 11胡同 13,14