查找即将过期的短域名

import os
import re
import urllib

# get page code by url
def getPageCode(url):
	urlItem = urllib.urlopen(url)
	pageCode = urlItem.read()
	urlItem.close()
	return pageCode

# save code
def savePage(filePath, pageCode):
	fileWrite = open(filePath, 'w')
	fileWrite.write(pageCode)
	fileWrite.close()

# analyze damain
def analyzeCode(filePath, rsPath):
	fileRead = open(filePath, 'r')
	fileWrite = open(rsPath, 'w')

	#set the rule
	regex = ur'^[\w]{1,5}\.(com|net|org)$'

	#get each line
	for eachLine in fileRead:
		print eachLine
		if re.match(regex, eachLine):
			fileWrite.write('%s' % eachLine)
	fileWrite.close()
	fileRead.close()

def main():
	url = "http://domain.webmasterhome.cn/tomorrowDel_domain.asp"
	fileDir = "d:/"
	filePath = fileDir + "code.txt"
	rsPath = fileDir + "rs.txt"
	print "The result saved in : " + rsPath + "\n----------------"
	print "1 get code..."
	pageCode = getPageCode(url)
	print "2 save code..."
	savePage(filePath, pageCode)
	print "3 analyze code..."
	analyzeCode(filePath, rsPath)

if __name__ == "__main__":
	main()

今天抽空把找域名的脚本重写了一次,自动联网抓取即将过期的短域名。

如果查找其它日期的短域名,修改url即可。

短域名的定义 可自己修改 24行的正则表达式。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值