htmlPretty.py
from BeautifulSoup import BeautifulSoup
import os, sys
if len(sys.argv) ==2:
f1 = sys.argv[1]
else:
print 'usage: htmlPretty.py file1.htm '
sys.exit(1)
if not os.path.exists(f1):
print 'ERROR: %s not found\n' % f1
sys.exit(1)
fp = open(f1, 'r')
soup = BeautifulSoup(fp, fromEncoding='utf-8') # or cp936
fp.close()
f2 = f1 +'l'
fp = open(f2, 'w')
fp.write(soup.prettify('utf-8'))
fp.close()
print f2
本文介绍了一个简单的Python脚本,用于将HTML文件格式化为更易读的形式。通过使用BeautifulSoup库解析输入文件,然后输出格式化的HTML到新的文件中。
1086

被折叠的 条评论
为什么被折叠?



