数据处理与社交网络情报收集指南
1. 文本分解与批量请求
在数据处理中,将长文本列表分解为诗节是一项常见任务。另一种分解长文本列表为诗节的方法是使用生成器函数,该函数会缓冲每个诗节。以下是具体的实现代码:
def split_stanzas_2(response):
stanza = []
for line in response:
if len(line) == 0:
if stanza: yield stanza
stanza = []
else:
stanza.append(line)
if stanza: yield stanza
此函数的工作流程如下:
1. 初始化一个空列表 stanza
,用于累积诗节的行。
2. 遍历 response
对象中的每一行。
3. 若遇到空行,且 stanza
列表不为空,则生成完整的诗节,并将 stanza
重置为空列表。
4. 若为非空行,则将其添加到当前诗节中。
5. 遍历结束后,若 stanza
列表不为空,则生成最后一个诗节。
此外,对 get_whois()
函数进行两个小调整,就可以获取多个 IP 地址的信息,而不仅仅是单个地址。具体调整如下: