应用场景
爬虫过程中,采集的数据常以str或float存入数据库;
- 遇到
含小数点的文本,需要转换成浮点型 xpath()或re.findall()提取信息返回列表,列表可能为空,不便存进数据库。
字符串转浮点型
- float
a = float('-1.21')
print(a)
- numpy
import numpy as np
ls = ['1.2', '3', '-0.5']
array = np.array(ls)
array = array.astype(float)
print(array)
- pandas
import pandas as pd
d = {'num': ['-0.5', '1', '1.2']}
df = pd.DataFrame(d)
num = pd.to_numeric(df['num'])
print(num)
取列表中的元素 并 转字符串
取列表第一个元素

ls1 = []
ls2 = [' a', 'b']
a = ls1[0].strip() if ls1 else ''
print(a)
a = ls2[0].strip() if ls2 else ''
print(a)
取列表全部元素

ls1 = []
ls2 = ['\ta', '\nb\xa0']
a = '|'.join(ls1)
print(a)
a = '|'.join([i.strip() for i in ls2])
print(a)
数据转换与处理技巧

被折叠的 条评论
为什么被折叠?



