python 字典排序<转>

本文介绍如何使用Python对字典和包含字典的列表进行排序,包括升序和降序操作,并提供了使用operator模块及lambda表达式的示例。
  1. #-*- encoding=utf-8 -*-  
  2.   
  3. import operator  
  4. #按字典值排序(默认为升序)  
  5. x = {1:23:44:32:10:0}  
  6. sorted_x = sorted(x.iteritems(), key=operator.itemgetter(1))  
  7. print sorted_x  
  8. #[(0, 0), (2, 1), (1, 2), (4, 3), (3, 4)]  
  9. #如果要降序排序,可以指定reverse=True  
  10. sorted_x = sorted(x.iteritems(), key=operator.itemgetter(1), reverse=True)  
  11. print sorted_x  
  12. #[(3, 4), (4, 3), (1, 2), (2, 1), (0, 0)]  
  13. #或者直接使用list的reverse方法将sorted_x顺序反转  
  14. #sorted_x.reverse()  
  15.   
  16. #取代方法是,用lambda表达式  
  17. sorted_x = sorted(x.iteritems(), key=lambda x : x[1])  
  18. print sorted_x  
  19. #[(0, 0), (2, 1), (1, 2), (4, 3), (3, 4)]  
  20. sorted_x = sorted(x.iteritems(), key=lambda x : x[1], reverse=True)  
  21. print sorted_x  
  22. #[(3, 4), (4, 3), (1, 2), (2, 1), (0, 0)]  
  23.   
  24. #包含字典dict的列表list的排序方法与dict的排序类似,如下:  
  25. x = [{'name':'Homer''age':39}, {'name':'Bart''age':10}]  
  26. sorted_x = sorted(x, key=operator.itemgetter('name'))  
  27. print sorted_x  
  28. #[{'age': 10, 'name': 'Bart'}, {'age': 39, 'name': 'Homer'}]  
  29. sorted_x = sorted(x, key=operator.itemgetter('name'), reverse=True)  
  30. print sorted_x  
  31. #[{'age': 39, 'name': 'Homer'}, {'age': 10, 'name': 'Bart'}]  
  32. sorted_x = sorted(x, key=lambda x : x['name'])  
  33. print sorted_x  
  34. #[{'age': 10, 'name': 'Bart'}, {'age': 39, 'name': 'Homer'}]  
  35. sorted_x = sorted(x, key=lambda x : x['name'], reverse=True)  
  36. print sorted_x  
  37. #[{'age': 39, 'name': 'Homer'}, {'age': 10, 'name': 'Bart'}]  
要从 HTML 表格中提取各列数据并分别存储,可以使用 Python 中的 `BeautifulSoup` 和 `pandas` 库来实现。以下是实现该功能的详细步骤和代码示例。 ### 提取 HTML 表格数据 首先,使用 `BeautifulSoup` 解析 HTML 内容,并提取表格中的数据。以下代码展示了如何获取表格的所有行和列,并将它们存储为字典形式的数据结构。 ```python from bs4 import BeautifulSoup import pandas as pd # 假设 html_content 是包含表格的 HTML 字符串 html_content = """ <table> <thead> <tr> <th>姓名</th> <th>年龄</th> <th>城市</th> </tr> </thead> <tbody> <tr> <td>张三</td> <td>25</td> <td>北京</td> </tr> <tr> <td>李四</td> <td>30</td> <td>上海</td> </tr> </tbody> </table> """ # 使用 BeautifulSoup 解析 HTML soup = BeautifulSoup(html_content, 'html.parser') table = soup.find('table') # 获取表头 headers = [header.get_text(strip=True) for header in table.find_all('th')] rows = [] # 遍历表格行 for row in table.find_all('tr'): cells = row.find_all(['td', 'th']) if len(cells) > 0: rows.append([cell.get_text(strip=True) for cell in cells]) # 将数据换为 pandas DataFrame df = pd.DataFrame(rows, columns=headers) # 输出 DataFrame print(df) ``` ### 存储各列数据 将提取到的数据换为 `pandas.DataFrame` 后,可以轻松地将各列数据分别存储为不同的文件或数据结构。例如,可以将每一列保存为单独的 CSV 文件。 ```python # 遍历 DataFrame 的每一列,并分别保存为 CSV 文件 for column in df.columns: df[[column]].to_csv(f'{column}.csv', index=False) ``` ### 进一步处理 如果需要对数据进行更复杂的处理,例如数据清洗、格式换或分析,可以使用 `pandas` 提供的丰富功能。例如,可以对数据进行排序、过滤或聚合操作。 ```python # 对“年龄”列进行排序 df_sorted = df.sort_values(by='年龄', ascending=False) print(df_sorted) # 对“年龄”列进行统计分析 print(df['年龄'].describe()) ``` ### 总结 通过使用 `BeautifulSoup` 和 `pandas`,可以轻松地从 HTML 表格中提取数据,并将各列数据分别存储为文件或进一步处理。这种方法不仅适用于简单的表格数据提取,还可以扩展到复杂的数据处理和分析任务中[^2]。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值