企鹅搜索优化算法与NoSQL数据库物理设计策略
1. 企鹅搜索优化算法
在数据科学领域,特征选择是提高机器学习算法性能的关键步骤。企鹅搜索优化算法(Penguin Search Optimization Algorithm)为特征选择提供了一种新的思路。
1.1 算法原理
企鹅搜索优化算法模拟了企鹅寻找食物的过程。在算法中,为每只企鹅预设了相同的氧气值,且在每次迭代开始和结束时保持一致。随着迭代进行,氧气量会按固定值减少,当达到一定时间后,迭代停止,这也可看作是算法达到最优解所需的迭代代数。
1.2 实验设置
实验使用Python语言,借助Anaconda软件和Jupyter Notebook进行实现。运行环境为4GB RAM、Intel i3核心处理器和500GB硬盘内存的计算机。采用了七个来自“UCI Machine Learning Repository”的真实数据集来评估算法效率,这些数据集在特征数量、类别数量和样本数量上具有多样性。具体数据集信息如下表所示:
| 数据集 | 观测数量 | 类别数量 |
| ---- | ---- | ---- |
| Iris | 150 | 3 |
| Glass | 214 | 6 |
| Ion | 351 | 2 |
| Pima | 768 | 2 |
| Vehicle | 846 | 4 |
| Wine | 178 | 3 |
| Wisconsin | 569 | 2 |
1.3 数据集介绍
- Iris数据集
超级会员免费看
订阅专栏 解锁全文
1845

被折叠的 条评论
为什么被折叠?



