Python3玩转儿 机器学习(1)

Python3玩转儿 机器学习(1)

机器学习的基础概念

数据

  • 著名的鸢尾花数据 https://en.wikipedia.org/wiki/lris_flower_data_set

lris setossa    lris versicolor    lris verginica

          lris setossa                                    lris versicolor                                         lris verginica

 

下面是鸢尾花的数据:

 

  • 数据整体叫数据集(data set)
  • 每一行数据称为一个样本(sample)
  • 除最后一列,每一列表达样本的一个特征(feature)
  • 最后一列,称为标记(label)

第i个样本行写作 ,也叫特征向量。第i个样本第j个特征值 第i个样本的标记写作

为了可视化特征方便,我们只抽取出特征中的前两个特征,其中萼片的长度作为横轴,萼片的宽度作为纵轴。

绘制下图:

对于每一个样本来说都会在坐标系中表示一个点,假设我们有三个特征,就可以在三维空间中表示它,同理如果有1000种特征,就可以在1000维的空间中表示它,而这个绘制样本的空间我们称它为特征空间(feature space)

通过可视化绘制样本点后,我们可以比较轻易的绘制出一根直线,红色样本在直线的一边而蓝色样本在直线的另一边。

分类任务本质就是在特征空间切分,在高维空间同理。

而鸢尾花拥有4个特征,应该是在4维特征空间中分析。

特征可以很抽象

  • 图像,每一个像素点都是特征
  • 28*28的图像有28*28=784个特征
  • 如果是彩色图像特征更多
posted @ 2018-04-22 10:17 饕客 阅读( ...) 评论( ...) 编辑 收藏
### 模拟退火算法中的误差分析 模拟退火算法作为一种随机搜索技术,在求解复杂优化问题时表现出色,但在实际应用中也会遇到一定的误差。这些误差主要来源于以下几个方面: - **初始温度设置不当**:如果初始温度过高,则接受较差解的概率较大;反之则可能导致过早收敛到局部最优解[^1]。 - **冷却速率不合理**:较快的降温速度可能会使系统未能充分探索状态空间而陷入局部极值;较慢的速度虽然有助于提高全局搜索能力,但也增加了计算成本和时间消耗[^3]。 - **邻域结构设计缺陷**:不合适的邻居定义方式会影响新解产生的质量以及遍历整个可行区域的能力,从而影响最终结果的质量[^4]。 为了有效减少上述因素带来的误差并提升模拟退火算法性能,可采取如下措施: #### 改进策略一:自适应调整参数 引入动态机制来自动调节关键参数如起始温度T0、终止温度Tf 和冷却因子α等。例如基于当前迭代次数或已访问节点数目来自适应改变这些值,使得早期阶段能够更广泛地探索解空间而在后期逐渐聚焦于优质候选解附近[^5]。 ```python def adaptive_cooling_schedule(iteration, max_iterations): T_start = 1000 # 初始高温 alpha = 0.98 # 冷却系数 if iteration < max_iterations * 0.2: return T_start / (iteration + 1)**0.5 elif iteration >= max_iterations * 0.8: return T_start * (alpha**(max_iterations - iteration)) else: return T_start * (alpha**iteration) ``` #### 改进策略二:混合其他启发式方法 结合遗传算法(GA)、粒子群优化(PSO)或其他元启发式算法共同作用,利用各自优势互补以改善整体效果。比如先用GA快速定位大致范围再转交SA精调细节位置,或者反过来先粗犷后精细的方式交替执行两种操作直至满足停止准则为止。 #### 改进策略三:增强型邻域搜索 采用更加灵活多样的移动模式构建新的试探方向集,确保每次更新都能朝着有利于降低能量的方向前进而不至于过分局限在某些特定路径上打转儿。这可以通过增加扰动强度或是变换坐标轴来进行尝试性跳跃实现更大尺度上的跃迁可能性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值