2.Network in Networks 论文总结

目的:

改进CNN,可以学习到更加抽象和有效的非线性特征

常规卷积层: conv→relu

  • conv: conv_out=∑(x·w)
  • relu: y=max(0, conv_out)

maxout: several conv(full)→max

  • maxout:一种激活函数形式
  • several conv (full): conv_out1 = x·w_1, conv_out2 = x·w_2, …
  • max: y = max(conv_out1, conv_out2, …)
  • 线性变化+Max操作可以拟合任意的的凸函数

NIN: serveral conv(full)→relu→conv(1x1)→relu

  • several conv (full): conv_out1 = x·w_1, conv_out2 = x·w_2, …
  • relu: relu_out1 = max(0, conv_out1), relu_out2 = max(0, conv_out2), …
  • conv(1x1): conv_1x1_out = [relu_out1, relu_out2, …]·w_1x1
  • relu: y = max(0, conv_1x1_out)
  • NIN想表明:不仅能够拟合任何凸函数,而且能够拟合任何函数,因为它本质上可以说是一个小型的全连接神经网络

1.MLP Convolution Layers

  • mlpconv网络层替代传统的convolution层

  • mlpconv网络层:卷积 + 传统的mlp(多层感知器)

  • 在跨通道(cross channel,cross feature map)情况下,mlpconv 等价于 卷积层 + 1×1卷积层

  • 1×1卷积层 实现多个feature map的线性组合,实现跨通道的信息整合

CNN高层特征是低层特征通过某种运算的组合
在每个局部感受野中进行更加复杂的运算(包含一个微型的多层网络),提高非线性
同一层中,不同特征层之间(每一层之间的特征提取又加上了一个小的神经网络。)

2.Global Average Pooling

替代全连接层,减少参数
feature map数量等于category数量

  • 传统:卷积出现在底层网络,最后一个卷积层的特征图通过量化送到全连接,接一个softmax逻辑回归分类层
    (特征提取+传统网络)
  • 优化:卷积之后,对每个特征图一整张图片进行全局均值池化,这样每张特征图都可以得到一个输出。
    (每张特征图相当于一个输出特征,表示输出类的特征。)
  • 特点:强化特征图与类别的关系,没有参数需要进行优化

3.补充

  • 仿射特征图(affine feature maps):是直接由线性卷积得到的特征图,没有通过激活函数进行非线性映射。

4.重点知识

  • 1×1卷积核:
    (1)一个通道:同一个w去乘以原图像上的每一个像素点,相当于做了一个scaling
    (2)多个通道:实现跨通道的交互和信息整合
    (卷积操作本身就可以做到各个通道的重新聚合的作用)
    (3)卷积时:11* 11* 3* 96(11*11的卷积kernel,输出map 96个)对于一个patch输出96个点,是输出feature map同一个像素的96个channel,但是现在多加了一层MLP,把这96个点做了一个全连接,又输出了96个点——很巧妙,这个新加的MLP层就等价于一个1 * 1 的卷积层
    (4)1 * 1的卷积可以看作是 对 每个feature map 对应的 相关 patch 做全连接(加权求和)
  • the author’s goal was to generate a deeper network without simply stacking more layers.
    It replaces few filters with a smaller perceptron layer with mixture of 1x1 and 3x3 convolutions. In a way,
    it can be seen as “going wide” instead of “deep”,
### 论文核心思想 Liu, Yilu 等人在 IEEE Transactions on Evolutionary Computation 上发表的论文《Community opinion maximization in social networks》主要探讨了社交网络中的意见最大化问题。该研究旨在通过优化算法,在特定社区中实现最大化的正面舆论传播效果[^4]。 论文的核心目标是在给定预算下,选择一组种子用户以促进某种观点的最大化扩散。这种扩散不仅依赖于用户的影响力,还受到其所在社区结构的影响。因此,作者提出了一个多目标优化框架,综合考虑了个体影响范围以及社区间的交互特性。 --- ### 方法论概述 为了实现上述目标,论文采用了基于进化计算的方法解决复杂的社会网络传播模型: 1. **多目标优化模型** 提出了一个结合社会网络特性的多目标函数,用于衡量不同策略下的意见传播效率和成本效益比。此部分涉及对社交网络拓扑结构的建模分析,并引入了社区检测技术来识别潜在的关键节点群组[^5]。 2. **遗传算法的应用** 利用遗传算法设计了一种高效的求解方案,能够快速找到近似最优解集。具体而言,通过对候选种子集合进行编码、交叉变异操作,逐步逼近全局最佳配置状态。这种方法特别适合处理大规模稀疏图上的组合优化难题[^6]。 3. **实验验证与性能评估** 基于真实世界的数据集开展了广泛的对比测试,证明所提方法相比传统贪婪算法及其他启发式搜索方式具有显著优势。特别是在面对高度异质性和动态变化环境时表现出更强适应能力[^7]。 --- ### 技术贡献总结 本文的技术亮点在于创造性地将进化计算理论应用于社交媒体营销领域,解决了现有方法难以兼顾精确度与时效性的问题。同时,针对实际应用场景需求,开发了一系列实用工具包便于后续研究人员进一步探索相关课题方向。 ```python import networkx as nx from deap import base, creator, tools, algorithms def evaluate_seeds(individual): """定义评价函数""" graph = nx.read_gml('social_network.gml') # 加载社交网络数据 spread_size = calculate_spread(graph, individual) # 计算传播规模 cost = sum([graph.nodes[node]['cost'] for node in individual]) # 总花费 return (spread_size, -cost) toolbox = base.Toolbox() creator.create("FitnessMulti", base.Fitness, weights=(1.0,)) # 多目标适配器 creator.create("Individual", list, fitness=creator.FitnessMulti) # 初始化种群并执行GA流程... population = toolbox.population(n=POP_SIZE) result_population = algorithms.eaSimple(population, ...) ``` ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值