在线用户行为定量分析与线性方程组问题研究
1. 引言
在当今数字化时代,搜索行业通过融合机制设计、算法、机器学习和大规模分布式计算等原理,在基于科学原则优化货币化方面取得了显著成效,这体现了计算机科学与微观经济学之间成功且不断发展的合作。然而,在理解在线用户如何响应所呈现的内容和体验方面,计算机科学与某些社会科学之间的合作仍存在不足。
我们将以图像搜索结果展示为例,探讨其中涉及的算法和机器学习问题。同时,会重点研究线性方程组相关问题,如 Max Lin 问题。
Max Lin 问题是给定一个在 $F_2$ 上的 $m$ 个线性方程、$n$ 个变量的系统 $Az = b$,每个方程被赋予一个正权重,目标是找到变量的赋值,以最大化满足方程的总权重,即满足方程的总权重减去不满足方程的总权重(称为“超额值”)。其特殊情况 Max r - Lin 指每个方程最多有 $r$ 个变量。
Håstad 的不可近似性定理表明,除非 $P = NP$,对于每个 $\epsilon > 0$,不存在多项式时间算法来区分 Max 3 - Lin 的实例,即无法区分至少 $(1 - \epsilon)m$ 个方程可同时满足的实例和少于 $(1/2 + \epsilon)m$ 个方程可同时满足的实例。
2. 最大超额值的结果
为了研究 Max Lin 问题,我们引入了两个约简规则:
- 约简规则 1 :设 $t = rankA$,且 $A$ 的列 $a_{i1}, \ldots, a_{it}$ 线性独立,则从 $Az = b$ 的方程中删除不在 ${z_{i1}, \ldots, z_{i
超级会员免费看
订阅专栏 解锁全文
924

被折叠的 条评论
为什么被折叠?



