自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

神经美学_茂森的博客

作为一名东南大学的在读博士生,我正尝试着探索人工智能与艺术这一交汇领域的微妙之处,希望能逐渐揭开两者间隐藏的联系。我的研究试图跨越技术的界限,触及人类感知与认知的深层次,以期能更深入地理解“美”这一抽象概念。

  • 博客(338)
  • 资源 (5)
  • 问答 (1)
  • 收藏
  • 关注

原创 【优快云博客之星2024】主题创作:回归人文主义,探寻情感本质:从文艺复兴到AI时代,我的情感探索之旅

多年来,我们的团队一直关注人工智能,尤其是AI在音乐领域的应用研究。随着技术的不断演进,我们也不断反思:在“算法、代码、数据”主导社会发展的今天,这种反思让我们回望14世纪的意大利,那时文艺复兴以“人”为中心,主张“人的尊严”与“自我发现”,掀起了对个体与人性的重新省察。正如当时思想家在《论人的尊严》中所言:“人有能力塑造自己,是万物奇迹的缩影。” 而)则在随笔中不断拷问自我的局限,鼓励人们以反省与怀疑的态度探寻真理。古希腊的更是直截了当地向世人提出了“)”的命题。

2025-01-18 20:41:02 1266 3

原创 重整化群与分形几何:微观世界与宏观形态的奇妙交汇

就像俄罗斯套娃,每个小娃娃都有着与整体相似的模样,重整化群在微观尺度的变换和分形几何在宏观形态上都遵循着自相似的规律”

2025-03-26 09:46:12 891

原创 角色塑造的“化学反应”公式:用数学模型解构复杂人性的吸引力法则

就像化学实验中不同元素的碰撞,角色的’不完美’与观众认知的’摩擦’能产生戏剧火花”

2025-03-25 21:19:37 874

原创 iPhone 16e vs 13 mini:苹果小屏手机如何选?

iPhone16e #iPhone13mini #性能对比 #小屏手机 #续航差异。标题:iPhone 16e vs 13 mini:苹果小屏手机如何选?——性能升级还是手感至上?

2025-03-17 09:59:00 1626

原创 思维链模型:用「分步推理」破解「复杂问题」的数学原理与代码实现

就像用GPS分段导航代替直觉驾驶,思维链通过显式推理步骤逼近问题最优解”

2025-03-12 11:23:40 1022

原创 大模型代码编写能力(尤其是长代码生成)的排名表格

建议优先选择GPT-4或DeepSeek-MoE-16b进行长代码开发,若涉及中文业务可尝试Qwen2.5-Coder。

2025-03-11 15:22:12 226

原创 神经网络优化之旅:“看得见”的数学公式与可视化图

优化算法就像在崎岖山路上寻找的山谷,目标是让这座大山的高度,最终达到。

2025-03-10 16:23:07 890

原创 哲学中的“本质”: 剥开“现象外衣”,直击事物“内在灵魂”的核心公式与代码解析

PCA 降维的过程,可以类比为哲学上。

2025-03-09 19:20:23 926

原创 复杂性之墙:为何脑科学等领域难觅“爱因斯坦”?

就像理解一片森林远比理解一棵树复杂,脑科学等领域研究的是高度复杂的‘森林’,而非物理学研究的相对简单的‘树木’”

2025-03-09 19:13:48 1002

原创 懒惰决策方程:大脑如何精确计算“努力值不值得“的优化公式

懒惰的双重本质机制类型数学模型生物学基础进化意义防过劳死机制EtTfatigue⇒↓AtEtTfatigue​⇒↓At大脑中的疲劳感受器与能量监测系统防止体力透支导致生存风险防资源枯竭机制dIdt−λIt×fNdtdI​−λIt×fN多巴胺系统对重复刺激的适应性下降促进资源多样化利用,避免单一资源枯竭。

2025-03-09 14:00:13 248 1

原创 互信息: 揭示变量间“心有灵犀“程度的度量器

就像两个朋友之间的默契程度,互信息测量两个变量间共享了多少信息”:将互信息缩放到[0,1]区间,便于比较不同变量对之间的关联强度。:在特征选择中,高互信息表示特征与目标变量强相关,更有预测价值。:在已知第三方信息Z的情况下,X和Y之间还共享了多少额外信息。:互信息像是解锁的钥匙,是用钥匙Y后剩余的复杂度。

2025-03-08 22:31:25 932

原创 雍正摊丁入亩:让“富的更富,穷的更穷”税制,变成“多田多缴,无田不缴”的公平公式

基础的摊丁入亩公式简洁明了,突出了改革的核心思想。更精细的土地等级公式则更贴近实际情况,可以用于更精确的税收计算和政策分析。人均税负和亩均税负公式则可以用于宏观层面评估改革的整体效果,例如减轻了人均税负,提高了亩均税收等。

2025-03-01 14:55:20 837

原创 神经元“同频共振”:大脑连接的秘密公式与代码

简化赫布定律和STDP模型都描述了神经元连接的增强机制,但STDP模型更进一步,考虑了神经元激活的时间顺序,更符合生物神经元的实际工作方式。简化赫布定律适用于初步理解神经可塑性概念,而STDP模型则更适用于构建更精细的神经元网络模型,尤其是在处理时间序列数据时。

2025-02-26 11:30:54 1265

原创 脉冲神经网络(SNN)实现工具库对比分析

(Biological Brain Circuitry),而不同的工具库就是“不同功能的工具箱”。。

2025-02-25 14:49:50 329

原创 DDoS攻击:当互联网高速公路遭遇“洪水”——公式与代码揭秘网络拥堵的真相

Throughput=TotalDataTransferredTotalTime Throughput = \frac{Total Data Transferred}{Total Time} Throughput=TotalTimeTotalDataTransferred​通俗解释:吞吐量就像高速公路的运输能力,表示在一定时间内,这条路能运送多少货物。如果吞吐量高,说明道路畅通,运输效率高;如果吞吐量下降,可能意味着道路拥堵或者发生了事故。打比方:想象一个收费站,吞吐量就是每分钟能通过收费站的车辆数量。如果

2025-02-24 22:59:06 731

原创 互信息:信息世界的“共同语言”,揭秘变量间“心有灵犀”的程度

就像情侣间的悄悄话,互信息告诉你,知道一个人的秘密,能让你多大程度上猜到另一个人的心思。

2025-02-24 09:54:34 809

原创 【通俗理解】SNN:模拟“大脑脉冲”,揭秘类脑计算的“神经密码”

SNN 的公式体系涵盖了。

2025-02-22 10:53:09 953 1

原创 神经网络防“失忆“秘籍:弹性权重固化如何让AI学会“温故知新“

如同统计学生复习时翻看某页笔记的次数,翻看越频繁的页面(参数)获得越多荧光标签(高F值):在图像分类任务中,给识别"猫耳朵"的关键神经元增加3倍保护权重。“就像学霸给重点笔记贴荧光标签,EWC给重要神经网络参数上锁”

2025-02-22 10:36:36 758

原创 大模型变“健忘症患者“?——公式揭秘灾难性遗忘的防治之道

给橡皮泥加铁丝骨架(正则化),或定期回放旧形状(回放策略),就能保持新旧记忆共存”

2025-02-22 10:29:59 1013

原创 变分推断:就像用简笔画替代写实油画,变分推断用简单分布捕捉复杂分布的关键特征

就像用简笔画替代写实油画,变分推断用简单分布捕捉复杂分布的关键特征”

2025-02-19 10:13:43 756

原创 复杂系统自组织:从无序到有序的神奇转变

复杂系统的就像是一群蚂蚁,没有一个总指挥,却能通过彼此之间的互动,自发地构建出复杂且有序的蚁巢。在这个过程中,系统从原本看似杂乱无章(无序)的状态,逐渐形成稳定且有规律(有序)的结构。

2025-02-17 15:28:56 1027

原创 “学而不思饿肚子,思而不学撑爆胃”:用数学公式解释学习与思考的平衡

【代码】“学而不思饿肚子,思而不学撑爆胃”:用数学公式解释学习与思考的平衡。

2025-02-15 11:32:51 663

原创 -*- coding: utf-8 -*-:让中文代码不再乱码的 “翻译官”

让程序能正确读取包含中文、日文等非英文字符的代码文件。如同U盘插入不同电脑时需要选择正确的文件系统格式(NTFS/FAT32),这个声明告诉Python用。当N=1000时,GBK需1100字节,UTF-8需1200字节,GBK节省空间但牺牲兼容性。:若代码文件包含90%英文和10%中文,GBK总字节数为。相当于给Python解释器配备。:汉字“码”的Unicode码点是。双字节字符(如部分中文)三字节字符(常用汉字)#Python编码声明。

2025-02-13 10:07:39 802

原创 【论文解读】神经网络就像“数学乐高积木”:多层前馈网络如何用简单函数拼接复杂世界

K. Hornik, M. Stinchcombe, and H. White. Multilayer feed- forward networks are universal approximators. Neural Net- works, 2(5):359-366, 1989 论文解读。

2025-02-13 09:46:32 1144

原创 【Deepseek - R1 - ZERO】通过强化学习生成思考链推理模型?

在探讨为何在Deepseek - R1 - ZERO出现前无人尝试放弃,通过强化学习生成思考链推理模型时,涉及到几种方法,每种方法都有其缺点。在Deepseek - R1 - ZERO出现前,人们普遍认为仅靠ORM如此稀疏的奖励空间不可能训练出模型。而该模型出现后发现,解法在于参数量。同时,PRM和MCTS或许也有各自的解法,只是尚未被发现。

2025-02-13 09:23:02 264

原创 深度学习模型的“思维链”:模型内部的推理过程

思维链 (Chain of Thought, CoT) 就像给深度学习模型配备了一套,让模型不再仅仅是,而是能够像人类一样,一步步地展示其。这就像解一道数学题,模型不再直接给出答案,而是会先列出,再得出最终结果。

2025-02-13 01:08:08 660

原创 【通俗理解】生物稳态的 “平衡术”:从 负反馈到 主动预测 的生存智慧

肾脏通过调节尿液的浓缩度,以及抗利尿激素 (ADH) 的调控,来实现渗透压的精细调节。通过免疫记忆预测病原体的再次入侵,并提前做出免疫应答,以减少感染的风险和程度。,当车速过快(血糖过高)时,踩刹车(分泌胰岛素)减速;当车速过慢(血糖过低)时,松开刹车(分泌胰高血糖素)加速,最终使车速(血糖)稳定在。当加入少量酸或碱时,缓冲对组分之间的比例会发生变化,但 pH 值的变化相对较小,从而起到缓冲作用。,为了生存和繁衍,必须维持内部环境的稳定,即使外界环境变化。第一个公式表示血糖浓度的变化受到胰岛素的降低作用(

2025-02-10 20:53:41 1062 1

原创 【通俗解释,入门级】DeepSeek - R1 - Zero:强化学习提升LLM推理能力的奥秘

强化学习在DeepSeek - R1 - Zero里就像是一位“聪明的探险家”,在各种可能的推理路径中探索,通过不断尝试,找到最正确的推理链。它不像传统方法依赖大量人工标注数据,而是自己在“推理世界”里闯荡,靠来引导自己走向正确方向。

2025-02-10 20:38:38 707

原创 控制论与信息论:维纳和香农的核心分歧在于对「信息本质」的理解

通过公式推演与代码实现,揭示了控制论与信息论在系统优化中的辩证统一关系。维纳与香农的分歧本质上是「系统目的性」与「信息抽象性」的。:5G通信中通过Turbo码逼近信道容量极限。:雷达信号去噪,通过功率谱分析增强有效信号。存在耦合时,系统的信息复杂度由。,这种对立恰恰推动了。

2025-02-10 19:05:09 1704

原创 盐铁论的“经济公式”:国家调控与自由放任的 千年辩论

并非量化模型,这里的 “代码” 和 “可视化” 是。,国家应主动调控经济,掌握重要资源,增加财政收入。并非现代科学意义上的公式化理论,而是一场围绕。,政府应减少干预,让市场自由发展。我们可以将辩论双方的。,理解其背后的逻辑。

2025-02-08 11:26:33 814

原创 重整化群(RG):物理学的 “放大镜”和 “简化术”,带你 “看透”物质世界的 “尺度秘密”

重复上述步骤,不断放大尺度,得到一系列重整化后的参数。,可以找到重整化群变换的固定点。观察,忽略微观细节,抓住宏观本质,就像。一样,从复杂到简洁,揭示物理规律的。是粗粒化后的有效哈密顿量,只依赖于。,使得在更大尺度上,系统仍然可以用。展开指数项,进行求和运算,可以得到。,使得粗粒化后的模型与原始模型在。,相邻自旋之间有相互作用,能量为。:参数在重整化群变换下的演化轨迹。,它帮助我们理解物理系统在不同。以下 Python 代码演示了。,研究物理系统在不同尺度下的。为例,推导重整化群变换函数。

2025-02-06 15:44:35 731

原创 苹果大模型的“差分隐私”:数据保护的 隐身衣 与数学迷宫

一个随机化算法MM满足ϵδϵδ-差分隐私,如果对于任意两个相邻数据集DDD和D′D'D′(只相差一条记录),以及所有可能的输出集合S⊆RangeMS⊆RangeMPrMD∈S≤eϵPrMD′∈SδPrMD∈S≤eϵPrMD′∈Sδ变量解释MM:随机化算法,即应用差分隐私机制的算法。DDD:原始数据集。D′D'D′:与DDD相邻的数据集,即D′D'D′通过添加或删除DDD。

2025-02-06 14:38:13 719

原创 【进展表格】苹果AI入华遇阻?百度、腾讯、字节跳动“三选一”背后的博弈

(Tech-Compliance-Ecosystem Trilemma)的三角矛盾。:苹果智能(Apple Intelligence)在中国落地的关键,在于解决。

2025-02-05 13:27:48 568

原创 分析哲学:从 语言解剖到 思想澄清的哲学探险

分析哲学,就像一位 “语言侦探”,专注于 “解剖语言”,揭示我们日常使用的语言、科学语言乃至哲学语言背后的 “真实含义”。它相信许多哲学难题,都源于我们对语言的 “误解” 和 “含糊不清”。【分析哲学就像是给 “思想做体检”,用 “逻辑手术刀” 精细地 “解剖语言”,去除 “概念的脂肪” 和 “逻辑的赘肉”,让思想变得 “清晰透亮”。它不是要建立宏大的哲学体系,而是要 “澄清概念”,“解决具体问题”,就像 “工匠打磨零件”,追求思想的 “精确” 和 “实用”。】分析哲学的核心方法可以概念化地表示为:哲学清晰

2025-02-03 23:51:10 1680

原创 嵌入原则:数据特征如何 融入 模型的 损失地形

构建一个简单的模型,包含一个嵌入层,并使用 MNIST 数据集进行训练,可视化嵌入向量的分布,以及损失景观的简化表示。通过这种方式,对比损失能够有效地引导模型学习到区分相似性和不相似性的嵌入表示,从而将数据特征融入到损失景观中。不同的损失函数会塑造不同的损失景观,从而影响特征融入的方式和模型的学习效果。对比损失公式旨在学习到一种嵌入表示,使得相似的样本在嵌入空间中距离较近,不相似的样本距离较远。嵌入原则的核心在于,数据特征通过嵌入函数。在模型的参数空间中,共同塑造了模型的。参与到损失函数的计算中,并最终。

2025-02-03 12:09:14 843

原创 DeepSeekV3 训练成本揭秘:五百五十七万美元炼成大模型的经济学

大模型训练成本,就像建造一座 “知识摩天大楼”,需要消耗大量的 “建筑材料” 和 “施工时间”。GPU 小时就是 “施工时间” 的度量单位,而 GPU 租赁价格则代表 “劳务费用”。【DeepSeekV3 的训练成本之所以能做到 GPT-4o 的 1/20,总成本不到 六百万美元,核心在于 “精打细算”。研发团队通过 “优化算法” 减少了 “设计图纸的复杂性”,通过 “框架优化” 提升了 “施工效率”,并通过 “硬件协同优化” 降低了 “材料损耗”。最终,用更少的 “施工时间” 和 “劳务费用”,建成了同样

2025-02-03 11:14:18 849

原创 康德哲学与自组织思想的渊源:从《判断力批判》到系统论的桥梁

康德哲学中的和概念,为中的自组织思想提供了哲学基础,预见了复杂系统中现象的理论框架。

2025-02-02 22:39:45 1039

原创 【方法论】ChatGPT与DeepSeek的联合应用,提升工作效率的新解决方案

的使用,可以在高效生成初稿的基础上,进一步通过联网验证和修正,确保输出内容的准确性与高质量,最后通过优化增强内容的可读性和逻辑性。

2025-01-28 18:50:34 1667

原创 【公式】卢布贬值风险:义乌到俄罗斯贸易的汇率陷阱

虽然购买力平价和利率平价等理论也与汇率相关,但它们更侧重于宏观经济层面的汇率决定和金融市场的套利。我们这里讨论的公式更直接地服务于微观层面的国际贸易,帮助企业量化和管理汇率风险,特别是针对像。

2025-01-27 21:31:00 860

原创 认知三阶段与熵:从简单到复杂再到有序的旅程

假设我们学习一门新的编程语言(例如 Python)。:初学者只接触到基本语法和简单程序,感觉一切都很直接明了。就像一个整洁的房间,只有几件必需家具。HX−∑i​pxi​logpxi​pxi​:随着学习深入,接触到更多高级概念(如面向对象、异常处理、库的使用等),开始感到困惑和混乱。就像房间里堆满了各种物品,杂乱无章。

2025-01-22 16:23:57 1189 1

一本制作很用心的影集

Wear Good Shoes Inspiring Advice from Magnum Photographers by Magnum Photos (z-lib.org)

2020-11-30

7个回归分析方法思维导图.png

7个回归分析方法 什么是回归分析? 回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。 这种技术通常用于 预测分析、 时间序列模型 以及发现变量之间的因果关系。 例如,司机的鲁莽驾驶与道路交通事故数量之间的关系,最好的研究方法就是回归。 回归分析是建模和分析数据的重要工具。 在这里,我们使用曲线/线来拟合这些数据点, 在这种方式下,从曲线或线到数据点的距离差异最小。 我会在接下来的部分详细解释这一点。 我们为什么使用回归分析? 如上所述,回归分析估计了两个或多个变量之间的关系。 下面,让我们举一个简单的例子来理解它: 比如说,在当前的经济条件下,你要估计一家公司的销售额增长情况。 现在,你有公司最新的数据,这些数据显示出销售额增长大约是经济增长的2.5倍。 那么使用回归分析,我们就可以根据当前和过去的信息来预测未来公司的销售情况。 使用回归分析的好处良多。 具体如下: • 它表明自变量和因变量之间的显著关系 它表明多个自变量对一个因变量的影响强度 回归分析也允许我们去比较那些衡量不同尺度的变量之间的相互影响,如价格变动与促销活动数量之间联系。 这些有利于帮助市场研究人员,数据分析人员以及数据科学家排除并估计出一组最佳的变量,用来构建预测模型。 我们有多少种回归技术? 有各种各样的回归技术用于预测。 这些技术主要有三个度量 (自变量的个数, 因变量的类型 回归线的形状)。 对于那些有创意的人,如果你觉得有必要使用上面这些参数的一个组合,你甚至可以创造出一个没有被使用过的回归模型。 但在你开始之前,先了解如下最常用的回归方法: 1. 线性回归(Linear Regression) 线性回归通常是人们在学习预测模型时首选的技术之一。 在这种技术中, 因变量是连续的, 自变量可以是连续的也可以是离散的, 回归线的性质是线性的。 线性回归使用最佳的拟合直线(也就是回归线) 在因变量(Y)和一个或多个自变量(X)之间建立一种关系。 用一个方程式来表示它,即 Y=a+b*X + e, 其中a表示截距, b表示直线的斜率, e是误差项。 这个方程可以根据给定的预测变量(s)来预测目标变量的值。 现在的问题是:我们如何得到一个最佳的拟合线呢? 这个问题可以使用最小二乘法轻松地完成。 一元线性回归和多元线性回归的区别在于, 多元线性回归有(>1)个自变量, 而一元线性回归通常只有1个自变量。 最小二乘法也是用于拟合回归线最常用的方法。 对于观测数据,它通过最小化每个数据点到线的垂直偏差平方和来计算最佳拟合线。 因为在相加时,偏差先平方,所以正值和负值没有抵消。 我们可以使用R-square指标来评估模型性能。 要点: • 自变量与因变量之间必须有线性关系 • 多元回归存在多重共线性,自相关性和异方差性 线性回归对异常值非常敏感。它会严重影响回归线,最终影响预测值 多重共线性会增加系数估计值的方差,使得在模型轻微变化下,估计非常敏感。 结果就是系数估计值不稳定, 在多个自变量的情况下,我们可以使用向前选择法,向后剔除法和逐步筛选法来选择最重要的自变量。 2. 逻辑回归(Logistic Regression) 逻辑回归是用来计算“事件=Success”和“事件=Failure”的概率。 当因变量的类型属于二元(1 / 0,真/假,是/否)变量时,我们就应该使用逻辑回归。 这里,Y的值从0到1,它可以用下方程表示。 odds= p/ (1-p) = probability of event occurrence / probability of not event occurrence ln(odds) = ln(p/(1-p)) logit(p) = ln(p/(1-p)) = b0+b1X1+b2X2+b3X3....+bkXk 概要 上述式子中,p表述具有某个特征的概率。 你应该会问这样一个问题:我们为什么要在公式中使用对数log呢? 因为在这里我们使用的是的二项分布(因变量),我们需要选择一个对于这个分布最佳的连结函数。 它就是Logit函数。 在上述方程中,通过观测样本的极大似然估计值来选择参数, 而不是最小化平方和误差(如在普通回归使用的)。 要点: • 它广泛的用于分类问题。 逻辑回归不要求自变量和因变量是线性关系。 它可以处理各种类型的关系,因为它对预测的相对风险指数OR使用了一个非线性的log转换。 逻辑回归是用于分类的~这个得记住 为了避免过拟合和欠拟合,我们应该包括所有重要的变量。 有一个很好的方法来确保这种情况, 就是使用逐步筛选方法来估计逻辑回归。 它需要大的样本量,因为在样本数量较少的情况下,极大似然估计的效果比普通的最小二乘法差。 自变量不应该相互关联的,即不具有多重共线性。 然而,在分析和建模中,我们可以选择包含分类变量相互作用的影响。 • 如果因变量的值是定序变量,则称它为序逻辑回归 • 如果因变量是多类的话,则称它为多元逻辑回归 3. 多项式回归(Polynomial Regression) 对于一个回归方程,如果自变量的指数大于1,那么它就是多项式回归方程。 如下方程所示:y=a+b*x^2 在这种回归技术中,最佳拟合线不是直线。 而是一个用于拟合数据点的曲线。 重点: 虽然会有一个诱导可以拟合一个高次多项式并得到较低的错误,但这可能会导致过拟合。 你需要经常画出关系图来查看拟合情况,并且专注于保证拟合合理,既没有过拟合又没有欠拟合。 下面是一个图例,可以帮助理解: 明显地向两端寻找曲线点,看看这些形状和趋势是否有意义。 更高次的多项式最后可能产生怪异的推断结果。 4. 逐步回归(Stepwise Regression) 在处理多个自变量时,我们可以使用这种形式的回归。 在这种技术中,自变量的选择是在一个自动的过程中完成的,其中包括非人为操作。 这一壮举是通过观察统计的值,如R-square,t-stats和AIC指标,来识别重要的变量。 逐步回归通过同时添加/删除基于指定标准的协变量来拟合模型。 下面列出了一些最常用的逐步回归方法: • 标准逐步回归法做两件事情。即增加和删除每个步骤所需的预测。 • 向前选择法从模型中最显著的预测开始,然后为每一步添加变量。 • 向后剔除法与模型的所有预测同时开始,然后在每一步消除最小显着性的变量。 这种建模技术的目的是使用最少的预测变量数来最大化预测能力。 这也是处理高维数据集的方法之一。 5. 岭回归(Ridge Regression) 岭回归分析是一种用于存在多重共线性(自变量高度相关)数据的技术。 在多重共线性情况下,尽管最小二乘法(OLS)对每个变量很公平,但它们的差异很大,使得观测值偏移并远离真实值。 岭回归通过给回归估计上增加一个偏差度,来降低标准误差。 上面,我们看到了线性回归方程。还记得吗? 它可以表示为:y=a+ b*x 这个方程也有一个误差项。完整的方程是: y=a+b*x+e (error term) , [error term is the value needed to correct for a prediction error between the observed and predicted value] => y=a+y= a+ b1x1+ b2x2+....+e, for multiple independent variables. 在一个线性方程中,预测误差可以分解为2个子分量。 一个是偏差, 一个是方差。 预测错误可能会由这两个分量或者这两个中的任何一个造成。 在这里,我们将讨论由方差所造成的有关误差。 岭回归通过收缩参数λ(lambda)解决多重共线性问题。 看下面的公式: 在这个公式中,有两个组成部分。 第一个是最小二乘项, 另一个是β2(β-平方)的λ倍,其中β是相关系数。 为了收缩参数把它添加到最小二乘项中以得到一个非常低的方差。 要点: 除常数项以外,这种回归的假设与最小二乘回归类似; 它收缩了相关系数的值,但没有达到零,这表明它没有特征选择功能,这是一个正则化方法,并且使用的是L2正则化。 6. 套索回归(Lasso Regression) 它类似于岭回归。 Lasso (Least Absolute Shrinkage and Selection Operator)也会惩罚回归系数的绝对值大小。 此外,它能够减少变化程度并提高线性回归模型的精度。 看看下面的公式: Lasso 回归与Ridge回归有一点不同,它使用的惩罚函数是绝对值,而不是平方。 这导致惩罚(或等于约束估计的绝对值之和)值使一些参数估计结果等于零。 使用惩罚值越大,进一步估计会使得缩小值趋近于零。 这将导致我们要从给定的n个变量中选择变量。 要点: • 除常数项以外,这种回归的假设与最小二乘回归类似 • 它收缩系数接近零(等于零),确实有助于特征选择 这是一个正则化方法,使用的是L1正则化 7. 回归(ElasticNet) ElasticNet是Lasso和Ridge回归技术的混合体。 它使用L1来训练并且L2优先作为正则化矩阵。 当有多个相关的特征时,ElasticNet是很有用的。 Lasso 会随机挑选他们其中的一个,而ElasticNet则会选择两个。 Lasso和Ridge之间的实际的优点是,它允许ElasticNet继承循环状态下Ridge的一些稳定性。 要点: 它可以承受双重收缩 • 选择变量的数目没有限制 • 在高度相关变量的情况下,它会产生群体效应 除了这7个最常用的回归技术,你也可以看看其他模型,如Bayesian、Ecological和Robust回归。 如何正确选择回归模型? 当你只知道一个或两个技术时,生活往往很简单。 我的老师曾告诉我,如果结果是连续的,就使用线性回归。 如果是二元的,就使用逻辑回归! 然而,在我们的处理中,可选择的越多,选择正确的一个就越难。 类似的情况下也发生在回归模型中。 在多类回归模型中,基于自变量和因变量的类型,数据的维数以及数据的其它基本特征的情况下,选择最合适的技术非常重要。 以下是你要选择正确的回归模型的关键因素: 1. 数据探索是构建预测模型的必然组成部分 在选择合适的模型时,比如识别变量的关系和影响时,它应该首选的一步。 2. 比较适合于不同模型的优点,我们可以分析不同的指标参数 如统计意义的参数,R-square,Adjusted R-square,AIC,BIC以及误差项,另一个是Mallows' Cp准则。 这个主要是通过将模型与所有可能的子模型进行对比(或谨慎选择他们),检查在你的模型中可能出现的偏差。 3. 交叉验证是评估预测模型最好额方法 在这里,将你的数据集分成两份(一份做训练和一份做验证)。 使用观测值和预测值之间的一个简单均方差来衡量你的预

2020-05-22

摄影技巧大汇总 摄影原理 相机操作 拍摄技巧 思维导图.png

非常详细的资源,历时三天整理。摄影技巧学习 机器上的参数 镜头上的 OIS 相机上的 为什么要用取景器? 没有取景器的微单拍摄,在以下场景非常苦恼: 1、强光下 2、老花眼,尤其是我这样37岁就开始老花眼的人 3、尤其是长焦拍摄,需要稳定的状态下。单反相机机身和脸部是一个重要的支撑点。 4、液晶取景非常费电,为了抓拍又不能随时关机,得多带几块电池。 除非在看取景器非常困难的情况下需要显示屏辅助取景(比如相机高度已高过头顶或机位很低)一般情况还是看取景器。 1是因为取景器是光学成像,镜头所拍摄的东西通过相机里的反光板能一点不差的传送到眼睛里,显示屏是电子的,从真实度和清晰度都不如取景器。 2显示屏取景更费电,如果出门拍摄一天都用显示器取景会很费电。 3一般单反相机在显示屏模式下按下快门时,快门不是马上释放,而是要有一个1秒钟左右的间隔,如果拍摄移动物体,这个世界可能被摄体已经不在预先构图中预计出现的位置了。 当然,微单用的是电子取景器,这个是要耗电的,不过关掉电子屏还是会节省很多点。 如何关闭自动连接手机传输图像? 耗电情况如何? 后期 capture one 后期 导入图片后不能编辑,所有的编辑图标都是灰色的 首选项-图像-打开JPEG编辑、打开tiff编辑、打开png编辑都勾上。 没找着 打开JPEG编辑 然后,查看英文界面发现乃session一词,就是允许用户直接访问硬盘上的图像文件并对其直接操作的意思。 这个功能是C1与LR的最大不同之一,用LR时,不导入就无法对图像进行编辑调整,而C1用户则可在会话的方式下,直接查看硬盘的目录树,在任意位置上打开图像文件。 然后,从目录树里直接选择图像文件并打开编辑,会话是首选。当用此法查看图像时,也会在图像所在的文件夹里同时生成一个CaptureOne子文件夹。 是不是和图层有关? 也无法联机拍摄? 是不是xt30不支持 是不是和激活不成功有关? 重新激活pro模式 c1 的几种模式 Express版本免费提供给Sony用户使用(在Pro for Sony的基础上,对有一些功能进行了阉割); Pro for Sony为收费版本,功能与Capture One Pro一样,但是只支持Sony机器。 DB版本免费提供给Phase One和Leaf的数码后背用户使用,不支持135系列相机。 Capture One Pro的售价为239欧元/279美刀(国内售价2390元),支持市场上绝大部分的135相机和数码后背(据我的经验来看,只不支持宾得),功能最为齐全。 如何查看已经激活? 重新安装 Capture One有几个核心功能: 1.最好的Raw格式解析算法 2.最好的联机拍摄(商业摄影师联机拍摄首选) 3.颜色编辑器 4.图层遮罩 5.关键字管理(Capture One Pro 9新功能) 6.与PS、LR相比,Capture One 提供了另外的一套后期思路,在我看来学习Capture One的成本要比LR低,但因为国内相关教程较少,所以Capture One在中国的用户没有LR的多,知名度也没有LR的高。 通俗讲capture one的优势 Capture One 可以创建属于你自己的色彩管理文件 Capture One 可以让你马上看到画面中对焦对实了的部分 有点像观看照片时的峰值 Capture One 可以用色彩编辑器做你想做的关于色彩的一切调节 Capture One 联机拍摄无人能比 还可以用iPad或iPhone无线实时监看画面 拿过去给模特看 做动作或表情调整 ram格式是个什么格式? affinity photo 拍摄技巧 如何保持手持拍摄? ①双手握持三点接触法 ②贴身握机发 ③颈部拉直肩带发 能拍一些平移的画面 ④机身防抖 ⑤后期 ⑥人肉独脚架(利用重力下坠) ⑦广角拍摄,短焦开启防抖 ⑧拍成慢动作,也能防抖 用更高的帧数 其他 有时手持拍摄也是有独特的效果的 机器拍摄 画面有点不自然,有点假 光圈快门感光度调节顺序 首先根据需要的景深选择光圈, 用光圈优先模式:这样快门速度就自动了。 这个曝光只能由相机自动决定,差不了太多。 大多数摄影师大多数场景常用光圈优先模式拍摄? 如何设置为光圈优先? 根据物体移动速度选快门速度, 快门速度会适合抓拍,或者是记录轨迹 如果用快门优先模式,可以设置相对比较快的快门速度,光圈自动,同样能满足大部分拍摄。 最后根据需要的曝光选感光度。 B什么意思? 曝光补偿和感光度的区别? 元素要少!(做减法) 元素统一 云和天空 人为产生的元素 黑夜会弱化掉所有的元素,只留下点亮的那些东西 减法 虚化 虚化了背景,统一了元素 元素划分 调色上做减法 处理前 处理后(去掉了几种颜色) 处理前 处理后 对焦 如何手动对焦? 想要收获最好的虚化效果,要达到以下三个条件 手动对焦一般都是在一些很极限的情况下才会用了。 不要太在意专业啊、手动啊啥的,千万别以为手动就是专业的,自动对焦本身就是技术的进步,没有那个摄影师会在自动能满足的情况下去考虑手动对焦,除非是职业装13的。 手动对焦适用场合大致如下: 1、弱光环境 很多拍星空的朋友都有这样的体验,当你想拍摄清晰的前景,对远处暗淡的主体对焦时,你半按快门,却发觉相机无法对焦。 在低光低对比的环境下,相机是无法准确对焦的,此时,手动对焦便是最好的选择。 2、微距拍摄   近距离拍摄物体,半按快门,图像一直在对焦和失焦之间徘徊,始终无法全按快门拍照,此时是最尴尬的时刻,这是因为景深太浅,导致相机无法自动对焦。 这时使用手动对焦就可以解决大部分问题。 3、主体前有遮挡物   在一些场合,你想拍摄的被摄主体前面,有其他物体在前景位置遮挡,比如栏杆,玻璃等等,自动对焦往往就会将焦点放在前景物体上,而不是你想拍摄的主体,此时,用手动对焦能快速解决问题。 4、使用老镜头   老镜头多没有自动对焦模式,只支持手动对焦,此时便毫无其他选择了。 5、摄影乐趣 以前很喜欢蔡司镜头,它拍出的图片色彩浓郁,德味甚浓,但蔡司头都是手动头。 犹豫再三,半年前还是禁不住诱惑进了一只蔡司50/1.4镜头。 其后,我多次用它进行街拍或人像拍摄,不得不说,手动对焦的乐趣,是旁人无法体会的。 二、手动对焦方法 1、相机设置:(以尼康相机为例) 1.1.镜头的对焦模式,调为手动,即 “M”档。 1.2.相机的对焦模式,调为手动,即 “M”档。 1.3.另外,我拍摄风光类题材,相机的拍摄模式也是手动“M”档。 2、对焦点选择: 2.1.静态风光摄影中,一般选择全景深的近三分位对焦。 2.2.城市夜景风光,对焦部位尽量选择窗户等相对高光比区域,便于合焦确认。 2.3.强光手电辅助照亮主体,也是手动快速对焦的法宝。 3、手动对焦方法: 3.1.稳定:使用三角架等设备固定相机。 3.2.光圈:一般风光摄影的光圈设置为F8-F16,在对焦时,先把它设置为镜头的最大光圈,以得到最浅景深便于合焦识别。这一步是手动精准对焦的关键! 3.3.打开相机背屏显示模式: 3.4.选择对焦点: 左右上下移动背屏上的红色方块,来选择对焦点。 3.5.最大限度放大对焦点: 按相机上的放大键,最大限度放大对焦点。 3.6.手动转动镜头的对焦环,调节到对焦点最清晰为止。 3.7.把光圈设置再调整回实拍光圈,即F8-F16。 3.8.手动对焦完毕,可以实拍。 其他的合焦确认方法: 1、相机合焦提示 调节对焦环,观察单反相机目镜,里面有合焦显示提示。尼康相机是白色的圆点,没有合焦时,是向右或向左的白色三角。 2、峰值对焦 峰值对焦是索尼微单相机所具备的一种对焦方式,其原理是将画面对比度最高的区域用高亮的方式显示出来。越是接近合焦,画面上出现的红色(颜色也可设定为其他颜色)颗粒就越是明显。而这些红色的颗粒就是所谓的峰值。 对焦环 如何手动对焦? 想要收获最好的虚化效果,要达到以下三个条件 手动对焦一般都是在一些很极限的情况下才会用了。 不要太在意专业啊、手动啊啥的,千万别以为手动就是专业的,自动对焦本身就是技术的进步,没有那个摄影师会在自动能满足的情况下去考虑手动对焦,除非是职业装13的。 手动对焦适用场合大致如下: 1、弱光环境 很多拍星空的朋友都有这样的体验,当你想拍摄清晰的前景,对远处暗淡的主体对焦时,你半按快门,却发觉相机无法对焦。 在低光低对比的环境下,相机是无法准确对焦的,此时,手动对焦便是最好的选择。 2、微距拍摄   近距离拍摄物体,半按快门,图像一直在对焦和失焦之间徘徊,始终无法全按快门拍照,此时是最尴尬的时刻,这是因为景深太浅,导致相机无法自动对焦。 这时使用手动对焦就可以解决大部分问题。 3、主体前有遮挡物   在一些场合,你想拍摄的被摄主体前面,有其他物体在前景位置遮挡,比如栏杆,玻璃等等,自动对焦往往就会将焦点放在前景物体上,而不是你想拍摄的主体,此时,用手动对焦能快速解决问题。 4、使用老镜头   老镜头多没有自动对焦模式,只支持手动对焦,此时便毫无其他选择了。 5、摄影乐趣 以前很喜欢蔡司镜头,它拍出的图片色彩浓郁,德味甚浓,但蔡司头都是手动头。 犹豫再三,半年前还是禁不住诱惑进了一只蔡司50/1.4镜头。 其后,我多次用它进行街拍或人像拍摄,不得不说,手动对焦的乐趣,是旁人无法体会的。 二、手动对焦方法 1、相机设置:(以尼康相机为例) 1.1.镜头的对焦模式,调为手动,即 “M”档。 1.2.相机的对焦模式,调为手动,即 “M”档。 1.3.另外,我拍摄风光类题材,相机的拍摄模式也是手动“M”档。 2、对焦点选择: 2.1.静态风光摄影中,一般选择全景深的近三分位对焦。 2.2.城市夜景风光,对焦部位尽量选择窗户等相对高光比区域,便于合焦确认。 2.3.强光手电辅助照亮主体,也是手动快速对焦的法宝。 3、手动对焦方法: 3.1.稳定:使用三角架等设备固定相机。 3.2.光圈:一般风光摄影的光圈设置为F8-F16,在对焦时,先把它设置为镜头的最大光圈,以得到最浅景深便于合焦识别。这一步是手动精准对焦的关键! 3.3.打开相机背屏显示模式:

2020-05-16

Python数据科学速查表.pdf

免费,超级有用的速查表,内容清晰明了,值得反复翻阅,总共十四张。我将他们汇总成了一个pdf文件,方便查阅~

2020-04-08

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除