- 博客(24)
- 收藏
- 关注
原创 4 Matplotlib 文字图例
Matplotlib 提供了丰富的文本支持,包括数学表达式、TrueType 字体、旋转文本、换行符以及 Unicode 字符等。Matplotlib 提供了两种方式来绘制图例:pyplot 和面向对象(OO)方法。Matplotlib 提供了全局字体设置和局部字体设置两种方式。Tick(刻度)和 Ticklabel(刻度标签)可以通过。参数控制图例的显示位置,可选择位置字符串(如。,我们可以在图形的不同位置添加文本。方法可以为图形添加图例。参数为图例设置标题。)或对应的数字代码。
2025-04-20 10:50:39
748
原创 2 matplotlib绘图库
matplotlib 是一个用于绘制图形的 Python 库,其核心思想是通过Artist对象在Canvas上绘制图形。:表示绘图区,所有图像都在此区域绘制。Renderer:表示渲染器,类似于画笔,控制如何在 FigureCanvas 上绘图。Artist:具体的图表组件,例如线条、文本、图形等,是与用户交互的接口。
2025-04-18 11:48:48
557
原创 1 解析方法与几何建模
许多物理问题(如力、速度、加速度)都可以用向量表示,这使得我们可以直接通过向量的运算来计算合力、相对速度等,而不必借助复杂的几何图形。例如,边长、角度、面积等可以通过向量的模长、内积等来求解,平行、垂直等关系可以通过向量共线或内积为0来判定。结果表明,覆盖宽度与海水深度呈现典型的函数关系,随着距离的增加,覆盖宽度逐渐减小,且在一定距离内,重叠率会达到最小值。Python 提供了多个库,可以帮助我们简便地求解各种数学问题,尤其是在数值计算和符号计算方面,Numpy 和 Sympy 是最常用的工具。
2025-04-18 11:48:26
995
原创 第10章 大模型的有害性(下)
除了前面讨论的性能差异和社会偏见外,大型语言模型可能产生的有毒性和假信息也是其潜在的有害影响。一些缓解策略,如基于数据的微调(DAPT)和解码策略(PPLM),虽然能减少生成的毒性,但也可能带来负面影响,譬如对特定文化背景的理解不充分,或者对边缘化群体的偏见。在测试过程中,GPT-3生成的文本有时展现出较高的毒性,即使是非毒性提示也可能引发有毒内容的生成。研究表明,经过微调的语言模型可以生成与真实新闻几乎无法区分的内容,这使得它在虚假信息战役中的潜力不可小觑。10.3.1.1 相关工作。
2024-12-03 22:37:23
789
原创 第9章 大模型的有害性(上)
在AI中,特别是大型语言模型的应用中,许多决策会依据受保护的社会群体属性(如种族、性别、宗教、年龄等)。大型语言模型的性能差异和社会偏见问题往往与历史上的歧视现象一致,尤其是交叉性理论指出,处于多个边缘化群体交集的个体(如黑人女性)通常面临更为严重的歧视。尽管具体的下游应用环境中伤害的影响较为直观,但作为基础模型的LLMs所引发的上游问题同样不可忽视。有效的缓解措施需要采用更广泛的社会技术方法,这些方法需要涵盖LLMs的应用环境,并根据不同的社会情境作出适应性调整。动机:测试模型对涉及人名的理解。
2024-12-03 22:35:50
1611
原创 第8章 分布式训练
不同的并行策略适用于不同的场景,选择合适的并行策略是提升训练效率的关键。数据并行适用于较小模型和大规模数据集,模型并行适合大模型但较小的数据集,流水并行适合非常庞大的网络,而混合并行则结合了多种策略以满足复杂需求。选择何种策略将依赖于硬件资源、模型大小以及数据分布等多方面的因素。
2024-12-02 23:56:13
720
原创 第7章 大模型之Adaptation
在语言模型的适配过程中,Probing和是主要的适配方法。通过不同的策略(如调整输入提示、插入适配器模块、修改输入结构等),可以显著提升模型在特定任务上的表现,而不必完全依赖传统的全量微调。通过这些技术,语言模型能够更好地处理下游任务的多样性和复杂性,实现更加高效和灵活的人工智能应用。
2024-12-02 23:54:57
2043
原创 第6章 模型训练
目标函数:根据模型类型不同,选择适合的目标函数(如最大似然、掩码语言建模、下一句预测)。优化算法:使用如 SGD、Adam、AdaFactor 等优化算法,并结合混合精度训练、学习率调整等技术,提升训练效率与稳定性。
2024-11-30 12:00:00
739
原创 第5章 大模型的数据
大型语言模型的能力来源于广泛的训练数据,这些数据通常涵盖了多种领域和语言,主要以网络上的原始文本为基础。本章讨论了大模型背后的数据构成、数据的偏差和问题,以及如何通过文档记录和数据治理提高数据质量和透明度。
2024-11-30 11:30:00
694
原创 第3章 模型架构
大语言模型的核心在于高效的分词技术(如BPE、Unigram)和强大的Transformer架构。通过编码、解码或两者结合的方式,模型能够高效完成理解与生成任务。GPT-3 以其深度和宽度的平衡优化,实现了卓越的生成性能。
2024-11-30 11:00:00
888
原创 第4章 新的模型架构
混合专家模型高效稀疏激活,支持大规模模型的训练与推理。案例:GLaM、Switch Transformer等。基于检索的模型动态上下文增强,适用于知识密集型任务。案例:RAG、RETRO等。未来方向混合专家与检索模型的结合。设计更高效、可扩展的稀疏激活和检索机制。
2024-11-30 11:00:00
790
原创 第2章 大模型的能力
本章探讨GPT-3的多种能力,基于其在标准NLP基准测试和特定任务中的表现。结果显示,GPT-3在一些任务上表现优异(如语言建模),但在其他任务中落后于大量标签数据支持的系统。GPT-3并未特别针对任务进行训练,但通过上下文学习即可在多种任务中表现良好,展示出其广泛的适应能力。
2024-11-28 13:19:20
651
原创 第1章 引言
语言模型的目标是对输入的文本序列进行处理,生成新的文本或符号输出。输入序列问题:需要将文本信号转换为计算机可处理的数值。输出序列问题:需要将模型生成的数值映射回字符。独热编码将字符映射为向量,便于输入神经网络。模型输出概率分布,经过映射生成目标字符,逐步完成输出序列。语言模型(Language Model, LM)对词元序列 x1,...,xLx_1, ..., x_L 进行概率建模,评估序列的合理性。语言模型的能力依赖其对语法知识和世界知识的隐式掌握,从而评估序列的概率。
2024-11-28 13:18:51
705
原创 2.3 投资学基础概念
投资是为了获得未来可能但并不确定的收益(未来价值,Future Value),而作出牺牲确定现值(Present Value)的行为。——(1990年诺贝尔经济学奖得主)时间性:资金具有时间价值,投资行为涉及到对当前消费的牺牲和对未来消费的规划。不确定性(风险性):投资存在风险,收益的大小并非确定。收益性:投资目的是增加财富,从而满足未来的消费需求。投资学(Investments)是研究投资行为及资产价格均衡的科学。它包括微观金融学、宏观金融学和交叉学科。微观金融学。
2024-11-28 13:11:46
584
原创 2.2 货币金融学基础概念
金融市场:资金从剩余方转向短缺方的市场,实现金融资源的有效配置,提高经济效率。债券市场:债券的发行和买卖场所,债券是借款的凭证,借款人承诺在未来定期支付现金。股票市场:股票的买卖、转让和流通场所,股票代表所有权,持股人拥有公司的一部分,享有公司收益与资产的权利。货币与通货膨胀货币:在经济活动中普遍接受的物品。通货膨胀:物价水平持续性上涨,可通过CPI、PPI等衡量。货币政策与财政政策货币政策:中央银行管理货币和利率的政策。财政政策:政府支出和税收收入的决策,分为预算赤字、预算盈余与预算平衡。
2024-11-27 19:59:08
385
原创 2.1 宏观经济学基础概念
1929年经济大萧条爆发,市场无法自我调节,凯恩斯在1936年发表《就业、利息与货币通论》,提出有效需求不足是经济危机的根本原因。1776年,亚当斯密发布《国富论》,提出了“看不见的手”理论,主张市场是自我调节的,经济活动无需政府干预。例如,在经济上行时,通货膨胀和利率变化会影响股票、债券和商品的表现,从而影响投资策略。利率是借贷成本的关键指标,利率变化直接影响企业和消费者的融资行为,进而影响总需求。凯恩斯认为,在经济萧条时,消费、投资都降低,此时通过增加政府购买可以提升国民收入,刺激经济。
2024-11-27 13:51:34
1007
原创 01. 投资与量化投资
经济学意义上的投资投资是为获得预期的社会经济效益而进行的资金或资本投入活动。目的是通过经济主体(如政府、企业、个人等)预先垫付一定量的资金或实物,经营某项事业,期望获得未来收益。投资分类实物投资:包括汽车、房屋、机器设备等有形资产的投资,目的是通过购置和建设固定资产来获得未来收益。金融投资:包括银行储蓄、股票、债券、基金等无形资产,投资者期望通过金融市场的增值获得回报。金融投资的演变从资本主义发展初期的实物投资到如今以金融投资为主,特别是证券投资,成为现代投资的主要形式。投资与投机的区别投资。
2024-11-27 13:49:49
1634
原创 FastAPI 依赖项系统理论笔记
在 FastAPI 中,依赖项(Dependencies)是指可以在路径操作函数(Path Operation Functions)中声明并执行的函数或类,它们主要用于提取请求参数、处理验证、提供预处理的数据等。一个依赖项可以依赖于另一个依赖项,FastAPI 会负责解析这些依赖项的执行顺序,并将结果传递给需要的地方。具体来说,对于每个请求,FastAPI 会在首次执行某个依赖项时保存该依赖项的结果,并将该结果传递给其他需要该结果的依赖项。参数,可以确保所有的路径操作函数都会执行这些依赖项。
2024-11-25 12:41:50
573
原创 FastAPI 文件上传与表单字段处理概述
FastAPI 提供了灵活的方式来处理文件上传和表单数据。通过使用File和Form参数,可以在同一请求中接收文件和表单字段数据。这种方式适用于多种场景,如用户上传文件并附带其他信息(例如验证令牌)时。
2024-11-20 20:56:31
364
原创 HTTP 状态码与 FastAPI 中的 status_code 参数
在 FastAPI 中,参数用于指定 HTTP 响应的状态码,它可以直接嵌入在路径操作函数的装饰器中,如@app.get()等。这种做法使得 API 响应更加清晰、符合标准,且能够根据不同的请求类型和操作结果返回合适的状态码。
2024-11-17 21:57:03
459
原创 FastAPI 学习笔记:处理 Query、Path、Cookie 和 Header 参数
是 URL 路径中的一部分。它们通常表示资源的唯一标识符或在 URL 中嵌入的动态内容。Path 参数是必需的,因为它们直接影响 URL 的匹配,只有路径完全符合才会触发对应的处理函数。是从客户端浏览器中发送的 Cookie 中提取的。是附加在 URL 中的查询字符串部分。它们通常用于从客户端传递可选数据,通常是通过 URL 中的。Query 参数可以有默认值,并且可以通过验证规则限制其值的范围或格式。是从 HTTP 请求头中提取的。来定义 Cookie 参数,并且可以为其设置默认值或添加验证规则。
2024-11-15 14:43:23
477
原创 FastAPI 基本用法与查询参数、路径参数的校验
在 API 设计中,幂等性意味着对同一资源的多次相同请求应该产生相同的效果。通过理解这个概念,掌握了如何设计接口,使其行为符合 API 规范,避免重复请求带来不必要的副作用。我通过学习了解,FastAPI 会自动将查询字符串中的参数传递给函数,并进行类型转换。语法来更方便地声明路径参数的元数据,增强代码的可读性和可维护性。类型,FastAPI 会自动识别为可选的字符串类型,如果请求中未提供此参数,则默认为。用于声明路径参数的类型,并进行校验和添加元数据。在学习路径参数时,我了解到,FastAPI 提供了。
2024-11-12 21:17:57
139
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人