- 博客(28)
- 收藏
- 关注
原创 Python入门第13课:数据可视化入门,用Matplotlib绘制你的第一张图表
在绘图前,先想清楚你想通过图表传达什么信息。折线图看趋势,柱状图看比较,散点图看关系,直方图看分布,饼图看比例。标题、x轴标签、y轴标签必不可少。当图表中有多个数据系列时,图例能帮助区分。选择合适的颜色、字体大小,避免图表过于花哨或拥挤。利用或这是防止布局错乱的神器。使用保存高质量图片。能确保所有元素都被包含在内。通过本课的学习,你已经成功迈出了数据可视化的第一步!Figure和Axes。使用面向对象的方法 () 进行绘图。绘制折线图、柱状图、散点图、直方图、饼图等基本图表。
2025-08-20 19:00:00
937
原创 Python入门第12课:数据处理神器,Pandas基础操作完全指南
Pandas支持链式调用,让代码更紧凑。.head(10)尽量使用Pandas内置的向量化操作(如),而不是对行进行for循环,效率更高。理解inplace会修改原对象,(默认) 返回新对象。谨慎使用inplace,以免意外修改原始数据。明确你的数据中NaN的含义,并选择合适的处理策略(删除、填充、插值)。大型DataFrame会占用较多内存。考虑使用合适的数据类型(如categoryhead()info()describe()是你开始分析数据的好朋友。
2025-08-20 07:00:00
744
原创 Python入门第11课:Python网络请求入门,使用requests库轻松获取网页数据
在使用响应内容前,务必检查或使用。避免程序因网络问题卡死。使用try-except捕获网络请求中可能发生的各种异常。如果进行网页抓取(Web Scraping),请检查网站的robots.txt文件(如)和使用条款,避免过于频繁的请求(设置延迟),不要给服务器造成过大负担。对于需要保持登录状态的多步操作,使用。API密钥、密码等敏感信息不要硬编码在代码中,可以使用环境变量或配置文件。requests适用于同步请求。如果你需要处理成千上万的并发请求,可以考虑aiohttp(异步) 或httpx。
2025-08-19 23:00:00
3951
原创 Python入门第10课:用Python操作Excel,openpyxl与pandas实用技巧
先想清楚任务是侧重数据处理还是格式排版,选择合适的工具或组合使用。对于超大Excel文件,考虑使用pandas的chunksize参数分块读取,或openpyxl的read_only模式。在生产脚本中,务必使用try-except处理文件不存在、权限不足、数据格式错误等异常。在项目中使用虚拟环境管理依赖。在修改重要Excel文件前,先备份。通过学习openpyxl和pandas,你已经掌握了用Python自动化Excel操作的强大技能。openpyxl赋予你“外科手术”般的精确控制力,而。
2025-08-19 20:30:00
998
原创 Python入门第9课:面向对象编程(OOP)从零开始,类、对象与三大特性
传统的过程式编程(我们之前主要使用的)是将程序视为一系列按顺序执行的步骤(函数)。而面向对象编程则是将程序视为一组对象 (Objects)的集合。每个对象都是现实世界中某个事物的软件模型。程序中的一个具体实例,比如一只“猫”、一辆“汽车”、一个“用户账户”。对象拥有状态 (State)和行为 (Behavior)。是创建对象的蓝图 (Blueprint)或模板 (Template)。它定义了对象应该具有哪些状态(属性)和行为(方法)。万物皆对象。
2025-08-18 23:00:00
788
原创 Python入门第8课:模块与包的使用,如何导入标准库与第三方库
在Python中,一个.py文件就是一个模块 (Module)。模块文件中可以包含函数、类、变量和可执行的语句。当项目变得更大时,单个模块可能仍然不够用。包 (Package)就是包含多个模块的文件夹。它允许你将功能相关的模块组织在一起,形成一个层次化的结构。使用小写字母和下划线 (snake_case),避免与标准库模块名冲突。合理规划包的目录结构,保持逻辑清晰。善用它来组织包的公共接口。通常建议:标准库导入相关第三方库导入本地应用/库特定导入每组之间用空行分隔。
2025-08-18 21:30:00
1095
原创 Python入门第7课:异常处理机制:让你的程序更健壮(try-except详解)
简单来说,异常就是程序在运行过程中发生的错误事件。它打断了正常的指令流。当内置的异常类型不足以表达你的业务逻辑错误时,你可以创建自己的异常类。自定义异常通常继承自Exception类或其子类。"""余额不足异常"""f"余额不足!
2025-08-17 17:00:00
1659
原创 Python入门第6课:文件操作之读写文本、CSV与JSON文件
文件操作是连接程序与外部世界的重要桥梁。使用open()和with语句安全地读写文本文件。利用csv模块高效处理CSV表格数据DictReaderDictWriter使操作更直观。运用json模块在Python对象和JSON数据格式之间自由转换,便于数据交换和配置管理。这些技能将使你能够创建能够持久化数据、读取配置、处理数据集和与外部系统交互的实用程序。创建一个文本文件,写入几行日记,然后读取并打印出来。创建一个CSV文件,包含你的书单(书名、作者、年份),然后编写程序读取并显示。
2025-08-17 10:00:00
675
原创 Python入门第5课:如何定义和使用函数,提升代码复用性
想象一下,你每天都要做“起床”这件事。这个过程可能包含一系列固定的步骤:睁眼、伸懒腰、坐起来、下床、洗漱。你可以把这些步骤封装成一个名为“起床”的“动作包”。每次需要起床时,你只需要说“执行起床动作”,而不需要每次都详细描述每一个步骤。在编程中,函数就是这样一个“动作包”或“代码块”。它是一段可重复使用的、执行特定任务的代码。你可以给它起一个名字,当需要执行这个任务时,只需“调用”它的名字即可。def函数是代码的“动作包”,用于封装可重复执行的任务。使用def定义函数,使用函数名()调用函数。
2025-08-16 18:00:00
859
原创 Python入门第4课:核心数据结构详解,列表、元组、字典与集合
特性列表 (List)元组 (Tuple)字典 (Dictionary)集合 (Set)符号[](){}(键值对){}(非空) /set()有序性有序有序3.7+ 保持插入顺序无序可变性可变不可变可变可变元素/键唯一性允许重复允许重复键唯一元素唯一访问方式索引索引键 (Key)成员检查主要用途存储有序序列,可修改存储固定数据,用作键存储键值对映射去重,集合运算列表、元组、字典和集合是Python数据处理的四大支柱。列表是灵活的有序容器。元组是安全的固定序列。字典。
2025-08-16 10:00:00
1477
原创 Python入门第3课:Python中的条件判断与循环语句
条件判断 (ifelifelse:让程序能够根据不同的情况执行不同的代码路径,实现分支逻辑。循环语句 (forwhile:让程序能够自动、重复地执行任务,极大地提高了效率。for循环适用于已知遍历对象(如列表、范围)的场景。while循环适用于基于条件判断是否继续的场景。循环控制 (breakcontinue:提供了更精细的循环控制能力。条件判断和循环是构建复杂程序的骨架。它们与变量、数据类型、输入输出结合,可以创造出功能强大的应用程序。尝试修改“猜数字”游戏,比如改变数字范围或最大尝试次数。
2025-08-15 22:30:00
1069
原创 Python入门第2课:Python基础语法全解析变量、数据类型与输入输出
在编程中,变量是用于存储数据值的容器。你可以把它看作一个盒子,盒子上贴着标签(变量名),盒子里放着东西(数据)。为数据贴上标签,方便存储和引用。掌握了intfloatstrboolNone这几种最基本的数据类型及其操作。学会使用print()输出信息,使用input()获取用户输入,并了解了类型转换的重要性。这些概念是构建任何Python程序的基础。务必多加练习,尝试创建不同的变量,进行各种运算,并编写一些简单的交互程序。我们将学习Python中的控制流程——使用ifelifelse。
2025-08-15 21:00:00
819
2
原创 深入理解 RAG:检索增强生成技术详解
是一种结合信息检索与语言模型生成的技术框架。在生成答案之前,先从外部知识库中检索相关信息,再将这些信息作为上下文输入给大模型,指导其生成更准确、有据可依的回答。RAG 技术为大语言模型注入了“外部大脑”,使其不再局限于训练时的静态知识,而是能够动态获取、理解和利用最新信息。它有效缓解了 LLM 的幻觉问题,提升了回答的可信度与可解释性。随着向量数据库、嵌入模型和推理引擎(如 vLLM)的不断进步,RAG 系统将变得更加高效、智能和普及。掌握 RAG,就是掌握了构建可信 AI 应用的核心钥匙。🚀立即行动。
2025-08-14 22:30:00
961
原创 Python入门第1课:环境搭建与第一个程序“Hello World”
恭喜你完成了Python学习的第一课!成功下载并安装了Python解释器。验证了Python环境是否正常工作。使用IDLE和脚本文件两种方式运行了第一个Python程序“Hello World”。初步了解了print()函数和字符串。
2025-08-14 22:00:00
813
原创 深入理解提示词工程:从入门到精通的AI对话艺术
提示词是用户输入给大语言模型的文本指令,用于引导模型生成期望的输出。提示词工程不仅是技术,更是人与AI协作的艺术。一个优秀的提示词,能让AI从“工具”变为“伙伴”,释放出惊人的创造力与效率。让AI为你写文章、做PPT、写代码构建智能客服、知识问答系统提升工作效率,释放创造力🚀立即行动:从今天开始,用心设计每一个提示词,开启你的AI高效之旅!附录:提示词设计检查清单任务是否清晰明确?是否指定了角色或视角?是否有示例或格式要求?是否包含必要的上下文?是否设定了长度、风格等约束?
2025-08-14 21:30:00
740
原创 深入理解 Transformer:从原理到大模型革命
Transformer 不仅是一个模型架构,更是一场深度学习的范式革命。它以“”的理念,证明了纯注意力机制足以胜任复杂的序列建模任务。从最初的机器翻译,到今天的通用人工智能探索,Transformer 持续推动着技术边界。掌握其原理,不仅有助于理解大模型的工作机制,更能为未来的创新提供无限可能。🚀立即行动:从阅读原始论文开始,动手实现一个 Transformer 模型,开启你的深度学习之旅!
2025-08-13 23:00:00
1190
原创 一文让你深入理解自注意力机制:Transformer 的核心引擎
自注意力机制是一种让模型在处理序列时,动态地关注序列中不同位置信息的方法。Query、Key 和 Value 都来自同一个输入序列。换句话说,序列中的每个元素都可以作为“问题”(Query)去查询序列中所有其他元素(包括自己)的“内容”(Value),并通过“标签”(Key)计算相关性。自注意力机制是现代深度学习的基石技术,它赋予了模型强大的上下文理解能力和长程依赖建模能力。从最初的 Transformer 到今天的 vLLM,每一次创新都在突破性能和效率的极限。
2025-08-13 21:00:00
1064
原创 一文让你深入理解注意力机制:从原理到Transformer与vLLM应用
注意力机制不仅是深度学习的一次范式转变,更是通往通用人工智能的重要基石。从最初的 Seq2Seq 模型,到颠覆性的 Transformer,再到 vLLM 的 PagedAttention,每一次演进都在突破性能和效率的边界。掌握注意力机制的原理,不仅有助于理解当前大模型的工作方式,更能为未来的算法创新和工程优化打下坚实基础。深入理解“Attention”,你就能真正理解现代 AI 的“思考”方式。🚀立即行动。
2025-08-13 19:00:00
3447
原创 基于 GitLab 的代码管理最佳实践:从部署到高效协作
代码仓库管理:支持 Git 仓库的创建、分支、合并、标签等操作CI/CD 流水线:内置强大 CI/CD 引擎,支持自动化构建、测试、部署项目管理:看板、Issue、里程碑、Wiki 文档代码质量与安全:静态代码扫描(SAST)、依赖扫描(Dependency Scanning)、许可证合规容器 registry:集成 Docker 镜像仓库监控与可观测性:应用性能监控、日志查看:开源免费,功能强大:商业版,支持高级功能(如高级 CI、安全审计):云端托管服务✅ 本文以GitLab CE。
2025-08-13 06:00:00
955
原创 一文了解禅道基础使用及部署,提升项目管理效率
自定义字段:为需求、任务、Bug 添加专属字段工作流:自定义状态流转规则权限管理:精细控制用户操作权限插件市场:安装 Jenkins 集成、飞书通知、代码评审等插件禅道作为一款功能全面、部署灵活、开源免费的国产项目管理工具,特别适合希望实现研发流程规范化、又不想承担高额软件成本的团队。无论是敏捷开发还是传统项目管理,禅道都能为你提供有力支持。禅道为青岛易软天创公司产品,本文不构成官方建议。阿里云服务建议仅供参考。
2025-08-12 22:00:00
1045
原创 Jira 部署与使用全攻略:从零搭建高效项目管理平台
Jira 最初是为 bug 和 issue 跟踪设计的,现已发展为支持 Scrum、Kanban 等多种敏捷方法的综合项目管理平台。任务创建与分配自定义工作流敏捷看板与冲刺(Sprint)管理报告与仪表盘丰富的插件生态(Atlassian Marketplace)与 Confluence、Bitbucket、CI/CD 工具深度集成Jira Cloud(云端托管):由 Atlassian 托管,开箱即用,适合大多数团队。Jira Data Center / Server(本地部署)
2025-08-12 20:00:00
3400
原创 一文带你了解vLLM及基础使用
vLLM 由加州大学伯克利分校的团队开发,其核心目标是显著提升大语言模型的推理效率。它通过创新的内存管理和调度算法,实现了比现有系统(如 Hugging Face Transformers)高出数倍的吞吐量,同时保持了极低的延迟。简单来说,vLLM 让你在相同的硬件资源下,能够服务更多的用户请求,或者以更低的成本提供相同的推理服务。vLLM 凭借其创新的 PagedAttention 技术,为大语言模型的高效推理树立了新的标杆。它不仅极大地提升了推理性能,也降低了服务成本,加速了 LLM 技术的落地应用。
2025-08-11 22:00:00
712
原创 一文教你本地部署自己的大模型:Ollama 部署与使用完全指南
它支持众多流行的开源模型(如 Llama 2/3, Mistral, Gemma, Phi 等),让你无需深入复杂的模型加载和推理代码,就能像使用命令行工具一样与强大的 AI 模型对话。幸运的是,Ollama 的出现为我们提供了一个优雅的解决方案——它让在本地机器上运行、管理和交互各种开源大模型变得前所未有的简单。模型文件较大,deepseek-r1:7b 约 5GB,70B 超过 43GB,请预留足够空间。首次运行时,Ollama 会加载模型到内存(可能需要一些时间,取决于模型大小和硬件)。
2025-08-08 22:00:00
786
原创 一文了解gerrit是什么以及gerrit的核心特点和概念
Gerrit 使用一个特殊的 Change-Id 来追踪一个变更的整个生命周期,即使你修改了提交信息重新推送,Gerrit 也能识别这是同一个变更的更新,而不是一个全新的变更。完全兼容 Git 命令,开发者仍然使用熟悉的 Git 工具(如 git clone, git add, git commit),只是推送(push)的目标和方式有所不同。当 Change 满足所有预设的投票要求(如至少一个 +2 和一个 Verified +1)后,有权限的用户可以点击 Submit 按钮,将代码正式合并到目标分支。
2025-08-07 22:00:00
729
原创 一文告诉你大模型部署Ollama和vllm该怎么选
GGUF + llama.cpp:使用 CPU/GPU 混合推理,支持 Metal(Apple)、CUDA(NVIDIA)、Vulkan(跨平台 GPU)加速。PagedAttention:vLLM 的核心创新,借鉴操作系统虚拟内存/分页思想,将注意力键值对(KV Cache)切分为“块”进行管理。核心定位:为开发者和终端用户提供一个极简方式来本地运行大语言模型(LLM),强调“开箱即用”、“零配置”体验。根据你的使用场景、硬件条件和性能需求,选择合适的工具,甚至可以组合使用,发挥各自优势。
2025-08-06 22:00:00
635
原创 主流大模型训练方法详解:SFT、DPO、CPT、RLHF、LoRA 等
随着大语言模型(LLM)的发展,出现了多种训练和微调策略。通过建模人类偏好对(preferred vs rejected responses),绕过传统RLHF中的奖励模型和强化学习阶段。在输入序列前添加可学习的前缀向量,用于控制模型的行为,类似Prompt Tuning。在LoRA基础上加入模型量化(如4-bit、8-bit),进一步压缩模型。利用对比学习的思想,使模型在不同提示下区分正负样本,增强语境感知能力。在预训练模型基础上,使用带标签的数据进行有监督微调。中等偏高,取决于模型大小和数据集规模。
2025-07-10 15:05:51
1222
原创 一张表,告诉你代码分支如何管理
版本发布:当决定要进行版本发布时,从develop分支创建release branch,在该分支上进行最后的测试和bug修复,完成后合并到main和develop。热修复处理:直接从main分支创建hotfix branch,修复完成后需同时合并至main和develop。特性开发:从develop分支拉出新的feature branch,完成开发后合并回develop。紧急情况下,任何有权访问的人都可以开始修复,但合并需要审核。集成特性分支和热修复,准备下一次发布。开发分支(develop)
2025-04-15 14:39:28
349
原创 一张表,让你快速选择合适的并发处理方式
选择合适的并发处理方法取决于多个因素,包括但不限于你的应用类型(I/O密集型 vs CPU密集型)、现有的技术栈、团队的技术熟练度以及具体的需求。如果您的应用既包含I/O密集型任务也有一定量的CPU密集型任务,或者您希望有一个更为简单的部署方案而不需要担心库的兼容性问题,那么gthread可能更适合。如果你的应用主要是I/O密集型的,并且希望在单个工作进程中处理大量并发连接,那么gevent或eventlet是很好的选择。类似于gevent,它也是一个基于协程的并发库,允许你在单线程中运行大量并发任务。
2025-04-15 11:21:22
1059
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅