Ivy @-优快云博客

原创算力是什么？怎么提升

定义：算力（Computing Power）是设备或系统在单位时间内执行计算任务的能力，涵盖硬件、软件与网络协同的综合性能，是 AI、大数据与高性能计算的核心生产力。核心指标FLOPS：每秒浮点运算次数，常用单位为 TFLOPS（万亿）、PFLOPS（千万亿）、EFLOPS（百亿亿）。TOPS：每秒整数运算次数，多用于边缘 AI 推理场景。算力分类类型核心载体典型场景通用算力CPU日常办公、基础计算智能算力AI 训练、推理超算算力超级计算机科学计算、气候模拟边缘算力。

2026-01-09 17:23:36 616

原创参考LLM制作数据集的通用实操指南

摘要：大语言模型(LLM)可作为辅助工具优化数据集制作流程，但不能替代真实数据采集。其核心价值体现在：1)设计规范化的标签体系和数据规格；2)优化标注流程，提供细粒度标注建议；3)辅助数据清洗和质量校验；4)自动生成文档和合规声明。使用需注意：严禁生成虚假数据，必须确保数据来源合法合规，保护隐私信息，并保持数据多样性和真实性。LLM输出需经人工校验，最终目标是提升数据集的专业性、规范性和制作效率，而非直接生成数据。

2026-01-08 14:53:45 410 1

原创揭秘LLM：大语言模型为何风靡互联网

摘要：本文系统探讨了大语言模型(LLM)的核心概念、技术架构及其在计算机视觉与心理学交叉领域的创新应用。LLM是基于Transformer架构的深度学习模型，通过海量数据训练实现语言理解与生成，其重要性体现在技术岗位需求和商业价值创造两方面。文章重点分析了LLM与传统数据库的本质区别，并详细阐述了"FER+LLM情感理解系统"的技术实现路线，包括图像预处理、表情特征提取、跨模态交互等模块。该系统将视觉表情识别与心理学语义解析相结合，实现了从"表情分类"到"情

2026-01-07 14:41:27 567

原创情感计算是怎样的？

情感计算是一门融合人工智能、心理学和计算机科学的交叉领域，旨在让计算机具备识别、理解、表达人类情感的能力。其核心包括情感识别（从面部、语音、文本等提取情感）、情感理解（分析情感成因）和情感表达（生成适配反馈）。技术发展呈现多模态融合（提升识别准确率）、生成式情感大模型（实现共情交互）、具身交互（应用于机器人等实体设备）等趋势。相比单模态，多模态情感计算虽能降低错误率，但数据需求更复杂。该技术正推动教育、医疗等领域的人机交互向更自然、人性化的方向发展。

2026-01-06 17:33:51 695

原创 Agent是什么？

摘要：本文系统梳理了AI领域Agent（智能体）的研究与应用现状。在文献分析方面，区分了核心期刊（北大核心、CSCD）与国际数据库（SCI、EI）对Agent研究的侧重差异，指出技术类研究集中在算法优化与系统实现，而社科类研究多探讨伦理问题。Agent作为具备自主性、反应性和社交性的计算实体，其发展呈现"大模型+规划+记忆+工具"的模块化趋势，2026年或将迎来AIAgent手机量产元年。文章详细解析了Google提出的A2A协议标准，该协议通过标准化通信框架解决多智能体协作问题...

2026-01-05 17:05:44 918

原创力扣，什么是扣子搭建？

本文主要探讨了力扣平台和扣子AI开发平台的区别与应用。力扣是一个算法题库和技术交流平台，提供在线竞赛功能，无需本地环境即可参与。扣子（Coze）则是字节跳动的AI应用开发平台，支持零代码/低代码方式构建AI智能体，适用于创建对话机器人、智能客服等工作流。文章还讨论了如何结合Python和深度学习技术，特别是在计算机视觉和心理学领域，开发自定义AI插件。虽然当前插件精度仍需提升，但展现了AI技术在专业领域的应用潜力。两个平台都采用网页端操作，但分别面向算法竞赛和AI应用开发两个不同领域。

2025-12-29 15:29:32 809

原创软件测试基础岗面试资料

虽然我尚未有机会直接使用Selenium和Appium进行测试，但我已经通过AI、网络在线课程进行了一定的学习，我相信通过实际项目中的实践，我能够快速掌握这些工具的使用方法，并为团队带来价值。我的面试官是直接围绕有没有相关实习经历、当时是做的哪方面的工作，能不能抗压，目前他的项目是什么，需要怎么样，还有没有什么问题要问他进行的。好好学，多自我思考！综上所述，我选择联想公司，是因为联想在行业内的领先地位、强大的技术创新能力、优秀的企业文化、丰富的职业发展机会、广阔的国际化视野以及良好的团队合作氛围。

2025-08-27 16:17:41 285

原创 AI应用实习生（根据招聘信息书写）

自主研发了城市管理系统、赤兔运维系统、微信商城、供应商系统、配送系统、客户管理系统、商品运营系统、分拣称重系统和波塞冬运维系统等九套系统，于2015年正式落地运营。此外，还提供1V1专属食材顾问答疑解惑，24小时高速响应，只需几分钟用户就可以在平台上一键下单完成采购。

2025-08-26 13:13:52 456

原创初级算法工程师——深度学习方向

矩阵运算、特征值、特征向量等。：概率分布、期望、方差、假设检验等。：导数、梯度、积分等。：梯度下降、牛顿法、拉格朗日乘数法等。：《线性代数及其应用》（David C. Lay）、《概率论与数理统计》（陈希孺）、《高等数学》（同济大学版）。：掌握基本语法、数据结构、文件操作、异常处理等。：NumPy、Pandas、Matplotlib、Seaborn等。：TensorFlow、PyTorch等。

2025-08-25 12:43:50 707

原创 CV中的随机失活

摘要：Dropout是计算机视觉中常用的正则化方法，通过随机"关闭"部分神经元防止过拟合。其核心原理是训练时随机失活部分神经元，测试时恢复并缩放输出。在CV任务中，Dropout及其变体（如DropBlock、Cutout）能有效提升模型泛化能力。实践建议包括：Dropout率通常设为0.3-0.5，需通过验证集调参；全连接层后用Dropout，卷积层可用DropBlock；测试时需关闭。调参方法包括：划分验证集、设置候选值、训练验证比较等，最终选择验证集性能最佳的Dropout率。

2025-08-09 17:02:16 703

原创 CV中Dropout

在计算机视觉（CV）领域，Dropout 是一种常用的**正则化技术**，尤其在卷积神经网络（CNN）中，用于防止**过拟合**。小数据集（如医学影像）需结合Dropout。- **卷积层后**：通常不建议直接使用Dropout（因卷积层参数共享，冗余较少），但部分研究（如**Stochastic Depth**）在残差块中使用。- **全连接层**：传统CNN（如AlexNet）在全连接层（如FC1、FC2）后添加Dropout（如 \( p=0.5 \)）。

2025-08-08 22:32:11 322

原创 CV领域中的早停

本文介绍了计算机视觉中常用的早停（EarlyStopping）技术及其应用。早停通过监控验证集性能防止过拟合，在图像分类、目标检测等任务中能有效节省计算资源。文章详细阐述了早停的工作机制，包括划分验证集、设置耐心值等步骤，并提供了PyTorch实现代码。同时对比了早停的优缺点，指出其需要配合代表性验证集使用。此外，文章还解答了关闭早停的方法和替代监控方案，如TensorBoard、CSV日志等，强调即使关闭早停，仍可通过保存最佳检查点来追踪模型性能。全文为CV任务中的模型训练提供了实用的正则化策略和进度监控

2025-08-08 22:22:38 1010

原创产品实习生

--### 一、关于岗位与工作内容1. 这个实习岗位目前最急需解决的 2–3 个具体任务是什么？2. 日常工作中，实习生有多大比例的时间会用于数据分析、用户调研、原型设计、跨部门沟通？3. 贵司使用哪些工具或系统来管理需求与项目进度（如 Axure、Figma、Jira、TAPD、飞书 OKR 等）？4. 产品文档的规范与模板已经成熟吗？还是允许实习生参与制定？---### 二、关于转正与晋升5. 过往实习生中，大约有多少比例顺利转正？转正评估的核心维度有哪些？

2025-08-08 21:43:30 296

原创数据标注实习生

数据标注实习生常见的职业起点，但发展路径远比“打零工”丰富。下面给出一条“从入门到专家”的阶梯式路线图，并穿插真实案例、能力模型与薪酬区间，方便你对照执行。

2025-08-08 00:00:26 584

原创正则化（主解答概念性）

过拟合现象：模型在训练集上表现极好（如准确率100%），但在测试集上表现差（如准确率仅60%），说明模型学到了训练数据中的噪声而非真实规律。- 高方差问题：复杂模型（如高阶多项式、深度神经网络）容易过度拟合训练数据，导致泛化能力差。- 原理：在训练时随机“关闭”一部分神经元（如每次迭代关闭50%），强制网络学习冗余特征。- L1正则化：像“橡皮筋”勒紧模型，直接剪掉不重要特征（权重归零）。- λ过大：模型过于简单，可能欠拟合（高偏差）。- λ过小：正则化失效，可能过拟合（高方差）。

2025-08-04 04:09:01 745

原创鲁棒性（主讲计算机视觉方向）

它既可以是自然产生的（如传感器漂移、环境噪声），也可以是人为引入的（如对抗攻击、数据增强），其核心特征是扰动的强度、频率或模式在时间维度上发生变化。GAN（Generative Adversarial Network）和 VAE（Variational Autoencoder）是两种主流的深度生成模型，都能“无中生有”地合成数据（图像、音频、文本等），但实现思路和训练方式截然不同。- sigma（标准差）：控制模糊程度，越大越模糊（\(\sigma=1\) 轻模糊，\(\sigma=5\) 重模糊）。

2025-08-04 02:08:41 2118

原创深度学习中数据预处理

深度学习中，数据预处理的核心目的不是“让数据更干净”，而是让原始数据与神经网络的数学假设、计算约束、优化动态三者之间达成可学习的对齐。它既服务于模型，也改造着数据。以下从目的、步骤、结果三个维度展开深度剖析。一、目的：对齐神经网络的三大需求1. 数值稳定性神经网络对输入的分布高度敏感。未处理的尺度差异、长尾分布或异常值会导致梯度爆炸/消失、权重矩阵病态（ill-conditioned），使训练无法收敛或陷入尖锐极小值。2. 容量适配。

2025-08-01 15:56:39 872

原创树莓派是什么？

树莓派是由剑桥大学团队2006年发起、2012年正式推出的教育用微型计算机，旨在提升编程教育普及度。2019年发布的树莓派4B是其第四代产品，搭载四核1.5GHz处理器，支持4K输出和多种外设接口，价格低廉但性能出色。它广泛应用于编程教学、家庭服务器、边缘AI和物联网等领域，至今仍是创客和开发者的高性价比选择。树莓派系统基于Linux，通过烧录工具即可快速部署，其庞大的社区生态和持续更新的硬件使其成为入门计算机科学的理想平台。

2025-08-01 12:09:05 905

原创 Flask Web接口与CLI脚本实现“零实时依赖”的图片上传、人脸检测、情绪识别及结果返回功能

本文提出一种零实时依赖的静态图片情绪识别方案，通过Flask Web接口和CLI脚本双通道实现。系统采用MTCNN进行人脸检测，预训练的FER2013模型进行情绪分类，支持浏览器上传或命令行直接处理图片。核心架构包含模型加载、图片预处理、预测函数等模块，实现了Web端表单提交和CLI批量处理的无缝集成。技术栈基于Python 3.9+、OpenCV、TensorFlow/Keras和Flask，模型权重和代码可完全本地化部署。文中详细解析了代码实现细节，包括文件上传验证、人脸检测、图像预处理、模型推理等关键

2025-07-31 15:50:59 759

原创 PyTorch框架

PyTorch框架解析：起源：由Torch(Lua)演进而来，2016年FAIR推出Python版PyTorch，2018年1.0版本实现研究到生产闭环，2022年2.0版本显著提速；原理：基于动态计算图、张量计算和自动微分三大机制，支持GPU加速和Python控制流；应用：提供从模型搭建、数据加载到训练部署的全流程工具链，支持TorchScript/ONNX等多种部署方式，并可通过Lightning等工具简化开发。PyTorch以Python易用性和动态图优势成为AI研究首选，同时具备工业级扩展能力

2025-07-31 14:53:44 816 1

原创小故事：AlphaGo事件

【摘要】AlphaGo在2015-2017年间实现围棋AI的重大突破：2015年首次击败职业棋手；2016年4-1战胜李世石；2017年3-0完胜柯洁；最终通过纯强化学习实现AlphaGo Zero，仅用3天自我对弈即超越所有人类棋谱训练的版本。其核心技术包括：监督学习（模仿人类棋谱）、蒙特卡洛树搜索（模拟胜率）、强化学习（自我博弈优化）、策略-价值网络（直觉与评估结合）和分布式计算（并行决策）。这一进程展示了AI从学习人类经验到自主超越的演进路径。

2025-07-31 10:46:08 946

原创深度学习主流框架的发展线路、技术特点与当下趋势

深度学习框架发展经历了四个阶段：萌芽期（2000年代初）主要依赖传统机器学习库；成长期（2012-2014）出现Theano、Caffe等早期框架；稳定期（2015-2019）形成TensorFlow和PyTorch双巨头格局；深化期（2020至今）趋向动静统一、大模型支持和国产化发展。当前主流选择包括PyTorch（研究）、TensorFlow（部署）和国产框架（PaddlePaddle/MindSpore）。技术趋势体现在分布式训练、编译器优化和训练-推理一体化等方面，与大数据生态形成互补关系。

2025-07-31 10:24:34 657

2401_87144448的博客