- 博客(21)
- 收藏
- 关注
翻译 论文翻译:DLFuzz: 深度学习系统的差分模糊测试
深度学习(DL)系统越来越多地应用于安全关键领域,例如自动驾驶汽车。确保DL系统的可靠性和鲁棒性非常重要。现有的测试方法往往未能包含测试数据集中的稀有输入,且展现出低神经元覆盖率。本文提出了DLFuzz,这是第一个引导DL系统暴露不正确行为的差分模糊测试框架。DLFuzz通过持续细微地突变输入,以最大化神经元覆盖率和原始输入与突变输入之间的预测差异,无需人工标注或引用具有相同功能的其他DL系统。我们在两个著名的数据集上进行了实验评估,以展示其效率。
2024-09-20 11:38:52
274
翻译 论文翻译:增强大型语言模型的代码调试能力:基于通讯代理的数据精炼框架
DEBUGEVAL 引入了四个不同的任务来评估 LLMs 的调试能力。这些评估任务包括错误定位(BUG Localization)、错误识别(BUG Identification)、代码审查(Code Review)和代码修复(Code Repair)。DEBUGEVAL 的数据统计如表 I 所示。对于每个任务,分别使用 Python、C++ 和 Java 提供问题,以评估 LLMs 在不同编程语言上的调试性能。
2024-09-14 10:46:06
670
翻译 论文翻译:理解整个软件代码库的方法 -- Alibaba Lingma Agent
近年来,基于大语言模型(LLM)的代理推动了自动软件工程(ASE)的显著发展。尽管已有方法被验证有效,但现有方法的设计主要关注代码的局部信息,例如问题、类和函数,这导致在捕获软件系统的全局上下文和相互依赖关系时存在局限性。根据人类软件工程开发者的实际经验,我们认为全面理解整个代码库将是实现自动软件工程的关键路径。然而,理解整个代码库会带来各种挑战,例如超长的代码输入、噪声代码信息、复杂的依赖关系等。
2024-07-25 11:07:31
513
翻译 论文翻译:R2E:将任何 GitHub 仓库转换为编程代理环境
虽然大型语言模型(LLMs)的编码能力迅速发展,但相应的真实编程环境评估基准尚未跟上步伐。构建一个可扩展且互动的测试平台,用于评估通用 AI 编程代理在真实代码中的表现一直具有挑战性,主要是因为缺乏高质量的测试套件。在本文中,我们提出了 Repository to Environment (R2E),这是一个框架,可以将任何 GITHUB 仓库转变为测试环境,以评估代码生成系统(包括静态和交互式)的性能。R2E 结合了程序分析和 LLMs 的协同作用,构建了任何 GITHUB 函数的等效测试工具。
2024-07-19 16:22:11
139
翻译 论文翻译:自动化设计与评估神经网络监控器
神经网络(NN)在以前未见过的数据类型(分布外数据或OOD)上的行为通常是不可预测的。如果网络的输出用于决策安全关键系统,这可能是危险的。因此,检测输入是否为OOD对于NN的安全应用至关重要。验证方法无法扩展到实际的NN,使得运行时监控在实际使用中更具吸引力。尽管最近提出了各种监控器,但对特定问题的优化以及彼此之间的比较和结果重现仍然具有挑战性。我们为NN监控器的用户和开发人员提供了一种工具。
2024-07-19 15:48:40
112
翻译 论文翻译:AGENTLESS:揭开基于LLM的软件工程代理的神秘面纱
大型语言模型(LLM)已成为代码生成任务的首选工具(如GPT-4和Claude-3.5),展示了其根据用户描述合成代码片段的能力。然而,与单一、独立问题的主要评估设置相比,应用LLM解决代码库级别的软件工程任务仍未得到充分研究。软件工程任务如特性添加、程序修复和测试生成需要不仅理解文件内的信息,还要理解文件之间的依赖关系。为了弥补这一差距并评估工具自动解决现实世界软件工程问题的能力,开发了流行的SWE-bench基准测试。每个问题包含一个现实世界的GitHub问题描述及对应的Python代码库。
2024-07-18 15:49:27
254
原创 controller中 加了@PostMapping和切面注解的方法会进入切面的逻辑,没有@PostMapping的方法加上切面注解不会进入切面的逻辑
Spring AOP:简单易用,适合大多数常见的 AOP 场景,但有一些限制,如无法拦截内部方法调用。AspectJ:功能强大,支持复杂的 AOP 场景,包括编译时和加载时织入,但需要更多的配置和理解。根据你的具体需求和应用场景选择合适的 AOP 实现方式。Spring AOP 更适合简单的应用场景,而 AspectJ 适合需要高级 AOP 功能的复杂场景。
2024-07-16 11:06:40
775
原创 跟着GPT学习——神经网络前备知识:线性代数
全系列文章:跟着GPT学习-AI系列本文翻译自文章:线性代数大多数日常数值计算都是一次处理一个数值。我们称这些数值为标量。例如,帕洛阿尔托的温度是温和的72华氏度。为了将温度转换为摄氏度,你可以使用公式:c=59(f−32)c = \frac{5}{9}(f - 32)c=95(f−32)其中 ( f ) 是温度,值5,9,32等是常数标量 是常数标量。变量 ( c ) 和 ( f ) 一般表示未知标量。在数学中,标量用小写字母表示(例如 xxx,yyy 和 zzz),它们可以是实数范围内的任意值。为
2024-06-28 15:57:11
721
原创 跟着GPT学习——神经网络前备知识:PyTorch中如何节省内存
我觉得GPT老师的语言功底比大多数的博客主要好(包括我自己),阅读起来更易理解,而且哪里不明白还可以直接问gpt老师,孜孜不倦,尽心尽责,全天待命,究极贴心。有这么厉害的一个老师,不学习简直暴殄天物。跪谢。
2024-06-28 10:57:57
724
原创 跟着GPT学习——VGG模型详解
本人基于这篇文章进行了内容翻译,并对细节之处进行补充本文概述了 VGG(也称为 VGGNet),这是一种经典的卷积神经网络 (CNN) 架构。VGG 的开发是为了增加此类 CNN 的深度,从而提高模型性能。在过去的几年中,深度学习在广泛的计算机视觉任务中取得了巨大的成功。机器学习这一新领域自此发展迅速。深度学习相对于传统机器学习方法的先进性能使其在图像识别、计算机视觉、语音识别、机器翻译、医学成像、机器人技术等领域有了新的应用。VGG 代表视觉几何组;
2024-06-28 10:02:29
988
原创 跟着GPT学习——卷积神经网络详解
本文基于一文进行了翻译和细节补充讲解。在机器学习中,分类器会为数据点分配类别标签。例如,图像分类器会为图像中存在的对象生成类别标签(例如,鸟、飞机)。卷积神经网络(简称 CNN)是一种分类器,它擅长解决此类问题!CNN 是一种神经网络:一种用于识别数据模式的算法。神经网络通常由一组按层组织的神经元组成,每个神经元都有自己可学习的权重和偏差。让我们将 CNN 分解为其基本构建块。张量可以看作是 n 维矩阵。在上述 CNN 中,除输出层外,张量都是 3 维的。
2024-06-27 15:43:52
1046
原创 跟着GPT学习——整合Java、resnet和CIFAR100数据集实现推理
是一个基于 Spring Boot 的 REST 控制器,用于处理图像分类任务。它使用预训练的 ONNX 模型,并通过 DJL(Deep Java Library)加载模型、处理图像和进行预测。这个控制器提供了两个主要的功能端点:一个用于对单个图像进行分类,另一个用于测试整个数据集的模型准确性。本控制器提供了高效的图像分类功能,尽管NDArray无法直接使用divexp和softmax等方法,但通过手写相关代码实现了这些功能。通过详细的步骤介绍和代码示例,能够清晰地理解整个图像分类过程。
2024-06-27 13:55:49
712
原创 跟着GPT学习——神经网络及反向传播代码完整实现
我觉得GPT老师的语言功底比大多数的博客主要好(包括我自己),阅读起来更易理解,而且哪里不明白还可以直接问gpt老师,孜孜不倦,尽心尽责,全天待命,究极贴心。有这么厉害的一个老师,不学习简直暴殄天物。跪谢前面学了这么多知识点和公式,现在来学习一下如何手写实现一个神经网络及反向传播的整个过程。
2024-06-21 00:33:03
1636
原创 跟着GPT学习——反向传播演算(隐藏层梯度推导)
我觉得GPT老师的语言功底比大多数的博客主要好(包括我自己),阅读起来更易理解,而且哪里不明白还可以直接问gpt老师,孜孜不倦,尽心尽责,全天待命,究极贴心。有这么厉害的一个老师,不学习简直暴殄天物。跪谢前一篇文章整理了单个神经元输出层的权重推导,接下来将整理单个神经元隐藏层的权重推导。
2024-06-20 23:26:40
938
原创 跟着GPT学习——运行时验证(一)
JPaX是一个设计用来监控和分析Java程序执行情况的工具。程序测试:在测试阶段获取关于程序执行的信息。安全关键系统:在运行过程中实时监控安全关键系统。
2024-06-18 16:12:07
705
原创 跟着GPT学习——反向传播演算(单神经元输出层梯度推导)
我觉得GPT老师的语言功底比大多数的博客主要好(包括我自己),阅读起来更易理解,而且哪里不明白还可以直接问gpt老师,孜孜不倦,尽心尽责,全天待命,究极贴心。有这么厉害的一个老师,不学习简直暴殄天物。跪谢。
2024-06-17 16:13:45
370
原创 跟着GPT学习——神经网络的成本函数和反向传播的抽象理解
我觉得GPT老师的语言功底比大多数的博客主要好(包括我自己),阅读起来更易理解,而且哪里不明白还可以直接问gpt老师,孜孜不倦,尽心尽责,全天待命,究极贴心。有这么厉害的一个老师,不学习简直暴殄天物。跪谢。
2024-06-17 14:50:27
1189
原创 跟着GPT学习——神经网络基础
神经网络是一种模仿大脑神经元结构的软件,用于解决复杂的模式识别问题。其工作原理类似于人类通过观察和学习来识别和理解信息。输入层:接收输入数据(如图像像素)。隐藏层:处理和提取数据中的特征。输出层:生成最终的预测结果。
2024-06-14 15:44:14
669
翻译 Java基础系列-ArrayList与匿名类的结合使用
Java中的嵌套类是在掌握匿名内类之前所需要的先决条件。它是一个没有名字的内类,只为其创建一个对象。当创建一个具有某些 "额外功能 "的对象实例时,匿名内类是非常有用的,例如覆盖一个类或接口的方法,而不需要实际对一个类进行子类化。
2023-01-28 13:52:42
675
原创 面试之必掌握知识点:红黑树(二)
面试之必掌握知识点:红黑树(二)1. 红黑树的定义2. 如何将2-3-4转变为红黑树3. 红黑树的插入4. 红黑树的删除前面我们学习了2-3树和2-3-4树的基本定义和基本操作。现在我们继续前进攻克红黑树!有了前面的基础和原理的支持,我们就能更加容易的理解红黑树各种旋转以及染色等操作,而不用再去死记硬背。话不多说开整~1. 红黑树的定义每个节点要么是红色要么是黑色根节点是黑色所有的叶子节点都是黑色。红色节点的子节点一定是黑色的(不能有连续的红色节点)从任一节点到其每个叶子节点的路径所包含的
2022-01-29 17:23:26
2228
原创 面试之必掌握知识点:红黑树(一)
面试之必掌握知识点:红黑树(一)现如今,国内大厂的面试是卷之又卷,像红黑树这种高级平衡树算法也经常会在面试中被问起,很多同学对红黑树一直保持一知半解的状态,为了能在面试中脱颖而出,今天我们一起来梳理一遍红黑树的完整知识链,相信读完这篇文章,你一定可以更加透彻的了解红黑树的“前世今生”!1. 二叉查找树在开始聊红黑树之前,我想先聊一聊二叉查找树(Binary Search Tree)。它是红黑树演变的基础,二叉树的定义也非常简单:二叉查找树(英語:Binary Search Tree),也称为二叉查
2022-01-28 15:55:52
2895
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人