- 博客(6)
- 收藏
- 关注
原创 基于 Tree-sitter 获取分析 AST(2)——基本用法【Python with Tree-Sitter for C Projects】
Basic Usage: Python with Tree-Sitter for C Projects
2025-02-23 18:00:54
1500
原创 【论文阅读】AutoBench: Automatic Testbench Generation and Evaluation Using LLMs for HDL Design
论文阅读,AutoBench:使用 LLMs 进行 HDL 设计的自动化测试平台生成与评估
2025-02-10 13:16:01
1173
1
原创 基于 Tree-sitter 获取分析 AST(1)—— 介绍与安装
与基于 Clang 的 AST 分析工具依赖编译参数和编译环境不同,Tree-sitter 只需要输入待处理的文件,不依赖任何额外操作,例如不需要编译参数,不会执行预处理。(S-expressions,Symbolic Expressions)是一种简洁的树形结构表示法,用括号和嵌套的文本结构表示树形数据,非常适合表达AST。*官方文档:https://tree-sitter.github.io/tree-sitter/index.html。文件,即正确构建了相关语言的语法解析器。目录用于存放语言解析器。
2025-01-13 16:38:19
2504
原创 【Clang AST】基于 Clang 获取分析 AST
AST是什么抽象语法树(Abstract Syntax Tree, AST)是源代码的抽象表示,广泛用于编译器和分析工具中。AST将源代码的语法结构转换为树形结构,其中每个节点表示代码中的一个语法元素。与源代码的文本表示相比,AST更关心代码的结构和语义。词法分析(Lexical Analysis):将源代码分解为一系列词法单元(Tokens),如关键词、变量名、操作符等。根据语言的语法规则,将Token序列组织成语法树(Syntax Tree),也就是初步的结构化表示。
2024-12-31 17:43:50
3585
原创 【论文阅读】您的 AI 生成的代码真的安全吗?Evaluating Large Language Models on Secure Code Generation with CodeSecEval
原始 SecurityEval 数据集并未包含“Secure Code”、“Test”和“Entry_Point”的注释,其“不安全代码”实例通常不完整,需要额外的上下文,如辅助函数或特定配置,以确保功能的完整性。因此,SecEvalBase 的实例选择基于完成不安全代码的可行性,并为缺失的属性提供必要的注释。(2)LLMs在不同漏洞类型上的表现:GPT-4 通过引入“漏洞感知问题”描述,多数类型的 Pass@k 显著提升,但在某些漏洞类型(如注入类漏洞)上表现欠佳,说明它在应对特定漏洞时存在挑战。
2024-11-09 15:56:04
2045
1
原创 【论文阅读ICSE2024】CoderEval: A Benchmark of Pragmatic Code Generation with Generative Pre-trained Models
第二,尽管DS-1000中的一些函数依赖于第三方库,但DS-1000所反映的开发场景与实际代码生成相去甚远,因为DS-1000中没有任何函数依赖于目标函数外的用户定义函数。传统基准(如HumanEval)主要评估独立函数的生成能力,忽略了非独立函数在实际开发中的高占比(通过分析 GitHub 上分别用 Java 和 Python 编写的 100 个最受欢迎的项目发现非独立功能占开源项目功能的 70% 以上),导致无法全面评估模型在复杂依赖环境下的表现。(2)统计所有目标函数中,符合上述条件的函数的比例。
2024-11-03 15:52:55
2078
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅