- 博客(35)
- 资源 (8)
- 问答 (1)
- 收藏
- 关注
原创 大模型应用开发框架:LangChain、LlamaIndex和Haystack的全面解析
框架优势劣势最适合的应用场景LangChain灵活性和可扩展性强,功能丰富,支持Python和Node.js学习曲线长,用户界面不友好动态、数据响应型应用,研究项目,复杂的对话代理LlamaIndex高效处理大型数据集,快速搜索与检索,结果更值得信赖功能有限,黑盒性质数据密集型应用,实时系统,与大型语言模型集成Haystack生产就绪,模块化设计,全面的NLP管道设置复杂,资源密集生产环境应用,复杂搜索应用,企业级应用。
2025-04-15 08:57:42
884
原创 简述谷歌A2A协议
A2A 协议是由谷歌发起的一项开放标准,旨在实现不同AI智能体之间的通信与互操作性。可用的智能体客户端在samples/python/hosts目录,分为cli和multiagent。开源项目中包含了智能体 server和智能体 client的通用库,可复用的Python(能够发现彼此能力、协商交互模式(文本、表单、文件,未来可能支持音视频)并协作完成任务。)用于构建A2A客户端/服务器,处理JSON-RPC通信、任务管理及可能的认证。运行方式如下:(以crewai举例)运行方式如下:(以cli举例)
2025-04-13 01:27:58
1003
原创 AI和大模型技术在网络脆弱性扫描领域的最新进展与未来发展趋势
AI和大模型技术在网络脆弱性扫描领域展现出巨大的潜力和价值。通过自动化漏洞检测、加速漏洞管理周期、实时威胁检测和响应,AI可以显著提高网络安全水平。未来,随着大型语言模型(LLMs)的应用和自主化、智能化的发展,AI将在网络安全领域发挥更加重要的作用,为组织提供更加强大和可靠的安全保障。
2024-11-08 18:22:27
848
原创 大模型在代码审计中的应用和技术细节
例如,通过集成自动化测试工具,大模型可以在代码提交后立即进行多轮测试,确保代码的质量和安全性;未来,随着技术的不断进步,大模型将在代码审计领域发挥更大的作用,推动软件开发进入更加安全和高效的智能化时代。例如,CodeGuru可以分析代码的复杂度、冗余性和性能瓶颈,并提供具体的优化建议,从而提升代码的可维护性和运行效率。近年来,随着大模型技术的发展,越来越多的研究和实践将其应用于代码审计,以提高审计的效率和准确性。例如,通过生成详细的审计日志和解释报告,帮助开发人员理解模型的决策过程,提高审计结果的可信度。
2024-10-31 15:22:01
1326
原创 大模型在自动化渗透测试中的应用
自动化渗透测试是指利用自动化工具和技术,模拟黑客攻击行为,对目标系统进行全面的安全评估。传统的渗透测试通常依赖于安全专家的手动操作,过程复杂且耗时。自动化渗透测试的目标是通过技术手段减少人工干预,提高测试效率和准确性。
2024-10-31 11:20:21
1158
原创 OpenAI最近的技术更新与发展全面分析
新模型o1的技术细节和性能提升,以及GPT-4 Turbo的多方面改进,都为AI技术的发展提供了新的动力。同时,OpenAI与苹果的合作也展示了科技公司之间合作的重要性,为未来的技术创新提供了新的模式。近期,OpenAI发布了一系列重要的技术更新,特别是在新模型的发布、现有模型的改进、API的增强以及与其他科技巨头的合作等方面取得了显著进展。OpenAI的这些技术更新不仅提升了模型的性能,还为整个AI行业的发展提供了新的方向。随着API的增强和新工具的推出,用户的使用体验得到了显著提升。
2024-10-30 10:05:02
453
原创 大模型RAG技术实现文档
RAG(Retrieval-Augmented Generation)是一种结合了检索和生成的混合模型,旨在提高自然语言处理任务中的准确性和效率。本文档将详细介绍如何使用LangChain库处理PDF文档,实现一个基于RAG技术的问答系统。运行上述代码后,系统将从PDF文档中提取相关信息,并生成回答“RAG(Retrieval-Augmented Generation)是一种结合了检索和生成的混合模型,旨在提高自然语言处理任务中的准确性和效率。使用大型语言模型(如。
2024-10-30 10:03:04
310
原创 大模型RAG技术分析
传统的LLM虽然经过大量数据训练,但其生成的内容可能不够准确或缺乏最新的信息。RAG通过引入外部知识库,使得模型在生成响应时能够参考更多的上下文信息,从而提高生成内容的质量和准确性。查询重写的目标是将用户的原始查询转换为多个更具体或更广泛的查询,从而提高检索的覆盖率和精确度。微调的目标是使模型更好地适应特定的任务和数据集。检索生成阶段的主要任务是在用户提出问题后,从向量数据库中检索相关的信息,并生成最终的响应。数据准备阶段的主要任务是从各种数据源中提取、处理和存储数据,以便后续的检索和生成。
2024-10-29 17:21:17
581
原创 软件供应链技术发展趋势分析
软件供应链攻击频发,合规性要求严格,技术复杂度高,这些因素都对市场的发展提出了更高的要求。然而,面对日益复杂的威胁和挑战,企业需要不断创新,采用先进的安全技术和管理方法,提高软件供应链的整体安全水平。同时,企业加强了对员工的安全培训,提高员工的安全意识和技能,减少人为因素导致的安全风险。AI和ML可以用于检测供应链中的异常行为,预测潜在的安全威胁,并自动采取应对措施,提高安全防护的智能化水平。市场竞争加剧,产品和服务的价格逐渐透明化,企业可以以更低的成本获得高质量的安全解决方案。
2024-10-29 17:10:12
807
原创 大模型技术在网络安全领域的应用与发展
大模型技术,尤其是深度学习和自然语言处理领域的大型预训练模型,近年来在网络安全领域得到了广泛应用。这些模型通过其强大的数据处理能力和泛化能力,为网络安全带来了新的机遇和挑战。本文将对大模型技术在网络安全领域的应用进行全面分析,识别关键应用进展,并探讨其对网络安全领域的潜在影响。
2024-10-28 17:35:36
1346
5
原创 微软大模型1B开源的 bitnet.cpp简介
微软开源的bitnet.cpp是一个针对1-bit大型语言模型(LLM)的推理框架,它能够在普通CPU上高效运行,无需依赖GPU。这个框架特别适合在资源受限的设备上运行大规模的模型,同时还能显著降低能耗和提高运行速度。bitnet.cpp。
2024-10-28 14:40:01
463
原创 浅谈软件安全开发的重要性及安全开发实践
*制定安全开发可量化管理流程**:为了确保软件开发过程的安全性,企业应建立一套可量化、可追溯的安全开发管理流程。通过建立企业安全战略、制定安全开发管理流程、提高安全开发意识以及实施一系列安全开发实践措施,企业可以构建安全可靠的信息系统,为企业的持续发展和创新提供有力保障。**明确安全需求**:基于攻击面分析的结果,企业应明确软件系统的安全需求。**建立企业安全战略**:企业应根据国家法律法规要求、自身业务特点及软件应用系统的实际情况,制定符合自身需求的安全发展战略。#### 企业要怎么进行安全开发?
2024-09-25 09:20:31
715
原创 xgboost 和Scikit-learn 关系
因此,尽管XGBoost具有独立性,但在实际应用中,它常被视为Scikit-learn生态系统的一部分,允许数据科学家们利用Scikit-learn的统一API进行数据预处理、模型选择、交叉验证以及模型评估等操作,同时享受到XGBoost在梯度提升方面的高性能表现。Scikit-learn则是Python中最流行、最全面的机器学习库之一,其中包含了大量的监督学习和无监督学习算法,包括了对GBM的一种实现。在Scikit-learn中,用户可以通过。类来使用梯度提升方法。
2024-03-28 18:19:20
765
1
原创 常用开源机器学习库
选择合适的库通常取决于具体的项目需求、数据集大小、计算资源和开发者的熟悉程度。PyTorch 是 Facebook 的 AI 研究团队开发的一个开源机器学习库,特别受深度学习社区的欢迎。Scikit-learn 是一个广泛使用的 Python 机器学习库,提供了大量的监督和非监督学习算法。它包括分类、回归、聚类和降维等算法,以及数据预处理、模型选择和评估等工具。它提供了一个灵活的张量计算库和自动微分系统,使得模型的实现和调试更加直观。它旨在简化深度学习模型的构建和实验,提供了易于理解的模型架构和预处理层。
2024-03-28 18:08:38
730
原创 漏洞扫描操作系统识别技术原理
*原理**:不同操作系统在实现TCP/IP协议栈时,会有一些细微的差异,这些差异体现在数据包的特定字段、响应行为或时间特性上。:如SYN/ACK响应中的TCP选项(如MSS、Timestamps、Window Scale等)的顺序、格式或值,以及对特定TCP标志位(如URG、ECE等)的处理方式。**原理**:在某些情况下,漏洞扫描器可以通过监听网络流量,捕获目标系统与其他主机通信的数据包,分析这些数据包中的特征来推测操作系统类型。:如特定操作系统产生的特定类型的ICMP消息、IP选项、IP碎片行为等。
2024-03-28 16:22:38
782
原创 linux下php访问不到/tmp目录下文件的问题
systemd服务会将的/tmp/目录重定向到另外一个目录,比如我系统里面php的tmp目录就被重定向到了 /tmp/systemd-private-6fd8249ddb434d9dbc78af925255bcd5-apache2.service-4xyy0d/tmp/systemd服务的这个特性,是由PrivateTmp属性来设定的,可以更改PrivateTmp属性值来选择是否需
2017-09-07 19:48:57
5305
原创 overlay文件系统浅析
overlayfs文件系统类似于aufs,相比aufs,overlay实现更简洁,很早就合入了linux主线, 合入主线后overlayfs修改为overlay。docker 使用overlay文件系统来构建和管理镜像与容器的磁盘结构。overlay文件系统分为lowerdir、upperdir、merged, 对外统一展示为merged,uperdir和lower的同名文件会被u
2017-08-18 16:54:46
15749
2
原创 linux下使用AES cbc加解密文件源码,支持所有类型文件
/* * Copyright (C) 2014-2019 Desen liu * Copyright (C) Topsec, Inc.*/#include #include #include #include #include #include #include #include #include #include #include #include #include #include #incl
2015-09-16 17:54:08
1971
原创 基于多线程设计检测多台主机ICMP消息串位的问题
一个进程中需要检测多台主机是否正常工作,采用了ICMP检测的方式,每个主机一个线程,定时PING对应主机是否存活。最后发现当有主机down机的情况下,依然能收到ICMP的回应报文。这个问题看起来很奇怪,其实了解PING的实现原理就会觉得出现这样的问题很正常。 首先ICMP是基于RAW套接字的,RAW套接字只匹配协议,并不按流匹配,也就是说一个或者多个进程采用RAW方式监听同样协
2015-01-04 19:25:36
1351
原创 linux主文件和动态库之间变量和函数访问
通常我们需要从动态库里面直接调用可执行程序中的函数和变量,如果调用了-l选项,linux进程会自动把动态库的函数和变量加入到动态段中,所以直接访问是没有问题的。我们这里要说的是非显示连接动态库,而是直接从c文件中通过dlopen函数打开动态库访问的方式,此时,gcc编译器不知道SO需要调用哪一个函数,所以不会讲函数放到动态段。故查找函数或者变量的时候,会出现找不到可执行程序中的符号的情况。
2014-12-27 23:08:34
3430
原创 nginx haproxy两者做负载均衡的优缺点
haproxy 主要功能就是负载均衡,负载均衡算法支持很多,支持健康检查,支持各种会话保持方式,支持远程信息获取等。 haproxy本身就是一个负载均衡的软件。但是haproxy上扩展性很差,添加新功能很费劲,对不断扩展的新业务,haproxy很难应对。nginx web服务器为主,负载均衡虽然有nginx plus但是,并不开源,nginx最大的优势是结构性好,支持模
2014-12-16 18:46:53
4342
转载 nginx配置详解
#运行用户user www-data; #启动进程,通常设置成和cpu的数量相等worker_processes 1;#全局错误日志及PID文件error_log /var/log/nginx/error.log;pid /var/run/nginx.pid;#工作模式及连接数上限events { use epoll;
2014-02-17 18:07:27
576
原创 NGINX的进程处理乱谈
服务器处理程序一般会采用fork模式, 每来一个新的连接时,会创建一个新的进程,新的进程中会重新创建一个socket,后续新连接的消息就由fork出来的这个进程处理.NGINX架构修改了这种模式, 新连接过来时,还是由work进程来处理.对于fork模式, 新建的进程如果采用阻塞模式,应该是性能更高,因为在没有报文时,该进程不会被调度. 而同一个进程处理多个连接,就必须抛弃阻
2014-01-27 23:07:18
715
原创 nginx重要的数据结构
struct ngx_module_s { //ctx_index是分类的模块计数器,nginx的模块可以分为四种:core、event、http和 //mail,每一种的模块又会各自计数一下,这个ctx_index就是每个模块在其所属类组的计数值 ngx_uint_t ctx_index; //
2014-01-24 21:00:35
721
原创 nginx转发流程的框架结构
nginx初始化完成后,进入到运行阶段.代码如下: if (ngx_process == NGX_PROCESS_SINGLE) { ngx_single_process_cycle(cycle); //单进程 } else { ngx_master_process_cycle(cycle); //多进程,master进程进入这个,这个函数在
2014-01-24 19:18:10
868
原创 glibc 内存重复释放检测失效
glibc的malloc算法中,对于小内存的重复释放检测不完善,如果相同大小内存交叉多次释放时,无法检测出重复释放。测试环境:glibc版本4.4.1测试代码#include main(){ int *a = malloc(1); int *b = malloc(1); int *c = NULL;
2014-01-23 14:39:19
1141
转载 如何开好图文打印店
曾几何时,打字复印店布满城市的大街小巷,风光一时。但随着打印机和复印机的普及,许多单位,甚至个人都购置了这些设备,于是普通的打字复印店已是明日黄花,大多都是在惨淡经营,低端市场的打字复印店也不能满足客户的需求,这时的打印店的确需要开拓新的市场来实现一次新的飞跃。 在建筑工程设计、招标和审批的流程中,效果图和工程图的应用越来越普及,已经成为施工中不可或缺的部分。设计项目,往往设计费就
2013-04-23 22:46:42
2199
原创 panabit web密码忘记后的解决方法
panabit web 控制台的用户名和密码是放在/usr/panabit/admin/.htpasswd文件中,并且是明文。格式如下:admin:panabit冒号前面是用户名,后面是密码。直接修改后面的密码,然后执行/usr/panabit/bin/ipectrl httpd stop/usr/panabit/bin/ipectrl httpd start然后重新访问即
2013-04-13 15:36:17
7841
1
原创 panabit虚拟机安装以及实现的细节研究
panabit是国内协议识别性能最高的厂商,作为一个安全开发者,确实很有理由去研究下。 panabit一般运行在freeBSD系统下,但是最近的版本都有liveCD这也省去了我很多下在系统的时间。直接用vmware新建一个虚拟机,如果需要功能正常的话,至少需要3块网卡,通过liveCD启动,然后运行./setup, 虚拟机的安装就搞定了。panabit的数据网卡只能运行在2层模式
2013-04-13 14:54:29
4214
802.15.4-2006
2013-01-17
链接脚本中符号查找问题
2014-02-17
TA创建的收藏夹 TA关注的收藏夹
TA关注的人