自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(215)
  • 收藏
  • 关注

原创 阿里云云计算ACP实验-云企业网打通VPC

10.启动云企业网实例。

2025-01-20 13:54:28 144

原创 阿里云云计算ACP实验-NAT网关公网访问

创建资源手机验证码登录3.打开ECS发现所属地域为华东2 上海4.打开公网NAT页面公网NAT绑定EIP创建SNAT条目5.测试连通性配置入方向,cid=100.104.0.0/16ECS远程登录ping www.aliyun.com6.解绑EIP删除

2025-01-20 10:30:39 316

原创 阿里云ACP云计算实验室-专有网络VPC操作

在阿里云ACP云计算考证中,需要进行云计算实验,以下是专有网络VPC操作实验步骤:创建资源创建成果界面如下绑定手机号实例页面停止实例专有网络配置VPC添加安全组创建交换机10.更换专有网络。

2025-01-17 15:59:46 179

原创 阿里云云计算ACP必备100题(下)

阿里云云服务器ECS是一种简单高效、处理能力可弹性伸缩的计算服务,帮助您快速构建更稳定、安全的应用,提升运维效率,降低T成本。ECS属于:laaS(基础设施即服务)云服务器ECS服务的API服务地址是:ecs.aliyun-api.com如果您在创建Windowsi操作系统的阿里云的云服务器ECS实例时选择了数据盘,在登泉实例后要完成操作才可以正常使用该数据盘。格式化数据盘阿里云的云服务器ECS实例的安全组实现了类似虚拟防火墙的功能,用于设置单个或多个云服务器ECS实例的网络访问策略。对于云服务器安

2025-01-10 11:24:21 1154

原创 阿里云云计算ACP必备100题(上)

阿里云的云服务器ECS相对于传统物理服务器的一个重要特征是,可以更为便捷的进行服务器的配置升级。下列关于云服务器ECS无缝升级的说法错误的是云服务器ECS不支持新增数据盘当一个阿里云的云服务器ECS实例无法加入指定的安全组时,可能是原因造成的。本云服务器ECS实例目前已经加入的安全组数量达到上限ECS服务器会对每个访问的请求进行身份验证,以下哪一个是用于标识访问者身份的?Access Key ld安全组A中存在5台阿里云的云服务器ECS实例,您针对安全组A增加了一个新的规则来允许来自特定P地

2025-01-10 11:23:23 924

原创 LLM-Conda搭建开发环境

搭建 LLM(大语言模型)开发环境通常涉及几个关键步骤,包括安装必要的软件包、设置 Python 环境、配置所需的库、以及可能的 GPU 加速支持。

2024-12-27 11:53:26 1070

原创 推荐算法Surprise库安装

如果没有错误,并且打印出了版本号,说明安装成功。如果你遇到任何问题,随时告诉我,我可以帮你解决!安装完成后,你可以通过以下代码检查。,所以需要使用这个名称进行安装。你可以通过以下步骤安装。,讨论区回复获取提取码。讨论区回复获取提取码。

2024-12-03 11:13:50 510 7

原创 AI-TensorRT(一)

CUDA做并行化处理,大部分人工智能底层都是基于CUDA,Tensor英伟达推出的加速推理器。TensorRT的核心在于对于模型算子的优化(合并算子、利用GPU特性选择特定核函数等多种策略),通过tensorRT蒙古在Nvidia系列GPU上获得最好的性能因此tensorRT的模型,需要在目标GPU上世纪运行的方式选择最优算法和配置tensorRT生成的模型只能在特定条件下运行(编译的trt版本、cuda版本、编译时的GPU型号)

2024-10-20 22:44:14 428 1

原创 CV-标注工具

在计算机视觉和深度学习项目中,标注工具用于为数据集中的图像或视频进行人工标注。不同的任务,如物体检测、图像分割、关键点检测等,可能需要不同类型的标注工具。

2024-10-08 20:22:19 905 1

原创 CV-目标检测数据集

它由微软发布,旨在推动图像理解领域的研究,相较于PASCAL VOC,MSCOCO提供了更多的图像、更多的类别以及更详细的注释。数据集中的每张图像都有明确的标签,这些标签是由人工标注的,确保了数据集的高质量。:PASCAL VOC数据集包含了多种物体类别,常见的有20类,包括人、动物(如猫、狗、马)、交通工具(如自行车、汽车、飞机)、日常物体(如椅子、杯子、桌子)等。MSCOCO包含了80个物体类别,包括日常生活中的物品(如人类、家具、交通工具、动物等),而且类别更加多样化和丰富,适用于复杂的视觉场景。

2024-10-08 20:21:09 1146

原创 CV-项目:CRNN+CTC识别英文数字

word-recognition, 数据集命名为1_1.png。pretrained-model参数,保存格式为。

2024-10-07 01:45:58 968

原创 CV-项目:基于PaddleOCR识别车票

取对应的json对象。

2024-10-05 18:15:51 266

原创 CV-OpenCV人脸检测

这段代码首先安装了 opencv-python 库,然后导入了 cv2 模块。接下来,它加载了预训练的人脸检测模型,并加载了名为 faces2.png 的图像,并将其转换为灰度图像。然后,它使用 detectMultiScale 方法检测图像中的人脸,并使用 rectangle 方法在检测到的人脸周围绘制矩形框。最后,它使用 imshow 方法显示图像,并使用 waitKey 方法等待用户按下按键。请将 ‘faces2.png’ 替换为您要检测人脸的图像文件的名称。

2024-10-03 12:35:54 487

原创 大模型-推荐系统架构

A/B测试,新旧模型通过线上数据比例进行测试,比如新模型流量20%,旧模型流量80%,看运营数据结果。图像体系和算法引擎部分属于纯算法工程师或者NLP工作。数据采集和数据整理偏大数据,放置到关系型数据库中。大数据团队提供数据。涉及到数据埋点、采集。比如:分品类的猜你喜欢。实时模型训练,和用户数据收集调整模型。算法引擎和推荐接口为推荐工程师工作。召回、粗排、精排、重排。

2024-09-30 23:40:02 165

原创 深度学习-BP算法

BP网络 (Back Propagation Neural Network, BP Neural Network) 是一种经典的人工神经网络结构,广泛应用于机器学习和深度学习领域。它基于多层感知器(MLP)模型,并通过反向传播算法来优化网络的权重和偏置。

2024-09-29 14:09:38 776

原创 项目-机器学习分析金融风控-贷款违约预测(未完)

赛题以预测用户贷款是否违约为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时会对employmentTitle、purpose、postCode和title等信息进行脱敏。

2024-09-28 22:17:58 350

原创 项目-机器学习分析电信用户的流失原因

来自datafountain上的《电信客户流失数据》https://sso.datafountain.cn/

2024-09-28 21:38:20 1036 6

原创 AI工具-Conda

conda create --name 环境名 python=版本号conda activate 环境名conda install 包名conda remove --name 环境名 --all。

2024-09-28 00:08:14 704

原创 AI工具-Colab

Google Colab 是一个基于云的 Python 编程环境,允许你直接在浏览器中编写和运行代码。它特别适合数据分析、机器学习和深度学习等任务。

2024-09-27 15:15:09 581

原创 大模型-自洽性(Self-Consistency)

在训练过程中采用一致性增强技术,如对比学习、多任务学习等。推理和生成中使用自洽推理策略,如温度调节、束搜索等。校准模型输出和进行一致性验证,保证逻辑上不产生矛盾。利用模型集成和投票机制,增强预测结果的一致性。跨模态应用中进行模态对齐,确保不同输入模态的自洽性。这些方法可以帮助提高AI系统的稳定性和可靠性,确保其在处理复杂任务时前后一致。

2024-09-25 10:10:44 2128

原创 大模型-通过DevAGI调用OpenAI接口

【代码】大模型-通过DevAGI调用OpenAI接口。

2024-09-25 09:08:24 549

原创 大模型-基于腾讯云Hai实现小程序AI绘画(未完)

基于腾讯云的Hai(Hybrid AI,混合智能)平台,可以实现一个小程序的AI绘画功能。Hai提供了许多AI服务,包括图像生成、智能处理等,可以集成到小程序中。

2024-09-24 17:01:16 987

原创 大模型-实战腾讯云Hai使用AI绘画

打开JupterLab实验室,上传训练好的模型到stable-diffusion目录下。在webUI里面选择上传的模型进行训练。添加实例名称itcast_sd.创建成功。2分钟后创建成功,点击获取详情。运行Gradio WebUI。输入cat with hat。选择推理用的GPU基础型。

2024-09-23 15:28:08 627

原创 CV-CLIP

收集大规模图像和文本对数据。将图像输入图像编码器,将文本输入文本编码器,分别生成对应的嵌入。使用对比学习,最大化正确图像-文本对的相似度,最小化错误对的相似度。调整模型的权重,通过计算余弦相似度和InfoNCE损失函数优化模型。训练后,模型可以执行各种跨模态任务,如图像分类、文本描述生成、图像和文本检索等。CLIP的关键优势在于它的泛化能力和跨领域处理能力,使其在多模态任务中表现出色。

2024-09-23 08:51:19 1167

原创 CV-变分自编码器VAE

变分自编码器(VAE,Variational Autoencoder)是一种生成模型,能够学习数据的潜在表示,并生成与输入数据相似的新样本。VAE在传统自编码器的基础上引入了概率模型,使得生成过程具有更好的连续性和多样性。

2024-09-22 21:55:46 400

原创 CV-图像生成算法

图像生成算法是通过数学模型和计算机程序生成新的图像,常用于计算机视觉、艺术创作、数据增强等领域。这些算法可以在不同的应用场景中使用,具体选择依赖于任务需求和目标效果。

2024-09-22 21:53:37 436

原创 大模型-AIGC

AIGC,全称(人工智能生成内容),是指使用人工智能技术生成各种类型的内容。它包括但不限于文本、图像、音频、视频等形式,利用机器学习、深度学习以及自然语言处理等技术,自动创作出符合需求的数字内容。

2024-09-22 20:19:59 1044

原创 机器学习-faiss

(Facebook AI Similarity Search)是一个由 Facebook 开发的开源库,用于高效地进行大规模相似性搜索和稠密向量(dense vector)聚类。它主要用于处理机器学习中常见的高维向量,并且可以在大规模数据集中快速找到相似向量。

2024-09-22 12:01:13 549

原创 大模型-RAG

RAG(Retrieval-Augmented Generation)是一种结合信息检索与生成模型的技术,旨在提高文本生成的准确性和上下文相关性。它特别适用于需要从大量信息中提取和生成答案的场景,比如问答系统和对话生成。

2024-09-21 18:20:20 433

原创 LLM-LangChain入门

LangChain 是一个用于构建大语言模型(LLMs)应用程序的框架,旨在帮助开发者轻松整合不同的数据源、API,以及执行复杂的多步推理任务。它特别适用于对话式AI、智能代理和复杂的数据处理任务。

2024-09-21 18:15:47 974

原创 LLM-本地调用百度千帆API

在接入应用里面保留API Key和Secret Key。

2024-09-21 16:15:14 520 1

原创 LLM-配置虚拟试衣的新的训练集数据

在下面的训练数据集部分将下面的地址换为上面的oss地址。

2024-09-21 13:53:26 300

原创 LLM-实战阿里Pai平台虚拟试衣

通过添加少量的可微调参数和使用少量的数据集,快速进行模型的微调,从而为模特、动作、背景等提供广泛的生成空间。

2024-09-21 13:50:41 806

原创 LLM-基于Zero-shot方式实现金融信息匹配

【代码】LLM-基于Zero-shot方式实现金融信息抽取。

2024-09-20 11:56:55 447

原创 LLM-基于Zero-shot方式实现金融信息抽取

【代码】LLM-基于Zero-shot方式实现金融信息抽取。

2024-09-20 11:55:51 690

原创 大模型-基于Zero-Shot实现LLM金融文本分类

Zero-Shot” 是一个机器学习和自然语言处理 (NLP) 中的术语,指的是模型在的情况下,能够直接执行该任务。简单来说,模型无需经过该任务的特定训练,也不需要提供示例,它可以根据已有的广泛知识完成任务。这一能力对于处理新任务或在数据稀缺的情况下非常有用。

2024-09-20 11:13:41 599

原创 大模型-AutoDL实战调用chatglm-6b

【代码】大模型-AutoDL实战调用chatglm-6b。

2024-09-20 08:39:49 540

原创 PyTorch-常用张量操作

reshapesqueezeunsqueezetransposepermuteview和contiguous的示例,每个例子都有输出结果说明。

2024-09-19 13:41:29 289

原创 大模型-在Autodl运行汉翻英.py

liam168/trans-opus-mt-zh-en 是一个基于 Hugging Face Transformers 库的机器翻译模型,专门用于中文(zh)到英文(en)的翻译任务。这个模型是基于 OPUS 语料库训练的,它使用了先进的神经网络架构来进行高质量的翻译。它可以通过 Hugging Face 的 transformers 库轻松加载和使用,适用于需要机器翻译的场景。

2024-09-19 12:36:58 328

原创 CV-DeepLab

每个版本的 DeepLab 都在前一个版本的基础上进行了改进,提升了图像分割的精度和效率。DeepLabv1 引入了空洞卷积和 CRF,DeepLabv2 改进了 ASPP,DeepLabv3 去除了 CRF 并进一步改进了 ASPP,而 DeepLabv3+ 则通过编码器-解码器架构和深度可分离卷积实现了更高的精度和效率。

2024-09-18 20:05:02 521

基于LangChain的PDF问答系统:PDF内容解析与用户交互的技术实现及应用场景

内容概要:本文档详细介绍了基于LangChain框架构建的PDF问答系统,涵盖从文件上传到内容解析再到智能问答的整体流程和技术细节。首先,在用户上传PDF文件方面,系统提供了前端页面用于文件选择与上传状态展示,并在后端实现了文件接收与验证。接下来,系统利用诸如PyMuPDF、pdfminer这样的解析工具对文件内容进行转换成可处理文本,同时考虑到异常情况的反馈机制。最后一步即核心功能——问答环节,则借助于预训练的语言模型来理解和回应用户的提问。此外,接口设计部分明确界定了不同操作对应的API调用规则和服务路径,确保前后端数据流通顺畅。 适配人群:有一定Web开发经验的研发人员或技术人员。 使用场景及目标:适用于需要自动化处理大量文献资料并从中抽取关键信息的企业和个人开发者,帮助提高工作效率降低人工成本。 其他说明:本项目涉及多个方面的技术和概念,包括但不限于前后端工程、数据库管理和自然语言处理等方面的知识点,因此不仅是一份具体的实施指南也是学习跨学科集成的一个很好范例。 本系统适合熟悉Web应用程序设计和开发的专业人士研究参考,尤其是那些想要掌握完整的文档解析和自动问答技能集的开发者。 对于希望提升客户服务满意度或加快科研进展的情境尤为适用,例如客服聊天机器人或是论文综述助手之类的。具体而言它可以作为内部员工自助查询平台、公共档案检索服务平台等各类信息管理系统的一部分,辅助用户迅速获取所需数据。 项目涉及到的组件和技术点较为丰富,涵盖了从前端交互设计直到后台逻辑运算的全过程。除了掌握特定工具如Vue.js以及Flask之外还需要深入了解Python程序设计思想及自然语言处理领域的相关理论知识。同时它也是一个实践机器学习与深度学习模型应用于实际产品中的好例子。

2025-01-17

基于Vue.js和Flask的客服机器人构建-集成交互、NLP和OpenAI集成方案及实现路径

内容概要:本文详细介绍了构建一个简易客服机器人的完整过程及其关键技术架构。文章阐述了一个MVP版本的客服机器人,重点讨论了自动问答、自然语言处理(NLP)、人工客服转接、订单查询以及用户反馈等功能的设计思路和技术实现方法。通过前端使用Vue.js框架搭建交互界面、消息传递功能,而后端通过Python(Flask)提供API接口响应前端请求,并利用外部API或开源工具(例如OpenAI、Google Dialogflow等)完成NLP功能实现,此外还涉及数据库配置,用于存储备用知识库、处理订单信息,最后描述了如何集成人工客服系统,确保遇到复杂情况时用户可以获得真实客服的帮助。 适合人群:对于想要深入了解客服机器人开发全过程,特别是熟悉或有意进入Web开发、NLP、前后端配合、数据库操作以及信息安全领域的开发者而言非常有价值。 使用场景及目标:适用于企业希望低成本快速迭代一款能满足基本客服需求的应用场合;也可以作为培训教程指导新手逐步掌握完整的全栈开发技能,最终能够独立部署运维此类应用。 其他说明:该案例特别强调实际操作性和安全性考虑,提供了详细的编码实例与潜在问题解决指南,使读者能够在理解原理的基础上顺利完成类似项目的建设任务。同时,文中还提及了一些最佳实践,包括版本控制的最佳做法、持续集成的初步认识以及如何优化用户体验等。

2025-01-17

使用Django和Vue构建具有多种登录方式和个人博客系统的Web应用教程

内容概要:本文详述了一款基于Django后端框架和Vue前端框架相结合开发的简单博客系统,涵盖了博客的基本功能如文章的增删改查、用户身份验证与个性化信息设置等,深入讲解了Django框架中的视图、模板、表单处理以及前后端的API对接等关键技术,还介绍了引入Elasticsearch增强搜索能力、添加广告轮播图以及整合微信与手机验证码等方式拓展用户体验的方法,同时也涉及到了从本地SQLite数据库平滑切换至高性能MySQL数据库、部署至服务器和相关安全性配置等方面的实用技巧,使博客系统不仅功能完备且性能优异。 适合人群:熟悉Python基础和有一定的前端JS基础知识的人士,希望学习或进阶Web开发技术的爱好者。 使用场景及目标:①学习掌握Django与Vue在实际项目中的综合运用,实现前后端无缝连接;②了解中小型Web应用从需求分析到上线部署的全流程操作要点。 其他说明:文中提到的技术点广泛,但每个技术细节都有细致的指导,可以帮助读者逐步建立起完善的个人或企业级别的博客网站。

2025-01-17

金融风控领域中基于Pandas的贷款违约预测数据分析预处理

内容概要:本文档主要展示了针对某平台发布的贷款违约预测比赛数据集的探索性和预处理步骤。首先通过pandas库读入并初步浏览训练数据和测试数据,接着关注了两者的共有特征以及唯一存在于训练集里的标签‘是否违约’。同时详细描述了各项借贷相关属性的具体含义。再进一步统计了数据的基本信息、各字段缺失情况并用柱状图展示缺失比例。对于数据清洗环节,则聚焦于空缺值填充,特别是对如就业年限这类特殊字符表述做了合理的转换与补充。 适合人群:希望从事金融风险评估领域的研究学者、数据分析员或者对风控建模感兴趣的从业者。 使用场景及目标:①可用于理解贷款数据结构化信息的理解;②作为竞赛参赛者的预处理参考;③为后续建立违约预测提供数据支持。 阅读建议:本部分内容侧重前期数据探索,因此读者应该熟悉Python编程尤其是pandas库的使用方法,在跟随作者思路完成操作的同时还要学会分析不同字段背后的业务逻辑。另外还需注意隐私保护,在涉及真实世界项目时确保遵守相关规定对敏感信息做适当脱敏处理。

2025-01-17

微信小程序商城系统需求文档与技术架构详解

内容概要:本文档详细介绍了基于微信小程序开发的商城系统的设计和实现。系统旨在为用户提供便捷的在线购物体验,涵盖六大主要功能模块——首页、个人中心、优惠券、订单管理、购物车和商品详情页。此外,文档还强调了系统的非功能性需求,如安全性、性能、可扩展性和用户体验,并概述了所使用的前后端技术栈,如微信小程序框架、Node.js、Express和MongoDB。为了确保系统的稳定性和可靠性,还包括详细的测试计划、上线计划以及风险管理工作。 适用人群:适用于有微信小程序开发背景的技术人员,特别是参与过前后端开发、移动应用开发或者电子商务系统开发的工程师和技术经理。同时,对于希望深入了解微信小程序及其相关技术栈的初学者也非常有价值。 使用场景及目标:该文档可用于项目启动阶段的技术规划和需求分析;作为团队内部的学习资料,帮助技术人员理解和掌握微信小程序商城系统的关键技术和架构特点;同时也是系统开发、部署和后期维护的重要指导文档,确保整个开发周期内的高效运作。 其他说明:附录部分推荐了一系列开发和协作工具,如微信开发者工具、Visual Studio Code (VS Code) 和 Postman,有助于提高开发效率并简化调试过程。同时提供了项目管理和协同工作的解决方案,包括Trello/JIRA等工具的应用。

2025-01-17

北京市二手房价格预测-数据清洗与随机森林回归模型的应用

内容概要:本文基于北京市链家二手房数据集,通过数据处理、清洗、特征工程和机器学习模型训练,最终实现了二手房价格预测。具体步骤涵盖:数据读取与初步处理,提取关键特征如楼层数、建筑面积、房屋结构等,删除异常和无关数据,处理缺失值并进行标签编码。通过对比多种模型(线性回归、Adaboost、随机森林等),确定最佳模型为经过参数调优的随机森林,其测试集R²得分为0.9346。 适用人群:适用于有一定编程基础和数据分析经验的研究人员、开发人员或数据科学家,特别是那些希望深入学习房价预测相关技术和实践的人士。 使用场景及目标:通过对二手房市场的精准预测,可以辅助房地产商制定营销策略,购房者做出合理投资决策。此外,也为城市规划提供了科学依据。 其他说明:文中详尽展示了如何利用Python及其相关库(如Pandas用于数据操作、Scikit-Learn用于机器学习)完成全流程任务;并且给出了最终的模型部署方法以及性能评估指标。 此项目的重点在于展示了一套完整的从原始数据获取到构建高性能预测模型的过程,强调了实际应用中常见的挑战如数据质量控制、复杂特征处理等问题解决方案。同时,对于想要快速掌握机器学习应用案例的学习者来说,是一个非常好的参考资料。

2025-01-17

电信用户流失预测:数据分析与模型应用提升客户留存率

内容概要:本文详细介绍了针对电信用户的流失预测项目的全过程,旨在通过分析客户信息及其使用的服务特性等因素来预测潜在流失用户,以便采取措施减少客户流失率。文中首先概述了任务背景,指出相较于获客成本,保持现有客户更为经济有效;然后详述了数据集特点、预处理流程,包括处理缺失值、数值转换等,并通过各种图形化手段探讨不同类型属性如年龄、家庭状况、网络使用和服务订购等对用户流失倾向的具体影响。在此基础上进行了特征工程,比如标准化数值型变量和编码类别型变量等,解决类别不平衡问题后采用五种不同的机器学习算法进行模型比较,最终选定表现最佳的LGB模型用于生产环境中的预测。模型性能良好地反映了各变量对于客户是否会离开服务商的关键作用。 适合人群:本文适合从事数据挖掘、电信市场研究的专业人士和有一定经验的数据分析师,尤其是关注客户生命周期管理的研究者和技术爱好者。 使用场景及目标:主要应用于希望优化客户服务、改进营销策略的企业机构,在预测客户可能会转向竞争对手之前提前识别风险个体并执行针对性挽留方案。 其他说明:除了模型选择外,文档还提出了多项基于客户画像制定预防性的销售策略提议,包括但不限于特定用户群体(如老年人或未婚人士)提供定制化的优惠政策以及加强某些服务领域的宣传力度等方面;此外还提及通过设定合理的阈值筛选出重点关注对象来最大化投入产出效益。

2025-01-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除