自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(58)
  • 收藏
  • 关注

原创 flink1.20.2环境部署和实验-2

续flink1.20.2环境部署和实验-1的内容,搭建flink应用开发环境,实现flink消费kafka数据,并打印在控制台。

2025-11-08 23:40:52 400

原创 flink1.20.2环境部署和实验-1

本文详细介绍了Apache Flink和Kafka的环境部署过程,针对Flink 1.20.2和Kafka 4.1.0版本提供了两种部署方式:1)非容器化部署需分别配置JDK11和JDK17环境,包括SSH免密登录设置和集群配置;2)推荐使用Podman容器化部署Kafka,简化了流程。部署完成后可通过Web界面(http://[IP]:8081)监控Flink集群状态。最后简要提及实验目标:实现Flink消费Kafka消息并输出到控制台的功能。文章提供了完整的安装流程和关键配置说明。

2025-11-08 22:22:46 867

原创 工程经济对折现率选择的理论、方法与行业实践研究

在国有企业并购风光电项目的评估中,存在内评外评差异较大的问题:外部评估机构通常给出较高的折现率(如7.35%),而企业内部评估则倾向于较低的折现率(如4.12%),这种差异主要源于对β系数、企业特定风险调整系数以及债务资本成本的不同取值。的数学表达为现值计算中的分母部分,其基本公式为:PV = FV / (1 + r)^t,其中PV为现值,FV为未来值,r为折现率,t为时间期数。是社会折现率的应用扩展。社会折现率的确定需要考虑代际公平、社会时间偏好率和资本的社会机会成本等因素,是一个复杂但重要的发展方向。

2025-10-12 23:05:33 993

原创 量化交易中常见的盘面数据

选择量化交易的数据源,关键在于匹配自身需求。• 对于初学者和个人开发者,可以从 AkShare、Yahoo Finance 等免费数据源入手,配合 Backtrader、Zipline 等回测框架进行学习实践。• 对于专业投资者或机构,通常需要投资于 Wind、东方财富Choice、Tushare Pro 等付费数据服务,以获得更高质量、更稳定和更全面的数据支持。

2025-09-26 00:27:44 769

原创 低碳经济:碳汇——从生态固碳到金融资产的价值转化

碳汇是指通过生态系统的自然循环或人工干预,将大气中的二氧化碳等温室气体吸收并固定在植被、土壤或海洋中的过程、活动及机制,其核心功能是降低大气温室气体浓度,与 “碳源”(向大气排放温室气体的源头,如工业排放、化石燃料燃烧)形成动态平衡。这一概念源自《京都议定书》,既是全球应对气候变化的核心生态手段,也是碳金融市场重要的底层资产来源 —— 未经过核证的碳汇是生态资源,经标准化流程转化后可成为可交易的 “碳资产”。​。

2025-09-20 19:36:56 1143

原创 银行的消费和普惠条线的差别及消费金融市场情况

本文对消费金融和普惠金融进行简单的比较,并搜集了消费金融公司的24年的一些营收、资产规模数据。

2025-09-13 23:24:26 615

原创 coze1-podman容器化部署coze

coze已经开源一段时间了,版本升级的也比较快,记录下使用podman部署coze的过程,这里使用的是coze v0.2.2的版本来安装了,老的版本会和新版本不太一样,肯定是推荐使用新版本来安装。因为docker不好拉取镜像,使用podman可以顺畅的拉取相关镜像,所以也强烈推荐使用podman。设置好那么保存,具体的URL和model名称,根据实际情况来修改。如果都拉取成功,并都成功运行了,会看到coze的相关11个容器。至此,如果顺利的情况下,能够进去界面,就成功一半了。如果已经安装好,那么忽略。

2025-08-06 21:17:55 1092 1

原创 信创及一次ORACLE到OB的信创迁移

它支持多种关系型数据库、消息队列与 OceanBase 数据库之间的数据复制,是集数据迁移、实时数据同步和增量数据订阅于一体的数据传输服务,OMS 帮助您低风险、低成本、高效率的实现 OceanBase 的数据流通,助力构建安全、稳定、高效的数据复制架构。评估程序连接到ORACLE数据库中,进行评估,评估后,工具出具评估报告,供迁移者查阅。有必要说的是,OB虽然是云原生的分布式数据库,但是它不像MPP数据库一样,表是自动散列分布式存储的,它必须在建表的时候明确为分区表,才会分布式存储在集群的节点中。

2025-08-03 22:53:08 1407 4

原创 HF Transformer安装和pipeline使用

本文介绍HF transformer的安装和pipeline的简单实用

2025-07-27 11:00:38 907

原创 使用podman 容器化安装DIFY

本文阐述了使用podman容器化安装DIFY的过程

2025-07-22 20:27:51 1445 1

原创 超参数消融

超参数消融是机器学习模型优化中的一种系统性实验方法,用于评估不同超参数对模型性能的影响,进而筛选出最优超参数组合。在复杂模型(如神经网络、集成模型)中,通过移除某个组件(本质是调整“是否启用该组件”的超参数)来评估其必要性。同时调整多个相关超参数(如学习率与批大小、正则化参数与迭代次数),分析参数间的交互影响。,逐一或分组移除、调整超参数,观察模型性能变化,从而确定每个超参数的重要性和最佳取值。通过超参数消融,不仅能提升模型性能,还能深入理解模型行为,为后续优化提供科学依据。:在随机森林中测试不同。

2025-07-20 20:52:14 1100

原创 网络智能体研究综述

本文研究网络智能体相关技术,并介绍阿里的websailor网络智能体

2025-07-19 12:47:51 711

原创 WSL安装发行版上安装podman

本文在windows11上,使用WSL拉取并创建ubuntu24.04虚拟机,再安装podman,并通过podman拉取了一个n8n的镜像,运行一个容器。在安装过程中,涉及到了OS和podman的国内镜像的配置,可以加速拉取的过程。

2025-06-29 16:41:30 944

原创 TEXT2SQL-vanna多表关联的实验

在vanna上验证多表关联的可行性

2025-06-12 23:36:48 708

原创 一个n8n构建的能和LLM对话的Agent

本文介绍了如何在Windows环境下通过虚拟机CentOS搭建一个基于n8n工作流平台和OLLAMA本地LLM模型的对话Agent。内容包括:1)OLLAMA的下载安装、环境变量设置和模型拉取;2)n8n的容器化部署流程;3)创建对话工作流的具体步骤,包括凭证配置和模型选择。该方案能快速构建具备LLM对话能力的Agent,适合入门使用,但需注意n8n的商用收费政策。整个系统采用本地化部署,保障数据隐私性。

2025-06-10 23:39:04 1029

原创 Doris-2:单虚拟机上非docker化安装Doris实验环境

本文详细介绍了在CentOS Stream 10虚拟机上非docker化安装Apache Doris 2.1.10单机实验环境的步骤。内容包括:1) 准备OpenJDK 8环境;2) 操作系统配置(修改文件句柄数、虚拟内存区域、关闭swap和防火墙);3) 创建专用doris用户;4) 部署FE和BE节点,配置元数据和存储路径;5) 启动服务并验证运行状态;6) 通过MySQL客户端注册BE节点;7) 创建测试数据库和表验证安装。该环境适合学习使用,需要至少4核CPU、8GB内存和50GB磁盘空间,重点解决

2025-06-08 15:37:05 1206

原创 Doris-1:Doris简介

Apache Doris 是一款基于 MPP 架构的高性能、实时分析型数据库。它以高效、简单和统一的特性著称,能够在亚秒级的时间内返回海量数据的查询结果。Doris 既能支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。基于这些优势,Apache Doris 非常适合用于报表分析、即席查询、统一数仓构建、数据湖联邦查询加速等场景。用户可以基于 Doris 构建大屏看板、用户行为分析、AB 实验平台、日志检索分析、用户画像分析、订单分析等应用。

2025-06-08 15:34:39 1015

原创 clickhouse-1-特性及docker化安装

主要介绍CK的特性,并采用docker安装单节点环境。ClickHouse 是一款由俄罗斯 Yandex 公司开发的开源列式数据库管理系统(DBMS),专为 ​​在线分析处理(OLAP)​​ 场景设计,以极致的查询性能和海量数据处理能力著称。

2025-05-25 23:37:52 1237

原创 MCP-1:MCP组件与工作流程

MCP(Model Context Protocol)是由Anthropic推出的开放标准协议,旨在为大型语言模型(LLM)与外部数据源、工具之间提供标准化的交互方式。MCP通过定义统一的接口和通信机制,使AI模型能够安全、灵活地访问外部资源,如数据库、API和文件系统,从而提升模型在复杂任务中的实用性。MCP架构包括三个主要组件:MCP Hosts(用户与AI模型交互的入口)、MCP Clients(负责与MCP Server建立连接并管理通信的中间件)和MCP Server(功能提供层,封装数据、工具和

2025-05-21 23:34:13 1298

原创 数据要素及征信公司数据要素实践

数据要素是数字经济时代的新型生产要素,指以电子形式存在、通过计算方式参与生产经营活动并创造价值的数据资源。新型生产要素地位​​:与劳动力、资本、土地等传统要素并列,成为现代经济体系中的基础性战略资源。例如,国家数据局的成立(2023年)标志着数据要素在政策层面的战略地位提升价值创造方式​​:通过数据加工、共享和流通,赋能生产优化、风险管理、决策支持等场景。例如,制造业通过IoT数据优化设备维护周期,金融业通过信用评估模型降低信贷风险特殊属性​​:非竞争性​​:数据可被多主体重复使用且价值不减;

2025-05-19 23:47:16 1420

原创 企业信息化的“双螺旋”——IT治理和数据治理

数据治理•定位:以数据为核心的资产管理体系,聚焦于数据全生命周期的价值创造与风险控制。•核心目标:保障数据的可用性、可靠性、安全性,推动数据驱动决策,并满足合规要求(如GDPR、CCPA)。•典型内容◦ 数据标准与元数据管理;◦ 数据质量管理(清洗、稽核);◦ 数据安全与隐私保护;◦ 数据权限与合规审计;◦ 数据共享与生态合作。IT治理•定位:组织对IT资源的战略性管理,旨在通过协调技术、流程和人员,支撑业务目标实现。•核心目标。

2025-03-21 23:29:17 922

原创 数据治理下半场:如何用文化变革撬动企业数字化转型?

在数字经济浪潮中,企业的数据治理已从技术命题升级为战略必答题。但当某零售巨头投入千万搭建数据中台后,却发现业务部门仍习惯凭经验决策;某金融公司引入AI风控模型后,数据质量差导致30%的预警失效——这些真实案例揭示了一个残酷现实:​技术再先进,没有文化基因的变革,终将沦为华而不实的"数据摆件"。​。

2025-03-16 19:54:56 1075

原创 单机上使用docker搭建minio集群

这里在ubuntu上单机安装一个minio集群,可以作为比如GIT-LFS的存储,用于存放大模型权重文件等。

2025-02-23 23:20:48 1392 1

原创 写一个python组件

假设我们的组件名为mydetector,它将有一个基本的XX功能。如下是组件项目的目录结构:││ ├──.py│。

2025-02-19 23:56:11 434

原创 YOLOV11-1:YoloV11-安装和CLI方式训练模型

本文介绍yoloV11的安装和命令行接口。

2025-02-03 22:44:23 1486

原创 CDSN 2024博客之星总评选-主题文章创作,我的AI之路-起手篇

这种转变不仅拓宽了语言模型的应用场景,也使其变得更加智能,成为了连接多种信息形式的桥梁,为未来的人工智能发展开辟了新的可能性。到了2020年,我有幸主导了AI中台的研发工作,这使我对数据标注流程、训练工艺、AI平台架构等及其在企业级应用中的重要性有了更加深刻的理解。希望我的经历能给同样热爱AI的朋友们带来些许启发,让我们携手共进,在追逐梦想的路上越走越远。除了核心的大模型外,书生浦语还配备了一整套完善的工具链,涵盖了从模型部署、模型推理优化、模型量化、模型评测、Agent、多模型支持等的各个环节。

2025-01-24 21:47:48 1035

原创 Ubuntu下安装Harbor

Harbor 是一个开源的 Docker registry 服务器,由 VMware 开源并捐赠给 CNCF(云原生计算基金会),它基于 Docker 分布式应用程序框架构建。Harbor 扩展了 Docker Registry 的功能,增加了安全性、标识和管理特性,使其更适合企业使用。

2025-01-11 23:25:19 1617

原创 Ubuntu24.04安装NVIDIA驱动及工具包

NVIDIA 驱动程序(NVIDIA Driver)是专为 NVIDIA 图形处理单元(GPU)设计的软件,它充当操作系统与硬件之间的桥梁,使得计算机能够正确识别和使用 GPU 的功能。为了使用 CuDNN,你需要先安装 CUDA Toolkit,然后下载并安装与你的 CUDA 版本相匹配的 CuDNN 库。ubuntu 24.04与nvidia有专门的支持,若通过到nvidia官网下载的版本来安装,不能使用,需要通过系统的软件和升级功能来安装 ,Additional Drivers,选择一个版本来安装。

2024-12-27 00:30:42 6071 1

原创 LangChain 1:langchain调大模型对话

本文基于langchain 0.3.4,使用langchain_openai连接大模型,调用大模型对话功能。

2024-10-20 22:17:34 1090

原创 使用apipost连接openai的接口进行模型对话

本文通过apipost来连接openai的标准接口

2024-10-20 18:54:40 941

原创 MindSearch CPU-only 版部署

MindSearch 是一个由上海人工智能实验室推出的开源 AI 搜索引擎框架,具有与 Perplexity.ai Pro 相同的性能。本文以 InternStudio 算力平台为例,来部署 CPU-only 的 MindSearch。

2024-10-07 16:10:26 521

原创 LMDeploy量化部署

基于Cuda12.2-conda镜像,在30% A100下实现。

2024-10-07 15:18:50 1519

原创 使用LlamaIndex构建RAG

LlamaIndex是一个数据框架,它主要用于连接大型语言模型(LLMs)与外部数据源,例如API、PDF文档、SQL数据库等。这个框架的设计目的是为了增强LLM的能力,使其能够理解和生成更准确、更有上下文关联的文本,尤其是在涉及私人数据或特定领域知识的情况下。LlamaIndex通过创建索引结构来组织和访问数据,这样可以更高效地检索相关信息并将其提供给LLM。这些索引可以是列表索引、向量索引、树索引或关键词索引等,具体取决于数据类型和需求。

2024-10-05 17:09:53 1569 2

原创 PMP与CMMI:两种管理方法的对比

尽管PMP和CMMI都对项目管理和组织绩效有积极影响,但它们的作用范围不同。PMP专注于单个项目的有效管理,而CMMI则着眼于整个组织的过程改进。实际上,在许多成功的组织中,两者往往是相辅相成的。拥有PMP认证的专业人员可以在具体项目中运用他们的技能,而CMMI则为这些项目提供了一个更广泛的、持续改进的环境。

2024-09-17 23:12:44 1074

原创 使用LangGPT提示词让大模型比较浮点数

LLM在对比浮点数字时表现不佳,经验证,internlm2-chat-1.8b (internlm2-chat-7b)也存在这一问题,本文采用LangGPT 进行结构化提示词设计,让internlm2-chat-1_8b能够正确比较浮点数。(注意:估计1.8B的对话能力比较弱,别把模型带偏了:))本文使用书生浦语的开发机环境InternStudio来部署模型与实验。

2024-09-17 22:33:03 715

原创 散文集-秋晨之韵

走在这样的清晨,每一步都踏着柔软的落叶,每一步都感受着大自然赋予的美好。无论是那一缕温暖的阳光,还是那片轻柔的云朵,亦或是那阵轻轻的微风,都在提醒我们:珍惜此刻,享受生活中的每一个瞬间。阳光透过树梢,斑驳地洒在地上,形成一片片温暖的光影。那些云,不再是夏天厚重的积雨云,而是轻盈飘逸的白云,它们在空中悠闲地漫步,时而聚拢,时而散开,像一群群自由的旅者,在蔚蓝的天幕上演绎着无声的故事。天空还残留着夜色的余温,但东方的地平线上已经泛起了淡淡的橙黄,如同画家在画布上轻轻点染的第一笔,预示着新的一天即将拉开序幕。

2024-09-01 11:12:01 392

原创 关卡1-3:Git

这个是internLM的3期训练营的通关笔记。

2024-07-21 16:46:26 532

原创 关卡1-2:Python关卡

此时会有弹窗提示输入ssh链接命令,回车后还会让我们选择要更新那个ssh配置文件,默认就选择第一个就行(如果你有其他需要的话也可以新建一个ssh配置文件)。点击VSCode侧边栏的“Run and Debug”(运行和调试),然后点击“Run and Debug”(开始调试)按钮,或者按F5键。打开vscode,点击左侧的extensions菜单,在搜索框中输入remote-ssh,选择第一个,点击“install”点击代码文件的左侧,要打断点的行,点击后,出现红点,即可。选择后,执行一遍,确认可以运行。

2024-07-21 00:25:32 1057

原创 关卡1-1:Linux + InternStudio

InternStudio 是大模型时代下的云端算力平台。基于 InternLM 组织下的诸多算法库支持,为开发者提供开箱即用的大语言模型微调环境、工具、数据集,并完美兼容 🤗 HugginFace 开源生态。端口映射是一种网络技术,它可以将外网中的任意端口映射到内网中的相应端口,实现内网与外网之间的通信。通过端口映射,可以在外网访问内网中的服务或应用,实现跨越网络的便捷通信。那么我们使用开发机为什么要进行端口映射呢?

2024-07-14 00:19:08 1132

原创 数据产品赋能数字化转型

数据产品是指利用现代信息技术,如大数据、云计算、人工智能等手段,对原始数据进行采集、清洗、整合、分析,并封装成易于使用的服务或应用的产品形态。高度集成化,将复杂的数据处理流程封装,提供简单易用的界面;智能化,内置高级分析算法,能自动发现数据规律和洞察;定制化,可根据不同行业和企业需求进行灵活配置。

2024-06-27 10:29:02 1197

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除