wengad-优快云博客

原创 flink1.20.2环境部署和实验-2

续flink1.20.2环境部署和实验-1的内容，搭建flink应用开发环境，实现flink消费kafka数据，并打印在控制台。

2025-11-08 23:40:52 400

本文详细介绍了Apache Flink和Kafka的环境部署过程，针对Flink 1.20.2和Kafka 4.1.0版本提供了两种部署方式：1）非容器化部署需分别配置JDK11和JDK17环境，包括SSH免密登录设置和集群配置；2）推荐使用Podman容器化部署Kafka，简化了流程。部署完成后可通过Web界面(http://[IP]:8081)监控Flink集群状态。最后简要提及实验目标：实现Flink消费Kafka消息并输出到控制台的功能。文章提供了完整的安装流程和关键配置说明。

2025-11-08 22:22:46 867

原创工程经济对折现率选择的理论、方法与行业实践研究

在国有企业并购风光电项目的评估中，存在内评外评差异较大的问题：外部评估机构通常给出较高的折现率（如7.35%），而企业内部评估则倾向于较低的折现率（如4.12%），这种差异主要源于对β系数、企业特定风险调整系数以及债务资本成本的不同取值。的数学表达为现值计算中的分母部分，其基本公式为：PV = FV / (1 + r)^t，其中PV为现值，FV为未来值，r为折现率，t为时间期数。是社会折现率的应用扩展。社会折现率的确定需要考虑代际公平、社会时间偏好率和资本的社会机会成本等因素，是一个复杂但重要的发展方向。

2025-10-12 23:05:33 993

原创量化交易中常见的盘面数据

选择量化交易的数据源，关键在于匹配自身需求。• 对于初学者和个人开发者，可以从 AkShare、Yahoo Finance 等免费数据源入手，配合 Backtrader、Zipline 等回测框架进行学习实践。• 对于专业投资者或机构，通常需要投资于 Wind、东方财富Choice、Tushare Pro 等付费数据服务，以获得更高质量、更稳定和更全面的数据支持。

2025-09-26 00:27:44 769

原创低碳经济：碳汇——从生态固碳到金融资产的价值转化

碳汇是指通过生态系统的自然循环或人工干预，将大气中的二氧化碳等温室气体吸收并固定在植被、土壤或海洋中的过程、活动及机制，其核心功能是降低大气温室气体浓度，与 “碳源”（向大气排放温室气体的源头，如工业排放、化石燃料燃烧）形成动态平衡。这一概念源自《京都议定书》，既是全球应对气候变化的核心生态手段，也是碳金融市场重要的底层资产来源 —— 未经过核证的碳汇是生态资源，经标准化流程转化后可成为可交易的 “碳资产”。。

2025-09-20 19:36:56 1143

原创银行的消费和普惠条线的差别及消费金融市场情况

本文对消费金融和普惠金融进行简单的比较，并搜集了消费金融公司的24年的一些营收、资产规模数据。

2025-09-13 23:24:26 615

原创 coze1-podman容器化部署coze

coze已经开源一段时间了，版本升级的也比较快，记录下使用podman部署coze的过程，这里使用的是coze v0.2.2的版本来安装了，老的版本会和新版本不太一样，肯定是推荐使用新版本来安装。因为docker不好拉取镜像，使用podman可以顺畅的拉取相关镜像，所以也强烈推荐使用podman。设置好那么保存，具体的URL和model名称，根据实际情况来修改。如果都拉取成功，并都成功运行了，会看到coze的相关11个容器。至此，如果顺利的情况下，能够进去界面，就成功一半了。如果已经安装好，那么忽略。

2025-08-06 21:17:55 1092 1

原创信创及一次ORACLE到OB的信创迁移

它支持多种关系型数据库、消息队列与 OceanBase 数据库之间的数据复制，是集数据迁移、实时数据同步和增量数据订阅于一体的数据传输服务，OMS 帮助您低风险、低成本、高效率的实现 OceanBase 的数据流通，助力构建安全、稳定、高效的数据复制架构。评估程序连接到ORACLE数据库中，进行评估，评估后，工具出具评估报告，供迁移者查阅。有必要说的是，OB虽然是云原生的分布式数据库，但是它不像MPP数据库一样，表是自动散列分布式存储的，它必须在建表的时候明确为分区表，才会分布式存储在集群的节点中。

2025-08-03 22:53:08 1407 4

原创 HF Transformer安装和pipeline使用

本文介绍HF transformer的安装和pipeline的简单实用

2025-07-27 11:00:38 907

原创使用podman 容器化安装DIFY

本文阐述了使用podman容器化安装DIFY的过程

2025-07-22 20:27:51 1445 1

原创超参数消融

超参数消融是机器学习模型优化中的一种系统性实验方法，用于评估不同超参数对模型性能的影响，进而筛选出最优超参数组合。在复杂模型（如神经网络、集成模型）中，通过移除某个组件（本质是调整“是否启用该组件”的超参数）来评估其必要性。同时调整多个相关超参数（如学习率与批大小、正则化参数与迭代次数），分析参数间的交互影响。，逐一或分组移除、调整超参数，观察模型性能变化，从而确定每个超参数的重要性和最佳取值。通过超参数消融，不仅能提升模型性能，还能深入理解模型行为，为后续优化提供科学依据。：在随机森林中测试不同。

2025-07-20 20:52:14 1100

原创网络智能体研究综述

本文研究网络智能体相关技术，并介绍阿里的websailor网络智能体

2025-07-19 12:47:51 711

原创 WSL安装发行版上安装podman

本文在windows11上，使用WSL拉取并创建ubuntu24.04虚拟机，再安装podman，并通过podman拉取了一个n8n的镜像，运行一个容器。在安装过程中，涉及到了OS和podman的国内镜像的配置，可以加速拉取的过程。

2025-06-29 16:41:30 944

原创 TEXT2SQL-vanna多表关联的实验

在vanna上验证多表关联的可行性

2025-06-12 23:36:48 708

原创一个n8n构建的能和LLM对话的Agent

本文介绍了如何在Windows环境下通过虚拟机CentOS搭建一个基于n8n工作流平台和OLLAMA本地LLM模型的对话Agent。内容包括：1）OLLAMA的下载安装、环境变量设置和模型拉取；2）n8n的容器化部署流程；3）创建对话工作流的具体步骤，包括凭证配置和模型选择。该方案能快速构建具备LLM对话能力的Agent，适合入门使用，但需注意n8n的商用收费政策。整个系统采用本地化部署，保障数据隐私性。

2025-06-10 23:39:04 1029

原创 Doris-2：单虚拟机上非docker化安装Doris实验环境

本文详细介绍了在CentOS Stream 10虚拟机上非docker化安装Apache Doris 2.1.10单机实验环境的步骤。内容包括：1) 准备OpenJDK 8环境；2) 操作系统配置（修改文件句柄数、虚拟内存区域、关闭swap和防火墙）；3) 创建专用doris用户；4) 部署FE和BE节点，配置元数据和存储路径；5) 启动服务并验证运行状态；6) 通过MySQL客户端注册BE节点；7) 创建测试数据库和表验证安装。该环境适合学习使用，需要至少4核CPU、8GB内存和50GB磁盘空间，重点解决

2025-06-08 15:37:05 1206

原创 Doris-1：Doris简介

Apache Doris 是一款基于 MPP 架构的高性能、实时分析型数据库。它以高效、简单和统一的特性著称，能够在亚秒级的时间内返回海量数据的查询结果。Doris 既能支持高并发的点查询场景，也能支持高吞吐的复杂分析场景。基于这些优势，Apache Doris 非常适合用于报表分析、即席查询、统一数仓构建、数据湖联邦查询加速等场景。用户可以基于 Doris 构建大屏看板、用户行为分析、AB 实验平台、日志检索分析、用户画像分析、订单分析等应用。

2025-06-08 15:34:39 1015

原创 clickhouse-1-特性及docker化安装

主要介绍CK的特性，并采用docker安装单节点环境。ClickHouse 是一款由俄罗斯 Yandex 公司开发的开源列式数据库管理系统（DBMS），专为在线分析处理（OLAP）场景设计，以极致的查询性能和海量数据处理能力著称。

2025-05-25 23:37:52 1237

原创 MCP-1：MCP组件与工作流程

MCP（Model Context Protocol）是由Anthropic推出的开放标准协议，旨在为大型语言模型（LLM）与外部数据源、工具之间提供标准化的交互方式。MCP通过定义统一的接口和通信机制，使AI模型能够安全、灵活地访问外部资源，如数据库、API和文件系统，从而提升模型在复杂任务中的实用性。MCP架构包括三个主要组件：MCP Hosts（用户与AI模型交互的入口）、MCP Clients（负责与MCP Server建立连接并管理通信的中间件）和MCP Server（功能提供层，封装数据、工具和

2025-05-21 23:34:13 1298

原创数据要素及征信公司数据要素实践

数据要素是数字经济时代的新型生产要素，指以电子形式存在、通过计算方式参与生产经营活动并创造价值的数据资源。新型生产要素地位：与劳动力、资本、土地等传统要素并列，成为现代经济体系中的基础性战略资源。例如，国家数据局的成立（2023年）标志着数据要素在政策层面的战略地位提升价值创造方式：通过数据加工、共享和流通，赋能生产优化、风险管理、决策支持等场景。例如，制造业通过IoT数据优化设备维护周期，金融业通过信用评估模型降低信贷风险特殊属性：非竞争性：数据可被多主体重复使用且价值不减；

2025-05-19 23:47:16 1420

原创企业信息化的“双螺旋”——IT治理和数据治理

数据治理•定位：以数据为核心的资产管理体系，聚焦于数据全生命周期的价值创造与风险控制。•核心目标：保障数据的可用性、可靠性、安全性，推动数据驱动决策，并满足合规要求（如GDPR、CCPA）。•典型内容◦ 数据标准与元数据管理；◦ 数据质量管理（清洗、稽核）；◦ 数据安全与隐私保护；◦ 数据权限与合规审计；◦ 数据共享与生态合作。IT治理•定位：组织对IT资源的战略性管理，旨在通过协调技术、流程和人员，支撑业务目标实现。•核心目标。

2025-03-21 23:29:17 922

原创数据治理下半场：如何用文化变革撬动企业数字化转型？

在数字经济浪潮中，企业的数据治理已从技术命题升级为战略必答题。但当某零售巨头投入千万搭建数据中台后，却发现业务部门仍习惯凭经验决策；某金融公司引入AI风控模型后，数据质量差导致30%的预警失效——这些真实案例揭示了一个残酷现实：技术再先进，没有文化基因的变革，终将沦为华而不实的"数据摆件"。。

2025-03-16 19:54:56 1075

原创单机上使用docker搭建minio集群

这里在ubuntu上单机安装一个minio集群，可以作为比如GIT-LFS的存储，用于存放大模型权重文件等。

2025-02-23 23:20:48 1392 1

原创写一个python组件

假设我们的组件名为mydetector，它将有一个基本的XX功能。如下是组件项目的目录结构：││ ├──.py│。

2025-02-19 23:56:11 434

原创 YOLOV11-1：YoloV11-安装和CLI方式训练模型

本文介绍yoloV11的安装和命令行接口。

2025-02-03 22:44:23 1486

原创 CDSN 2024博客之星总评选-主题文章创作，我的AI之路-起手篇

这种转变不仅拓宽了语言模型的应用场景，也使其变得更加智能，成为了连接多种信息形式的桥梁，为未来的人工智能发展开辟了新的可能性。到了2020年，我有幸主导了AI中台的研发工作，这使我对数据标注流程、训练工艺、AI平台架构等及其在企业级应用中的重要性有了更加深刻的理解。希望我的经历能给同样热爱AI的朋友们带来些许启发，让我们携手共进，在追逐梦想的路上越走越远。除了核心的大模型外，书生浦语还配备了一整套完善的工具链，涵盖了从模型部署、模型推理优化、模型量化、模型评测、Agent、多模型支持等的各个环节。

2025-01-24 21:47:48 1035

原创 Ubuntu下安装Harbor

Harbor 是一个开源的 Docker registry 服务器，由 VMware 开源并捐赠给 CNCF（云原生计算基金会），它基于 Docker 分布式应用程序框架构建。Harbor 扩展了 Docker Registry 的功能，增加了安全性、标识和管理特性，使其更适合企业使用。

2025-01-11 23:25:19 1617

原创 Ubuntu24.04安装NVIDIA驱动及工具包

NVIDIA 驱动程序（NVIDIA Driver）是专为 NVIDIA 图形处理单元（GPU）设计的软件，它充当操作系统与硬件之间的桥梁，使得计算机能够正确识别和使用 GPU 的功能。为了使用 CuDNN，你需要先安装 CUDA Toolkit，然后下载并安装与你的 CUDA 版本相匹配的 CuDNN 库。ubuntu 24.04与nvidia有专门的支持，若通过到nvidia官网下载的版本来安装，不能使用，需要通过系统的软件和升级功能来安装，Additional Drivers，选择一个版本来安装。

2024-12-27 00:30:42 6071 1

原创 LangChain 1：langchain调大模型对话

本文基于langchain 0.3.4，使用langchain_openai连接大模型，调用大模型对话功能。

2024-10-20 22:17:34 1090

原创使用apipost连接openai的接口进行模型对话

本文通过apipost来连接openai的标准接口

2024-10-20 18:54:40 941

原创 MindSearch CPU-only 版部署

MindSearch 是一个由上海人工智能实验室推出的开源 AI 搜索引擎框架,具有与 Perplexity.ai Pro 相同的性能。本文以 InternStudio 算力平台为例，来部署 CPU-only 的 MindSearch。

2024-10-07 16:10:26 521

原创 LMDeploy量化部署

基于Cuda12.2-conda镜像，在30% A100下实现。

2024-10-07 15:18:50 1519

原创使用LlamaIndex构建RAG

LlamaIndex是一个数据框架，它主要用于连接大型语言模型（LLMs）与外部数据源，例如API、PDF文档、SQL数据库等。这个框架的设计目的是为了增强LLM的能力，使其能够理解和生成更准确、更有上下文关联的文本，尤其是在涉及私人数据或特定领域知识的情况下。LlamaIndex通过创建索引结构来组织和访问数据，这样可以更高效地检索相关信息并将其提供给LLM。这些索引可以是列表索引、向量索引、树索引或关键词索引等，具体取决于数据类型和需求。

2024-10-05 17:09:53 1569 2

原创 PMP与CMMI：两种管理方法的对比

尽管PMP和CMMI都对项目管理和组织绩效有积极影响，但它们的作用范围不同。PMP专注于单个项目的有效管理，而CMMI则着眼于整个组织的过程改进。实际上，在许多成功的组织中，两者往往是相辅相成的。拥有PMP认证的专业人员可以在具体项目中运用他们的技能，而CMMI则为这些项目提供了一个更广泛的、持续改进的环境。

2024-09-17 23:12:44 1074

原创使用LangGPT提示词让大模型比较浮点数

LLM在对比浮点数字时表现不佳，经验证，internlm2-chat-1.8b (internlm2-chat-7b)也存在这一问题，本文采用LangGPT 进行结构化提示词设计，让internlm2-chat-1_8b能够正确比较浮点数。（注意：估计1.8B的对话能力比较弱，别把模型带偏了：））本文使用书生浦语的开发机环境InternStudio来部署模型与实验。

2024-09-17 22:33:03 715

原创散文集-秋晨之韵

走在这样的清晨，每一步都踏着柔软的落叶，每一步都感受着大自然赋予的美好。无论是那一缕温暖的阳光，还是那片轻柔的云朵，亦或是那阵轻轻的微风，都在提醒我们：珍惜此刻，享受生活中的每一个瞬间。阳光透过树梢，斑驳地洒在地上，形成一片片温暖的光影。那些云，不再是夏天厚重的积雨云，而是轻盈飘逸的白云，它们在空中悠闲地漫步，时而聚拢，时而散开，像一群群自由的旅者，在蔚蓝的天幕上演绎着无声的故事。天空还残留着夜色的余温，但东方的地平线上已经泛起了淡淡的橙黄，如同画家在画布上轻轻点染的第一笔，预示着新的一天即将拉开序幕。

2024-09-01 11:12:01 392

原创关卡1-3：Git

这个是internLM的3期训练营的通关笔记。

2024-07-21 16:46:26 532

原创关卡1-2：Python关卡

此时会有弹窗提示输入ssh链接命令，回车后还会让我们选择要更新那个ssh配置文件，默认就选择第一个就行（如果你有其他需要的话也可以新建一个ssh配置文件）。点击VSCode侧边栏的“Run and Debug”（运行和调试），然后点击“Run and Debug”（开始调试）按钮，或者按F5键。打开vscode，点击左侧的extensions菜单，在搜索框中输入remote-ssh,选择第一个，点击“install”点击代码文件的左侧，要打断点的行，点击后，出现红点，即可。选择后，执行一遍，确认可以运行。

2024-07-21 00:25:32 1057

原创关卡1-1：Linux + InternStudio

InternStudio 是大模型时代下的云端算力平台。基于 InternLM 组织下的诸多算法库支持，为开发者提供开箱即用的大语言模型微调环境、工具、数据集，并完美兼容 🤗 HugginFace 开源生态。端口映射是一种网络技术，它可以将外网中的任意端口映射到内网中的相应端口，实现内网与外网之间的通信。通过端口映射，可以在外网访问内网中的服务或应用，实现跨越网络的便捷通信。那么我们使用开发机为什么要进行端口映射呢？

2024-07-14 00:19:08 1132

原创数据产品赋能数字化转型

数据产品是指利用现代信息技术，如大数据、云计算、人工智能等手段，对原始数据进行采集、清洗、整合、分析，并封装成易于使用的服务或应用的产品形态。高度集成化，将复杂的数据处理流程封装，提供简单易用的界面；智能化，内置高级分析算法，能自动发现数据规律和洞察；定制化，可根据不同行业和企业需求进行灵活配置。

2024-06-27 10:29:02 1197

空空如也

空空如也