- 博客(58)
- 收藏
- 关注
原创 flink1.20.2环境部署和实验-2
续flink1.20.2环境部署和实验-1的内容,搭建flink应用开发环境,实现flink消费kafka数据,并打印在控制台。
2025-11-08 23:40:52
400
原创 flink1.20.2环境部署和实验-1
本文详细介绍了Apache Flink和Kafka的环境部署过程,针对Flink 1.20.2和Kafka 4.1.0版本提供了两种部署方式:1)非容器化部署需分别配置JDK11和JDK17环境,包括SSH免密登录设置和集群配置;2)推荐使用Podman容器化部署Kafka,简化了流程。部署完成后可通过Web界面(http://[IP]:8081)监控Flink集群状态。最后简要提及实验目标:实现Flink消费Kafka消息并输出到控制台的功能。文章提供了完整的安装流程和关键配置说明。
2025-11-08 22:22:46
867
原创 工程经济对折现率选择的理论、方法与行业实践研究
在国有企业并购风光电项目的评估中,存在内评外评差异较大的问题:外部评估机构通常给出较高的折现率(如7.35%),而企业内部评估则倾向于较低的折现率(如4.12%),这种差异主要源于对β系数、企业特定风险调整系数以及债务资本成本的不同取值。的数学表达为现值计算中的分母部分,其基本公式为:PV = FV / (1 + r)^t,其中PV为现值,FV为未来值,r为折现率,t为时间期数。是社会折现率的应用扩展。社会折现率的确定需要考虑代际公平、社会时间偏好率和资本的社会机会成本等因素,是一个复杂但重要的发展方向。
2025-10-12 23:05:33
993
原创 量化交易中常见的盘面数据
选择量化交易的数据源,关键在于匹配自身需求。• 对于初学者和个人开发者,可以从 AkShare、Yahoo Finance 等免费数据源入手,配合 Backtrader、Zipline 等回测框架进行学习实践。• 对于专业投资者或机构,通常需要投资于 Wind、东方财富Choice、Tushare Pro 等付费数据服务,以获得更高质量、更稳定和更全面的数据支持。
2025-09-26 00:27:44
769
原创 低碳经济:碳汇——从生态固碳到金融资产的价值转化
碳汇是指通过生态系统的自然循环或人工干预,将大气中的二氧化碳等温室气体吸收并固定在植被、土壤或海洋中的过程、活动及机制,其核心功能是降低大气温室气体浓度,与 “碳源”(向大气排放温室气体的源头,如工业排放、化石燃料燃烧)形成动态平衡。这一概念源自《京都议定书》,既是全球应对气候变化的核心生态手段,也是碳金融市场重要的底层资产来源 —— 未经过核证的碳汇是生态资源,经标准化流程转化后可成为可交易的 “碳资产”。。
2025-09-20 19:36:56
1143
原创 coze1-podman容器化部署coze
coze已经开源一段时间了,版本升级的也比较快,记录下使用podman部署coze的过程,这里使用的是coze v0.2.2的版本来安装了,老的版本会和新版本不太一样,肯定是推荐使用新版本来安装。因为docker不好拉取镜像,使用podman可以顺畅的拉取相关镜像,所以也强烈推荐使用podman。设置好那么保存,具体的URL和model名称,根据实际情况来修改。如果都拉取成功,并都成功运行了,会看到coze的相关11个容器。至此,如果顺利的情况下,能够进去界面,就成功一半了。如果已经安装好,那么忽略。
2025-08-06 21:17:55
1092
1
原创 信创及一次ORACLE到OB的信创迁移
它支持多种关系型数据库、消息队列与 OceanBase 数据库之间的数据复制,是集数据迁移、实时数据同步和增量数据订阅于一体的数据传输服务,OMS 帮助您低风险、低成本、高效率的实现 OceanBase 的数据流通,助力构建安全、稳定、高效的数据复制架构。评估程序连接到ORACLE数据库中,进行评估,评估后,工具出具评估报告,供迁移者查阅。有必要说的是,OB虽然是云原生的分布式数据库,但是它不像MPP数据库一样,表是自动散列分布式存储的,它必须在建表的时候明确为分区表,才会分布式存储在集群的节点中。
2025-08-03 22:53:08
1407
4
原创 超参数消融
超参数消融是机器学习模型优化中的一种系统性实验方法,用于评估不同超参数对模型性能的影响,进而筛选出最优超参数组合。在复杂模型(如神经网络、集成模型)中,通过移除某个组件(本质是调整“是否启用该组件”的超参数)来评估其必要性。同时调整多个相关超参数(如学习率与批大小、正则化参数与迭代次数),分析参数间的交互影响。,逐一或分组移除、调整超参数,观察模型性能变化,从而确定每个超参数的重要性和最佳取值。通过超参数消融,不仅能提升模型性能,还能深入理解模型行为,为后续优化提供科学依据。:在随机森林中测试不同。
2025-07-20 20:52:14
1100
原创 WSL安装发行版上安装podman
本文在windows11上,使用WSL拉取并创建ubuntu24.04虚拟机,再安装podman,并通过podman拉取了一个n8n的镜像,运行一个容器。在安装过程中,涉及到了OS和podman的国内镜像的配置,可以加速拉取的过程。
2025-06-29 16:41:30
944
原创 一个n8n构建的能和LLM对话的Agent
本文介绍了如何在Windows环境下通过虚拟机CentOS搭建一个基于n8n工作流平台和OLLAMA本地LLM模型的对话Agent。内容包括:1)OLLAMA的下载安装、环境变量设置和模型拉取;2)n8n的容器化部署流程;3)创建对话工作流的具体步骤,包括凭证配置和模型选择。该方案能快速构建具备LLM对话能力的Agent,适合入门使用,但需注意n8n的商用收费政策。整个系统采用本地化部署,保障数据隐私性。
2025-06-10 23:39:04
1029
原创 Doris-2:单虚拟机上非docker化安装Doris实验环境
本文详细介绍了在CentOS Stream 10虚拟机上非docker化安装Apache Doris 2.1.10单机实验环境的步骤。内容包括:1) 准备OpenJDK 8环境;2) 操作系统配置(修改文件句柄数、虚拟内存区域、关闭swap和防火墙);3) 创建专用doris用户;4) 部署FE和BE节点,配置元数据和存储路径;5) 启动服务并验证运行状态;6) 通过MySQL客户端注册BE节点;7) 创建测试数据库和表验证安装。该环境适合学习使用,需要至少4核CPU、8GB内存和50GB磁盘空间,重点解决
2025-06-08 15:37:05
1206
原创 Doris-1:Doris简介
Apache Doris 是一款基于 MPP 架构的高性能、实时分析型数据库。它以高效、简单和统一的特性著称,能够在亚秒级的时间内返回海量数据的查询结果。Doris 既能支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。基于这些优势,Apache Doris 非常适合用于报表分析、即席查询、统一数仓构建、数据湖联邦查询加速等场景。用户可以基于 Doris 构建大屏看板、用户行为分析、AB 实验平台、日志检索分析、用户画像分析、订单分析等应用。
2025-06-08 15:34:39
1015
原创 clickhouse-1-特性及docker化安装
主要介绍CK的特性,并采用docker安装单节点环境。ClickHouse 是一款由俄罗斯 Yandex 公司开发的开源列式数据库管理系统(DBMS),专为 在线分析处理(OLAP) 场景设计,以极致的查询性能和海量数据处理能力著称。
2025-05-25 23:37:52
1237
原创 MCP-1:MCP组件与工作流程
MCP(Model Context Protocol)是由Anthropic推出的开放标准协议,旨在为大型语言模型(LLM)与外部数据源、工具之间提供标准化的交互方式。MCP通过定义统一的接口和通信机制,使AI模型能够安全、灵活地访问外部资源,如数据库、API和文件系统,从而提升模型在复杂任务中的实用性。MCP架构包括三个主要组件:MCP Hosts(用户与AI模型交互的入口)、MCP Clients(负责与MCP Server建立连接并管理通信的中间件)和MCP Server(功能提供层,封装数据、工具和
2025-05-21 23:34:13
1298
原创 数据要素及征信公司数据要素实践
数据要素是数字经济时代的新型生产要素,指以电子形式存在、通过计算方式参与生产经营活动并创造价值的数据资源。新型生产要素地位:与劳动力、资本、土地等传统要素并列,成为现代经济体系中的基础性战略资源。例如,国家数据局的成立(2023年)标志着数据要素在政策层面的战略地位提升价值创造方式:通过数据加工、共享和流通,赋能生产优化、风险管理、决策支持等场景。例如,制造业通过IoT数据优化设备维护周期,金融业通过信用评估模型降低信贷风险特殊属性:非竞争性:数据可被多主体重复使用且价值不减;
2025-05-19 23:47:16
1420
原创 企业信息化的“双螺旋”——IT治理和数据治理
数据治理•定位:以数据为核心的资产管理体系,聚焦于数据全生命周期的价值创造与风险控制。•核心目标:保障数据的可用性、可靠性、安全性,推动数据驱动决策,并满足合规要求(如GDPR、CCPA)。•典型内容◦ 数据标准与元数据管理;◦ 数据质量管理(清洗、稽核);◦ 数据安全与隐私保护;◦ 数据权限与合规审计;◦ 数据共享与生态合作。IT治理•定位:组织对IT资源的战略性管理,旨在通过协调技术、流程和人员,支撑业务目标实现。•核心目标。
2025-03-21 23:29:17
922
原创 数据治理下半场:如何用文化变革撬动企业数字化转型?
在数字经济浪潮中,企业的数据治理已从技术命题升级为战略必答题。但当某零售巨头投入千万搭建数据中台后,却发现业务部门仍习惯凭经验决策;某金融公司引入AI风控模型后,数据质量差导致30%的预警失效——这些真实案例揭示了一个残酷现实:技术再先进,没有文化基因的变革,终将沦为华而不实的"数据摆件"。。
2025-03-16 19:54:56
1075
原创 单机上使用docker搭建minio集群
这里在ubuntu上单机安装一个minio集群,可以作为比如GIT-LFS的存储,用于存放大模型权重文件等。
2025-02-23 23:20:48
1392
1
原创 CDSN 2024博客之星总评选-主题文章创作,我的AI之路-起手篇
这种转变不仅拓宽了语言模型的应用场景,也使其变得更加智能,成为了连接多种信息形式的桥梁,为未来的人工智能发展开辟了新的可能性。到了2020年,我有幸主导了AI中台的研发工作,这使我对数据标注流程、训练工艺、AI平台架构等及其在企业级应用中的重要性有了更加深刻的理解。希望我的经历能给同样热爱AI的朋友们带来些许启发,让我们携手共进,在追逐梦想的路上越走越远。除了核心的大模型外,书生浦语还配备了一整套完善的工具链,涵盖了从模型部署、模型推理优化、模型量化、模型评测、Agent、多模型支持等的各个环节。
2025-01-24 21:47:48
1035
原创 Ubuntu下安装Harbor
Harbor 是一个开源的 Docker registry 服务器,由 VMware 开源并捐赠给 CNCF(云原生计算基金会),它基于 Docker 分布式应用程序框架构建。Harbor 扩展了 Docker Registry 的功能,增加了安全性、标识和管理特性,使其更适合企业使用。
2025-01-11 23:25:19
1617
原创 Ubuntu24.04安装NVIDIA驱动及工具包
NVIDIA 驱动程序(NVIDIA Driver)是专为 NVIDIA 图形处理单元(GPU)设计的软件,它充当操作系统与硬件之间的桥梁,使得计算机能够正确识别和使用 GPU 的功能。为了使用 CuDNN,你需要先安装 CUDA Toolkit,然后下载并安装与你的 CUDA 版本相匹配的 CuDNN 库。ubuntu 24.04与nvidia有专门的支持,若通过到nvidia官网下载的版本来安装,不能使用,需要通过系统的软件和升级功能来安装 ,Additional Drivers,选择一个版本来安装。
2024-12-27 00:30:42
6071
1
原创 LangChain 1:langchain调大模型对话
本文基于langchain 0.3.4,使用langchain_openai连接大模型,调用大模型对话功能。
2024-10-20 22:17:34
1090
原创 MindSearch CPU-only 版部署
MindSearch 是一个由上海人工智能实验室推出的开源 AI 搜索引擎框架,具有与 Perplexity.ai Pro 相同的性能。本文以 InternStudio 算力平台为例,来部署 CPU-only 的 MindSearch。
2024-10-07 16:10:26
521
原创 使用LlamaIndex构建RAG
LlamaIndex是一个数据框架,它主要用于连接大型语言模型(LLMs)与外部数据源,例如API、PDF文档、SQL数据库等。这个框架的设计目的是为了增强LLM的能力,使其能够理解和生成更准确、更有上下文关联的文本,尤其是在涉及私人数据或特定领域知识的情况下。LlamaIndex通过创建索引结构来组织和访问数据,这样可以更高效地检索相关信息并将其提供给LLM。这些索引可以是列表索引、向量索引、树索引或关键词索引等,具体取决于数据类型和需求。
2024-10-05 17:09:53
1569
2
原创 PMP与CMMI:两种管理方法的对比
尽管PMP和CMMI都对项目管理和组织绩效有积极影响,但它们的作用范围不同。PMP专注于单个项目的有效管理,而CMMI则着眼于整个组织的过程改进。实际上,在许多成功的组织中,两者往往是相辅相成的。拥有PMP认证的专业人员可以在具体项目中运用他们的技能,而CMMI则为这些项目提供了一个更广泛的、持续改进的环境。
2024-09-17 23:12:44
1074
原创 使用LangGPT提示词让大模型比较浮点数
LLM在对比浮点数字时表现不佳,经验证,internlm2-chat-1.8b (internlm2-chat-7b)也存在这一问题,本文采用LangGPT 进行结构化提示词设计,让internlm2-chat-1_8b能够正确比较浮点数。(注意:估计1.8B的对话能力比较弱,别把模型带偏了:))本文使用书生浦语的开发机环境InternStudio来部署模型与实验。
2024-09-17 22:33:03
715
原创 散文集-秋晨之韵
走在这样的清晨,每一步都踏着柔软的落叶,每一步都感受着大自然赋予的美好。无论是那一缕温暖的阳光,还是那片轻柔的云朵,亦或是那阵轻轻的微风,都在提醒我们:珍惜此刻,享受生活中的每一个瞬间。阳光透过树梢,斑驳地洒在地上,形成一片片温暖的光影。那些云,不再是夏天厚重的积雨云,而是轻盈飘逸的白云,它们在空中悠闲地漫步,时而聚拢,时而散开,像一群群自由的旅者,在蔚蓝的天幕上演绎着无声的故事。天空还残留着夜色的余温,但东方的地平线上已经泛起了淡淡的橙黄,如同画家在画布上轻轻点染的第一笔,预示着新的一天即将拉开序幕。
2024-09-01 11:12:01
392
原创 关卡1-2:Python关卡
此时会有弹窗提示输入ssh链接命令,回车后还会让我们选择要更新那个ssh配置文件,默认就选择第一个就行(如果你有其他需要的话也可以新建一个ssh配置文件)。点击VSCode侧边栏的“Run and Debug”(运行和调试),然后点击“Run and Debug”(开始调试)按钮,或者按F5键。打开vscode,点击左侧的extensions菜单,在搜索框中输入remote-ssh,选择第一个,点击“install”点击代码文件的左侧,要打断点的行,点击后,出现红点,即可。选择后,执行一遍,确认可以运行。
2024-07-21 00:25:32
1057
原创 关卡1-1:Linux + InternStudio
InternStudio 是大模型时代下的云端算力平台。基于 InternLM 组织下的诸多算法库支持,为开发者提供开箱即用的大语言模型微调环境、工具、数据集,并完美兼容 🤗 HugginFace 开源生态。端口映射是一种网络技术,它可以将外网中的任意端口映射到内网中的相应端口,实现内网与外网之间的通信。通过端口映射,可以在外网访问内网中的服务或应用,实现跨越网络的便捷通信。那么我们使用开发机为什么要进行端口映射呢?
2024-07-14 00:19:08
1132
原创 数据产品赋能数字化转型
数据产品是指利用现代信息技术,如大数据、云计算、人工智能等手段,对原始数据进行采集、清洗、整合、分析,并封装成易于使用的服务或应用的产品形态。高度集成化,将复杂的数据处理流程封装,提供简单易用的界面;智能化,内置高级分析算法,能自动发现数据规律和洞察;定制化,可根据不同行业和企业需求进行灵活配置。
2024-06-27 10:29:02
1197
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅