自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(398)
  • 收藏
  • 关注

原创 FineBI产品的学习

数据关联:FineBI 提供的关联建模功能,让管理员能够在选择需要的数据之后,自动根据数据仓库的关联关系进行建模,同时也提供了手动的关联关系配置,支持组合主键的关联关系配置。可根据实际需要分析的问题,自由切换主题和模型,FineChatBI 依据用户的选择的主题和模型进行回答,从而提升数据质量和问答可信度,有效避免答非所问。2)数据编辑能力:FineBI 重点打造的自助数据集,提供了新增列,分组汇总,过滤,排序,上下合并,左右合并等功能,让用户以极低的学习成本将数据处理成自己需要的结果。

2025-07-28 08:43:53 182

原创 查看 SQL server的慢查询SQL

SELECT TOP 20 qs.total_worker_time / 1000 AS [Total CPU Time (ms)], qs.execution_count [Execution Count], qs.total_worker_time / qs.execution_count / 1000 AS [Average CPU Time (ms)], qs.last_execution_time AS [Last Execution Time], qs.m

2025-07-25 09:23:24 252

原创 NLP2SQL

NLP2SQL的技术本质与未来方向‌‌技术本质‌:NLP2SQL是‌自然语言理解‌、‌数据库知识图谱‌与‌代码生成‌的交叉领域,其核心挑战在于‌语义对齐‌(自然语言→数据库Schema)与‌逻辑推理‌(生成合法SQL)。‌未来方向‌:‌大模型驱动的端到端生成‌:减少中间表示,直接生成SQL。‌多模态交互‌:支持语音、图表等多模态输入输出。‌因果推理‌:支持反事实查询(如“如果降价10%,销量会如何变化?”)。‌行业垂直化‌:构建医疗、金融等领域的专用模型。

2025-07-23 10:20:55 525

原创 大模型基本原理

引用论文 Large Language Models: A Survey [1](Chain of Thought, CoT)通过要求/提示模型在输出最终答案之前,中间逐步的推理步骤这一方法来增强大模型的算数、常识和推理的性能。从该角度,可以将大模型的范式分为两类:和,前者适合快速反馈,处理即时任务,后者通过推理解决复杂问题。

2025-07-23 09:29:33 648

原创 AI大模型应用场景

财报自动化解析:通过自然语言处理(NLP)技术,自动提取上市公司财报关键指标(如营收、利润、现金流),并生成结构化分析报告。RPA(机器人流程自动化):DeepSeek的AI可自动执行重复性财务任务,如对账、付款审批、税务申报,提升效率50%以上。财务预测建模:基于历史数据训练预测模型,辅助企业进行收入预测、成本优化及现金流管理,准确率较传统方法提升30%以上。智能记账与发票处理:OCR(光学字符识别)+ NLP技术自动识别发票信息,并录入财务系统,减少人工录入错误。1、智能财务分析与预测。

2025-07-23 08:46:43 97

原创 AI agent 学习

DeepResearch又是DeepSearch的升级版,由Gemini率先提出,经ChatGPT发扬光大,不仅能深度搜索,还能做深度研究;而AI Agent则是具有自主执行能力的智能系统,能够完成从规划到执行的完整闭环,直接交付产品。DeepSearch是AI搜索的升级版,可以边搜边想,直到找到最优答案;其中,LLM扮演了Agent的“大脑”,在系统中提供推理、规划能力。一个基于大模型的AI Agent系统可以拆分为。,是判断一款AI产品是不是Agent的关键。这几个关键部分组成。

2025-07-08 19:58:29 302

原创 [decimal](25, 12) 这个类型表示 的位数是多少

表示该小数最多可以存储 **25位数字**(包括小数点前和小数点后的数字)。> **`DECIMAL(25,12)` 表示总共可以存储 25 位数字。表示其中有 **12位是小数部分**,即小数点后最多有12位数字。- 小数点前有 13 位数字(1234567890123)- 小数点后有 12 位数字(456789012345)- `s`(标度)= 小数点后有多少位数字 ✅。- `p`(精度)= 总共能存多少位数字 ✅。- **小数位数(标度)**:12。- **总位数(精度)**:25。

2025-06-28 11:02:28 412

原创 SQL Server 索引设计的核心思想:覆盖索引(Covering Index)

INCLUDE情况是否推荐说明INCLUDE不包含字段❌ 一般不够高效需要 Key LookupINCLUDE包含 ID(主键)⚠️ 有时有用可用于连接其他表,但仍需回表INCLUDE包含所有查询字段✅ 推荐使用覆盖索引,性能最佳字段太多或经常变动❌ 避免 INCLUDE 所有字段维护成本高,得不偿失实用技巧优先将 WHERE 条件中的字段放在索引键列(ON (...));将 SELECT 中需要返回的字段放在 INCLUDE;

2025-06-27 13:14:04 661

原创 毛利和毛利率

销售成本(COGS):即“销货成本”,包括直接生产或采购该商品的成本(如原材料、人工、制造费用),不包括管理费用、税费、利息等间接成本。毛利和毛利率是两个密切相关的财务指标,常用于评估企业或产品在销售过程中的盈利能力。它表示每赚取1元收入中,有多少是扣除直接成本后的利润,反映企业的盈利能力。毛利率 = (40,000 ÷ 100,000)× 100% = 40%毛利 = 100,000 - 60,000 = ¥40,000。也就是说,每卖出1元的产品,有0.4元的毛利。四、参考标准(不同行业差异大)

2025-05-27 09:07:15 673

原创 sqlserver 定时任务重跑数据

select * from app_job_date_procedure_status_history order by id desc select * from app_job_date_status_history order by id descUPDATE app_job_date_procedure_status_historySET status = 2WHERE id = 58;UPDATE app_job_date_status_history set status = 2 wher

2025-05-08 14:08:46 211

原创 git 合并分支

在工程文件中 手动处理冲突。

2025-05-08 08:55:46 244

原创 防止HTTPS页面通过<iframe>标签嵌入HTTP内容

防止HTTPS页面通过<iframe>标签嵌入HTTP内容出于安全考虑,现代浏览器实施了严格的规则来防止HTTPS页面通过<iframe>标签嵌入HTTP内容。这种行为主要是为了防止所谓的“混合内容”问题,即在一个安全(加密)的页面中加载非安全(未加密)的内容。这样做可能会暴露用户数据,并降低整体安全性。

2025-04-30 15:01:51 1148

原创 orc识别文字的原理

OCR(Optical Character Recognition,光学字符识别)技术是一种将印刷体或手写体文本转换为机器编码文本的技术。在OCR技术中,识别文字的过程涉及多个步骤,主要包括图像预处理、特征提取、字符识别和后处理。

2025-04-29 08:42:21 579

原创 token 数量的计算

Token 是自然语言处理(NLP)中的基本单位。它可以是一个单词、子词(subword)、字符,甚至是标点符号。不同的模型和编码方案对 token 的定义可能不同。例如:编码器的核心功能是实现。

2025-04-27 14:08:03 931

原创 PaddleX的安装

请参考下述命令,使用飞桨框架官方 Docker 镜像,创建一个名为。的容器,并将当前工作目录映射到容器内的。1、安装PaddlePaddle。查看 docker 版本。

2025-04-27 09:50:37 889

原创 OCR(Optical Character Recognition),光学字符识别

使用OCR技术,实现拍照文字识别、相册图片文字识别和截图文字识别,可应用于搜索、书摘、笔记、翻译等移动应用中,方便用户进行文本的提取或录入,有效提升产品易用性和用户使用体验。,是指通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用。字符切割:对图像中的文本进行字符级的切割,尤其注意字符粘连等问题。文字识别阶段:包含特征提取、字符识别、版面恢复、后处理等子步骤。版面恢复:识别原文档的排版,按照原排版的格式将识别结果输出。、二值化、图像降噪、分类法,识别出字符。

2025-04-25 13:32:00 526

原创 String.length() 方法返回的是字符串中的 字符数,而不是字节数

返回的是UTF-16 代码单元的数量,也就是字符数。对于常见的汉字,通常是一个代码单元(2 字节),计为 1 个字符。对于特殊字符(如表情符号或扩展区字符),可能需要两个代码单元(4 字节),计为 2 个字符。

2025-04-23 09:39:17 302

原创 ES 参数调优

【代码】ES 参数调优。

2025-04-07 10:33:24 611

原创 Markdown 表格的基本格式

Markdown 表格的基本格式如下:markdown复制| 标题1 | 标题2 | 标题3 || 内容1 | 内容2 | 内容3 || 内容4 | 内容5 | 内容6 |

2025-03-27 10:21:10 1333

原创 ES 加入高亮设置

这是实现跨字段高亮的关键设置,允许在。字段上高亮,即使查询的是其他字段(如。- 当没有匹配时返回的文本长度。- 控制每个高亮片段的大小。- 控制返回的高亮片段数量。

2025-03-25 15:37:10 530

原创 ES 字段的映射定义了字段的类型及其行为

例如,可以按 content_answer.keyword 对文档进行排序,或者对 content_answer.keyword 的值进行计数统计。例如,查询关键字 "测试" 可以匹配到字段值 "这是测试文本",因为分词器会将 "这是测试文本" 分割为 ["这是", "测试", "文本"]。例如,如果字段值是 "这是测试文本",分词器可能会将其分割为 ["这是", "测试", "文本"]。例如,查询字段值 "这是测试文本" 只能匹配到完全相同的字段值,而不能匹配到部分匹配的内容。

2025-03-25 13:50:20 547

原创 阿里云服务器部署 六 PaddleNLP词向量服务

curl -X POST http://172.16.108.44:6001/ -H 'Content-Type: application/json' -d '{"data":[{"text": "智能大屏"}, {"text": "智能销售"}]}'发现少了GLIBCXX_3.4.20,解决方法是升级libstdc++安装paddlenlp2.5.2。安装paddlepaddle。升级libstdc++

2025-03-21 14:22:20 442

原创 Systemd 是 Linux 系统的 ‌核心服务管理工具‌,负责管理系统的启动、服务生命周期和资源分配

Systemd是 Linux 系统的 ‌‌,负责管理系统的启动、服务生命周期和资源分配。它替代了传统的SysV init系统,提供更高效、统一的服务管理方式。

2025-03-21 13:18:52 443

原创 阿里云服务器部署 五 Nginx + springboot

Nginx的部分配置。

2025-03-21 10:08:11 245

原创 阿里云服务器环境部署 四 MySQL主从配置

MySQL配置主从由于担心单点的mysql会有风险,所以需要部署一个mysql 的slave由于已经在44上部署了mysql,所以只能修改配置后在43上再部署一个mysql的从库。

2025-03-19 09:51:23 513

原创 Linux 内存解读

≈ 12G (系统"真正可用"内存 = Free + 可回收的 Buff/Cache)= 17G (已使用的内存,含应用程序 + 部分缓存)= 9G (内核缓存,可被快速回收)= 4G (完全未被使用的内存)= 30G (物理内存总量)

2025-03-18 14:52:39 262

原创 阿里云服务器环境部署 三 Minio文件服务集群的搭建

sudo yum install tree 安装tree命令。1、三台机器 配置 vim /etc/hosts。二、编写docker-compose.yml 文件。1、不带nginx的minio。1、带nginx的minio。创建相关目录并上传文件。

2025-03-18 13:30:21 488

原创 docker 命令里 --restart=unless-stopped 参数的作用

如果 Elasticsearch 因配置错误(如内存不足、数据损坏)启动失败,容器会无限重启。:若宿主机资源不足(如内存),可能导致 Elasticsearch 反复崩溃重启,需合理分配资源(如。:当容器意外退出(如进程崩溃、宿主机重启等)时,Docker 会自动重启容器。:确保 Elasticsearch 服务高可用,避免因意外崩溃导致服务不可用。:宿主机重启后,容器自动恢复,无需人工干预。时,容器才会保持停止状态。

2025-03-18 09:53:17 852

原创 阿里云服务器环境部署 二 ES集群+Kibana部署

ES部署一、准备工作提前开放三台服务器的9200、9300端口,需要配置的服务器额外开放5601端口。只需要配置一个kibana即可连接es集群。创建es网卡二、安装 elasticsearch 8.14创建目录1、docker 拉取ES镜像3个节点都要拉取。

2025-03-18 09:31:19 392

原创 阿里云服务器环境部署 一 Docker Jdk

ifconfig 查看内网IP地址。1、修改hostname。重新ssh链接 即可。

2025-03-17 10:30:48 266

原创 阿里云服务器挂载磁盘

阿里云服务器挂载磁盘进入阿里云服务器后发现磁盘不够,需要把600G的磁盘加入进来。bash复制bash复制验证挂载是否成功:bash复制复制。

2025-03-17 08:54:41 542

原创 Tomcat迁移至Undertow

2、将代码中涉及到tomcat的jar改为Undertow,或避免异常。

2025-03-12 11:04:32 226

原创 Springboot + minio

【代码】Springboot + minio。

2025-03-07 16:23:24 261

原创 DeepSeek java 流式接口开发

【代码】DeepSeek java 流式接入。

2025-03-06 08:48:12 1281

原创 org.apache.logging.log4j.LoggingException: log4j-slf4j-impl cannot be present with log4j-to-slf4j

.. 1 more。

2025-03-03 15:14:06 571

原创 SpringBoot项目集成DeepSeek-R1接口指南

【代码】SpringBoot项目集成DeepSeek-R1接口指南。

2025-03-03 09:05:50 324

原创 DeepSeek R1本地部署(windows)

本地部署 DeepSeek 可以让你在自己的设备上运行 AI 模型,避免网络延迟和隐私问题。以下是一个简洁的本地部署教程,帮助你快速上手。

2025-02-28 17:20:29 486

原创 DeepSeek技术架构学习

DeepSeek技术架构学习。

2025-02-28 11:36:35 445

原创 在AI中,tokens是自然语言处理(NLP)的基本单位,用于文本的分割和处理。

‌ Tokens可以是单个单词、字符、子词或标点符号,具体形式取决于使用的分词方法。‌12。

2025-02-28 11:29:10 688

原创 DeepSeek入门学习

DeepSeek-R1 凭借创新的技术实现重大突破。在极少量标注数据的基础上,通过深度优化的后训练阶段,显著提升了模型的推理能力。在数学运算、代码生成、自然语言推理等核心领域,其表现均达到了与 OpenAI o1 正式版相当的水平。​深度搜索有服务器繁忙的情况​。

2025-02-27 17:39:59 1235

中国城市经纬度和部分城市邮编

中国城市经纬度和部分城市邮编

2024-01-05

大数据平台集群整体规划文档

大数据平台集群整体规划文档

2023-10-09

大数据集群规划和配置文档

大数据集群规划和配置文档

2023-08-14

大数据集群规划和配置文档

大数据集群规划和配置文档

2023-08-14

Doris 1.2.4.1 Dockerfile制作 init-fe.sh 和 init-be.sh

Doris 1.2.4.1 Dockerfile制作 init-fe.sh 和 init-be.sh

2023-08-03

Doris 1.2.4.1 Dockerfile制作 init-fe.sh

Doris 1.2.4.1 Dockerfile制作 init-fe.sh

2023-08-03

Doris 1.2.4.1 Dockerfile制作 init-be.sh

Doris 1.2.4.1 Dockerfile制作 init-be.sh

2023-08-02

Dinky plugins的依赖jar包

Dinky plugins的依赖jar包

2023-06-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除