自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

uncle_ll的博客

keep healthy, keep going.

  • 博客(903)
  • 资源 (12)
  • 收藏
  • 关注

原创 个人分享及推荐

分享这里是我在平时阅读到的好书、好资料,我把他们都放在此处,也算是我自己的一个收藏夹。所有的这些都是我自己阅读完了,认为质量很不错,对成长有帮助的文章,希望他们也能给你带来成长

2020-01-11 20:15:07 430

原创 Dify-13: 文本生成API端点

本文档介绍了Dify平台提供的文本生成API功能,适用于翻译、摘要等非对话式AI应用场景。API支持单次请求处理,无需维护会话上下文。所有请求需通过API密钥进行身份验证,建议采用流式响应模式提升性能体验。 核心端点/completion-messages支持POST请求,接收包含query字段的inputs参数,可附加文件(如图片)。响应提供阻塞(完整返回)和流式(SSE分块)两种模式,包含token用量计费信息。 文档还包含文件上传、停止生成和消息反馈等辅助端点说明,并列出常见错误代码(如参数无效400

2025-07-22 23:00:00 546

原创 Base44:用自然语言 “说” 出你的 Web 应用,AI 零代码开发有多颠覆?

Base44是一款AI驱动的零代码应用开发平台,让用户通过自然语言描述快速生成全功能Web应用。其核心特点包括:1)自然语言交互,用户用日常语言描述即可自动生成前后端代码;2)全栈一体化技术栈,内置数据库、API等企业级服务;3)商业化场景优化,支持短信、地图等实用功能。平台采用成本优化的Claude模型,上线3周即获1万用户,半年内实现盈利,2025年被Wix以8000万美元收购。Base44提供可视化编辑器、版本控制和协作功能,支持数据管理和行级安全设置,适合快速构建MVP或内部工具。其成功证明了AI时

2025-07-15 22:10:11 639

原创 Dify-11: API参考

Dify API开发指南摘要:本文详细介绍了Dify服务的API集成方式,支持开发者编程调用不同类型AI应用功能。API分为四种应用类型:聊天应用(带会话历史)、文本生成应用(无状态)、工作流应用(多步骤流程)和智能体聊天应用(工具增强)。

2025-07-14 09:13:58 1160

原创 李宏毅NLP-9-语音转换

可从。

2025-07-09 23:33:39 1258

原创 李宏毅NLP-8-语音模型

语言模型与连续语言模型解析 语言模型(LM)通过估计token序列概率来评估文本合理性,在语音识别等任务中发挥重要作用。传统N-gram模型依赖离散词频统计,面临数据稀疏问题,导致未见过词组合概率被错误估计为0。连续语言模型创新性地引入推荐系统的矩阵分解思想,将词和上下文表示为低维向量,通过向量内积预测共现概率。这种方法利用向量相似性的泛化能力,自动为未观察到的词组合分配合理概率,有效解决了N-gram的稀疏性缺陷,实现了类似神经网络的连续表示优势。

2025-07-06 15:50:05 976

原创 李宏毅NLP-7-计算分数和训练和测试

模型核心特点适用场景缺点LAS依赖注意力,隐式对齐,建模长距离依赖离线高精度识别(如语音转写)不支持在线实时处理CTC独立解码,显式对齐,支持在线实时简单识别(如关键词检测)无法建模 token 依赖RNN - T依赖解码,显式对齐,支持在线,建模依赖实时高精度识别(如语音助手)训练和推理复杂度较高。

2025-07-03 07:26:18 1002

原创 Dify-12: 聊天应用API端点

Dify 聊天 API 文档摘要:该文档详细介绍了 Dify 平台的聊天 API 功能,提供包括消息发送、文件上传、对话管理等完整接口说明。API 采用 Bearer Token 认证,支持流式和阻塞两种响应模式,并允许文件上传实现多模态交互。核心功能包含创建/停止消息、上传文件、管理对话历史等功能,同时提供详细的请求/响应参数说明及示例。强调 API 密钥需安全存储于服务端,防止客户端泄露风险。文档结构清晰,包含端点列表、参数表格和 JSON 示例,为开发者提供全面的集成指南。

2025-06-25 19:41:29 1115

原创 Dify-10:租户管理

用户账户:注册、认证、资料管理工作区(租户):包含独立成员和资源的组织单元成员与角色:工作区内的基于角色访问控制(RBAC)认证流程:支持密码、邮箱验证码、OAuth 等多种认证方式该系统通过提供身份和访问控制,与 RAG 知识系统(参见 RAG 知识系统)、对话系统(参见 对话系统)等组件集成。

2025-06-18 19:15:36 1189

原创 Dify-9:模型提供方系统

Dify 中的模型提供方系统负责管理与各种人工智能模型提供方的集成,处理凭证信息,并为调用模型提供统一的接口。该系统使 Dify 能够通过一个通用的抽象层与多个模型提供方(如 OpenAI、Azure OpenAI、Anthropic 等)协同工作,既支持系统管理的凭证(通过 Dify 云服务),也支持用户自定义提供的凭证。

2025-06-17 19:20:23 909

原创 Dify-8:对话系统

Dify对话系统管理用户与AI应用间的交互会话,包含对话状态追踪、消息存储及用户反馈处理等核心功能。系统采用对话(Conversation)和消息(Message)双数据模型架构:对话模型记录会话元数据(如应用ID、交互模式、状态等),消息模型存储具体交互内容(查询/回复文本、令牌数等)。系统提供分层次服务接口(基础对话服务、Web扩展服务)和三类API端点(控制台API、服务API、WebAPI),支持对话创建、检索、重命名、删除等全生命周期管理

2025-06-16 19:21:01 893

原创 Dify-7: RAG 知识系统

摘要:Dify的RAG知识系统通过ETL流程管理外部知识检索,核心组件包括数据集(Dataset)、文档(Document)和分段(Segment)。系统支持两种索引技术(高质量向量索引和经济型关键词索引)和三种文档处理形式(全文、问答对和分层结构)

2025-06-11 19:10:32 889

原创 Dify-6: 部署

本文详细介绍了Dify系统的部署方案,主要包含架构说明、系统要求、部署方法和配置指南

2025-06-10 19:19:20 1762

原创 Dify-5:Web 前端架构

本文介绍Dify Web前端技术架构,采用Next.js框架构建,主要技术栈包括TypeScript、Tailwind CSS和i18next。系统采用模块化设计,包含基础组件、领域组件和页面组件三层架构,支持多语言国际化。通过React Context API进行状态管理,利用Next.js路由实现高效导航。该架构实现了组件复用、状态共享和多语言支持,提供了良好的开发体验和用户交互。

2025-06-03 19:29:01 925 1

原创 李宏毅NLP-7-CTC/RNN-T文本对齐

本文介绍了三种语音识别模型(LAS、CTC、RNN-T)的解码、训练及对齐机制。LAS模型通过直接计算P(Y|X)实现端到端识别,使用束搜索解码。CTC和RNN-T需要处理语音-文本对齐问题,通过引入空白符并求和可能路径的概率来优化识别。三种模型均采用最大对数似然训练,但对齐方式不同:HMM通过状态转移扩展文本长度,CTC允许插入空白符,RNN-T则强制每个token至少出现一次。网格图展示了各模型的对齐路径选择规则,包括字符重复、空白符插入等约束条件,有效解决了语音与文本的时间不对齐问题。

2025-05-26 23:42:09 909

原创 Dify-4:API 后端架构

Dify 的 API 后端基于现代 Python 技术栈构建,采用 Flask 作为 Web 框架。系统支持水平扩展,包含无状态的 API 服务器和处理后台任务的 Celery 工作节点。详细介绍 Dify API 后端服务的架构,包括其核心组件、服务组织、数据流和集成点。API 后端作为 Dify 的“中枢神经系统”,将 Web 前端与各类 AI 模型及数据存储系统连接起来。Dify 的后端使用 Docker 进行容器化处理,不同组件有各自独立的服务。

2025-05-22 18:56:12 1321

原创 Dify-3:系统架构

系统设计支持可扩展性、可部署性,并能适应多种环境(包括自托管和云部署)。概述了 Dify 的系统架构,解释主要组件如何协同工作以提供大语言模型(LLM)应用开发平台。对话系统负责管理用户与大型语言模型(LLM)之间的交互,处理聊天历史记录、消息格式化和上下文管理。工作流系统支持创建和执行复杂的AI流程,将LLM交互与工具、分支逻辑和数据转换相结合。Dify使用了一套全面的配置系统,该系统支持环境变量、配置文件和运行时设置。存储结构化数据,关键表包括用户、应用、数据集、会话和工作流。

2025-05-19 18:52:42 1401

原创 Dify-2:项目介绍

Dify 是一款开源的大语言模型(LLM)应用开发平台,旨在弥合 AI 应用原型设计与生产部署之间的鸿沟。本文档为希望了解或扩展平台的开发者及技术用户提供 Dify 架构、组件与功能的技术概览。

2025-05-12 19:05:16 1190 1

原创 Python dotenv 使用指南:轻松管理项目环境变量

很多开发者容易把自己开发的项目上传到Github上,但偶尔会忘记把数据库密码、支付接口密钥等敏感信息和谐掉,当代码提交上去时,这些信息就像裸奔一样暴露在所有人面前。更糟糕的是,不同环境(开发 / 测试 / 生产)的配置频繁切换,每次都要修改代码,效率低下且容易出错。

2025-04-26 22:53:38 1254 1

原创 FastAPI 零基础入门指南:10 分钟搭建高性能 API

【代码】FastAPI 零基础入门指南:10 分钟搭建高性能 API。

2025-04-26 19:05:17 722

原创 解决Dify代码执行器网络报错:Failed to execute code

当配置文件缺失时,sandbox服务会默认禁用网络功能,导致代码执行器无法建立网络连接。配置文件来初始化网络参数,但在Docker部署流程中,该文件未自动生成到挂载目录。Dify的沙箱服务(sandbox)需要。

2025-04-24 18:33:08 1701

原创 李宏毅NLP-6-seq2seq&HMM

XYPY∣XY∗Y∗argmaxY​PY∣XPY∣XPXPX∣YPY​PXYY∗argmaxY​PX∣YPYPX∣Y隐马尔可夫模型(HMM)在语音识别中对声学模型PX∣Y的建模思路,通过引入状态序列S:将PX∣Y(基于文本序列Y的声学概率)转换为PX∣S(基于状态序列S的声学概率),并说明一个文本序列Y对应一个状态序列S。

2025-04-21 07:38:01 785

原创 李宏毅NLP-5-RNNT&Neural Transducer&MoChA

说明:就是普通的 seq2seq 模型。通过编码器(Encoder)处理输入序列h1−h4h^1 - h^4h1−h4等隐藏状态),解码器利用注意力机制(attention)生成输出c0−c4c^0- c^4c0−c4等)。说明:解码器是线性分类器的 seq2seq 模型。通过引入空白符ϕ\phiϕ解决输入输出不对齐问题,每个时间步独立输出 token,后处理合并重复 token 并去除ϕ\phiϕ。说明:输入一个元素就要输出一个元素的 seq2seq 模型。

2025-04-19 13:10:23 837

原创 李宏毅NLP-4-CTC

CTC算法

2025-04-16 23:19:31 1194 7

原创 Dify-1:入门介绍

dify介绍

2025-04-16 19:23:10 1033

原创 Google-Tensorflow-NLP

googleNLP

2025-04-15 07:52:12 1148

原创 企业级RAG行业应用落地方案——阿里云百炼

rag行业应用落地方案

2025-04-14 21:43:22 1389

原创 李宏毅NLP-3-LAS

LAS算法

2025-04-13 20:00:24 491

原创 李宏毅NLP-2-语音识别介绍

(语音识别很难吗?这是一张关于语音识别模型使用占比的饼状图。数据来源于对INTERSPEECH’19、ICASSP’19、ASRU’19三个会议超100篇论文的调研。“lexicon free” 表示相关系统或方法不依赖预先设定的词汇表来进行处理,比如某些语音识别技术尝试直接对语音信号进行分析转换,不借助传统词汇表的辅助,以适应更灵活、未知的语言场景。

2025-04-12 12:30:18 1189

原创 互联网金融贷后催收合规技术指南

禁止骚扰无关人员、限制催收时间(22:00-8:00)、杜绝暴力威胁。:仅针对债务人及合同约定担保人。

2025-04-11 09:27:38 1117

原创 GPT模型角色解析:System、User、Assistant

在GPT模型中,`system`、`user`和`assistant`是三种不同的角色,分别用于引导对话流程和区分对话中的不同参与者。

2025-04-10 20:47:09 603

原创 达摩院Paraformer-ONNX模型:一站式高精度中文语音识别工业级解决方案

阿里达摩院推出的`speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx`模型,通过ONNX运行时优化,集语音端点检测、实时转写、标点恢复等核心功能于一体,为工业场景提供开箱即用的高并发语音识别服务。

2025-04-09 09:24:00 1831

原创 自然语言处理利器NLTK:从入门到核心功能解析

自然语言工具包(Natural Language Toolkit,NLTK)自2001年诞生于宾夕法尼亚大学以来,已成为自然语言处理(NLP)领域最具影响力的Python库之一。作为全球数十所顶尖高校的教学工具和研究基础,NLTK凭借其模块化设计和丰富的功能集合,持续为语言学研究者、数据科学家和AI开发者提供强大支持。作为NLP领域的"瑞士军刀",NLTK通过清晰的模块划分和教学友好的设计,持续赋能新一代NLP开发者。提供t-test、卡方检验、PMI等统计方法检测词汇共现。

2025-04-07 23:30:00 1254

原创 从 Credit Metrics 到 CPV:现代信用风险模型的进化与挑战

现代信用风险模型借助量化分析与科学建模手段,极大地提升了风险管理的精细化水平。不同模型各具优劣,金融机构在选择时应综合考虑自身业务特点、数据基础以及风险偏好等因素,灵活选择合适的模型,或结合多种模型构建全面的风险评估体系,以此来有效应对复杂多变的市场环境,实现稳健经营与可持续发展。

2025-04-02 09:53:55 1533

原创 身份证翻拍与图片检测技术全解析:原理、方法与应用

总之,身份证翻拍类型多样,翻拍图片手段丰富且存在共性问题,与正常拍摄图片质量有别。翻拍图片检测技术多管齐下,深度学习在其中应用广泛且有实际案例和开源项目支持。随着技术发展,这些技术将不断优化,在保障信息安全、维护版权等方面发挥更重要作用。希望本文能帮助读者深入理解这一领域知识,如有疑问或建议,欢迎交流。在当今数字化时代,身份证翻拍及图片检测技术在众多领域发挥着关键作用。本文将深入探讨身份证翻拍的类型、翻拍图片的手段、其与正常拍摄图片的质量差异、翻拍图片检测技术以及相关开源项目,为您呈现这一领域的全面知识。

2025-04-02 09:29:44 1635

原创 目标检测中的非极大值抑制(NMS)原理与实现解析

是一种关键的后处理技术,用于去除冗余的检测结果,保留置信度最高且位置最优的边界框。本文将通过一段Python代码解析NMS的核心实现逻辑,并演示其在OpenCV环境中的实际效果。在目标检测任务中,模型通常会对同一目标生成多个重叠的候选框(如锚框或预测框)。,键为类别名称,值为该类别对应的边界框列表。,表示左上角和右下角坐标及置信度。

2025-03-20 09:02:38 746

原创 解决MySQL字符集冲突引发的“Illegal mix of collations”错误

解决字符集冲突

2025-03-18 20:30:00 1240

原创 李宏毅NLP-1-课程介绍

NLP任务概览

2025-03-17 23:25:37 433

原创 深度学习与传统算法在人脸识别领域的演进:从Eigenfaces到ArcFace

其核心思想是将人脸图像视为高维向量,通过协方差矩阵计算特征向量(即特征脸),将原始数据投影到由前k个最大特征值对应的特征向量张成的低维子空间。在FERET数据集上,Eigenfaces曾达到85%的识别准确率,证明了线性降维的有效性。2014年提出的DeepFace采用3D对齐技术将输入图像校正至正面视角,通过含8层卷积的神经网络提取4096维特征。局部二值模式(LBP)通过计算3×3邻域内中心像素与周围像素的灰度比较生成8位二进制码,形成256维直方图特征。

2025-03-17 19:31:25 1540

原创 一文读懂 KYC:金融、IT 领域的关键应用与实践

KYC,中文意为 “充分了解你的客户” ,是金融机构以及特定行业在与客户建立业务关系或开展特定交易时,必须遵循的基本原则与流程。这要求机构全面、深入地审查客户的身份、背景、财务状况、资金来源、交易目的和性质等信息,从而对客户有一个全方位的认知。比如银行在为客户开设账户时,会仔细核实客户的身份证件、工作单位、收入情况等,这就是 KYC 的具体体现。

2025-02-19 09:11:48 2568 1

互联网金融贷后催收合规技术指南

互联网金融贷后催收合规技术指南

2025-04-11

Stefano Mattoccia 的讲义 Stereo Vision: algorithms and applications

Stefano Mattoccia 的讲义 Stereo Vision: algorithms and applications,自己花了很大力气下下来的,对立体视觉的讲解和各种方法的比较

2016-09-14

deppfake.pdf

deepface ppt介绍如何使用 的

2019-10-29

s3-python.pdf

亚马逊 aws s3 python接口文档 可供参考

2020-09-01

中国医学影像AI白皮书.pdf

白皮书 | 医学影像

2020-08-31

HammerDB mysql及oracle数据库性能测试工具

适合Linux 64位系统 ,mysql及oracle性能的小工具。 的

2017-08-07

今日头条20代年轻人群指数研究报告-2019.8-58页.pdf

今日头条 人群消费调查 ,涵盖各个行业 。

2019-10-18

2019年武汉市文化与金融白皮书报告.pdf

武汉市 文化与金融白皮书 2019 。

2019-11-10

智能时代 吴军 .mobi 电子书

大数据和机器智能的出现,对我们的技术发展、商业和社会都会产生重大的影响。作者吴军在《智能时代:大数据与智能革命重新定义未来》中指出,首先,我们在过去认为非常难以解决的问题,会因为大数据和机器智能的使用而迎刃而解,比如解决癌症个性化治疗的难题。同时,大数据和机器智能还会彻底改变未来的商业模式,很多传统的行业都将采用智能技术实现升级换代,同时改变原有的商业模式。大数据和机器智能对于未来社会的影响是全方位的。

2016-10-16

鸟叔私房菜

ARM的一些资料,浅俗易懂, 可以自行下载浏览 自学。

2014-05-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除