- 博客(81)
- 收藏
- 关注
原创 数字人永生,一篇教会你,用AI让老照片开口说话
大卫·伊格曼在《生命的清单》一书中讲到:人会死三次,第一次是断气的时候 ,从生物学意义上死去了;第二次是下葬的时候,人们来参加葬礼,怀念其一生,然后在社会死去了;第三次是被最后一个人忘记的时候,那时候才真正的死了。
2024-07-14 21:49:23
2707
1
原创 Ai应用开发简介,coze注册与初体验【coze入门到实战】
扣子是新一代 AI 应用开发平台。无论你是否有编程基础,都可以在扣子上快速搭建基于大模型的各类 Bot,并将 Bot 发布到各个社交平台、通讯软件或部署到网站等其他渠道。
2024-06-16 21:19:33
1691
原创 项目实践 | 从零开始边缘部署轻量化人脸检测模型——EAIDK310部署篇
Tengine 由 OPEN AI LAB 主导开发,该项目实现了深度学习神经网络模型在嵌入式设备上的快速、高效部署需求。为实现在众多 AIoT 应用中的跨平台部署,本项目基于原有 Tengine 项目使用 C 语言进行重构,针对嵌入式设备资源有限的特点进行了深度框架裁剪。同时采用了完全分离的前后端设计,有利于 CPU、GPU、NPU 等异构计算单元的快速移植和部署,同时降低评估和迁移成本。
2024-06-16 09:36:44
779
原创 智能体Agent开发入门代码实战 | 提升gpt3.5的数学计算能力
为了解决这个问题,我们可以使用Function Calling技术调用外部工具进行数学计算。Function Calling 允许 GPT-3.5将自然语言请求转换为 API 调用进行数学计算,从而获得更精准的结果。效果如下图。为了更好理解Agent的原理,本文不采用任何Agent框架(例如LangChain、LangGraph)。
2024-06-16 09:29:15
1125
原创 4款产品经理资料包+优惠券设计prd文档
为了更好地理解产品经理的职责与技能,并提供实用的工具和资源,海哥准备了以下四款免费下载的产品经理资料包。
2024-06-15 22:40:07
376
原创 Ollama 与 Dify:AI 应用开发的强强联合
随着大型语言模型(LLM)的快速发展,它们为 AI 应用开发提供了强大的功能和灵活性。然而,在本地环境中部署和管理 LLM 仍然是一项挑战。Ollama和 Dify 两个开源项目为解决这一挑战提供了强大的解决方案。Ollama 是一个本地推理框架,允许开发人员轻松地在本地部署和运行 LLM,例如 Llama 3、Mistral 和 Gemma。Dify 是一个 AI 应用开发平台,提供了一套完整的工具和 API,用于构建、管理和部署 AI 应用。本文将介绍Ollama和Dify的功能和优势,并展示如
2024-06-15 20:19:23
3274
1
原创 如何使用 Dify 搭建属于你的投资分析 Agent 助手
现在,Dify 在应用编排中新增了 Agent Assistant 模式(智能助手),可以基于不同的 LLMs 作为基础的自然语言理解和推理模型(目前 Dify 已支持市面上所有流行的 LLMs ),并提供一系列工具让 LLM 根据需要来调用,解决多步骤的复杂问题场景,帮助开发者构建更具想象力的 GPTs 和 Agent Assistants(智能助手)。
2024-06-15 20:08:43
5342
原创 【神经网络算法】一文搞懂GAN(生成对抗网络)
条件生成对抗网络(Conditional GAN):论文采用条件生成对抗网络作为基本的框架,其中生成器的任务是根据文本编码器的输出生成相应的图像,而判别器的任务则是判断生成的图像是否与给定的文本描述相符。生成器负责将源图像转换为目标风格的图像,而判别器则用于区分生成的图像和真实目标风格的图像。CycleGAN的主要贡献在于解决了非配对图像转换的问题,为图像到图像的转换提供了一种新的方法。通过建立文本和图像之间的对应关系,并学习从文本到图像的映射函数,实现了文本到图像的转换。
2024-03-18 17:12:00
1166
原创 【神经网络算法】一文搞懂Tokenization(分词)
词形变化:英文单词具有丰富的词形变化,如时态、语态、单复数等,需要进行词形还原(Lemmatization)和词干提取(Stemming)以统一处理。词干提取:cities,children,teeth 这些词,需要转换为 city,child,tooth”这些基本形态。计算机通过分词能够识别出文本中的基本语义单元,进而进行词性标注、句法分析、语义推理等更高级的处理。问题转化:分词可以将非结构化的文本数据转化为结构化数据,这样复杂的自然语言处理就被转化为了更易于处理的数学问题。
2024-03-18 12:23:24
1407
原创 【神经网络算法】 一文搞懂BERT(基于Transformer的双向编码器)
本文将从的原理BERT的应用三个方面,带您一文搞懂| BERT。BERT的本质一种基于多层编码器的预训练语言模型,通过结合Tokenization、多种Embeddings和特定任务的输出层,能够捕捉文本的双向上下文信息,并在各种自然语言处理任务中表现出色。BERT架构BERT的输入是一个原始的文本序列,它可以是单个句子,也可以是两个句子(例如,问答任务中的问题和答案)。在输入到模型之前,这些文本需要经过特定的预处理步骤。
2024-03-17 18:27:21
1458
原创 【神经网络算法】 一文搞懂Self-Attention和Multi-Head Attention
随着Transformer模型的迅速普及,Self-Attention(自注意力机制)和Multi-Head Attention(多头注意力机制)成为了自然语言处理(NLP)领域中的核心组件。本文将从简要介绍、工作流程、两者对比三个方面,为您解析这两种注意力机制。
2024-03-17 14:50:26
1790
1
原创 神经网络算法 - 一文搞懂Loss Function(损失函数)
平方误差则是预测值与真实值之间差值的平方,常用于平方损失函数中,以便更显著地突出较大的误差。误差棒通常以线条或矩形的形式出现在数据点的上方、下方或两侧,其长度或大小代表了误差的量级。损失函数接受模型的预测值和真实值作为输入,并输出一个标量值,即损失值,表示模型在整个数据集上的总体预测误差。在机器学习中,目标是使预测值尽可能接近真实值,因此需要通过最小化预测值和真实值之间的差异来实现。损失函数的选择对于模型的训练速度和效果至关重要,因为不同的损失函数会导致不同的梯度下降速度。交叉熵损失用于分类。
2024-03-15 18:38:39
1239
原创 【神经网络算法】一文搞懂回归和分类
本文将从回归和分类的本质、回归和分类的原理、回归和分类的算法三个方面,带您一文搞懂回归和分类Regression AndClassification。
2024-03-14 09:27:49
8379
1
原创 【大模型开发 】 一文搞懂Fine-tuning(大模型微调)
本文将从三个方面,带您一文搞懂。一、微调的定义大模型微调是利用特定领域的数据集对已预训练的大模型进行进一步训练的过程。它旨在优化模型在特定任务上的性能,使模型能够更好地适应和完成特定领域的任务。二、微调的核心原因定制化功能:微调的核心原因是赋予大模型更加定制化的功能。通用大模型虽然强大,但在特定领域可能表现不佳。通过微调,可以使模型更好地适应特定领域的需求和特征。领域知识学习:通过引入特定领域的数据集进行微调,大模型可以学习该领域的知识和语言模式。这有助于模型在特定任务上取得更好的性能。
2024-03-13 22:27:21
85501
7
原创 【大模型开发 】一文搞懂RNNs工作原理
本文将从三个方面,带您一文搞懂输入层:接收输入数据,并将其传递给隐藏层。输入不仅仅是静态的,。。隐藏层的输出不仅取决于当前的输入,。输出层:根据隐藏层的输出生成最终的预测结果。
2024-03-13 20:26:23
1253
原创 【大模型开发 】 一文搞懂CNNs工作原理(卷积与池化)
接收输入:TextCNN接收词嵌入向量作为输入,这些向量通常是通过预训练的词嵌入模型(如Word2Vec或GloVe)得到的,它们将文本中的每个单词转换为固定维度的向量。:由两个卷积核大小为3的卷积层构成,执行卷积操作以提取更深层次的文本特征,使用ReLU激活函数,通过pre-activation直接连接,提高信息的流通性。C3层:利用16个5x5的卷积核组合S2层的特征图,生成10x10的特征图,实现特征的高级组合。C5层:通过120个5x5的卷积核与S4层全连接,生成全局特征,输出为1x1的特征图。
2024-03-13 12:15:23
1470
原创 一文讲通SQL数据分析
虽然第一个表为每个球员保留了一条记录,但第二个表的关键是球员+赛季,所以如果我们做一个普通的连接,结果将是一个笛卡尔乘积,每个球员的基本细节在属性表中出现的次数将与这个球员出现的次数相同。一旦两个表都有相同的键,我们就可以把它们连接在一起(把子查询看作是任何其他的表,只是临时性的),我们在连接后不会有重复的行。他们大约有53%的预测是正确的。使用子查询是SQL的一个重要工具,因为它允许以非常先进的方式操作数据,而不需要任何外部脚本,特别是当你的表以这样的方式断裂而不能直接连接时,这一点尤为重要。
2024-03-12 15:42:57
1176
原创 广告投放优化(线性规划求解)(Excel+Python)
案例背景:对于大多数广告主来说,广告投放的目的无非就是吸引更多的用户,最终实现营销转化。他们特别关注这些信息:投放渠道有哪些?曝光及流量预估有多少?媒体/广告公司承诺的量是否达到?数据是不是真实?广告的投入与产出比......某品牌公司新开发了一款药物牙膏,公司准备投入 370万元进行广告媒体宣传,希望消费者能了解新产品,并能够吸引消费者购买新产品。根据广告媒体预算情况,目前有5种媒体可供选择,相关有效信息:1、至少进行 300次电视广告播放;2、至少有550万名潜在顾客被告知;3、电视广告投入不超过 22
2024-03-12 12:26:53
964
原创 【数据挖掘】家庭用电预测——数据清洗与数据分析
以上数据都是间隔一分钟测得的,有功功率单位为 KW,有功电能的单位为瓦时,通过有功率乘以时间(1分钟=1/60小时)乘以1000计算得到总的有功电能消耗,单位为瓦时,减去三个sub之和,得到了家庭中其他电路的电能消耗。可以看到,在北半球法国巴黎较暖的月份,有功功率比较大的点少,而在较冷的月份,有功功率比较大的点多。parse_dates:{'datetime':[0,1]}将原数据中的第1、2列作为新的列名为 ‘datatime’ 的列,即将原来的日期列、时间列合并为日期时间一列;
2024-03-11 10:31:04
4173
原创 【数据分析】FIFA足球运动员身价预测(线性回归)
当Age每增加一个单位的时候,球员身价平均减少6个单位,当Overall每增加一个单位的时候,球员身价平均增加10个单位,当花式每增加一个单位的时候,球员身价平均增加4.7个单位。F检验:P值=8*e-45
2024-03-11 09:43:33
1119
原创 【Paddle实战】基于PaddleSpeech搭建私人录音转文字服务
将result.csv文件读入,拼成完整的段落,利用TextExecutor进行标点符号修正,最终将修正结果存入final_result.txt文件。遍历每一个文件,将它们分别送入ASRExecutor进行识别,所有识别文本集中保存到列表words里,最终写入result.csv文件。通过auditok.split来对音频进行切分,切分后新建目录:change/audio/文件名/,将文件存入该目录。将会议录音文件录音.wav放入工程目录下,执行程序,结果如下。API调用语音识别。
2024-03-10 20:24:02
1996
1
原创 【数据分析】:FIFA足球运动员数据建模及类型分析(因子分析+聚类)
ID标识、Name名字、Age年龄、Nationality国籍、Overall总评、Best Overall Rating最佳位置评分、Potential潜力、Club俱乐部、International Reputation声誉。其中Work_Ratetransfer_1是进攻/防守参与度为高/低心态,典型球员为眼中只有球门的C罗纳尔多,Work_Ratetransfer_4是进攻/防守参与度为中/低心态,典型球员为散步大师球王梅西。量纲不一致,方差很大,需要做标准化。当然设置10类不一定合理。
2024-03-10 18:52:47
2620
2
原创 【爬虫】爬取微博数据作运营情况分析案例解析(weiboSpider爬虫+python数据分析)
微博数据爬取python工具有很多。本次为我们选用:weiboSpider唯一的难度是cookie的获取,严格按照说明文档进行即可。配置好config.json文件运行main.py即可爬取数据。
2024-03-10 14:33:59
3420
1
原创 6000部短剧的名字里,写着中国人最隐秘的欲望
除了热血中年们看了就走不动道的“战神”(98次),主流的畅销批发头衔可以概括为“龙的传人”大型连续剧,包括“龙王”(32次)、“狂龙”(31次)、“龙帅”(22次)、“龙尊”(20次)、 “天龙”(17次)、“潜龙”(17次)、“隐龙”(16次)和“神龙”(15次),从周一到周日每天都能换上不重样的皮肤。故事里的“她”,可以是追悔莫及的“前妻”(63次)和“未婚妻”(14次),也可以是身居高位的“女帝”(40次)、“公主”(24次)与“师姐”(24次),共同特征主要是“绝色”(22次)
2024-03-10 11:30:35
1213
原创 【软件测试】进阶路线之测试开发
测试平台上面会集成各种所需要的测试工具,比如可以通过测试平台实现接口测试,接口自动化测试,性能测试,测试环境的自动部署,测试数据的自动生成等等功能。在上述的内容中,我们所描述的只是一些通用的测试平台的功能,除了这些常见的以为,不同的公司根据项目的特点不同,还会有更多的定制化的需求。根据项目的实际情况,去定制生成测试数据的功能,只需要输入所需要的数据量,就可以一键生成测试数据了,非常的方便。因为使用第三方的测试工具,对于不同的测试资源的管理是分散的,每个人都在自己的电脑上的工具去完成对应的工作,
2024-03-09 20:38:49
975
原创 【数据中台】数据中台知识体系大全
数据中台是一套可持续“让企业的数据用起来”的机制,是一种战略选择和组织形式,是依据企业特有的业务模式和组织架构,通过有形的产品和实施方法论支撑,构建的一套持续不断把数据变成资产并服务于业务的机制。
2024-03-09 19:52:01
2043
原创 【数据治理】数据治理操作指南(完整版)
数据治理可以有效保障数据建设过程在一个合理高效的监管体系下进行,最终提供高质量安全流程可追溯的业务数据。
2024-03-09 16:50:58
7775
原创 【数据中台】企业如何搭建适合自己的数据中台?
数据中台是企业数据价值实现的能力框架,包括数据存储汇聚、数据开发、数据管理、数据服务、数据资产运营等能力,是企业业务数据化的承载体,是企业业务通过数据视角的一种呈现,担负了企业数字化所需的核心综合数据能力。数据资产管理是数据中台面向企业提供数据能力的一个窗口,数据资管理将企业的数据资产统一管理起来,实现数据资产的可见、可用、可运营。数据集成没有统一的定义数据的标准,没有统一的数据存储规范,只是粗放地收集数据,把数据散乱地存放在服务器里,这些数据还不能被使用和赋能业务,这些集成后的数据也不能称之为数据资产。
2024-03-09 13:22:17
1201
原创 【数据分析】数据分析方法论及经验总结
分析者首先要认清企业的商业模式,要与公司的管理者同步公司的短期和长期目标,了解企业的盈利来源和运作方式,通过公司内外部数据的对比发现运营中的问题和商机。因此,我认为价值的实现才是整个过程的最后一个阶段,这个阶段虽然是有业务人员控制的,但是仍然需要分析师的深度参与。比如To C的电商行业,数据量已经到了一定量级,而人的需求往往是变化较快的,且这个行业没有形成事实上的垄断。数据选择微观的但较为简单的指标,分析过程中着重在于指标的历史趋势、相关指标之间的对比和变化,结论侧重于发现和定义业务问题。
2024-03-09 10:47:56
3166
原创 【日志监控】SpringBoot+Vue实现日志监控可视化平台
如何设计一个优秀而又可靠的日志服务,是一直以来都是一个很难的课题,写本文的目的起源于大学时期做的一个项目,那时候后台部署到阿里云上,每次遇到Error的问题的时候都需要登陆服务器查看,非常的麻烦,于是我就突发奇想为什么不对Spring的日志进行拦截,展示到前端界面呢?于是就产生了这个项目。
2024-03-09 09:21:46
1109
2
原创 【爬虫】案例-爬取B站视频
在该script标签中去除首部的window.__playinfo__=后,大括号内是一个json格式的数据,里面有需要的视频资源地址信息,对该json进行格式化显示后。网络爬虫,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本,通俗的讲是指向网站/网络发起请求,获取资源后分析并提取有用数据的程序。B站的视频资源在script标签中的data中的dash内,视频资源的音频和视频是分开的两个url地址。使用浏览器开发者模式,打开该网页的源代码,找到视频资源请求的url,如图所示。
2024-03-08 21:57:16
2688
1
原创 【提示词开发】ChatGPT指令开发详细教程!
评估是否有足够的优质文案样本来训练AI模型,以及是否有合适的AI工具和技术(比如GPT-4)能够生成具有创造性和针对性的营销文案。在概念阶段,你需要做的就是进行市场和技术研究,收集和分析过往成功的小红书文案案例,以及确定AI文案生成所需的数据集。通过不断调整和改进AI指令,提高生成文案的质量,让AI生成的文案更吸引目标用户,同时保持内容的多样性和创新性。如果能自动化生成吸引人的小红书文案,将极大提升内容产出的效率,同时保持或提高文案的质量。
2024-03-08 14:20:54
1316
原创 【AIGC】Animate Anyone阿里全民舞王背后的科技,基于图片高可控动画生成
然而,图像到视频领域仍然存在挑战,特别是在角色动画中,暂时保持与角色详细信息的一致性仍然是一个艰巨的问题。通过这种技术,可以在不需要复杂动画技能和昂贵的软件情况下,创造出流畅的动画视频,Animate Anyone提供了一种由图像到视频合成中角色动画创建的新方法和新思路,具有未来扩展到各种图像到视频应用的潜力。从官网提供的示例中,我们可以看到,不管是图片生成视频、时尚视频合成还是人类舞蹈,Animate Anyone生成的动画视频在人物的一致性和画面的稳定性上,都表现极佳,视频质量很高,也非常流畅!
2024-03-08 10:16:31
2448
原创 【微信小程序】小白快速上手实战
最近由于工作原因,接触了一些小程序项目开发,抽时间进行了一下基础知识整理,权当笔记记录吧,全文就是一个上手知识梳理,如果是已经比较熟悉的朋友,本文不会给你带来多少帮助。大多数内容官方文档中都有,本文做一些集中梳理以及个人理解,如需更深入了解,建议还是全面学习一下官方文档,或者等到使用的时候再去了解。官方文档链接本文假设你对html、JavaScript、css、json等web基础有一定的了解。微信小程序实际上是利用微信这个载体,让企业或个人拥有类似手机App的使用体验及服务。
2024-03-07 21:38:30
864
原创 【微信小程序】云开发从 0 到 1 实战,项目搭建及配置
打开 uniapp 开发工具:HBuilderX,单击「文件」->「新建」->「项目」。给你的小程序项目起个名字,然后启用 uniCloud 云开发,选择「阿里云」,点击创建。如果未登录的话,会弹出下面的提示框,我们用刚刚注册的「HBuilderX」账号登录一下即可。然后就会出现下方的页面提示:项目创建成功,左侧多处一个目录,即刚刚创建的小程序项目代码文件夹。刚刚创建的项目目录结构如下图,这是编辑器替我们搭建好的基础框架,我们在此基础上开发即可。
2024-03-07 20:23:55
2660
原创 【AIGC 】一篇文章,帮你了解什么是虚拟数字人?
▲ 从AYAYI社交账号的更新来看,目前主要是分享一些AYAYI的摆拍图片,穿着的服装、饰品都比较真实、时尚,拍照环境都是休闲、艺术类的场景。:真人根据视频监控系统传来的用户视频,与用户实时语音,同时通过动作捕捉采集系统将真人的表情、动作呈现在虚拟数字人形象上,从而与用户进行交互。Siren是高保真、实时、可交互数字人,用到了实时渲染、表情捕捉、动作捕捉、高保真3D扫描等前沿技术,达到了目前业界最高的技术水平。,切入各类,形成行业应用解决方案,赋能影视、传媒、游戏、金融、文旅等领域,根据需求为用户提供。
2024-03-07 17:30:28
2421
原创 【AIGC 】百度商业多模态理解及 AIGC 创新实践
之前,常规的思路是,训练一个模型去学习图片的模态,一个自回归的任务,然后做文本的任务,再套用一些双塔的模式,去拉近二者的模态关系。从2020年开始,我们把量化的损失逐步压低,去年达到了一个点以下,这样就可以在大模型抽出来特征之后,我们用这种可学习量化的方式对视觉内容进行刻画,具备语义关联ID的特征其实非常适配我们现在的商业系统,包括推荐系统的ID的这样一个探索的研究方式。数据方面,我们的商业域有着亿级的数据,但仍然不够,我们需要进一步扩展,引入商业域以往的数据,并进行清洗和梳理。构建了百亿级别的训练集。
2024-03-07 13:45:01
1116
低代码框架用于构建自定义 AI 模型:ludwig
2024-03-17
现代终端的文本编辑器:micro
2024-03-17
计算机科学课程:Crash-Course-Computer-Science-Chinese
2024-03-17
交互式深度学习书与多框架代码:d2l-en
2024-03-17
可视化 DAG 工作流任务调度系统:dolphinscheduler
2024-03-17
相片加密软件:ente
2024-03-17
内网扫描工具:fscan
2024-03-17
资产管理系统:snipe-it
2024-03-17
MacOS解锁工具:OpenCore-Legacy-Patcher
2024-03-13
Redis 客户端:ioredis
2024-03-13
手机或桌面推送通知工具:ntfy
2024-03-13
看板工具:focalboard
2024-03-13
大数据学习成长笔记知识全集
2024-03-12
javaSpring学习笔记
2024-03-12
合成大西瓜微信小游戏源码
2024-03-12
Windows12 网页版在线体验:win12
2024-03-09
云基础设施管理:opentf
2024-03-09
Android Root权限工具:Magisk
2024-03-09
可视化的Python框架:streamlit
2024-03-09
基于GPT的文档查询:DocsGPT
2024-03-09
基于Docker的开发者平台:appwrite
2024-03-09
开屏广告自动跳过助手:Android-Touch-Helper
2024-03-08
笔记应用:joplin
2024-03-08
数学动画的编程工具:manim
2024-03-08
高效可扩展的Node.js框架:nest
2024-03-08
虚拟桌宠模拟器:VPet
2024-03-08
Web应用程序部署:kamal
2024-03-08
先进的前端拖放页面生成器:elementor
2024-03-08
AI编码助手:tabby
2024-03-07
JavaScript运行时工具包:bun
2024-03-07
一款游戏引擎:godot
2024-03-06
API探索和测试IDE:bruno
2024-03-06
企业级即时通讯项目:zulip
2024-03-06
OpenAI的代码解释器:open-interpreter
2024-03-06
定制应用程序仪表板:homepage
2024-03-06
可重复使用的计算机视觉工具:supervision
2024-03-06
多功能过滤工具:uBlock
2024-03-06
基于音频的说话视频同步工具:video-retalking
2024-03-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人