- 博客(59)
- 资源 (1)
- 收藏
- 关注
原创 《不夜归港》第23章 - 分镜脚本
I need to create a single HTML file that displays a manga panel with Chinese text overlays. The base image shows a study room with two characters. Let me plan what I need to do:I'll use the following image URL for the base manga panel: https://cdn1.genspar
2025-04-08 18:12:24
661
原创 Python+DALL - E 3:轻松打造数据主题漫画,解锁数字创意新玩法!
" ) ] page2 = ComicPage( title="运营商的数据要素布局", theme="运营商三巨头的'数据争夺战'", panels=page2_panels ) # 生成漫画 output_dir = "comic_output" print("正在生成第一页漫画...") page1_urls = generator.generate_comic_page(page1, output_dir) print("第一页漫画生成完成!快来跟着代码一起,开启你的数字漫画创作之旅吧!
2025-04-08 11:05:22
620
原创 [特殊字符] 代码已完成 ✅该 FastAPI 服务器端应用
if frame_count % int(self.frame_rate * 5) == 0: # 每5秒保存一帧。• 替换 cv2.VideoCapture(video_path) 为 cv2.VideoCapture(0) 以处理。print(f"视频分析完成,共提取 {len(self.key_frames)} 个关键帧")print(f"生成 {len(self.notes)} 条笔记")print(f"结果已保存到 {output_dir}")# 如果帧间差异超过阈值,认为是关键帧。
2025-04-02 15:52:07
561
原创 会议视频智能整理系统实现方案
本会议视频智能整理系统通过整合视频分析、语音识别和内容整理技术,能够高效地将冗长的会议视频转化为结构化的知识资产。系统设计注重实用性和扩展性,可根据实际需求进一步优化和定制,适用于企业会议、教育讲座等多种场景。
2025-04-02 09:52:58
641
原创 CausalRAG:将因果图集成到检索增强生成中,提升知识密集型任务的性能
在自然语言处理(NLP)领域,大型语言模型(LLMs)的进步已经彻底改变了我们对文本理解和生成的能力。然而,在知识密集型任务中,传统的检索增强生成(RAG)系统面临着诸多挑战,如上下文完整性受损、过度依赖语义相似性以及检索精度不足等问题。本文提出的CausalRAG框架通过引入因果图,为RAG系统带来了新的视角。CausalRAG不仅保留了上下文的连续性,还通过追踪因果关系提高了检索的精确性和响应的可解释性。实验结果表明,CausalRAG在多个指标上优于传统的RAG和基于图的RAG方法。
2025-03-28 11:23:19
733
原创 《Retrieval Augmented Generation and Understanding in Vision: A Survey and New Outlook》
这篇论文提出了检索增强生成(RAG)技术在计算机视觉中的应用,具体来说,
2025-03-28 10:52:09
729
原创 《揭秘:多代理LLM系统为何频频失败?》
这篇论文《Why Do Multi-Agent LLM Systems Fail?》对多代理大型语言模型(LLM)系统中的失败模式进行了开创性的研究。作者通过系统地分析多个流行的多代理框架,识别出14种独特的失败模式,并提出了一个适用于各种多代理框架的全面分类法(MASFT)。这项工作不仅为理解多代理系统的失败提供了结构化的框架,还为未来的研究指明了方向。论文中提出的MASFT分类法通过专家注释和一致性验证,确保了其可靠性和有效性。
2025-03-28 10:34:03
612
原创 超浪漫!用 HTML 实现的互动情书贺卡源码来袭
家人们,今天我要给大家分享一个超赞的 HTML 源码 —— 互动情书贺卡!在这个数字化的时代,用代码写情书已经成为了一种独特又浪漫的表达方式。这份源码就为我们提供了一个绝佳的范例,让我们可以借助代码的力量,向心爱的人传达深情厚意。
2025-03-27 17:31:50
631
原创 阿里通义千问开源Qwen2.5-Omni-7B:全能多模态模型,开发者不可错过的技术革新!
👉 核心亮点速览:全模态感知,端到端交互:业界首个支持文本、图像、音频、视频无缝处理的多模态模型,Thinker-Talker双核架构实现“大脑”与“发声器”协同,实时生成文本与自然语音响应,交互如真人对话般流畅。性能碾压同级,开源免费商用:7B参数规模下,音频、视觉、语音生成能力超越单模态模型及闭源竞品(如Gemini-1.5-Pro),OmniBench多模态任务得分刷新SOTA,支持手机端轻量部署。创新技术加持:首创TMRoPE位置编码,精准同步音视频时间戳;
2025-03-27 16:47:43
347
原创 寻找强大的多模态模型来助力你的项目吗?Qwen2.5-Omni绝对值得你关注!它支持实时音视频交互,分块输入和即时输出,让你的项目能够实现更流畅的用户体验
此外,在单模态任务中,Qwen2.5-Omni在多个领域中表现优异,包括语音识别(Common Voice)、翻译(CoVoST2)、音频理解(MMAU)、图像推理(MMMU、MMStar)、视频理解(MVBench)以及语音生成(Seed-tts-eval和主观自然听感)。Qwen2.5-Omni在包括图像,音频,音视频等各种模态下的表现都优于类似大小的单模态模型以及封闭源模型,例如Qwen2.5-VL-7B、Qwen2-Audio和Gemini-1.5-pro。
2025-03-27 16:42:32
868
原创 文件脱敏小助手
✨ 进度提示:处理时会显示 "正在处理第 3 页..." 等提示。✨ 安全备份:处理前自动保存原文件副本(后缀加_bak)📄 脱敏小助手.exe(Windows 可执行文件)✅ 培养信息安全意识(通过可视化反馈和科普内容)A:检查文件路径是否正确,文件是否在当前文件夹。(更新日期:2025 年 3 月 26 日)📄 示例文件(包含各种敏感信息的测试文件)✅ 保护初中生的隐私安全(防止个人信息泄露)📄 使用说明书.pdf(初中生漫画版)Q:处理后的 Word 表格乱了?✅ 支持自定义敏感词(即将推出)
2025-03-26 17:13:40
987
原创 [特殊字符] 你是否需要一键隐藏 Word/Excel/PDF 中的身份证、手机号、姓名?
这不是一个普通的脱敏工具,而是数据安全的瑞士军刀✅ 开发者:高扩展性架构,轻松集成到现有系统✅ 企业:合规的数据去标识化解决方案✅ 教育:信息安全意识培养的实践教具👉现在 star 仓库,守护你的数据隐私!👇GitHub 地址 ⭐优快云 博客 🔗(详细技术解析)
2025-03-26 17:07:25
657
原创 检索增强生成(RAG)如何革新计算机视觉?这篇综述给出了答案!
这篇论文全面回顾了计算机视觉领域中检索增强生成(RAG)技术的现状,探讨了其在视觉理解、视觉生成和具身视觉中的应用。通过整合外部知识,RAG技术显著提高了模型在图像识别、视频分类、图像生成和3D生成等任务中的性能。尽管RAG技术在计算机视觉中仍面临检索效率、模态对齐和计算成本等挑战,但未来的研究方向包括实时检索优化、跨模态融合和RAG在具身AI、3D内容生成和机器人领域的应用,有望进一步推动这一领域的发展。:在图像生成方面,RAG技术被应用于从文本描述生成真实图像的任务。
2025-03-26 15:21:47
444
原创 关于秘塔搜索的deepresearch方案
这个模式有意思,先想后搜,先搜后广。可以让模型先提出思考框架与路径,再进一步进行资料的整合与分析。采用“小模型+大模型”协同架构,将需要深度推理的框架思考、步骤拆解的部分,交给业内擅长推理的DeepSeek R1来完成;与此同时,为了提高响应速度,将应该快、可以快的信息搜索、资料整合部分,用秘塔自研的模型来完成。在这个框架下,秘塔可以在2-3分钟完成数百个网页的搜索与分析。
2025-02-19 17:29:30
236
原创 数据集-Deepseek
HF:https://huggingface.co/datasets/Congliu/Chinese-DeepSeek-R1-Distill-data-110k,MS:https://modelscope.cn/datasets/liucong/Chinese-DeepSeek-R1-Distill-data-110k,该数据集为中文开源蒸馏满血R1的数据集,数据集中不仅包含math数据,还包括大量的通用类型数据,总数量为110K。”,防止跳出思维模式,强制在每个输出的开头增加"\n",再开始生成数据。
2025-02-18 07:59:56
212
1
原创 研究了DeepSeek在内的几十种模型微调方法后,强烈推荐这几种模型微调工具.....
由于规模的原因,微调大型预训练模型的成本通常高得令人望而却步。Firefly 是一个开源的大模型训练项目,支持对主流的大模型进行预训练、指令微调和DPO,包括但不限于Qwen2、Yi-1.5、Llama3、Gemma、Qwen1.5、MiniCPM、MiniCPM3、Llama、InternLM、Baichuan、ChatGLM、Yi、Deepseek、Qwen、Orion、Ziya、Xverse、Mistral、Mixtral-8x7B、Zephyr、Vicuna、Bloom等。
2025-02-17 15:29:19
855
原创 [特殊字符]【WPS+DeepSeek办公革命】优快云开发者必看!
WPS官方出手接入Deepseek,国内办公方式终于要变天了!「3分钟完成季度报告,表格预测准确率超预期」——@沢野。👉 立即升级WPS 2025新春版,体验文档智能加速!: WPS官方内置DeepSeek:开启智能办公新纪元。「合同条款提取效率提升10倍」——WPS社区热帖。1️⃣ 官方直连免配置,响应速度提升300%3️⃣ 免费账号可用,同步支持联网搜索。(警惕第三方插件,认准官方「灵犀」入口。(公众号/周报/思维导图全场景覆盖)(PDF/Excel秒读核心内容)(大纲+模板自由选)
2025-02-17 10:04:06
172
原创 推荐号码前区:07, 12, 19, 28, 35 | 后区:02, 09奇偶比:3:2(07,19,35为奇;12,28为偶)大小比:3:2(大号28,35;中小号07,12,19)和值:
| |
2025-02-14 17:20:34
170
原创 前9层杨辉三角
for j in range(1, i):计算中间的元素值,通过上一层的相邻元素相加得到。# new_row.append(1):每一层的最后一个元素也是 1。# 使用 center 方法居中对齐每一行,确保输出格式美观。# new_row = [1]:每一层的第一个元素总是 1。# 使用 map(str, row) 将整数转换为字符串。# 使用 join 方法将列表中的元素连接成一个字符串。# 初始化第一层:triangle = [[1]]# 计算当前元素的值。# 打印前9层杨辉三角。
2025-01-10 14:20:43
217
原创 落体反弹问题
函数返回两个值:球在指定次数反弹后的总行程和最后一次反弹的最大高度。对于编程练习中的落体反弹问题,我们通常假设没有空气阻力,并且每次反弹后的高度是前一次的固定比例。比如,如果球每次反弹的高度都是上一次的一半,那么我们可以编写一个程序来计算球在特定次数反弹后的总行程以及最后一次反弹的最大高度。落体反弹问题通常指的是一个物体(例如球)从一定高度自由下落到地面后,每次落地都会反弹到前一次高度的一部分,然后再次落下。请注意,这个例子中,我们假设球在第一次触地后开始计算行程,并且每次反弹后的高度都是上一次的一半。
2025-01-10 10:33:31
270
原创 猴子吃桃问题
猴子第一天摘下若干个桃子,当即吃了一半,还不过瘾,又多吃了一个。第二天早上又将剩下的桃子吃掉一半,又多吃了一个。到第10天早上想再吃时,见只剩下一个桃子了。求第一天共摘了多少桃子。反推计算:通过循环从第9天到第1天,逐步计算前一天的桃子数。公式为 (peaches + 1) * 2,表示前一天的桃子数是当天剩下的桃子数加1再乘以2。我们可以从第10天开始反推,逐步计算出第一天摘了多少桃子。通过这种方法,我们可以准确地计算出第一天摘了多少桃子。初始化:从第10天开始,假设第10天剩下的桃子数为1。
2025-01-10 10:31:54
273
原创 28前20项之和
对于每一项,计算分子(斐波那契数列中的下一个数)和分母(当前数),然后求和。sum_of_fractions 函数:计算给定项数的分数序列之和。fibonacci 函数:用于生成斐波那契数列中的第 n 个数。主程序:调用 sum_of_fractions 函数并打印结果。print(f'前{20}项之和为: {result}')运行上述代码将得到前20项之和。# 计算前20项之和。
2025-01-10 10:30:31
204
原创 30计算一系列分数的和,其中每个分数的分子是Fibonacci序列中的第i+1个数, 而分母是Fibonacci序列中的第i个数。
计算一系列分数的和,其中每个分数的分子是Fibonacci序列中的第i+1个数,# 计算当前分数的分子:Fibonacci序列中的第i+1个数。# 计算当前分数的分母:Fibonacci序列中的第i个数。而分母是Fibonacci序列中的第i个数。n -- 一个整数,表示要计算的分数的个数。total_sum -- 所有分数的和。# 将当前分数的值加到总和中。# 遍历从1到n的每个整数。# 返回所有分数的总和。
2025-01-10 10:29:05
203
原创 31 计算第position个人的年龄。
position -- 一个整数,表示要计算的人的位置。计算第position个人的年龄。age -- 对应位置人的年龄。# 计算第五个人的年龄。
2025-01-10 10:28:19
167
原创 32判断输入字符串代表的是星期几
我们需要编写一个Python程序来判断输入的星期几的第一个字母(如果第一个字母相同,则继续判断第二个字母)input_str = input("请输入星期几的第一个字母: ")input_str -- 一个字符串,表示要判断的星期几。# 如果有多个候选者,继续判断第二个字母。# 如果只有一个候选者,直接返回。weekday -- 对应的星期几名称。判断输入字符串代表的是星期几。# 获取输入字符串的第一个字母。# 如果第一个字母在字典中。# 输入星期几的第一个字母。
2025-01-10 10:27:31
326
原创 反转列表并打印
定义函数 reverse_list:该函数接受一个列表 input_list 作为参数,并使用切片操作 [::-1] 来反转列表。反转列表并打印:调用 reverse_list 函数获取反转后的列表,并将其打印出来。示例列表 example_list:创建一个包含数字的列表。
2025-01-10 10:26:04
196
原创 35矩阵的主对角线元素的和
定义函数 sum_main_diagonal:该函数接受一个二维列表 matrix 作为参数,并初始化一个变量 total_sum 用于存储主对角线元素的总和。遍历矩阵的主对角线元素:使用 for 循环遍历矩阵的主对角线元素(即 matrix[i][i]),并将这些元素累加到 total_sum 中。计算主对角线元素之和并打印:调用 sum_main_diagonal 函数获取主对角线元素之和,并将其打印出来。示例矩阵 example_matrix:创建一个3x3的矩阵。# 遍历矩阵的主对角线元素并累加。
2025-01-10 10:24:45
130
原创 通义万相视频生成重磅升级,成功登顶VBench,运镜、质感直达专业级
Prompt: 一位摩托车骑手在狭窄的城市街道上以极快的速度疾驰,避开了附近建筑物发生的大爆炸,火焰猛烈地咆哮着,投射出明亮的橙色光芒,碎片和金属碎片在空中飞舞,加剧了现场的混乱。然而,骑手依然不屈不挠,准确无误地在混乱中穿梭,极富电影感,超精细细节,身临其境,3D,动作连贯。在具体实现中,通过将视频拆分为若干块(Chunk)并缓存中间特征,代替了直接对长视频的 E2E 解码过程,使显卡的使用仅与 Chunk 大小相关,而无需考虑原始视频长度,让模型可以对无限长的 1080P 视频进行高效编解码。
2025-01-09 13:58:24
1635
原创 计算机单词
abbr.“读取-求值-输出循环”的简写【详解】英文全称为“read-eval-print loop”,是一种交互式控制台,如标准的python或非主流的ipython和bpython。phrase.小黄鸭调试法【详解】一种调试代码的方法,即向别人解释一个问题,甚至可能是向一个对编程一无所知的人解释,然后在解释问题的过程中偶然发现解决方案。phrase.魔术方法【详解】“特殊方法”的非正式同义词,是一种由Python隐式调用的方法,用来对某个类型执行特定操作,例如相加等等。通常,复合语句会跨越多行。
2024-12-31 17:00:14
249
原创 数据工程师
学习新技术: 云计算:如果你还没有深入接触,可以学习AWS、Google Cloud、Azure等云平台的使用,尤其是数据存储、计算和分析方面的工具。 大数据技术:像Hadoop、Spark等大数据处理框架,了解它们的底层原理和如何处理海量数据。 容器化和微服务:学习Docker、Kubernetes等技术,能够提升你的开发和部署效率。 自动化和脚本: 编写自动化脚本来优化日常的重复性工作,节省时间,提升效率。 比如,自动化数据清理、数据转换等常见任务。 数据管道优化:
2024-12-31 16:22:17
169
原创 Python词汇(基础版)
phrase.通用换行【详解】一种解读文本流的方式,将以下所有符号都识别为行结束标志:Unix 的行结束约定 '\n'、Windows 的约定 '\r\n' 以及旧版 Macintosh 的约定 '\r'。phrase.面向对象编程【详解】一种编程风格,面向对象编程是以数据为中心(相对于以功能为中心)的程序设计方法的典型代表,数据和处理数据的操作被组织成类和方法。phrase.一等函数【详解】一等函数是在语言中属于一等对象的函数,即能在运行时创建,赋值给变量,当作参数传入,以及作为另一个函数的返回值。
2024-12-31 16:20:24
363
原创 计算机单词
v.跑, 奔跑, 跑(某段距离), 跑步;余地, 备用的时间[金钱或空间];n.环境, 背景, (戏剧、小说等的)情节背景;adj.显而易见的, 明显的, 显著的, 有标记成份的(如正式或非正式用语)不工作的, 休息的;adj.空白的, 空的, 无图画(或标记、装饰)的, 没表情的。adj.相关的, 有联系的, 属同一家族的, 有亲属关系的。n.纽扣, 扣子, (机器的)按钮, (电脑屏幕上的)按键。n.页, 张, 版, 版面, 历史篇页(指历史大事或时期)v.驾驶, 开车, 驾车送(人);
2024-12-31 16:18:02
334
原创 计算机单词
v.跑, 奔跑, 跑(某段距离), 跑步;余地, 备用的时间[金钱或空间];n.环境, 背景, (戏剧、小说等的)情节背景;adj.显而易见的, 明显的, 显著的, 有标记成份的(如正式或非正式用语)不工作的, 休息的;adj.空白的, 空的, 无图画(或标记、装饰)的, 没表情的。adj.相关的, 有联系的, 属同一家族的, 有亲属关系的。n.纽扣, 扣子, (机器的)按钮, (电脑屏幕上的)按键。n.页, 张, 版, 版面, 历史篇页(指历史大事或时期)v.驾驶, 开车, 驾车送(人);
2024-12-31 16:16:56
333
原创 数据收集与准备
数据收集与准备是机器学习和深度学习项目中的第一步,也是最重要的一步。数据的质量直接影响到模型的性能。如果数据不够代表性、干净或没有充分预处理,那么模型的效果可能会大打折扣。在我这样的AI模型的训练中,数据收集和准备是一个复杂且系统的过程。让我详细说明一下这一阶段的主要步骤。
2024-12-31 16:11:10
752
原创 大规模文本数据集
大模型数据的核心是庞大的文本数据集,这些数据集通常包含来自多个领域的数据,用于提升模型的泛化能力。这样的开源平台,选择你需要的预训练模型,并使用你自己的数据进行微调。这样能够有效降低计算成本并提高效率。最简单的方式是,利用像。
2024-12-31 16:04:37
1658
原创 语音分离(Separation)的概念和过程
这张图片通过图示和文字详细解释了语音分离的概念和过程,即通过音频和视觉特征将混合的声音分离成各个讲话者单独的声音。
2024-12-31 15:55:59
233
原创 创建一个最简单的数据大模型
创建一个最简单的数据大模型其实并不需要从零开始训练一个复杂的模型,可以利用现有的预训练模型进行微调(fine-tuning)来实现。这不仅能让你快速上手,还能在较短的时间内获得不错的效果。以下是步骤和建议:首先,明确你想要模型完成的任务:确定了目标任务后,选择合适的预训练模型进行微调。最简单的大模型就是从现有的预训练模型开始,这样可以节省大量的时间和计算资源。以下是一些常见的预训练模型,可以直接用来进行微调:你可以选择一个开源的、已经预训练好的模型,并在此基础上微调。数据集对于训练非常重要。最简单的做法是使
2024-12-31 15:55:15
2159
原创 知识图谱的构建过程涉及到数据采集、实体识别、关系抽取、知识融合和知识存储等步骤。
2. **多源数据整合** - 它可以整合来自不同数据源的数据,包括结构化数据(如数据库)、半结构化数据(如XML、JSON)和非结构化数据(如文本、图像)。3. **知识推理** - 基于知识图谱中的现有关系,可以进行知识推理,发现新的知识和关系。### 应用领域 1. **搜索引擎** - 谷歌的知识图谱被广泛应用于搜索引擎,能够提供更准确的搜索结果和知识卡片。3. **推荐系统** - 通过分析用户和物品之间的关系,知识图谱可以用于推荐系统,提供更个性化的推荐。
2024-12-09 11:51:24
870
CausalRAG:将因果图集成到检索增强生成中,提升知识密集型任务的性能
2025-03-28
检索增强生成(RAG)技术在计算机视觉中的应用
2025-03-28
这篇论文《Why Do Multi-Agent LLM Systems Fail?》对多代理大型语言模型(LLM)系统中的失败模式进行了开创性的研究 作者通过系统地分析多个流行的多代理框架
2025-03-28
《揭秘:多代理LLM系统为何频频失败?》
2025-03-28
深度解析AI幻觉现象及其对DeepSeek的影响与解决方案
2025-02-24
DeepSeek重塑开源大模型生态系统及全球算力需求爆发对AI服务器和ASIC芯片市场的影响
2025-02-15
2025年人工智能算力与算法变革: DeepSeek引领新一代高性价比AI推理模型
2025-02-15
2025年DeepSeek引领国内AI产业链突破:性能对标OpenAI及行业市场动态
2025-02-15
机械设备行业的趋势变化及其对投资的影响-聚焦DeepSeek和自动化装备
2025-02-15
DeepSeek-V3:大型专家混合语言模型的技术革新与应用
2025-02-15
DeepSeek-R1:通过强化学习提升大型语言模型的推理能力
2025-02-15
DeepSeek大模型系列引发全球关注,推进国产大模型与AI算力产业发展
2025-02-15
DeepSeek开源大模型技术革新及产业影响力解析
2025-02-15
DeepSeek的成本创新及对全球AI产业链的影响分析-AI模型竞争的新篇章
2025-02-15
计算机行业研究:DeepSeek大模型驱动算力平权与端侧AI、Agent投资机遇
2025-02-15
大模型知识蒸馏技术及其在大型语言模型中的应用与优化
2025-02-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人