- 博客(27)
- 收藏
- 关注
原创 MER-Factory 技术开发路线图
MER-Factory是一个推动情感计算发展的开源项目,旨在构建端到端的自动化情感计算平台。项目支持情绪识别、原因提取和讽刺检测等核心任务,兼容单/多模态输入。采用Alpaca/ShareGPT/MS-Swift数据格式,通过LLaMA-Factory等框架微调模型,并创新性地结合LLM自动评估与人机协同审查机制。项目分阶段推进:短期聚焦基础建设,长期致力于降低复杂AI开发门槛。
2025-07-23 19:40:50
676
原创 AI驱动数据质量优化:破局数据治理难题
合成数据填补缺失值(GAN或Diffusion模型生成可信数据)时间序列数据的异常模式识别(LSTM/Prophet模型)非结构化文本数据的标准化与去重(如BERT实体消歧)表格数据中的错误值修正(AutoML与梯度提升树)语义冲突检测(基于知识图谱的关联分析)数据质量增强的对抗训练策略。
2025-07-18 10:36:59
332
原创 MER-Factory:情感计算新利器技术文档
MER-Factory是一个开源Python框架,专为情感计算设计,支持多模态和单模态数据标注。该系统采用模块化架构,通过状态驱动图管理复杂工作流,支持无监督和有监督两种标注模式。核心技术包括OpenFace面部特征提取、FFmpeg媒体处理、多种LLM集成(OpenAI、Google等)以及并行处理能力。系统分为特征提取和主处理两个阶段,使用状态对象传递数据,并通过条件边实现动态流程控制。MER-Factory特别适合构建情感识别数据集,提供从原始特征提取到LLM生成情感推理的完整流程,并以结构化JSON
2025-07-16 10:49:54
857
原创 MER-Factory:多模态情感识别与推理数据集自动化工厂API参考
摘要 MER-Factory 是一个多模态情绪识别工具,提供完整的 API 参考文档。核心模块包括: main.py:CLI 入口点,包含 main_orchestrator 函数协调处理流程,支持多种模型(Hugging Face、OpenAI、Ollama)和并发处理。 facial_analyzer.py:FacialAnalyzer 类负责分析 OpenFace 输出的动作单元数据,检测情绪峰值并生成摘要。 emotion_analyzer.py:EmotionAnalyzer 类提供从动作单元到情
2025-07-15 10:28:49
457
原创 MER-Factory:多模态情感识别与推理数据集自动化工厂工具介绍
MER-Factory调优仪表板简介 MER-Factory调优仪表板提供一站式数据管理和模型配置解决方案。主要功能包括: 📊 数据管理 支持CSV文件上传/预览/编辑/导出 多媒体内容预览功能 数据质量5星评分系统 ⚙️ 配置管理 交互式提示编辑模板 多模型选择(Gemini/ChatGPT等) 自动生成命令行代码 📱 特色优势 响应式设计适配多设备 拖放上传简化操作流程 实时编辑自动保存更改 使用方法:双击打开本地tools/tune-dashboard.html文件即可使用全部功能。
2025-07-15 10:27:04
579
原创 MER-Factory 自动化构建多模态情感识别与推理数据集入门指南
MER-Factory 是一个快速部署的情绪识别系统,支持多模态分析。安装前需配置 FFmpeg 和 OpenFace 环境。系统提供 MER、AU、Audio、Video 和 Image 五种管道类型,支持 Google Gemini、OpenAI、Ollama 本地模型等多种 AI 引擎。安装后可通过简单命令行快速运行情绪分析,输出包含面部动作单元、音频特征和情绪识别结果。系统还提供测试脚本和常见问题解决方案,适合不同场景的情绪识别需求。
2025-07-14 15:31:35
802
原创 (万字长文)MER-Factory:自动化构建多模态情感识别与推理数据集
MER-Factory:自动化构建多模态情感识别数据集的开源工具 MER-Factory是一个开源项目,旨在自动化构建多模态情感识别与推理(MER)数据集。该项目提供完整的数据处理流水线,支持视频、音频和图像三类输入数据,包含面部动作单元提取、音频分析、视频内容描述等核心功能。系统能够识别情感高峰时刻,综合分析视觉、音频和面部等多模态信息,最终生成包含情感识别和推理的综合性数据集。该工具支持多种AI模型(如Gemini、ChatGPT等),并提供了简单的命令行接口。项目已在GitHub开源,为多模态情感研究
2025-07-14 12:17:24
3516
原创 YOLOv5白皮书-第Y4周:common.py文件解读
该文件是实现YOLO算法中各个模块的地方,如果我们需要修改某一模块(例如C3),那么就需要修改这个文件中对应模块的的定义。由于YOLOv5版本问题,同一个模块你可能会看到不同的版本,这都是正常的,以官网为主即可。NMS: 移除一些网络模型预测时生成的多余检测框,该算法的核心思想是指搜索局部得分最大值预测并移除与局部最大值预测框重叠度超过一定阈值的检测框。Focus模块是作者自己设计出来,为了减少浮点数和提高速度,本质是将图像进行切片,将原图像的宽高信息切分,聚合到channel通道中。
2023-02-10 22:11:08
348
原创 数据分析可视化之seaborn速成(一)
数据分析可视化之seaborn速成(一)在进行数据分析前最重要的一点,是了解你的数据,最直接最直观了解数据的方法呢,就是把他的分布,走势等等特征在一张图片上画出来。seaborn是一个基于matplotlib的数据可视化库,他使用起来非常的简单,这一期,我们就利用十分钟左右的时间,零基础入门seaborn!首先我们导入需要的几个库
2022-03-21 16:19:52
1251
原创 Pandas Series的一些简单操作
Pandas Series的一些简单操作创建序列import pandas as pds = pd.Series([1,2,3],index = ['A','B','C'],name = 'First_Series')'''A 1B 2C 3Name: First_Series, dtype: int64'''s.values# array([1, 2, 3], dtype=int64)type(s.values)# numpy.ndarrays.index#
2022-03-16 16:34:45
2068
原创 NumPy的一些简单操作
NumPy是Python里面一个非常著名的科学计算库。我们知道,在Python里面一切皆对象,这造成了在一些开发中,我们的Python占用内存会灰常灰常大,但是在NumPy里面,我们在NumPy Array中可以直接存储原始数据类型(int float),如图。
2022-03-14 10:18:27
2579
原创 西瓜书学习笔记(一)
1、假设空间编号 色泽 根蒂 敲声 好瓜 1 青绿 蜷缩 浊响 是 2 乌黑 蜷缩 浊响 是 3 青绿 硬挺 清脆 否 4 乌黑 稍蜷 沉闷 否 对于西瓜好坏的分类,我们可以做出许多种假设,比如:我们可以假设(色泽=青绿,根蒂=蜷缩,敲声=*)的瓜均为好瓜,其中*表示无论它取什么对结果无影响,而所有这些假设所组成的集合就称为假设空间。 ...
2021-11-12 01:05:45
709
【概率论与数理统计】随机变量及其分布学习报告:涵盖离散型与连续型随机变量、分布律及应用实例解析文档的主要内容
2025-07-15
【概率论与数理统计】多维随机变量及其分布:二维随机变量性质与应用综述
2025-07-15
【概率论与数理统计】第一章知识点解析:涵盖随机实验、事件关系、概率计算及条件概率应用
2025-07-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
1