自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(53)
  • 收藏
  • 关注

原创 NLP中的“触发器”形式

在自然语言处理(NLP)中,触发器的设计更加依赖于。

2025-04-11 16:26:45 129

原创 Reddit数据集

数据集中的节点代表Reddit帖子,而边则表示如果同一用户对两个帖子都发表了评论,则这两个帖子之间建立连接。数据集总共包含232,965个帖子,平均度数为492,意味着平均每个帖子与492个其他帖子通过同一用户的评论相连。每个数据实例代表一个Reddit帖子或评论,包含以下字段:文本内容、标签(情感或主题类别)、数据类型(指示条目是帖子还是评论)、社区名称、日期时间、用户名编码和URL编码等。节点标签是帖子所属的社区或“subreddit”。数据集的前20天用于训练,其余天用于测试(其中30%用于验证)。

2025-02-05 16:26:45 513

原创 联邦大模型微调

微调(Fine-tuning)是一种迁移学习的技术,用于在一个已经预训练好的模型基础上,通过进一步训练来适应特定的任务或数据集。微调可以在具有相似特征的任务之间共享知识,从而加快训练速度并提高模型性能。

2024-12-27 21:59:37 1078

原创 EleutherAI/pythia-70m

它包含两组八个模型,大小分别为 70M、160M、410M、1B、1.4B、2.8B、6.9B 和 12B。对于每种尺寸,都有两个模型:一个在 Pile 上训练,一个在数据集全局去重后在 Pile 上训练。EleutherAI/pythia-70m” 是由 EleutherAI 开发的一个小型开源语言模型,它是 Pythia Scaling Suite 系列中参数量最小的模型,拥有大约 7000 万个参数。Pythia 模型套件的设计初衷是促进大型语言模型的科学研究,尤其是可解释性研究。

2024-12-27 21:19:42 281

原创 medical meadow medical flashcards

medalpaca/medical_meadow_medical_flashcards” 是一个在 Hugging Face 数据集平台上可用的数据集。这个数据集主要面向医学领域,包含了大量的医学知识卡片,这些卡片由医学生创建和更新,旨在帮助学习和记忆重要的医学概念。在删除包含图像的卡片后,我们利用 OpenAI 的 GPT-3.5-turbo 将卡片改写为连贯的、上下文相关的问答对。这些卡片通常包含简明扼要的摘要和助记法,有助于学习和保留关键的医学知识点。:数据集的格式为 JSON,语言为英文。

2024-12-27 20:31:56 302

原创 联邦大小模型:提示微调架构

根据提示学习策略,并非所有模块都必须使用。例如,在生成任务中,学习过程中没有Verbalizer。PromptTrainer是一个控制器,它控制数据流和训练过程,并具有一些独特的属性,用户也可以以传统方式实现训练过程:从可训练参数的角度来看,提示学习的训练可以分为两种策略。第一种策略同时调整提示和PLM,这在低数据制度下被证明是有效的(OpenPrompt还提供了一个FewshotSampler来支持少样本学习场景)。

2024-12-27 15:48:24 794

原创 日志记录器

日志记录器(logger)的作用是记录程序运行时产生的信息,这些信息可以用于调试、监控和分析程序的行为。在Python中,日志记录器通常使用。:设置了一个日志记录器,用于记录脚本的运行信息。

2024-12-05 15:27:51 257 1

原创 Accurate Forgetting for Heterogeneous Federated Continual Learning

联邦持续学习 FCL:现有研究主要集中在减轻与其他客户合作时持续学习的灾难性遗忘问题(遗忘现象并非总是有害的设计的场景:在FL场景中,客户端之间的统计异质性和数据噪声可能会表现出虚假的相关性,从而导致有偏差的特征学习。虽然现有的学习策略侧重于完全利用先前的知识,但我们发现忘记有偏见的信息在我们的研究中是有益的。——>提出精准遗忘概念,生成重播方法 AF-FCL:选择性地利用联邦网络中的先前知识,采用基于normalizing flow(规范化流)模型的概率框架来量化先前知识的可信度。

2024-09-23 11:28:44 692

原创 CAFE: Catastrophic Data Leakage in Vertical Federated Learning(纵向联邦学习)

梯度共享机制(批处理)会泄露私有数据—>提出数据泄露攻击CAFE—>提出缓解CAFE对策在分布式机器学习系统(如联邦学习(FL)中部署的梯度共享机制可能会泄露私有训练数据。增加批处理大小以使数据恢复复杂化通常被视为防止数据泄漏的一种有前途的防御策略。在本文中,我们重新审视了这一防御前提,并提出了一种先进的数据泄漏攻击,并提供了理论依据,以有效地从共享聚合梯度中恢复批量数据。我们将提出的方法命名为垂直联邦学习中的灾难性数据泄漏(CAFE)。

2024-09-19 20:31:46 878 1

原创 人脸匿名化初步研究:解决人脸隐私安全

将人脸图像匿名化方法从图像语义修改、图像语义保持、视觉可恢复以及深度学习过程中的人脸隐私保护四个方面进行分类,将人脸视频匿名化方法从聚焦面部区域隐私的视频匿名化方法和面向生物特征隐私的视频匿名化方法两个方面进行分类。

2024-09-12 16:59:10 1790 1

原创 【论文阅读】A Differentially Private Federated Learning ModelAgainst Poisoning Attacks in Edge Computing

边缘计算部署中,资源受限的终端设备存在破坏的可能性,以及被滥用以促进中毒攻击的可能性。在处理终端设备上的敏感用户数据时,需要隐私保护。(2)现有方法:现有的方法只考虑防御中毒攻击或支持隐私,没有同时考虑这两个属性。(3)提出方法:提出一种针对中毒攻击的差分私有联邦学习模型,该模型专为边缘计算部署而设计。首先,设计一种基于权重的算法,对边缘节点中终端设备上传的参数进行异常检测,提高小尺寸验证数据集的检测率,并最大限度地降低了通信成本。其次,利用差分隐私技术来保护边缘计算环境中数据和模型的隐私。

2024-08-25 22:37:35 808 1

原创 基于模型分割的联邦学习

Split Learning的核心思想是将网络的结构进行拆分,每个设备只保留一部分网络结构,所有设备的子网络结构构成一个完整的网络模型。这种方法的主要思想是,通过对数据进行细粒度的切分,可以捕捉到数据中更加局部的特征和模式,从而有助于模型学习。同时,随着深度学习技术的不断发展,DNN分割的方法也在不断改进和优化,提高了分割的效果和速度。设计一种多轮迭代再聚合的模型聚合算法,加速FL聚合。SL可以在资源受限的情况下进行ML训练,因为设备只训练分割后的ML网络模型的前几层,从而让IoT设备进行FL成为可能。

2024-03-17 19:19:24 1339

原创 ClusterFL: A Similarity-Aware Federated Learning System forHuman Activity Recognition

不同用户的活动往往表现出一定程度的相似性,这可能源于被试者的生物特征(如性别、身高、体重等)、物理环境(如被试者的活动地点),甚至是传感器的偏差[6,23,64]。我们调查了表1中列出的六个实词HAR数据集的数据相似度,包括基于智能手机的公共人类活动识别(SHAR)数据集[5],公共异构HAR (HHAR)数据集[51];以及我们自己收集的4个新数据集(Depth, IMU, UWB, HARBox数据集)(见第7节)。

2024-03-10 19:44:04 1259

原创 基于秘密分享和梯度选择的高效安全联邦学习

2024-03-03 14:38:39 438

原创 最小描述长度

最小描述长度(Minimum Description Length,MDL)在联邦学习中可以用于评估模型在描述数据时的性能,以及指导模型在联邦学习环境中的训练。MDL原则的基本思想是,一个好的模型应该能够用尽可能短的语言来描述数据,同时能够准确地预测或解释数据的特性。要计算一个模型的MDL,通常需要评估模型在描述数据时的信息量,同时也要考虑到模型本身的复杂度。总的来说,最小描述长度在联邦学习中的应用可以帮助我们在多个客户端之间找到一个平衡点,实现全局模型的优化,并提高模型的泛化能力。

2024-02-25 21:28:03 1033

原创 t-SNE方法:

t-SNE(t-分布随机邻域嵌入,T-distributed Stochastic Neighbor Embedding)是一种流行的机器学习算法,主要用于降维。该算法特别适用于将高维数据映射到低维空间,如2维或3维,以便于可视化和分析。可以从具有数百甚至数千个维度的数据中创建引人注目的两维“地图”t-SNE(t-DistributedStochastic Neighbor Embedding,T 分布随机近邻嵌入)是一种可以把高维数据降到二维或三维的降维技术。t-SNE通过在。

2023-12-05 17:39:51 1578

原创 电力信息系统特点及安全防御

电力信息系统的构建,为居民用电和企业服务提供了帮助,有利于促进电力行业的信息化发展。尤其是在大数据时代,对电力信息系统的运行提出了更高的要求,只有保障其安全性与可靠性,才能防止其对居民用电产生影响。网络是一个虚拟性和开放性极强的世界,在电力信息系统运行中通常会受到网络安全问题的威胁,必须加强防护,以消除其中存在的安全隐患。从安全性和存储功能两方面深入分析了电力信息系统的功能需求,提出了网络信息安全分析架构的特点,探索了基于大数据的电力信息系统网络安全技术应用措施。

2023-12-01 18:28:18 1520

原创 项目申请书撰写【笔记】

撰写项目申请书需要良好的科技写作技能。好的项目申请书应该条理清 晰、逻辑严密。整份申请 书要有清晰的结构,每部分都有特定的功能,让项目评审人觉得一目了 然。每一段话也要有特定的功能,表达要有层次和递进。要注意起承转合、文脉通畅,也要有详有略。1) 项目的立项依据;2) 项目的研究内容、研究目标, 以及拟解决的关键科学问题;3) 拟采取的研究方案及可行性分析;4) 本项目的特色与创新之处;5) 年度研究计划及预期研究结果。

2023-12-01 14:02:27 777

原创 信息中心网络提出的背景、研究现状及研究内容

等。其中信息中心网络ICN因其良好的可扩展性和对高效可靠内容分发的天然支持, 自从诞生起就受到了学术和工业界的广泛关注并已成为未来网络架构的一个有希望的候选方案。通过以命名数据为核心,ICN有利于实现网内缓存和多播机制以促进信息的高效及时传递,能够更好地适应当前互联网的特点,即互联网的核心功能越来越偏向于信息传播而非终端主机之间的成对通信。同时ICN通过引入泛在的网内缓存功能可以有效地提升内容传输效率和用户体验,大幅减少网络中的冗余流量传输。

2023-11-19 20:09:06 507

原创 GL-Cache: Group-level learning for efficient and high-performance caching

web应用强依赖于软件缓存去实现低延迟和高吞吐量服务。Web应用程序严重依赖软件缓存来实现低延迟、高吞吐量的服务为去适应变化的负载,近年来为学习缓存(学习清除)设计三种方案:面向对象学习、面向分配学习和面向专家学习。为了适应不断变化的工作负载,近年来设计了三种类型的学习缓存(学习清除):对象级学习、从分布中学习和从简单专家中学习然而,我们在现有方法下讨论 学习的间隔尺寸过于细了(对象级),导致高计算量和存储;对于过于粗糙负载和专家级在对象和叶节点考虑存在高效差距的不同。

2023-10-10 21:46:12 296

原创 中国计算机学会推荐国际学术会议和期刊目录A类会议

中国计算机学会推荐国际学术A类会议

2023-09-11 16:07:19 137

原创 DeepMag: Sniffing Mobile Apps in Magnetic Field through Deep Convolutional Neural Networks

出发点:由于恶意使用无监督传感器数据而在智能手机上发现的一个新漏洞针对问题及达到效果:为了减轻此类攻击,提出了一种噪声注入方案,可以有效地将 App 嗅探精度降低到仅 15%,同时对良性 App 的影响可以忽略不计。

2023-09-10 20:30:45 121

原创 信息中心网络

由于ICN 网络中节点缓存的内容 由于icn网络中节点缓存的内容都来自于其他节点的转发,攻击者有机会将污染的内容注入网络。并天然的支持一些IP网络不能解决的问题,例如,移动性,In-network caching网络缓存,内容分发等。总之,条件匿名是一种保护数据隐私的技术手段,在满足一定条件下,使得数据中的个体不易被识别,从而在数据发布、共享和分析过程中保护数据主体的隐私权益。同时ICN赋予节点网间缓存的能力,使得请求内容的兴趣包可以在网络中缓存相应内容的节点被满足和响应,从而极大地提升网络的传输效率。

2023-09-03 19:16:45 441

原创 Privacy-Preserving federated learning An application for big data load forecast in buildings

说明背景:大数据分析和预测的重要地位存在问题:负荷预测模型需要消耗大量的关键词:足够种类的数据才能达到高精度,同时这些数据是敏感的;带宽消耗提出使用联邦学习(FL)作为一种去中心化的机器学习差分隐私隐私保护(FL 方法不提供可证明的隐私保证(1)带宽高效(2)引入了 POWER-SELECTION 协议来选择参与 FL 轮的建筑物。

2023-08-13 19:02:31 191

原创 Fine-Grained Preference-Aware Personalized Federated POIRecommendation with Data Sparsity

出发点:时间敏感、异构、有限的POI记录严重限制了联邦POI推荐的发展在极其稀疏的历史轨迹下设计了细粒度的偏好感知个性化联邦 POI 推荐框架,即 PrefFedPOI具体方案:PrefFedPOI通过结合每个本地客户端内的历史近期偏好和周期性偏好来提取当前时段的细粒度偏好。由于某些时段POI数据极度缺乏,针对模型参数上传设计了数据量感知选择性策略。此外,提出了一种带有强化学习的性能增强聚类机制,以捕获所有客户之间的偏好相关性,以鼓励积极的知识共享。

2023-08-06 17:52:21 373

原创 将word每页页眉单独设置

此时光标跳到下一页中,再点开第二页的页眉,将”同前节“这个按钮点掉。(1)在第一页的最后一行输入页面布局的分隔符:选择下一页分节符。(之前想直接这个操作,但是同前节无法取消)

2023-08-03 18:42:55 2770 1

原创 A privacy-compliant fingerprint recognition system based on homomorphic encryption and Fingercode te

出发点:在具有高度隐私合规性的生物识别系统中,处理生物识别匹配的服务器也不应该在数据库中学习任何内容,并且服务器应该不可能利用生成的匹配值来提取有关用户存在的任何知识或行为。提出了一种基于分布式生物识别系统的新颖的完整演示器,该系统能够通过利用密码系统来保护个人的隐私。所实现的系统通过利用同态加密和使用 Fingercode 模板来计算加密域中的匹配任务。

2023-07-27 14:57:59 197

原创 TrustCom2023

随着计算机系统和通信网络的快速发展和日益复杂,用户对信任、安全和隐私的要求越来越高。因此,在开放、动态、异构、移动、无线和分布式计算环境中,传统安全技术和措施可能无法满足用户需求,这是一个巨大的挑战。因此,我们需要构建各种应用程序允许用户享受更全面服务的系统和网络,同时维护信任、安全和隐私。可信计算和通信作为一种有用的创新技术,越来越受到研究人员的关注。

2023-07-04 20:55:40 1959

原创 报错main.py: error: unrecognized arguments: stack_size 4 1001,770,123

报错main.py: error: unrecognized arguments: stack_size 4 1001,770,123

2023-05-11 15:06:50 759

原创 顶会论文投稿经验分享-笔记【CVPR 2023预讲会】

顶会论文投稿经验分享

2023-04-23 14:01:08 918 1

原创 ccf b类及以上会议(准备)

ccf b会议 联邦学习论文

2023-04-21 16:09:38 1423

原创 人脸识别【课程笔记1】

根据attribute-aware深度网络生成人脸部件map图(partness map),文章共使用了5个部件:hair,eye,nose,mouth,beard. 通过part的结合计算人脸的score.部件与部件之间是有相对位置关系的,比如头发在眼睛上方,嘴巴在鼻子下方,因此利用部件的spatial arrangement可以计算face likeliness. 通过这个打分对原始的人脸proposal进行重排序。人脸属性分析核心算法:表情识别、年龄识别、颜值识别、装饰识别、脸型识别、性别识别。

2023-04-10 20:30:37 74

原创 视频笔记【sci期刊常见的审稿意见汇总】

参考文献格式:参考期刊的参考样式来了解这些文献的确切格式,以及标点和大写的使用。消除多个引用(避免一句简单的背景描述,后面插入多篇参考文献)查看期刊要求,修改后应该提交什么版本。

2023-04-08 21:56:35 1440

原创 论文投出后有感

(3)开始写的时候先确定自己所要投的期刊或会议,找到官方提供的模板,在上面修改,一定要注意官方对图、表、公式的格式要求,保留好每次作图、表的数据(一定好备份保留!(5)像描述“如图所示、如表所示”等词时,需要放到句末,不要放在句首;(2)不要完全等到实验做完再去写引言和相关工作,可以边做边写,平时有意识的收集自己所阅读过的文献。(1)对自己而言,不适合一部分写完再写下一部分,需要快速列出一个大纲,再快速填充。(7)在写的时候不要当成认为形式,要多站在读者的角度去思考这部分怎么清楚的表达。

2023-04-06 15:59:48 154

原创 High-efficiency medical image encryption method based on2D Logistic-Gaussian hyperchaotic map【视频笔记】

构造了一个具有较宽超混沌范围的二维logistic -高斯超混沌映射(2D-LGHM)

2023-04-05 22:01:36 336

原创 OTSU方法的最佳全局阈值处理

OTSU算法

2023-03-19 17:09:34 97

原创 FedBoosting: Federated Learning with GradientProtected Boosting for Text Recognition(论文研读:第二篇)

数据隐私保护—>联邦学习框架—>非独立同分布数据产生权重差异、泛化差、梯度泄漏—>联邦加速算法FedBoosting

2023-03-10 11:36:25 269 1

原创 专利写作相关笔记:

专利写作

2023-02-23 18:30:35 328

原创 Cloud-Edge-End Collaboration in Air–GroundIntegrated Power IoT: A SemidistributedLearning Approach

在本文中,我们研究了面向AGI-PIoT中云-边-端协作的多层、多时间尺度多维资源分配优化问题。FEDERATION在大时间尺度上优化物理层任务卸载,在小时间尺度上优化应用层准入控制、物理层功率控制和计算资源分配。与EMM、DTO和FTO相比,FEDERATION协议的端到端时延分别降低了86.63%、71.11%和51.29%,能耗分别降低了18.43%、16.79%和16.15%。物理层安全的联合优化将作为未来工作的重点。

2023-02-03 14:15:16 842

原创 模糊金库算法(fuzzy vault )

模糊金库算法

2023-01-30 20:35:07 779

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除