
科研资源
文章平均质量分 83
源码数据
这个作者很懒,什么都没留下…
展开
-
大模型基础-深度解析-环境影响
环境影响是一个巨大的话题。一切都是相互联系的,所以很难得出一个干净的定量指标。但要真正着眼于全局。尽管如今大语言模型的还很少,但它正在快速增长。大语言模型的通用性提供了节省成本的潜力(“一次性训练”并适用于许多不同的任务)。但它们的成本要高得多,需要可能需要重新训练。这里的权衡是什么?缓解措施尝试在使用清洁能源的数据中心训练模型碳抵消的效果各不相同(森林种植活动产生单一种植)更高效的模型架构、训练程序、硬件(但要注意反弹效应)在论文报告排放量。原创 2025-03-12 09:30:00 · 701 阅读 · 0 评论 -
大模型基础-深度解析-大模型的有害性(下)
有毒性和假信息(toxicity 和 disinformation)大型语言模型可能产生攻击性的、有害的内容,或者产生误导性的内容。然而,在我们深入讨论之前,需要指出的是,语言模型与这些伤害之间存在一种断裂。语言模型处理的是文本,这是它们接受训练的数据,并且擅长捕获统计模式。然而,这些伤害涉及的是人,即某个人收到一段文本并因此感到困扰或受伤。这意味着我们需要从更广泛的社会背景来考虑其危害性,而不是从文本的本身属性角度。在讨论大型语言模型之前,我们有必要将有毒性和假信息置于内容审核的问题中来理解。原创 2025-03-11 08:15:00 · 1037 阅读 · 0 评论 -
大模型基础-深度解析-大模型的有害性(上)
在这次内容中,我们将开始探讨大型语言模型的有害性(危害)。:我们知道“能力越大责任越大,对于当前开创性的大模型来说,我们需要了解这些模型的能力和危害之间的密切关系。大模型的能力所展示的潜力将导致这些模型被广泛的采用,但是与此同时造成它们的危害。由于AI的发展是近几年发展的产物,因此对于危害的研究与预防依旧是一个很新的事情。因此回顾历史,从过往历史中的其他领域中的危害、安全和伦理问题的防御进行了解,首先考虑一些在具有成熟的危害和安全传统的学科中使用的高层次思想和方法,有助于对当前AI领域有所借鉴。原创 2025-03-10 12:30:00 · 1073 阅读 · 0 评论 -
大模型基础-深度解析-分布式训练
近年来,深度学习被广泛应用到各个领域,包括计算机视觉、语言理解、语音识别、广告推荐等。在这些不同的领域中,一个共同的特点就是模型规模越来越大,比如 GPT-3 模型的参数量达到1750亿。即使用1024张 80 GB 的 A100,那么完整训练 GPT-3 的时长都需要1个月。模型规模的扩大,对硬件(算力、内存)的发展提出要求。然而,因为的存在,单一设备的算力及容量,受限于物理定律,持续提高芯片的集成越来越困难,难以跟上模型扩大的需求。原创 2025-03-10 08:45:00 · 619 阅读 · 0 评论 -
大模型基础-深度解析-大模型之Adaptation
探测作为一种强大的分析工具,通过冻结语言模型表示编码器(上图中灰色部分)和优化特定任务的探针(上图中预测头,蓝色部分)来工作。这些模型可以是线性的或浅前馈预测头,提供了一种灵活的方法来理解和解释深度学习模型的内部工作机制。固定长度表示的策略也进一步促进了这一目的,提供了灵活而有效的解决方案。冻结(灰色):无需任何操作。优化(蓝色,每个任务有所不同):语言模型的所有参数,外加一个新的预测头。微调是一种强大的工具,可以使预先训练的语言模型更好地符合人类的期望和需求。原创 2025-03-09 15:00:00 · 992 阅读 · 0 评论 -
大模型理论基础介绍
本项目旨在作为一个大规模预训练语言模型的教程,从数据准备、模型构建、训练策略到模型评估与改进,以及模型在安全、隐私、环境和法律道德方面的方面来提供开源知识。项目将以为基础,结合来自开源贡献者的补充和完善,以及对前沿大模型知识的及时更新,为读者提供较为全面而深入的理论知识和实践方法。通过对模型构建、训练、评估与改进等方面的系统性讲解,我们希望建立一个具有广泛参考价值的项目。我们的项目团队成员将分工负责各个章节的内容梳理和撰写,并预计在三个月内完成初始版本内容。原创 2025-03-06 12:01:12 · 643 阅读 · 0 评论 -
我国各省、地级市、县域数据经济数据大全-最新出炉_附下载链接
下载链接-点它👉👉👉。原创 2024-11-08 08:00:00 · 866 阅读 · 0 评论 -
2005-2021年国自然管理学部标书80+份及历年立项清单-最新出炉_附下载链接
内容:该资源包含了80多份管理科学部中标标书,为准备国家自然科学基金(国自然)的申请者提供了宝贵的参考和借鉴。部分清单:文章中提供了部分中标标书的清单,但具体标书内容需通过提供的链接查看。原创 2024-11-07 15:02:44 · 503 阅读 · 0 评论 -
精心整理教育研究专题数据资源大全-最新出炉_附下载链接
简介:《中国教育统计年鉴》是由教育部发展规划司根据全国各省、自治区、直辖市教育厅(教委)上报的学校基层统计调查数据整理汇编而成,全面反映我国教育事业发展情况。内容涵盖:综合部分、高等教育、中等教育、初等教育、特殊教育、学前教育、各级各类学校的分布情况、办学条件、科学研究等。数据范围:31个省、直辖市、自治区。数据年份:2000-2022年(包含2022年数据)。指标数量:3000+。数据来源:《中国教育统计年鉴2000-2022年》。原创 2024-11-07 14:29:10 · 1038 阅读 · 0 评论 -
【灯光数据最新整理】 2000至2023年“NPP-VIIRS“夜间灯光数据(500m分辨率)-最新出炉_附下载链接
时间范围:2000-2023年数据格式:栅格数据(.tif)数据分辨率数据坐标系数据来源:国家科技基础条件平台—国家地球系统科学数据中心(原创 2024-10-30 20:30:38 · 1371 阅读 · 0 评论 -
各省、地级市、上市公司能源消耗总量面板数据-最新出炉_附下载链接
下载链接-点它👉👉👉。原创 2024-10-31 07:00:00 · 607 阅读 · 0 评论 -
2000-2023年全国各省、地级市居民消费价格指数CPI-最新出炉_附下载链接
下载链接-点它👉👉👉。原创 2024-10-30 18:06:30 · 586 阅读 · 0 评论 -
已更新10万条国家社科基金立项清单和近100份申请书范本-最新出炉 附下载链接
2024年度国家社科基金已开始申报,为了方便大家选题和撰写标书做参考,我们收集了以下资源:我们提供了超过100份经管类的国家社科基金立项申请书范本,供您参考和学习。以下是国家社科基金项目申请书的结构,以及表格各个部分的填写要点、撰写思路以及一些细节提示:结构:通常包括封面、目录、项目论证(活页)、活页摘要、推荐意见表、申报数据表等部分。填写要点:撰写思路:细节提示:我们还附赠了其他标书等相关资料,供您参考和学习。原创 2024-10-30 17:58:39 · 597 阅读 · 0 评论