
数学建模
文章平均质量分 96
是Yu欸
这里是我读博期间的笔记本,记录学习和成长,争取顺利毕业ing
展开
-
【数据集划分】oracle数据集划分(总结版)
假如你有超百万条oracle数据库数据,那么一直使用的代码:`train_df, temp_df = train_test_split(df, test_size=0.3, random_state=42)`,很可能1h还没划分完数据。最终解决方案:生成一列随机数,然后随机打乱。取前70%的样本划分为训练集,70%到90%之间的样本划分为测试集,剩余的样本划分为验证集。原创 2024-06-06 18:07:31 · 3470 阅读 · 92 评论 -
【Paddle】稀疏计算的使用指南 & 稀疏ResNet的学习心得 (2) + Paddle3D应用实例稀疏 ResNet代码解读 (1.6w字超详细)
稀疏格式是一种特殊的数据存储方式,旨在有效存储和处理其中大部分元素为零的矩阵或张量。这种方法可以显著减少存储空间的需求,并提高数据处理的效率。常见的稀疏格式包括 COO(坐标列表格式)、CSR(压缩稀疏行格式)等。conv3x3和conv1x1是用于创建3D稀疏卷积层的帮助函数,它们使用了PaddlePaddle的SubmConv3D,这是一种专门处理稀疏数据的3D卷积。原创 2024-05-29 14:06:52 · 5681 阅读 · 171 评论 -
【Paddle】PCA线性代数基础 + 领域应用:人脸识别算法(1.1w字超详细:附公式、代码)
主成分分析(PCA,Principal Component Analysis)是一项在高维数据中,寻找最重要特征的降维技术,大大减少数据的维度,而不显著损失信息量。本文将通过实际的 Paddle 代码示例,来展示所提供的高效、灵活的线性代数API,如何简化了机器学习和深度学习中的数据处理和分析工作,为高维数据集的处理和分析提供了有效工具。将从以下两个板块展开介绍。- **PCA的算法原理**:介绍PCA的数学基础,如何从线性代数的角度理解PCA,以及PCA算法的步骤。- **PCA在人脸识别中原创 2024-04-30 19:41:38 · 5258 阅读 · 147 评论 -
一文速通半监督学习(Semi-supervised Learning):桥接有标签与无标签数据
论文看到哪学到哪 ^ - ^在机器学习的世界里,我们通常遇到这样一个现实问题:标注数据(有标签的数据)往往昂贵且难以获得,而未标注数据(无标签的数据)却大量存在,易于收集。假设你正在尝试教会计算机区分猫和狗的照片,但只有少数照片是打上了“猫”或“狗”的标签,大部分照片都没有标签。这时候,半监督学习就闪亮登场了,它是一种使用大量未标注数据和少量标注数据进行学习的方法,旨在提高学习效率和准确性。原创 2024-03-18 21:16:36 · 6325 阅读 · 26 评论 -
【2024美赛】在COMAP比赛中使用大型语言模型和生成式AI工具的政策Use of Large Language ModelGenerative AI Tools in COMAP Contests
在模型开发的许多任务中,人类的创造力和团队合作是必不可少的,而依赖AI工具引入风险。如果没有对AI工具的作用进行开放和明确的引用和参考文献,那么可疑的段落和工作更有可能被识别为抄袭并取消资格。这项政策是由于大型语言模型(LLMs)和生成式AI辅助技术的兴起而提出的。如果团队选择使用AI,在报告结束后,添加一个名为AI使用报告的新部分。在你的25页解决方案的参考文献部分使用文中引用,并列出所有使用的AI工具。重要的是要注意,LLMs和生成式AI有其局限性,无法取代人类的创造力和批判性思维。原创 2024-02-02 11:58:42 · 2374 阅读 · 3 评论 -
【2024美赛】F题(中英文):减少非法野生动物贸易Problem F: Reducing Illegal Wildlife Trade
具体来说,你可以考虑如何在其他领域的全球努力,例如,努力遏制其他形式的贩运或努力减少气候变化与遏制非法野生动物贸易的努力,可能是一个复杂系统的一部分。你的目标是说服一个客户执行你的项目。此外,你的团队必须提交一份为客户准备的关键要点的1页备忘录,突出你的5年项目提案以及为什么这个项目适合他们作为客户(例如,资源获取、他们的任务范围、与他们的使命声明相符等)。使用数据驱动的分析,你将如何说服你的客户这是一个他们应该承担的项目?(换句话说,你的客户应该拥有执行你提议的项目所需的权力、资源和兴趣。原创 2024-02-02 13:13:30 · 2740 阅读 · 26 评论 -
【2024美赛】E题(中英文):房产保险的可持续性Problem E: Sustainability of Property Insurance
随着气候变化增加了更严重的天气和自然灾害的可能性,ICM希望确定如何在当前位置上最好地处理房产保险,以便系统在承担未来索赔成本的同时也确保保险公司的长期健康。气候适应的保险风险框架。随着保险格局的变化,未来的房地产决策必须做出以确保房产更具有弹性并且有意识地建造,包括为不断增长的社区和人口提供适当服务的可行性。撰写一页给社区的信件,推荐一个计划、时间表和成本提案,以考虑你从保险和保护模型的结果中获得的洞察,为他们珍视的地标的未来做计划。可能有些社区,你的保险模型建议不承保当前或未来的房产保险政策。原创 2024-02-02 13:07:04 · 2633 阅读 · 1 评论 -
【2024美赛】D题(中英文):五大湖水资源问题Problem Problem D: Great Lakes Water Problem
这些变化反过来影响该地区的生态系统,进而影响湖泊及其周围发现的动植物的健康,以及居住在水盆地中的居民。这些水位是温度、风、潮汐、降水、蒸发、湖底形态(湖底的形状)、河流流量和径流、水库政策、季节循环和长期气候变化之间复杂相互作用的结果。在五大湖水系统的水流中有两个主要的控制机制——苏锡圣玛丽的补偿工程(三座水电站、五个导航闸和一个在急流头部的闸门大坝)和康沃尔的摩西-桑德斯大坝,如附录中所示。IJC还对你使用的历史数据来通知你的模型和建立参数感兴趣,因为他们好奇你的管理和控制策略与以往模型的比较情况。原创 2024-02-02 12:58:03 · 2912 阅读 · 0 评论 -
【2024美赛】C题(中英文):网球中的势头Problem C: Momentum in Tennis
这位年轻的西班牙选手似乎在第四盘开始时完全控制了比赛,但比赛的走向再次发生了变化,德约科维奇完全控制了比赛,以6-3赢得了该盘。在看似有优势的选手身上发生的惊人转折,有时是许多分甚至是多个局,这通常归因于“势头”。此外,如果存在势头,比赛期间的各种事件如何创造或改变势头并不是立即显而易见的。准备一份不超过25页的报告,包括你的发现,并包括一到两页的备忘录,总结你的结果,并为教练提供关于“势头”的作用以及如何准备选手应对影响比赛流程的事件的建议。相反,他假设比赛中的转折和一方选手的连续成功是随机的。原创 2024-02-02 12:43:26 · 8141 阅读 · 1 评论 -
【2024美赛】B题(中英文):搜寻潜水器Problem B: Searching for Submersibles
然而,在他们能够做到这一点之前,他们需要通过开发安全程序以应对与主船失去通信和可能的机械故障(包括潜水器失去推进力)的情况,从而赢得监管机构的批准。你可以使用最多25页的总页数来进行所有解决方案工作和任何你想包括的额外信息(例如:图纸、图表、计算、表格)。发生在物体的平均密度等于其所浸没的流体的密度时,结果是浮力与否则会使物体沉没(如果物体的密度大于其所浸没的流体)或上升(如果它较轻)的重力平衡。- 开发一个模型,使用你的位置模型提供的信息来推荐初始部署点和搜索模式,以最小化定位丢失潜水器的时间。原创 2024-02-02 12:21:18 · 2090 阅读 · 1 评论 -
【2024美赛】A题(中英文):资源可用性与性别比例Problem A: Resource Availability and Sex Ratios
你可以使用最多25页的总页数来进行所有解决方案工作和任何你想包括的额外信息(例如:图纸、图表、计算、表格)。在食物可用性低的环境中,生长速率将会较低,雄性的比例可以达到约78%的人口。在食物更容易获得的环境中,观察到雄性的比例约为56%。虽然许多种类在出生时表现出1:1的性别比例,但其他种类则偏离了均等的性别比。这称为适应性性别比例变化。在一些湖泊栖息地中,它们被视为对生态系统有重大影响的寄生物,而在世界的一些地区,如斯堪的纳维亚、波罗的海地区以及北美太平洋西北部的一些原住民中,七鳃鳗也是食物来源。原创 2024-02-02 12:11:49 · 4967 阅读 · 18 评论