- 博客(1612)
- 资源 (7)
- 收藏
- 关注
原创 jupyter notebook笔记:下拉菜单中添加新的conda 环境
假设我们在 Linux 环境下已经创建好了。出现在 Jupyter 中)
2025-04-02 10:41:51
213
原创 论文笔记:Instruction-Tuning Llama-3-8B Excels in City-Scale MobilityPrediction
将轨迹预测问题重构为一个带有指令的问答任务通过 GPT-3.5 和 4 进行实验,发现虽然该问答框架能在零样本情况下得到可接受结果,但仍存在准确性差、API 成本高、数据泄露风险等问题。——>使用 LoRA对 Llama-3-8B 进行了指令微调,仅微调注意力层和投影,提升效率。
2025-04-01 15:15:43
294
1
原创 深度学习&pytorch笔记:TCN
注:以下是个人观点:这边kernel_size=2(TCN的标准做法),所以此时dilation = 2**i还是dilation = kernel_size**i是无所谓的,但如果。每一个TemporalBlock是由两个因果扩张卷积组成的。如上图,把输出后的x5'和x6'裁剪掉。
2025-03-17 10:44:10
430
原创 数据集笔记:LTA static datasets
表示该区域为“区域 2 - 距离 RTS 站点 400 米半径范围内的区域”转换成经纬度,就直接用to_crs就行。停车区域描述,对停车区域的详细说明。它是一种投影坐标系,基于。用于表示道路边缘的线表示。
2025-03-06 12:03:43
752
原创 数据集/API 笔记:湿球黑球温度(WBGT)观测数据
WBGT是一个综合指标,考虑了气温、湿度、风速和太阳辐射,与气温不同。报告的WBGT是过去15分钟内的平均值,每15分钟更新一次。
2025-03-03 23:30:45
266
原创 数据集/API 笔记 新加坡相对湿度数据
数据由自动气象仪器采集,并在生成后立即自动发布。由于技术问题,数据可能会有缺失的情况。每分钟记录各个气象站的相对湿度数据,每五分钟更新一次。
2025-03-03 22:03:09
306
原创 数据集笔记:新加坡 一些交通的时间序列统计量
各类机动车年度保有量数据范围:2005年1月 - 2020年12月1.1 数据说明非高峰时段车辆包括周末车(Weekend Cars)和修订版非高峰时段车辆(Revised Off Peak Cars),该类别于2010年1月25日实施。轻型货车(LGV):最大总重 ≤ 3.5 公吨重型货车(HGV):最大总重 3.5 公吨 - 16 公吨超重型货车(VHGV):最大总重 > 16 公吨免税车辆包括免缴道路税的注册车辆、仅限非道路使用的车辆,以及工程机械车辆。校车(CB)
2025-03-01 23:06:43
410
原创 论文略读:SimCSE: Simple Contrastive Learning of Sentence Embeddings
EMNLP 2021。
2025-02-27 12:03:21
221
原创 论文略读:Understanding Contrastive Representation Learning through Alignment and Uniformity on the Hype
随机样例表征均匀分散在超球面上。
2025-02-27 11:54:23
165
原创 论文笔记:Interpretable Cascading Mixture-of-Experts for Urban Traffic Congestion Prediction
北京(2023 年 9 月 24 日至 2023 年 11 月 3 日)上海(2023 年 10 月 30 日至 2023 年 12 月 9 日)滴滴轨迹数据涵盖了城市主干道上的数百个路段数据集包括静态路段属性和动态交通特征。静态属性包括路段长度、宽度、限速、车道数、经度和纬度。每个路段的动态交通特征包括实时交通速度和拥堵等级最近的动态特征是从前 12 个时间间隔收集的历史特征 H 来自前几天(4天)和几周(4周)相同时间段(t-12~t)的记录。
2025-02-25 14:03:05
900
1
原创 论文笔记:Enhancing Sentence Embeddings in Generative Language Models
2024 ICIC。
2025-02-25 14:02:52
362
1
原创 论文略读:TrajRecovery: An Efficient Vehicle Trajectory Recovery Framework based on Urban-Scale Traffic
2024 KDD。 首个仅利用交通摄像头记录而非GPS数据的轨迹恢复框架
2025-02-24 22:54:42
316
原创 论文略读:DuMapNet: An End-to-End Vectorization System for City-Scale Lane-Level Map Generation
2024 KDD。
2025-02-24 22:23:37
250
原创 论文略读:From News to Forecast: Integrating Event Analysis in LLM-Based Time Series Forecasting with Re
2024 Neurips
2025-02-24 18:10:30
300
原创 论文笔记:Scaling Sentence Embeddings with Large Language Models
2024 ACL findings
2025-02-24 16:42:29
475
1
原创 论文笔记:MoEJetpack: From Dense Checkpoints to Adaptive Mixture of Experts for Vision Task
Neurips 2024
2025-02-23 09:56:04
210
1
原创 论文略读:Uncovering Hidden Representations in Language Models
说一下主要结论吧,对于下游任务,语言模型的中间层在所有架构和任务中始终优于最后一层
2025-02-22 22:14:36
476
原创 论文笔记:PMoE: Progressive Mixture of Experts with Asymmetric Transformer for Continual Learning
当路由器位于深层附近时(即 τ=24),不平衡问题自动得到解决,所有专家都得到了良好的分配。τ=24 时,分配模式更为多样,表明专家的使用更加全面。模型在适中的 τ下表现最佳,且计算成本与 τ成反比。浅层致力于通用能力,而深层则针对新获得的能力进行定。τ=6 时,大多数令牌主要分配给专家 2 或 8。
2025-02-22 20:39:53
256
1
原创 论文略读:Uni-MoE: Scaling Unified Multimodal LLMs with Mixture of Experts
TPAMI 2025多模态大模型+MOE。
2025-02-22 13:04:42
224
原创 论文略读:RankRAG: Unifying Context Ranking with Retrieval-Augmented Generation in LLMs
2024 Neurips
2025-02-22 12:35:42
231
network embedding lecture slide
2023-01-01
python 实现 cmaes (调用方便)
2022-02-13
ASTGCN(AAAI 2019).pdf
2021-08-13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人