- 博客(40)
- 资源 (1)
- 收藏
- 关注
转载 【转载】切换服务器后如何clone torch
Conda提供了一个工具可以帮我我们将当前环境的所有包依赖打包成一个.tar.gz压缩文件,这个文件里面包含conda install和pip install的所有包。(4)最后可以通过conda env list查看当前环境,会发现多了一个刚新建的环境。具体针对某个库的清华源链接,可以在有网的电脑上在终端进行pip install 这个库的时候,会打印在终端上。(1)在离线电脑的conda目录的envs目录下新建一个文件夹(如D:\anaconda3\envs\××),××名称就为新环境的名称;
2024-03-03 01:22:31
84
原创 Assertion `srcIndex < srcSelectDimSize` failed on GPU for `xxx`:CUDA上数组越界
Assertion `srcIndex < srcSelectDimSize` failed on GPU for `torch.cat()` 类似问题
2023-02-21 17:29:38
1012
原创 Networkx笔记:获取list类型的节点列表
lIf your node data is not needed, it is simpler and equivalent to use the expression for n in G, or list(G).可以直接用获取G的节点id列表,返回的是nodeview类型的迭代器。
2022-12-06 10:20:26
823
原创 [KDD2022] Spatial-Temporal Trajectory Similarity Learning in Road Networks (轨迹表示学习)
1. 作者观察到现有的轨迹相似度计算模型都没有建模时间相似性,从时空分离的角度**重新定义了轨迹相似度的概念**。2. 在轨迹的空间嵌入和时间嵌入时,作者提出了时空的**共同融合**模块,显式地建模了轨迹的时空相关性。3. 在考虑模块的重构时,作者每次都是先提出最简单的可行方案,再分析其缺陷,再迭代,使得对比实验具有很好的说服力。4. 作者对前人工作的总结非常充分,introduction提及的分布式的海量轨迹挖掘算法、轨迹相似度计算的应用的介绍是很新颖的。
2022-10-29 17:57:20
2081
原创 【从零开始的大数据学习】Flink官方教程学习笔记(一)
Flink的官网教程学习笔记:包含Scala入门、Scala基础数据结构,Scala的安装、Flink基本原理入门内容
2022-10-21 00:37:05
895
原创 TrajGAT:轨迹相似度计算模型
1. 作者提出的空间划分方式,将equal-size的网格转换为了层次结构,并通过同一级节点的连接,构造出了一个空间划分的图,具有一定的新意。2. 在此基础上,作者使用的图注意力机制捕获长序依赖,在实验上取得了良好的效果。
2022-10-19 09:39:15
3956
6
原创 数组的反向字典构造
构造数组内容->数组的字典service_levels = ["undefined", "低", "中", "较好", "良好", "优"]value = [0, 1, 2, 3, 4, 5]mydict = dict(zip(service_levels, value))
2022-05-04 14:25:00
272
翻译 大数据平台组件介绍
转载自:https://stackoverflow.com/questions/29679959/the-apache-projects-and-big-data-world/29681839#29681839As for hadoop, you have to understand, that Hadoop can mean two things, depending on the context. A bit like the term “Linux”, if your familiar wit
2022-04-14 12:27:53
314
原创 北京交通大学《机器学习》课程总结
本文为北交机器学习课程内容总结,对每种算法的文言描述做了概括性解释。内容基于于剑老师的著作《机器学习:从公理到算法》归类公理伯牙鼓琴,锺子期听之。方鼓琴而志在太山,锺子期曰:“善哉乎鼓琴!巍巍乎若太山。”少选之间而志在流水,锺子期又曰:“善哉乎鼓琴!汤汤乎若流水。”锺子期死,伯牙破琴绝弦,终身不复鼓琴,以为世无足复为鼓琴者。机器学习是在数据中学习概念。我们认为:概念具有内蕴表示和外延表示。内蕴表示是概念的本质特征(例如:概率密度分布函数),是对概念的...
2022-01-06 22:47:00
3218
2
原创 在大量数字数组中找到最*的k个数
最大/最小的k个数:https://www.cnblogs.com/ceachy/archive/2013/03/20/Algorithm_Max_m_from_N.html频率最多的k个数:https://blog.youkuaiyun.com/weixin_38111819/article/details/79148354?spm=1001.2101.3001.6650.3&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EC
2021-12-21 09:55:24
140
原创 如何审稿(持续更新)
1、问题的challenge是否分析清楚2、Motivation是否明确3、提出的模型idea是否有新意或者合理4、模型的描述是否清晰易懂5、实验设置是否合理,数据集是否足够6、baseline是否足够多 足够新非常重要7、实验结果是很好,结果分析是否合理8、是否进行消融实验或者组件分析...
2021-12-18 16:04:13
449
原创 现实中的软件工程:如何快速迭代代码
软件工程流程本科学习的软件工程核心:DesignDevelopmentEvaluationreturn to design agian…如何快速实现需求?首先,选择一个最简单的需求,写伪代码。实现一个最简单的步骤。新建新的代码,先做小的测试,最后合并基于这个步骤,进行修改,实现另一个步骤...
2021-12-10 20:06:58
634
原创 大数据实验1: Hadoop, Scala, Spark的安装
Why Spark?Spark 是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。Hadoop基于MapReduce,适用于循环迭代类型数据处理Spark针对机器学习算法,进行针对性计算优化,单元缩小到RDD模型
2021-11-18 00:21:33
2262
原创 Pytorch实验6:论文代码中的高级语法
整理了一下读GSnet代码时遇到的不懂的语法。Pytorch中的高级语法整理torch.tensor.repeat()bmm (input, mat2)tensor.permute(input, dims)关于permute(排列)函数的理解permute / transpose + contiguous + viewtorch.squeeze(input, dim=None)torch.unsqueeze(input, dim=None)torch.tensor.repeat()repeat里面的参
2021-11-10 09:15:01
1761
转载 review: PCA-based anomaly detection
Transfered from: https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/pca-based-anomaly-detectionPrincipal Component Analysis, which is frequently abbreviated to PCA, is an established technique in machine learning. PCA is frequ
2021-11-08 21:22:41
203
原创 算法作业2:分而治之 (持续更新)
什么是分治?把大的问题划分为小的问题;设计base case,解决小的问题;可以捕获规模大问题和规模小问题的关系时使用;可以用递归;可以用动态规划机器学习中的分治:决策树算法大数据中的分治:Map Reduce 类似于归并排序,分布式计算框架Hadoop通过设计算子,对大问题进行分布式并行处理,最后归并为结果,提高了运算效率。典型例题
2021-10-27 21:54:58
620
原创 详解数据结构:链表(持续更新)
结构体C里面叫结构体,C++里面叫全是public属性的类。链表#include <cstdio>using namespace std;struct Node{ int val; Node* next;} *head;int main(){ for (int i = 0; i < 4; ++i) { Node *p = new Node(); p->val = i; p->next =
2021-10-27 20:21:46
137
原创 机器学习:最小二乘法(Python实现)
最小二乘法求回归题目解 import numpy as np x_h = np.array([178,179,170,179,165,169,177,167,172,167]) f_h = np.array([185,187,176,187,168,173,182,177,180,170]) x_bar = np.average(x_h) f_bar = np.average(f_h) sum1 = np.dot(x_h,f_h.transpose())
2021-10-15 21:48:28
374
原创 [已解决] 解决ImportError: attempted relative import with no known parent package
问题Pycharm 无法识别,但是可以运行Pycharm可以识别,但是运行报错 attempted relative import with no known parent package解决问题来源:绝对路径啥从项目目录开始的修改方案:加上项目路径
2021-10-13 11:58:34
17453
3
原创 读懂GSnet(一):pandas读取pkl格式的多维数组,可视化理解时空数据
GSNet数据解读原始数据数据理解维度格式如何读取四维数组?读空间分布读时间分布读其它分布结语之前很少用过多维数组,不知道怎么读取。今天阅读论文《Learning Spatial-Temporal Correlation from Geographical and Semantic Aspects for Traffic Accident Risk Forecasting(AAAI 2021)》时,文章提供的原始数据是4维的,正好研究一下。原始数据代码和原始数据:https://github.com/
2021-10-12 13:10:08
3691
原创 优化作业:牛顿法求函数极值 (Pytorch编程实现)
目录题目符号微分法(失败)Pytorch自动微分小结题目符号微分法(失败)算不出来。Hessian阵算出来是个常数,不知道怎么做:import numpy as npdef f(x): prod1 = 0.2* np.matmul(x,x.transpose()) # 1/2x^tx A = np.array([[5,1,0,0.5],[1,4,0.5,0],[0,0.5,3,0],[0.5,0,0,2]]) prod2 = np.matmul(x.transpose(
2021-10-11 16:53:50
991
原创 深度学习复习笔记(持续更新)
Update date: 10/7目录(一)绪论人工智能概述深度学习概述(一)绪论人工智能概述人工智能一共经历了三个发展阶段:计算智能,感知智能,认知智能。计算智能使得机器能存能算,感知智能让机器能说会说、能看会认,而第三阶段的机器更加智能化,能理解事物并思考问题。人工智能的实现方法:神经网络得到任何局面的估值都是常数时间,这和搜索树是非常不同的神经网络这些算法最有意思的一点是其时间复杂度往往近似为常数(因为只是简单的函数求值),这和人的行为更加接近:人在很多认知问题上都是和输入无关的,时间
2021-10-07 10:36:28
776
原创 算法作业0:a+b问题大全(Python实现)
Problem A. A+B I样例输入1 2-1 1样例输出3 0解决:import sys #引入异常退出try: while(1): a,b = input().split() # 获取输入为字符串 print(int(a)+int(b))# 字符串转为intcatch(EOFError): sys.exit()Problem B. A+B II样例输入2 1 2-1 1样例输出3 0解决:t = int(input())f
2021-10-02 00:00:34
379
原创 算法作业1:遍历与枚举
本文持续更新Update date: 2021/10/1什么是遍历?遍历(enumerate),顾名思义,找出问题的可能解,然后一个一个地尝试。什么时候用遍历?简单而言,任何时候。借用老师的话:It should be your first idea!(拿道题,没思路,就枚举)It could need optimization!(过不了,找问题,再优化)It would be your last solution !(回头看,枚举是最“差”的算法,但是也是解决问题最基本的方法).
2021-10-01 23:24:14
1089
原创 疫情微博文本情感分类 (简化版SMP2020赛题)
2020年初,新型疫情来势汹汹,对人们的生产生活产生了巨大的影响,引发舆论广泛关注。在以微博为代表的社交媒体上,疫情相关的话题引起了网友们的广泛讨论。基于自然语言处理技术,深入挖掘微博文本中蕴含的情感态度信息,可以明确公众态度、感知情绪变化、辅助政府决策、引导网络正能量,具有研究意义和社会价值。本实验的任务是:使用深度学习方法,对给定的疫情微博数据集进行情感分析,输出微博蕴含的情绪类别。任务的优化目标是:提高在测试集上的评估得分。**特别地,训练数据不能脱离数据集范围,不可以引入外部语料、预训练模型
2021-09-23 17:14:27
5214
11
原创 算法作业 | BJTU1882 sqy 的锡纸烫(递推)
题目:https://citel.bjtu.edu.cn/acm/problem/1882前不久 sqy 老师花了大价钱,去做了一个帅气的锡纸烫。有着商业眼光的 sqy 一下子发现了大商机,于是他自己开了一家美容美发店。sqy 找了刚刚做完纹理烫的大预言家 cbj 预测了未来,发现每个顾客都只在白天来美发店,并且第一次来店里的时候都会充一次价值 xix_ixi 的卡,然后从第二天开始,每天白天都会来这里打理头发,而 sqy 仅收取成本价 1 元钱来吸引顾客,直到把卡掏空为止,这个顾客就再也不会回来。
2021-09-18 11:10:50
678
原创 [已解决] 手动实现神经网络解决回归问题,每个epoch的loss/accuracy完全一样是怎么回事?
问题:Loss/Accuracy不变今天下午跑实验2,手写的回归算法。反复检查Code没有问题,但是Loss从epoch2开始一直不变(如图)。是什么原因呢?网上方案经过手动排查,网上列出的原因主要有以下三种,测试了均没有效果。学习率太大、太小根据指数搜索策略,手动更改学习率为0.1、0.01、0.001后,loss依旧不变。yyy和y^\hat{y}y^不在同一维度,发生了广播for X, Y in train_iter: # the predication Yhat =
2021-08-02 19:01:16
6270
6
原创 (新手上路)疑问:for循环如何计算时间复杂度
看到这样一段代码:for(int i=0;i<n;i++){ for(int j=i;j<n;i++){ //复杂度为O(1)的算法 ... } }这个算法的时间复杂度为什么是O(n^2)呢?观察内循环n+(n-1)+(n-2)+(n-3)+……+1=(n+1)+[(n-1)+2]+[(n-2)+3]+[(n-3)+4]...
2018-03-08 12:06:42
11706
7
原创 Hello, 优快云!!!
原来优快云==Chinese Software Developer Network打算认真学C++了,加油!!!!!!!
2018-01-11 21:52:26
202
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人