曼哈顿距离,切比雪夫距离,余弦相似度,欧式距离,最小二乘法

曼哈顿距离,切比雪夫距离,余弦相似度,欧式距离
在这里插入图片描述
最小二乘法:
在这里插入图片描述

随机选择或下载数据集通常可以在很多在线资源上完成,例如Kaggle、UCI Machine Learning Repository或者是GitHub上的各种数据仓库。在Python中,你可以使用pandas库加载CSV文件,比如`pd.read_csv('data.csv')`。 绘制图表方面,Python的matplotlib库可以绘制各种图形,如`plt.boxplot(data)`, `plt.bar(x, heights)`等。Scikit-learn库中的`pairwise_distances()`函数能帮助计算多种距离,如: ```python from sklearn.metrics.pairwise import euclidean_distances, manhattan_distances, chebyshev_distance import numpy as np # 示例数据 data = np.random.rand(10, 2) # 欧式距离 euclid_dist = euclidean_distances(data) # 曼哈顿距离 manhat_dist = manhattan_distances(data) # 切比雪夫距离 cheby_dist = chebyshev_distance(data) for dist_name in ['euclidean', 'manhattan', 'chebyshev']: print(f"{dist_name} distance matrix:\n{getattr(distances, dist_name)(data)}") 计算相似度,例如余弦相似度,可以使用TfidfVectorizer或CountVectorizer配合scipy的cosine_similarity: ```python from sklearn.feature_extraction.text import TfidfVectorizer from scipy.spatial.distance import cosine vectorizer = TfidfVectorizer() tfidf_matrix = vectorizer.fit_transform(corpus) similarity_scores = 1 - cosine(tfidf_matrix[0], tfidf_matrix[1]) ``` 对于Jaccard相似度和汉明距离,它们一般用于集合和序列的比较,可以使用`sklearn.feature_extraction.text`中的`jaccard_score()`和`hamming_loss()`函数: ```python from sklearn.metrics.cluster import jaccard_score, adjusted_rand_score def calculate_jaccard(a, b): return jaccard_score([a], [b]) # 使用类似方法计算其他相似度和损失 ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值