李宏毅老师机器学习作业hw0

本文介绍了使用Python进行图片灰度处理的方法,并展示了如何通过读取文本文件来统计单词出现的频次。具体包括利用PIL库加载图像并将其转换为灰度显示,以及解析文本文件内容并统计各个单词出现的次数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


content=open("words.txt").read()
array=content.split(" ")
orderindex=0
for i in range(len(array)):
    if array.index(array[i])==i:
        print("%s %s %s"%(array[i],orderindex,array.count(array[i])))
        orderindex=orderindex+1


from PIL import Image
import matplotlib.pyplot as plt

img = Image.open('westbrook.jpg')
pix = img.load()
width = img.size[0]
print(width)
height = img.size[1]
print(height)
for x in range(width):
    for y in range(height):
        r,g,b=pix[x, y]
        pix[x,y]=int(r/2),int(g/2),int(b/2)
plt.figure("westbrook")
plt.imshow(img, cmap='gray')
plt.axis('off')
plt.show()

### 李宏毅2021机器学习第八次作业材料与解答 #### 关于李宏毅2021年机器学习课程中的第八次作业,该作业主要聚焦于处理仅有正常数据而缺乏异常样本情况下的模型构建与评估问题[^3]。 对于此类场景,通常会采用特定策略来应对不平衡的数据集挑战。具体而言,在训练过程中仅利用正常的实例作为输入,并通过调整算法参数或引入额外机制以增强检测能力。例如: - **选择合适的损失函数**:为了更好地适应这种特殊情境,可以考虑使用能够突出少数类别的损失函数形式。 - **设定合理的阈值**:由于不存在直接用于对比的异常样例,因此需要依据实际需求以及业务背景制定恰当的概率分界线来进行分类决策。 此外,针对此类型的任务,常用的性能度量方式之一是接收者操作特征曲线(Receiver Operating Characteristic Curve, ROC),它描绘了真阳性率随假阳性率变化的趋势图;AUC则表示ROC曲线下面积大小,反映了整体区分效果的好坏程度。 ```python from sklearn.metrics import roc_curve, auc import matplotlib.pyplot as plt def plot_roc(y_true, y_score): fpr, tpr, _ = roc_curve(y_true, y_score) roc_auc = auc(fpr, tpr) plt.figure() lw = 2 plt.plot(fpr, tpr, color='darkorange', lw=lw, label=f'ROC curve (area = {roc_auc:.2f})') plt.plot([0, 1], [0, 1], color='navy', lw=lw, linestyle='--') plt.xlim([0.0, 1.0]) plt.ylim([0.0, 1.05]) plt.xlabel('False Positive Rate') plt.ylabel('True Positive Rate') plt.title('Receiver operating characteristic example') plt.legend(loc="lower right") plt.show() ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值