
数据挖掘与机器学习
人工智能教学实践
这个作者很懒,什么都没留下…
展开
-
网络爬虫的本质是什么?
具体来说,网络爬虫是一种自动化工具,它使用HTTP协议向网站发送请求,并从网站的响应中提取所需的数据。爬虫可以按照事先定义好的规则和逻辑,自动地遍历网页链接、解析HTML内容、抓取文本、图像等资源,并将这些数据提取、处理和存储下来。数据提取与存储:对每个页面的内容进行处理和筛选,提取出所需的数据,并将其存储到数据库、文件或其他形式的存储介质中。遍历链接:爬虫根据规则从当前页面提取的链接,进一步构建新的URL列表,并继续发送请求,以便抓取更多页面。自动化程序模拟人类在互联网上的浏览行为。原创 2023-09-18 08:56:41 · 1299 阅读 · 0 评论 -
灵敏度分析与影响力分析
通过影响力分析,可以识别到对模型预测结果产生较大影响的数据点,这些数据点可能是异常值、离群点或者具有特殊性质的数据。进一步分析这些影响力较大的数据点,可以帮助我们了解模型在不同情况下的行为和性能,从而提高模型的可解释性和鲁棒性。通过进行影响力分析,可以识别出对模型结果具有较大影响的数据点,并进一步了解这些数据点对于模型的预测结果产生的贡献。灵敏度分析旨在评估模型的鲁棒性和确定性,帮助决策者了解模型的稳定性和可靠性,以及识别影响决策结果的关键因素。原创 2023-09-06 08:25:31 · 992 阅读 · 0 评论 -
隶属度函数图与λ 截集
事故发生的可能性分为极低(VL)、低(L)、中(M)、高(H)、极高(VH)五个等级,采用三角和梯形模糊数表示专家的评判语言,模糊数的定量化表达如图 所示。通过截集操作,我们可以获得一个新的模糊集合,其中隶属度大于等于截集阈值的元素被保留,而隶属度小于截集阈值的元素被剪除,从而将模糊集合转化为非模糊的集合。给定一个模糊集合,其隶属度函数表示元素与该模糊集合的隶属关系。其中,A_cut(x) 表示截集后的模糊集合,μ_A(x) 是原始模糊集合的隶属度函数,cut level 是设定的截集阈值。原创 2023-09-06 08:23:09 · 859 阅读 · 0 评论