87、文本挖掘特征选择与一阶逻辑解析

文本挖掘特征选择与一阶逻辑解析

1. 文本挖掘中的特征选择

1.1 基本概念

在文本挖掘中,涉及到一些重要的概率概念:
- (P(F)):特征 (F) 出现的概率。
- (\overline{F}):特征 (F) 不出现。
- (P(C_i)):第 (i) 类值的概率。
- (P(C_i|F)):在特征 (F) 出现的条件下,第 (i) 类值的条件概率。
- (P(F|C_i)):在第 (i) 类值的条件下,特征 (F) 出现的条件概率。
- (P(F|C_{pos})):在类值为“正”的条件下,特征 (F) 出现的条件概率。
- (P(F|C_{neg})):在类值为“负”的条件下,特征 (F) 出现的条件概率。
- (Z^{-1}(x)):标准正态分布的逆累积概率函数((z) - 分数)。
- (|C_i|):类 (C_i) 中的文档数量。
- (n(F, d)):若文档 (d) 包含特征 (F) 则为 1,否则为 0。

1.2 特征选择方法

1.2.1 基于支持向量机(SVM)的特征选择
  • Brank 等人的方法 :先使用所有特征训练线性 SVM,然后用诱导模型对特征进行评分(诱导超平面法向中分配给每个特征的权重作为特征得分)。实验表明,结合 SVM、感知机和朴素贝叶斯进行特征选择时,SVM 使用几乎所有特征时性能最佳。
  • Bi 等人的方法 :同样使用线性 SVM 对特征进行排序,但实验是在回归问题上进行,最终模型使
复杂几何的多球近似MATLAB类及多球模型的比较 MATLAB类Approxi提供了一个框架,用于使用具有迭代缩放的聚集球体模型来近似解剖体积模型,以适应目标体积和模型比较。专为骨科、生物力学和计算几何应用而开发。 MATLAB class for multi-sphere approximation of complex geometries and comparison of multi-sphere models 主要特点: 球体模型生成 1.多球体模型生成:Sihaeri的聚集球体算法的接口 2.音量缩放 基于体素的球体模型和参考几何体的交集。 迭代缩放球体模型以匹配目标体积。 3.模型比较:不同模型体素占用率的频率分析(多个评分指标) 4.几何分析:原始曲面模型和球体模型之间的顶点到最近邻距离映射(带颜色编码结果)。 如何使用: 1.代码结构:Approxi类可以集成到相应的主脚本中。代码的关键部分被提取到单独的函数中以供重用。 2.导入:将STL(或网格)导入MATLAB,并确保所需的函数,如DEM clusteredSphere(populateSpheres)和inpolyhedron,已添加到MATLAB路径中 3.生成多球体模型:使用DEM clusteredSphere方法从输入网格创建多球体模型 4.运行体积交点:计算多球体模型和参考几何体之间的基于体素的交点,并调整多球体模型以匹配目标体积 5.比较和可视化模型:比较多个多球体模型的体素频率,并计算多球体模型原始表面模型之间的距离,以进行2D/3D可视化 使用案例: 骨科和生物力学体积建模 复杂结构的多球模型形状近似 基于体素拟合度量的模型选择 基于距离的患者特定几何形状和近似值分析 优点: 复杂几何的多球体模型 可扩展模型(基于体素)-自动调整到目标体积 可视化就绪输出(距离图)
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值