非結構化數據分析
文章平均质量分 78
yrunagate
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
非結構化數據分析三
GMM 高斯混合模型方法 被聚到某類的概率 >>信息量較多 假設數據服從高斯混合分布 從K個高斯分布生成 目標: 求3K個參數 (W係數 MU SIGMA) 評價方式:似然函數最高 EX原创 2016-04-05 14:20:45 · 315 阅读 · 0 评论 -
非結構化分析二
決策邊界 二維分類 線性分類器 常用文本分類器都是線性分類器 樸素貝葉思 羅吉回歸 支持向量機 選擇分割面的方式不同 非線性分類器並不一定比線性分類器好 貝葉思及其在郵件過濾中的應用 垃圾郵件問題 傳統的垃圾郵件過濾法 主要有關鍵詞法 特定詞語判斷 校驗碼法 計算文本校驗碼 2002 paul graham提出使用貝葉斯推斷過濾垃圾郵件 訓練集越原创 2016-03-22 17:56:03 · 301 阅读 · 0 评论 -
非結構化數據分析
結構化數據>>數據庫 二維表 非結構化數據>>信息檢索 自由文本最典型 圖片 視頻 音頻 以關鍵字查詢 半結構化數據 文本挖掘的基本流程: 分詞tokenizer 文法處理 把他還原成原始單詞 linguistic modules 每個詞作為一列 變成結構化數據>>表 structured data 數據挖掘 關聯分析 異常點檢測原创 2016-03-15 17:26:36 · 381 阅读 · 0 评论
分享