
阿里云
solejay
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
服务器开箱设置
SSH 设置 SSH 远程连接 SSH 别名连接 通过 SSH 默认配置文件创建 SSH 别名 $ vi ~/.ssh/config 配置 config 文件 Host webserver HostName 192.168.225.22 User sk Host dns HostName server.example.com User root Host dhcp HostName 192.168.225.25 User ostechnix原创 2020-10-10 21:19:58 · 311 阅读 · 6 评论 -
【新人赛】阿里云恶意程序检测每周总结——添加数据&拼接词向量
文章目录添加数据拼接词向量 添加数据 通过添加第 1、2、3、4、5 类数据,使用 ngram 词向量和 xgboost 分类器,效果大幅提高 # 类别 1 数据 with open("new_data/label_1.pkl", "rb") as f: labels_1 = pickle.load(f) train_apis_1 = pickle.load(f) # list...原创 2019-12-01 20:01:36 · 906 阅读 · 3 评论 -
阿里云安全恶意程序检测之数据探索
数据说明 训练数据共有 file_id、label、api、tid、index 5个字段 测试数据共有 file_id、api、tid、index 4个字段 每个 file_id 对应一个 label 用来标记程序的种类,每个 file_id 有多个 tid,每个 tid 会调用多个 api,api 按照调用的先后顺序编号多个 index 这是一个序列分类的问题,从一串超长的文本序列中提取出信息...原创 2019-10-17 21:15:34 · 1293 阅读 · 1 评论 -
【新人赛】阿里云恶意程序检测每周总结
实现 SVM 分类器 from sklearn.svm import SVC svc = SVC(gamma='auto', probability=True, decision_function_shape='ovo') svc.fit(x_train, y_train) result = svc.predict_proba(x_test) gamma:核系数,默认为1 / n_featur...原创 2019-11-03 16:08:25 · 851 阅读 · 0 评论 -
【新人赛】阿里云恶意程序检测每周总结
调整随机种子和取平均 ngram(ngram_range(1, 3))固定 random_state=4:0.473048 train-mlogloss:0.06956 val-mlogloss:0.298036 random_state=42:0.472576 train-mlogloss:0.07944 val-mlogloss:0.297976 random_state=8:0.47...原创 2019-11-10 16:23:39 · 423 阅读 · 0 评论 -
【新人赛】阿里云恶意程序检测每周总结
调整随机种子和取平均 ngram(ngram_range(1, 3))、subsample=1固定 random_state=4 train-mlogloss:0.088442 val-mlogloss:0.294975 random_state=42 train-mlogloss:0.0727 val-mlogloss:0.300373 random_state=8 train-mlo...原创 2019-11-17 18:03:48 · 403 阅读 · 0 评论 -
【新人赛】阿里云恶意程序检测每周总结——混淆矩阵&word2vec
调整随机种子和取平均 ngram(ngram_range(1, 3))、subsample=1、10折固定 random_state=4 train-mlogloss:0.070363 val-mlogloss:0.303283 random_state=42 train-mlogloss:0.09246 val-mlogloss:0.305461 random_state=8 trai...原创 2019-11-24 15:22:39 · 672 阅读 · 3 评论