
NLP
文章平均质量分 53
cyong888
live with passion
展开
-
pytorch常用的函数
1.nn.Linear 全连接 https://www.jianshu.com/p/c6eabe6f69b1 2. nn.Conv2d 卷积 https://blog.youkuaiyun.com/sunny_xsc1994/article/details/82969867 https://www.jianshu.com/p/45a26d278473 3.nn.MaxPool1d原创 2021-01-07 12:32:40 · 161 阅读 · 0 评论 -
textcnn 的例子 用 Pytorch
1. 抽取训练数据 和 验证集 5:1 2. 生产词表:0 开始 ;同时统计每个句子的term数量 3. kernel_size= {2,3,4} 就是3个模板,分布式 2* n,3 *n, 4*n 4.kernel_num 是卷积输出channel数原创 2021-01-04 16:28:00 · 262 阅读 · 0 评论 -
团-搜索-面20201230
团-搜索-面 文本分类:样本失衡,如何解决 focalloss的原理是什么? 具体使用如何做? 向量召回 :一般有哪些方法? facebook的 faiss的原理是什么? bert 为什么比lstm好? selfattention的原理 bert 比 transform还多哪些东西? 完形填空部分,训练的是什么? ...原创 2020-12-31 11:19:19 · 116 阅读 · 0 评论 -
美团外卖/滴滴20201225面试
1. ANN的原理,即向量召回的原理 2. gbdt的原理,最好能涉及到公式的维度 3. gbdt 如何优化变快 4.原创 2020-12-25 19:05:07 · 185 阅读 · 0 评论 -
kuai手搜索广告面试题20201214
1. 数组的排列组合输出,譬如数组的值为123,那么输出为:123 132 213 231 321 312 2. 编辑距离的算法 这个要用到 动态规划,需要多看看 3. Top K的问题,当有一个数组 里面有很多值N个,我希望选出top K个值。 3.1 思路 先排序,这样可以,不过时间复杂度很高 3.2 建立小堆。 3.2.1 给N个值建立 小堆,此时时间复杂度是 K * logN。 3.2.2 给前面K个值建立小堆,然后 N-K的数字依次进入这个小堆,...原创 2020-12-15 16:52:28 · 207 阅读 · 0 评论 -
GBDT的使用例子
1.需要按照numpy 和 sklearn,安装的时候会有各种包的依赖。建议安装 anaconda3,这样就全部安装好了。安装地址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 2.python3的代码如下(和python2差不多) 3.训练速度特别快,100W的训练数据不到5分钟。 # -*- coding:utf-8 -*- import numpy as np import codecs import pickle from skl.原创 2020-06-10 10:18:45 · 1320 阅读 · 0 评论