
NBME-临床患者病历kaggle小黑初探
文章平均质量分 66
爱喝喜茶爱吃烤冷面的小黑黑
这个作者很懒,什么都没留下…
展开
-
小黑大口啃初版baseline:Score Clinical Patient Notes提交部分代码
目录数据目录:1.将fasttokenizer导入transformers库里面2.config类定义3.导包4.加载tokenizer5.评价指标6.转换函数7.utils包8.数据读取9.超参数阈值选择10.合并数据集11.dataset设置12.model设置13.推断函数14.model测试15.提交 数据目录: 1.将fasttokenizer导入transformers库里面 import shutil from pathlib import Path # transformers库的位置 t原创 2022-04-07 14:36:13 · 910 阅读 · 0 评论 -
小黑触摸kaggle的baseline试试:使用itertools.groupby和itertools.count抽取出连续的段
1.任务定义 我想从[1,2,3,4,8,9,10,11]中抽取出[1,2,3,4],[8,9,10,11]这两段连续(等差)序列,直接写while循环的代码比较复杂。于是我们把其转化为分组问题,把[1,2,3,4]与[8,9,10,11]分别分成两组。 2.核心代码 我们首先将分组的key设成一个函数,返回n-next(c),其中n为当前元素,next(c)返回计数器(不断加1)。同一个连续的序列,n-next(c)必定是同一个常数。itertools.groupby返回的是:每一个连续序列的key,也就原创 2022-04-04 15:14:14 · 636 阅读 · 0 评论