- 博客(39)
- 收藏
- 关注
原创 下载-使用doccano遇到的问题
解决方法:一种方法是更改doccano webserver的端口号,以避免与其他应用程序冲突。如果8080端口也被占用,可以尝试其他未被占用的端口号。或者可以尝试关闭占用8000端口的应用程序,然后再次尝试启动doccano webserver。问题描述:端口8000正在被另一个应用程序占用,导致无法启动doccano webserver。问题解决:没有再重新打开一个终端,激活构建的doccano虚拟环境,然后使用。这将显示占用端口8000的应用程序的进程ID(PID)。
2023-11-02 16:09:58
629
原创 NLP入门学习历程(1):TF-IDF及关键词提取应用改进
1.TF-IDF的主要思想是:如果某个单词在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。2.计算公式:TF-IDF=tf*idfTF-IDF=某文档中某词或字出现的次数/该文档的总字数 或总词数 * log(全部文档的个数/(包含该词或字的文档的篇数)+1)
2023-04-13 10:52:48
347
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人