- 博客(13)
- 收藏
- 关注
原创 jionlp文本处理:繁转简、提取金钱/地址/时间
parse_location可能更加灵活,会自行推断地址名,经常从不存在地址的文本种提取出地址。相较而言,recognize_location提取的更加准确,就是返回格式比较复杂,较难清洗。提取地址:recognize_location、parse_location。在不规整的长文本上效果不好,建议先提取【时间短语】再通过这个方法格式化。提取金额:ner.extract_money。提取时间:parse_time。原作者也是调用的【时间短语】。繁体转简体:tra2sim。
2024-12-16 18:08:56
224
原创 Python分析库——Pandas基础
Series 类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型。如果不指定索引,Pandas 将。对象组成的字典(共同用一个索引),拥有行索引和列索引,类似于 Excel 中的行号和列标。Pandas 可以使用 loc 属性返回指定行的数据,如果没有设置索引,第一行索引为。Pandas 数据结构 - DataFrame。添加新行:loc、append 、concat。DataFrame 的合并与分割。DataFrame的属性和方法。创建DataFrame。
2024-12-06 16:20:44
473
原创 Python基础/必看/先导
字典:grade = {'语文':110,'数学':98,'英语':118,'不及格':3}"520"+"1314",输出:5201314。注:没有引号就是数字相加。不可变类型:整型、浮点型、字符串、元组……不可变(除此之外,与列表基本一致)有序序列:字符串、列表、元组……可变类型:列表、字典、集合……注释快捷键: ctrl+\。无序序列:字典、集合……
2024-11-27 16:21:02
359
原创 初学RAG(缓慢更新……)
通过与外部知识库连接,RAG确保了模型可以获取最新的信息,及时适应当前的事件和知识。与传统的知识库问答(KBQA)相比,RAG技术在知识检索方面更加灵活,不仅能够从结构化的知识库中检索信息,还能够应对非结构化的自然语言文本。RAG被构建为一个应用于大型语言模型的框架,其目标是通过结合大模型的生成能力和外部知识库的检索机制,提升自然语言处理任务的效果。相较于单纯依赖大型语言模型对海量文本数据的学习,RAG允许模型在生成文本时从事实丰富的外部知识库中检索相关信息。图片与内容均源自于此链接。
2024-11-26 14:40:57
277
原创 Spark项目实战报错解决及补充:购物网站评价标签生成
总结一下在做下面这个项目时遇到的问题,原链接如下:(ps:这里只详述遇到的问题,源代码请移步原文。希望大家都能成功!!!
2023-05-29 00:01:58
220
1
原创 实验2 熟悉常用的HDFS操作
追加到原文件的开头,在HDFS中不存在与这种操作对应的命令,因此,无法使用一条命令来完成。(1)操作系统Linux(建议Ubuntu16.04或Ubuntu18.04);2.用-test检测文件是否存在,1表示文件已存在。(1)理解HDFS在Hadoop体系结构中的角色;(2)熟练使用HDFS操作常用的Shell命令;(3)熟悉HDFS操作常用的JavaAPI。3把文件传输到伪分布式中,0表示文件已存在。(2)Hadoop版本3.1.3;#覆盖原来文件,第一种命令形式。(3)JDK版本1.8;...
2022-07-28 16:30:12
3372
原创 Tomcat-如何创建动态的Web工程(Eclipse下&Tomcat文件下的webapps目录中)
在tomcat-7.0.5文件夹下的webapps文件夹中手动创建helloworld文件夹,并在其中创建WEB-INF文件夹,并在新建的文件夹中新建classes、lib文件夹和web.xml,并在web.xml中进行配置,可直接将webapps其它文件夹下的WEB-INF文件夹中的web.xml里面的内容复制粘贴到里面去,但encoding要改成UTF-8。web.xml是整个动态web工程的配置部署描述文件,可以在此配置很多web工程的组件。此时,一个完整的web工程目录就生成了。......
2022-07-26 21:57:19
712
原创 什么是Servelt? & 实操部署Web工程到Tomcat前的知识储备(Eclipse下)
5、浏览器发送一个HTTP请求,HTTP请求由Web容器分配给特定的Servlet进行处理,Servlet的本质是一个Java对象,这个对象拥有一系列的方法来处理HTTP请求。Web容器中包含了多个Servlet,特定的HTTP请求该由哪一个Servlet来处理是由Web容器中的web.xml来决定的。6、JSP本质上就是Servlet,Web服务器把每个被访问的JSP文件先翻译成对应的Servlet,然后再编译运行。是整个动态web工程的配置部署描述文件,可以在此配置很多web工程的组件。........
2022-07-26 21:40:01
238
原创 实验1 熟悉常用的Linux操作和Hadoop操作
2)使用hadoop用户登录Linux系统,启动Hadoop(Hadoop的安装目录为“/usr/local/hadoop”),为hadoop用户在HDFS中创建用户目录“/user/hadoop”(2)删除上面创建的目录“a1/a2/a3/a4”(在“/tmp”目录下面),然后查看“/tmp”目录下面存在哪些目录。(1)进入“/tmp”目录,创建一个名为“a”的目录,并查看“/tmp”目录下已经存在哪些目录。(2)在目录“/tmp”下新建目录test,再把这个目录复制到“/usr”目录下。...
2022-07-25 17:24:52
4700
原创 Java Web开发环境搭建&在eclipse中集成Tomcat
在主页标签页中servers>noserversareavaiable>finish>再双击>serverlocation>配置usetomcatinstallation和deploypathtomcat路径下webapps>ctrl+s保存>右键start启动。配置界面长这样,保存后,右键上图那个地方,点击start,会出现红色的一大串,然后stopped变成started。官网安装jdk,指定路径放在e盘java文件夹下的jdk文件夹中,并在java文件夹下创建jre文件夹。快去试试在浏览器中输入网址.
2022-07-23 22:07:22
218
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人