
大数据
文章平均质量分 64
howard_shooter
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
什么是 RAG,大模型微调,向量数据库的应用场景
这一招被实践证明还挺好用,解决了不少问题,这就是所谓的提示词工程(prompt engineering),这个过程有个需求,就是要根据问题文本,查找出和这个问题相关的背景知识文本,很自然的想到,这个查询可以去搜索引擎上查,但是有的公司的数据是私有的,搜索引擎是差不到的,那么其实就要求公司内部建立这么个搜索引擎,这是一个思路,实际上使用和搜索引擎差不多的一个东西,就是向量数据库,把背景知识(小明的妈妈。” 是我们想问大模型的问题,“小明的妈妈有三个孩子,老大叫小军,老二叫小米,老三叫小明。原创 2024-05-13 17:01:19 · 684 阅读 · 0 评论 -
召回率、精确率
这篇文章写的很好,我收藏记录一下,所谓召回率就是查全率,就是不漏掉本该是正样本(所要结果)的能力,所谓精确率就是输出的正样本是真的正样本。 通俗解释机器学习中的召回率、精确率、准确率 - 知乎 (zhihu.com)原创 2024-05-13 09:13:04 · 139 阅读 · 0 评论 -
单机搭建hadoop环境(包括hdfs、yarn、hive)
然后,下载hadoop安装包,这个包就包括了hdfs服务器和yarn服务器的执行文件和配置脚本。首先,要配置好Java的JAVA_HOME和PATH(etc/hadoop/hadoop-env.sh里的JAVA_HOME要改为本机的JAVA_HOME),还是有ssh本机的免密码登录。etc/hadoop/hdfs-site.xml (dfs.namenode.name.dir 和 dfs.namenode.data.dir)是服务器上存储元数据和数据的目录。yarn服务器,yarn的前提是hdfs服务器,原创 2024-01-28 16:56:36 · 2583 阅读 · 0 评论