- 博客(186)
- 收藏
- 关注

原创 智能知识问答-知识库搜索方案
本文深入探讨在智能知识问答系统中的知识库的设计与实现方法,包括如何组织和管理数据存储格式以及如何进行多维度映射等关键技术。通过对这些问题的解决,可以更好地建立起高质量的知识库并提高系统的性能表现。
2024-07-22 21:10:41
1621

原创 AI世界- 客流统计
AI世界花哨技术展示AI世界-跨镜追踪 AI世界-行人属性分析 AI世界- 客流统计 AI世界-人体关键点 AI世界-热力图 AI世界-换脸 AI世界-人脸PS AI世界-三维人脸重建 AI世界-人脸密集关键点 AI世界-车辆检测客流统计精准人头检测,对输入图片进行人头的精细定位,结合跟踪、多边形ROI等技术,可以统计任何时间点或者时间段内,一个或者多个、规则或不规则区...
2018-12-11 09:21:20
3036
6

原创 go随聊-非常快的son解析包
A high-performance 100% compatible drop-in replacement of "encoding/json"吐槽一下,这么NB了一个logo都没有:)How to getgo get github.com/json-iterator/goUsage100% compatibility with standard lib和标准包完全兼容...
2018-10-31 10:49:51
2617

原创 10亿级人脸搜索
人脸检索 给定一张照片,与指定人脸库中的N个人脸进行比对,找出最相似的一张脸或多张人脸。 根据待识别人脸与现有人脸库中的人脸匹配程度,返回用户信息和匹配度,即1:N人脸检索。可用于用户身份识别、身份验证相关场景。人脸检索技术难点:单机由于内存和CPU性能限制,能够支持的人脸检索数始终都有上限,所以必须进行集群设计来提高容量。 10亿级别的人脸库存储是一个问题,按每张图片50...
2018-09-14 15:45:20
6579
原创 通俗解释机器学习中的召回率、精确率、准确率
应用场景:你刷脸支付时就算几次没检测到你的脸,最多会让你愤怒,对银行损失不大,但是如果把你的脸检测成别人的脸,就会出现金融风险,让别人替你买单,对银行损失很大。请听题:你的老板让你做一个地震预测模型(以天为单位记某一天地震为正样本,不地震为负样本),你需要预测接下来100天的地震情况。:分母是预测到的正类,精确率的提出是让模型的现有预测结果尽可能不出错(宁愿漏检,也不能让现有的预测有错):分母是原本的正类,召回率的提出是让模型预测到所有想被预测到的样本(就算多预测一些错的,也能接受)
2025-03-02 10:10:14
554
原创 linux中根目录满了
Linux中的根目录(/)是文件系统的顶层目录,包含了所有其他目录和文件。根目录满了意味着这个顶层目录下的可用空间已经耗尽。
2025-02-26 11:20:09
249
原创 jupyter配置说明
这些参数是在Jupyter Notebook或Jupyter Lab的配置文件中使用的,用来自定义服务器的行为和特性。值: '*' 表示接受所有IP地址的连接,使得Jupyter服务器可以从任何机器上访问。值: 在这个例子中,使用/bin/bash作为终端的默认shell。作用: 设置Jupyter Notebook界面显示的内存使用限制。值: True 表示用户可以更改Jupyter服务器的密码。作用: 设置用于访问Jupyter服务器的加密密码。作用: 在没有活动的情况下自动关闭服务器的超时时间。
2025-01-22 20:31:02
1198
原创 详解YOLO检测算法的训练参数
也就是说,如果你的检测画面中存在目标的一小部分,它也会检测出来。这个参数是设置数据加载时的工作线程数,也就是并行加载数据的进程数。通过将多张图像组合在一起,增加了训练样本的多样性,有助于模型更好地适应不同的视角和尺度,从而提高模型在不同场景下的鲁棒性。即便经过翻转、旋转、改变透明度,甚至放大、缩小、尺寸压缩变形,更过分的话,裁掉一部分。这时候你标记了大量的数字2,但是经过数据增强后,数据其实是5,但是标记依然是2。就拿我这个数字标号的检测来说,如果我正常标记,不改配置直接训练的话,效果可能不会太好。
2025-01-21 17:31:13
1264
原创 docker访问权限问题
若不存在docker用户组,则需要使用以下命令添加docker用户组。若存在docker用户组,则可在输出中找到docker字段。然后验证是否生效,不出意外可以正常执行docker命令了。然后执行以下命令将当前用户加入到docker用户组中。docker ps -a时看到错误信息中包含。首先查看当前存在的用户组。
2025-01-15 17:38:29
650
原创 解决国内无法访问huggingface.co
要访问:https://huggingface.co/THUDM/chatglm3-6b。要想下载对应的文件,只是换个域名即可,参数地址路径不变。要改成:https://
2024-09-26 15:06:31
2838
原创 工资重回“3000块”时代
3000元是一个心理价位,但实际上对于许多家庭来说,可能在县城生活,除了基本的生活开销,很难剩下更多的钱。也就是说,如果你的工作收入在这个“五千块定律”所设定的范围内,并且在三年内没有超过平均水平的涨幅,那么你的工作基本上就是符合这个定性框架的。这个定律指的是,在大多数行业中,无论你的专业技能有多高,如果你从事的工作没有太多的竞争优势,那么你的收入基本上限就是5000元人民币。在上海,如果你愿意加一点钱,4000元甚至5000元,你可以找一个全职阿姨给你做饭,一天三顿饭的样子。不用担心他们的家庭压力。
2024-09-16 22:28:19
593
转载 vLLM加速部署LLM
目前只支持操作系统(包括子系统),因此环境准备分为 2 部分:Linux 环境准备:我们的操作系统如果是系统,那就无需其他操作。Python 研发环境准备。拉取现成的镜像,直接拉取nvidia现成的镜像拉取成功后启动容器,在容器中进行以下操作。
2024-09-16 17:32:47
1269
原创 unicorn 部署 FastAPI 应用程序
这样就好启动一个服务,reload=True支持热重载,方便调试。本地开发调试过程中,我通常是这样启动Fastapi服务的。
2024-09-11 15:21:33
414
原创 为什么2024年生意更难做了
因为暂时看不到新的增长点。甚至说连过去还能稳定运营的生意,也在出问题。因为随着入场人数的增加,竞争加剧的趋势会把所有人都给卷进去。任何行业,只要一卷,就会丧失利润。
2024-08-30 21:54:09
1823
原创 通义千问-VL-Chat-Int4
是阿里云研发的大规模视觉语言模型(Large Vision Language Model, LVLM)。Qwen-VL 可以以图像、文本、检测框作为输入,并以文本和检测框作为输出。Qwen-VL 系列模型性能强大,具备多语言对话、多图交错对话等能力,并支持中文开放域定位和细粒度图像识别与理解。
2024-08-30 18:57:52
948
原创 nvidia cuda镜像说明
这个版本在基础的 CUDA 11.1.1 和 cuDNN 8 的开发环境基础上,还基于 Ubuntu 20.04 操作系统。这使得该镜像不仅包含了 CUDA 和 cuDNN 的开发工具,还提供了 Ubuntu 20.04 操作系统的环境。这是一个基础镜像,提供了 CUDA 11.1.1 的基本环境,但没有安装 cuDNN 库。这是一个开发镜像,适用于在已安装 CUDA 11.1.1 和 cuDNN 8 的环境中进行深度学习模型的开发。该镜像包含运行时所需的库和工具,但不包含开发工具或头文件。
2024-08-29 14:18:36
799
原创 nvidia的cuda镜像
nvcr.io/nvidia/cuda:12.2.0-runtime-ubuntu22.04nvcr.io/nvidia/cuda:12.2.0-runtime-ubuntu20.04nvcr.io/nvidia/cuda:12.2.0-runtime-ubi9nvcr.io/nvidia/cuda:12.2.0-runtime-ubi8nvcr.io/nvidia/cuda:12.2.0-runtime-ubi7nvcr.io/nvidia/cuda:12.2.0-runtime-rockyli
2024-08-28 10:15:06
1399
原创 Kibana安装
Kibana是在有了相当多的数据之后,进行分析这些数据用的工具。Kibana里面有一个叫做Dev Tools的,可以很方便地以Restful风格向服务器提交请求。
2024-08-02 21:50:07
375
原创 安装SeaweedFS
SeaweedFS 是一个简单且高度可扩展的分布式文件系统。有两个目标:to store billions of files!(存储数十亿个文件!(快速提供文件!Seaweedfs的中心节点(center master)并不会管理所有文件的元数据而仅仅管理文件卷(file volmume),文件及其元数据的管理是由volume server实现的。这可以缓解center master的并发压力,并且将文件元数据分配到volume server可以实现更快的文件访问(只需一次磁盘读取操作)。
2024-08-02 18:41:40
449
原创 智能知识问答-知识库微调和参数调整
通过调整知识库搜索时的相似度和最大搜索数量,实现从知识库层面限制聊天范围。通常我们可以设置相似度为 0.7,并设置空搜索回复内容。这意味着,如果用户的问题无法在知识库中匹配时,会直接回复预设的内容。提示词的作用是引导模型对话的方向。
2024-07-22 21:17:58
406
原创 智能知识问答-Markdown文本分割器
在处理Markdown文档时,能够根据标题结构进行智能拆分是提高处理效率和准确性的关键。这正是Markdown文本分割器发挥作用的场景。通过这个工具,我们可以基于Markdown的标题层次结构,将文档拆分成结构化的小块,每个块都包含了相应标题下的内容。这样不仅有助于保持文档的语义结构完整,还能便于后续的内容管理和信息提取。
2024-07-22 21:05:55
212
原创 智能知识问答-段落章节文本分割器
段落章节文本分割器是一个“结构感知”的分块器,能够在元素级别上拆分文本,并为每个标题“相关”的块添加元数据。这意味着它不仅仅按照简单的文本流进行拆分,而是能够理解文档的结构,按照这种结构进行智能拆分。段落章节文本分割器尽可能的保留原文章节段落结构,保证章节完整性。
2024-07-22 21:04:27
241
原创 智能知识问答-递归字符文本分割器
指定一个块长度和一组分隔符(默认的字符列表是["\n\n", "\n", " ", ""]),根据分隔符的优先顺序对文本进行预分隔,然后将小块进行合并,将大块进行递归拆分,直到获得所需的块大小,最终这些块的大小并不完全相同,但它们仍然会逼近指定的块长度。
2024-07-22 21:03:35
672
原创 智能知识问答-逻辑框图
在问答环节,系统会检索并提取与问题相关的文档块,接着构建一个提示词(Prompt),将其输入到一个大语言模型中,最终由模型生成相应的问答内容。首先,将pdf、markdown、text等格式的文档进行分割,然后转换为嵌入(Embedding)形式,并存储到向量数据库里。
2024-07-22 20:54:06
352
1.8 Golang to build a real-time interactive SaaS Cloud - 董海冰.pdf
2024-05-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人