- 博客(509)
- 收藏
- 关注
原创 jiagu、snownlp、jieba库横向对比
github代码中文NLP资源库:https://github.com/fighting41love/funNLPsnownlp:https://github.com/isnowfy/snownlpHanLP:https://github.com/hankcs/HanLPTHULAC:https://github.com/thunlp/THULAC-PythonJiagu:https://github.com/ownthink/Jiagusnow参考:Python - SnowNLP 情感分析与自定义训练_
2024-06-17 16:12:48
384
原创 构建搜索 API服务
前面我们已完成在Qdrant创建了startups集合,导入了startups_demo.json数据,让我们开始构建神经搜索类。为了处理传入请求,神经搜索需要两件事:1)将查询转换为向量的模型,2)Qdrant 客户端来执行搜索查询。
2024-01-02 17:46:29
797
原创 文本搜索快速实现
然而,由于可能有太多数据无法容纳单个计算机内存,因此该函数将数据上的迭代器作为输入。将对您提供的数据进行编码。您将使用一个名为 的预训练模型all-MiniLM-L6-v2。库可以让您方便地下载和使用许多预训练的模型,例如 DistilBERT、MPNet 等。现在数据已存储在 Qdrant 中,您可以向它提问并接收语义相关的结果。框架使您可以访问常见的大型语言模型,将原始数据转换为嵌入。定义了两个主要框架后,您需要指定该引擎将使用的确切模型。您需要处理您的数据,以便搜索引擎可以使用它。
2024-01-02 17:45:17
1827
原创 Qdrant向量数据库
是专为支持而设计的向量和向量,这使得它适用于各种基于的等应用。Qdrant 使用编写,即使在高负载下也能快速、可靠地工作。
2024-01-02 17:44:00
4412
原创 什么是向量数据库
向量数据库是一种应用在高效存储和查询高维向量的数据库。在传统的OLTP和OLAP数据库中(如上图所示),数据按行和列组织(这些称为表),并根据这些列中的值执行查询。然而,在某些应用程序中,包括图像识别自然语言处理和推荐系统数据通常表示为高维空间中的向量,这些向量加上id和有效负载(Payload),组成我们存储在集合中的元素。在搞清楚向量数据库之前,先需要知道什么是向量(vector)。在AI领域中,向量是一个具有大小和方向的数学对象。它可以用来表示现实世界中的各种事物,例如图像、语音、文本等。在。
2024-01-02 17:43:19
576
原创 向量数据库 Qdrant 代码实战
以下是我实现的示例项目,可参考和star一下下哈!以下截取项目部分代码,对向量数据库进行简单查询。后面我会对向量数据库做详细的分享!
2024-01-02 17:38:31
923
原创 ChatGLM 手记
报错:AttributeError: 'ChatGLMTokenizer' object has no attribute 'tokenizer'. Did you mean: 'tokenize'?解决办法:报错的transformers版本 transformers==4.34.0。修改后的transformers版本transformers==4.33.2。
2023-12-12 09:57:34
1026
原创 12 要素 12 Factor
docker的dockerfile,php的composer.json,python的requirements.txt等依赖关系声明。12-Factor 应用的开发人员应该反对在不同环境间使用不同的后端服务,本地环境,测试环境,预发布环境与线上环境应尽可能的接近。将不同的工作分配给不同的 进程类型 ,比如web任务,和常驻内存的worker,开发者可以根据类型进行构建扩容。一个应用,一个基准代码git仓库,多个环境版本部署(prod,staging,develop)尽可能的保持开发,预发布,线上环境相同。
2023-11-24 16:29:25
581
原创 使用Grpc实现高性能PHP RPC服务
其中,创建了一个 Grpc 客户端,并传入服务端地址和端口,以及相关证书信息。接着创建了一个 Request 对象,设置了其 message 属性,并调用了 Grpc 服务端内部的 SayHello 方法,获得响应结果并输出。其中,GrpcService 继承了生成的 Grpc 服务端代码中的 GrpcServiceServer 类,并实现了 SayHello 方法。在客户端代码中,需要先创建一个 Grpc 客户端,并调用服务端的 SayHello 方法。在服务端代码中,需要实现定义的服务接口。
2023-11-20 10:46:05
849
原创 qdrant 手记
github: GitHub - qdrant/qdrant: Qdrant - High-performance, massive-scale Vector Database for the next generation of AI. Also available in the cloud https://cloud.qdrant.io/GitHub - qdrant/qdrant-web-ui: Self-hosted web UI for Qdrant文档:Introduction | 🦜️🔗
2023-11-01 18:21:42
288
原创 linux deepin系统 php多版本
pecl默认在php安装目录下的bin。2. 下载php安装pecl的脚本。1.先进入php安装的bin目录。
2023-10-26 17:09:59
402
原创 git stash命令详解
https://www.cnblogs.com/grimm/p/10550438.htmlhttps://www.cnblogs.com/grimm/p/10550438.html
2023-10-09 17:08:54
99
原创 docker内存清理
docker stats 命令可以帮助我们查看运行中的 Docker 容器的内存、CPU 使用情况。可以获得容器内部的内存使用量、CPU 总使用百分比、均值、最大、最小使用量等信息。使用 docker stats 命令。Docker内存占用大。
2023-09-27 10:41:43
425
原创 Linux服务器占用处理手记
ps命令是最基本同时也是非常强大的进程查看命令,使用该命令可以确定有哪些进程正在运行和运行的状态、进程是否结束、进程有没有僵死、哪些进程占用了过多的资源等等,总之大部分信息都是可以通过执行该命令得到的。ADDR 这个是 kernel function,指出该程序在内存的那个部分。free命令可以显示当前系统未使用的和已使用的内存数目,还可以显示被内核使用的内存缓冲区。top 运行中可以通过 top 的内部命令对进程的显示方式进行控制。然后通过pmap查看对应PID的详细信息,报告进程的内存映射关系。
2023-09-20 17:53:31
199
原创 Linux常用手记
1、curl工具不带有任何参数时,curl 默认发出 GET 请求。curl工具发送带有参数的GET请求。2、curl工具发送POST请求。curl工具发送json格式请求。
2023-09-20 16:29:19
197
原创 Elasticsearch 的页面工具kibana中 dev tool 菜单使用
首先来到kibana 页面,找到 dev tool 菜单,选择Console。4、针对某个索引下,随机查询,默认查询10条。9、按照单个条件查询返回特定内容和条数。10、当同一个属性满足逻辑或时的查询。8、单条件模糊查询 match。15、filter 过滤查询。5、分页模糊查询 查询3条。11、多条件联合并且查询。12、范围查询并进行排序。13、聚合查询查范围数量。14、聚合查询 aggs。7、精确查询 term。
2023-09-20 15:38:17
981
原创 Elasticsearch 聚合检索 (分组统计)
"size": 0,"aggs": {"terms": {"order": { "avg_price": "desc" } // 根据下述统计的结果排序},"aggs": {与#2.1节内容相似, 区别在于按照价格排序显示了.
2023-09-20 15:25:37
3854
原创 VSCode手记
删除当前行:Ctrl + Shift + K。注释多行:Ctrl + Shift + /注释当前行:Ctrl + /撤销:Ctrl + Z。重做:Ctrl + Y。查找:Ctrl + F。跳转声明代码:F12。
2023-09-20 14:46:46
412
原创 php接入es扩展
es官网:Elasticsearch:官方分布式搜索和分析引擎 | Elastices官方php客户端文档:概述 | Elasticsearch-PHP | Elastic
2023-09-20 14:17:29
476
原创 stable diffusion扩展Deforum生成视频
搜索Deforum,点击install等待安装即可,安装成功后重启webui,就能看到Deforum选项。先要搭建sd webui环境,后面会详细讲该扩展的参数。
2023-05-28 22:27:42
1718
1
原创 用Colab免费部署AI绘画云平台Stable Diffusion webUI
Google Colab 版的 Stable Diffusion WebUI 1.4webui github 地址:https://github.com/sd-webui/stable-diffusion-webui。
2023-05-18 15:20:35
2037
原创 小白安装 stabel diffusion 篇
在 stable-diffusion-webui-master 文件夹下,用编辑器打开 launch.py 文件,找到 commandline_args = os.environ.get 这一行,将它修改成下面的样子,也就是将 "--skip-torch-cuda-test" 改成 "--skip-torch-cuda-test --precision full --no-half",然后保存并退出即可。看见下图的界面,代表已经成功在你的电脑上安装了 stable-diffusion 这款软件了。
2023-05-18 10:56:57
2392
4
原创 关于SD webui 部署运行的一些坑
安装完毕后,再打开stable diffusion根目录的webui-user.bat会发现不再要求安装GFPGAN。如果还是无法安装gfpgan的原因是网络问题,就算已经科学上网,并设置为全局,也无法从github上下载源代码,从而导致install失败。因为stable diffusion会在其根目录创建虚拟python环境venv,因此安装方法与github有所不同。解决方法是直接到github下载 GFPGAN 代码到本地,并进行本地安装。不过是在虚拟环境venv下的。
2023-05-18 10:51:37
3213
原创 SD webui 手记
注:出现 No module 'xformers' 和 ModuleNotFoundError: No module named 'gdown' 可以执行。git拉取代码后,windows下支持根目录直接运行 webui-user.bat,前提本地需要先安装python环境,略过,我们直接跑源码玩。来单独拉取依赖,后面的扩展同理,可以打开requirements.txt查看所需的依赖扩展。然后就可以开始的AI生成图片之旅啦,接下来会更新几期关于显卡的调用和作图指令的技巧。就会出现webui的界面。
2023-05-17 15:26:07
1927
1
原创 一键部署自己的ChatGPT
最近尝试了下ChatGPT-Next-Web项目,可以一键免费部署你的私人 ChatGPT 网页应用,整体过程非常丝滑,觉得有必要推荐给大家。只要提供api key,即可在1分钟内完成一键部署。有自己的域名的话还可以无障碍访问和使用,速度要比ChatGPT原网页都要快。部署完成后可将地址修改为自己的域名,这样就可以分享给自己身边小伙伴体验了。这个很适合作为小团队或者个人部署使用,主要是速度贼快,体验非常好。
2023-05-10 14:57:58
1421
原创 ChatGPT指令大全
2. 不需要写解释。你现在是一个 [程序语言] 专家,我有一段程序 [附上程序],请帮我写一个测试,请至少提供五个测试案例,同时要包含到极端的状况,让我能够确定这段程序的输出是正确的。写出 [数字] 个有关 [主题] 的 [社群平台] 风格标题,要遵守以下规则:[规则 1]、[规则 2]、[其他规则]。你是 [某个主题] 的专家,请针对以下论述 [附上论述],提出 [数字] 个反驳的论点,每个论点都要有佐证。你现在是 [公司] 的 [职位] 面试官,请分享在 [职位] 面试时最常会问的 [数字] 个问题。
2023-05-07 16:52:33
6542
原创 ChatGPT写作提示词指令大全
介绍XX的背景和现状,分析XX问题的原因,提出相关政策建议,如XX等,并对政策的预期效果进行分析。账号主要发布XX相关的内容,需要突出XX,吸引用户的好奇心。指令模板:XX个人,XX交通方式,去XX,预算XX,推荐下XX天的行程安排,包括吃的,住的,玩的,最好具体一点,拿来就能用,记住兼顾XX的需求(有其他特殊需求都可以加进去)。指令:一家三口,自驾从台州去杭州,女儿7岁,预算2000,推荐下2天一夜的行程安排,包括吃的,住的,玩的,最好具体一点,拿来就能用,记住兼顾小朋友的需求。
2023-05-07 16:48:00
2840
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人