- 博客(116)
- 资源 (3)
- 收藏
- 关注
原创 使用Github Action将Docker镜像转存到阿里云私有仓库,供国内服务器使用,免费易用
方法原视频非常有用,这几天,想使用镜像来部署项目。试了很多方法在镜像官网,不能很好的pull 镜像。这个视频中给出了一种中转方法。注意::因为视频的时间较早,阿里云使用界面略有变化但是基本上,方法步骤是一样的。按照步骤操作,应该不会出问题。
2024-11-27 09:53:11
1443
1
转载 Ubuntu系统中NVIDIA-SMI 报错:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver.
当服务器未安装NVIDIA驱动程序,或驱动程序版本与显卡不匹配时,或者安装了某些系统软件或系统更新了内核时,服务器重启后可能无法连接到NVIDIA驱动程序。报错原因:NVIDIA-SMI失败,因为它无法与NVIDIA驱动程序通信。
2024-09-05 09:59:07
3151
原创 电脑重启后,不能远程连接服务器,该如何解决
电脑重启后,不能远程连接服务器,这是一个突发事件,令人崩溃这种情况一般,问题出在以下几个方面。逐一排查,大概率可以解决问题。
2024-07-02 15:11:56
1608
1
翻译 读:迈向LangChain 0.1:LangChain-Core和LangChain-Community
LLM 应用程序的调试非常棘手。了解步骤的确切顺序是什么、输入到底是什么以及输出到底是什么可以大大提高您的提示速度。我们建立了 LangSmith 来极大地促进这一点——稍后会详细介绍。
2024-01-12 10:44:44
2000
原创 使用Docker快速部署Flask接口服务二:部署深度学习模型算法
这里我依然利用部署服务:部署服务主要包括docker镜像和服务代码。docker镜像主要是服务代码的运行环境;服务是以flask为框架且利用gunicorn实现并发。优点:隔离运行环境;服务启动简单;便于迁移。
2024-01-09 16:50:03
131
原创 Python的sort()与sorted()排序函数的区别
在Python中,sort()方法和sorted()函数背后的排序机制是基于Tim Peters开发的Timsort算法。查找或创建自然运行:Timsort首先遍历数据,查找自然有序的小段,称为“运行”(runs),这些可以是已经排好序的子列表。尽管sort()和sorted()使用相同的排序算法(Timsort),它们在数据处理方式上存在差异,体现在是否会改变原始数据以及它们各自的适用范围。在Python中,你可以使用内置的sort()方法或者sorted()函数对列表进行排序。
2023-12-08 10:47:58
364
1
原创 NLP中几个简单的,字符串相似度计算方法
用预训练的词嵌入(如Word2Vec或GloVe)来表示文本,可以捕捉到词汇的语义信息,然后通过计算向量之间的距离(如余弦距离)来衡量相似性。: 这是一个衡量两个字符串相似度的经典方法,它通过计算将一个字符串转换成另一个字符串所需的最少单字符编辑操作次数(插入、删除或替换)来表示。: 在这种方法中,文本首先被转换为向量(例如,使用词袋模型),然后计算这两个向量之间的余弦角度,以此来度量它们的相似性。: 这种方法计算两组之间的交集与并集的比例,通常用于衡量基于集合(如单词集合)的相似度。
2023-12-05 13:57:37
2031
原创 CSV文件中使用insert 函数在指定列循环插入不同数据
这个表达式比较df2中的’id’列的每个值是否等于从df1中提取的id_value_1。其中,文件一与文件二的ID列是有关系,就是,这两个文件的ID列的值是一样的,但是位置可能不一样。ID ,name,age,身高,class。:这个循环遍历刚才找到的匹配索引的列表。文件二:merged_file.csv。:将这些索引转换成Python列表。结合在一起,这段代码就是在对。进行迭代的过程中,对于每一行,都在。:取出满足条件的那些行的索引。现在有个需求就是,将。明白需求了吧=====:这是在当前迭代中从。
2023-12-05 10:42:04
467
原创 为什么是LangChain?
我们知道因为一些不得已的原因,一些国外比较优秀的技术,我们不能看到,比如,如果我们想要借助 OpenAI 或 Hugging Face 创建基于大语言模型的应用程序。若非一些特殊方法,是难以实现的。从cahtgpt发布到今天不过一年时间,市面上的LLM已经百花齐放,不得不感慨技术革命的速度,为了能轻松构建大语言模型应用。不得不提起一个非常强大的第三方开源库:LangChain。官方文档这个库目前非常活跃,已经67Kstart了,每天都在迭代,更新速度飞快。
2023-11-06 17:20:03
1071
原创 ChatGLM3 模型学习与实战
智谱AI于27日论坛上推出了全自研的第三代基座大模型ChatGLM3及相关系列产品,这也是智谱AI继推出千亿基座的对话模型ChatGLM和ChatGLM2之后的又一次重大突破。
2023-10-30 10:55:32
2763
原创 pycharm远程连接Linux服务器
一种是 连接服务器,只是将pycharm作为一个可视化界面,也就是不将服务器中的虚拟环境不作为本地pycharm的使用环境。有时候,为了方便代码管理,以及更加方便的使用服务器资源,选择将编辑器与服务器远程连接是个不错的方法。可以看到我这里两个项目文件名字一样,这样只是为了方便我自己识别,你也可以不一样。,其他跟我一样就行,做完这些后尝试连接(就是红色框中的按钮)目的就是,咱们不用手动操作,上传服务器,就可以文件自动同步。二种是,将服务器的虚拟环境配置为pycharm的环境。连接方法有很多,这里值说两种。
2023-10-26 11:22:37
6000
原创 Pycharm 中 py 文件预设 文件头部信息
文件File–设置Settings–编辑器Editor–File and Code Templates- Python Script” 里面设置模板。- 在文件创建过程中在“新建文件”对话框中指定的新文件的名称。作者可以直接写自己的名字,而不使用 $ {USER}- 月份名称的前3个字母。- 将在其中创建文件的IDE的名称。- 当前用户的登录名。- 当前项目的名称。- 当前的系统日期。
2023-10-25 19:21:46
1126
原创 使用 docker 快速部署 flask接口服务 一
并且,这种方法有个弊端就是,一旦我的项目有什么变化,可能就需要重新构建镜像。可以使用gunicorn命令来测试是否可以正确运行,命令如下,打开网址127.0.0.1:80,将会打开我们的网站。:该 image 文件继承官方的 python,冒号表示标签,这里标签是3.9.5,即3.9.5版本的 python。排除的路径,注意:这个文件,根据自己需要创建,也就是项目中有些文件不需要放入镜像中,就将这些文件路径放入。docker的安装 和启动 ,以及 镜像和容器的 增删改查工作,网上有很多教程。
2023-10-23 18:12:21
2544
原创 力扣、每日一练:删除并获得点数
动态规划思想的应用:这道题通过使用动态规划的思想,将原问题拆解成子问题,并通过状态转移方程推导出最优解。这让我对动态规划的应用有了更深入的理解。处理数组元素的技巧:在解决这道题时,我们需要根据当前元素的选择情况来更新dp数组的值。这让我学会了如何巧妙地处理数组元素,并利用它们来构建状态转移方程。灵活运用Python语言实现算法:通过编写这道题的解题代码,我巩固了使用Python语言实现算法的能力。Python的简洁和灵活性让我能够快速地实现并调试算法代码。
2023-10-08 11:27:30
235
原创 知识图谱基本工具Neo4j使用笔记 五 :APOC插件安装及简单应用
APOC(Awesome Procedures on Cypher)是Neo4j图数据库的一个插件,它提供了一组强大的过程和函数,扩展了Cypher查询语言的功能。另外,apoc插件本身也是需要和neo4j的版本号一一对应的,两者是需要版本兼容的关系。使用APOC插件需要先下载并安装它,然后在Neo4j的配置文件中启用它。一旦启用,你就可以在Cypher查询中使用APOC提供的各种过程和函数了。正常情况情况下,配置到第五步就结束了,大概率配置成功了、但是我正好是不幸运的一拨人。直接复制到这个文件夹 就行。
2023-09-14 16:09:56
15247
9
原创 Python中的一些常用操作
关键理解:就是说 expand_dim(input,axis=[]) input的shape是固定的,扩展的结果就是在相应的维度上进行扩展,在此基础上,从PDF文件中提取表格数据,一种思路就是将提取出来的列表视为一个字符串就,#pie_chart = pygal.Radar() # 可以实现正六边型的趋势绘制。#pie_chart = pygal.Line() # 实现多重曲线趋势的绘制。综合来看,pdfplumber库的性能较佳,能提取出完整、且相对规范的表格。
2023-08-29 11:46:12
286
原创 Python生成给定列表的笛卡尔积
函数是Python标准库中的一个函数,位于itertools模块中。它用于生成多个可迭代对象的笛卡尔积。。*iterables:表示接受多个可迭代对象作为参数,这些对象将用来生成笛卡尔积。每个可迭代对象代表输入集合的一个维度。repeat:可选参数,表示重复生成的次数。返回值:一个迭代器,该迭代器生成所有可能的组合。下面是一个更详细的示例,展示了# 定义两个可迭代对象# 调用itertools.product函数并传入两个可迭代对象# 使用for循环遍历迭代器并打印结果('a', 1)
2023-08-24 17:11:27
302
原创 我的创作纪念日
在日常的创作中,我不仅获得了专业知识和技术技能的提升,也拓展了自己的视野和思维方式。同时,我也希望能够成为团队中的技术领导者,指导和培养年轻的算法工程师,分享我的经验和知识。我希望通过我的文字和见解,帮助更多的人理解和应用算法和技术,推动整个行业的发展。除了技术文章,我也计划探索其他形式的创作,例如写作关于算法思维和工程实践的书籍,或者制作在线教育课程,传递我的知识和经验给更多的学习者。我不断寻找新的话题,扩展我的技术广度和深度。我相信,通过持续的学习和进步,我可以取得更多的成就,并实现更高的职业追求。
2023-08-23 09:50:21
126
原创 知识图谱基本工具Neo4j使用笔记 四 :使用csv文件批量导入图谱数据
-database: 指定要导入的数据库名称。--mode: 指定导入模式,有两种可选值:csv 和 database。默认为 csv 模式,表示从 CSV 文件导入数据。--nodes: 指定包含节点数据的 CSV 文件路径。可以指定多个节点文件。: 指定包含关系数据的 CSV 文件路径。可以指定多个关系文件。: 指定 CSV 文件中字段之间的分隔符,默认为逗号 ,。: 指定 CSV 文件中数组类型字段中元素之间的分隔符,默认为;。: 如果关系中的节点不存在是否忽略,默认为 false。
2023-08-12 14:24:44
4711
5
原创 AI领域常用大模型地址及下载方法(持续更新)
为了方便大家使用UIE的强大能力,PaddleNLP借鉴该论文的方法,基于ERNIE 3.0知识增强预训练模型,训练并开源了首个中文通用信息抽取模型UIE。该模型可以支持不限定行业领域和抽取目标的关键信息抽取,实现零样本快速冷启动,并具备优秀的小样本微调能力,快速适配特定的抽取目标。在商业知识图谱数据开放基础之上,我们还开放了部分知识图谱技术平台能力,开源了若干知识图谱构建、融合、推理和应用工具,以促进知识图谱技术社区的发展。现在大模型比较多,平时需要调试对比,就把这些大模型简单一个收集。
2023-07-11 15:44:13
17658
原创 知识图谱构建系列:总纲
目前就职于一家B2C的电商公司,现在需求是想构建公司业务知识图谱来进行为业务节点进行数字赋能,说实在的领导给指定的方向比较宽泛,仅仅是给了一个方向,具体该怎么做,如何做,有点迷惑。写点博客记录下,从0到1构建电商知识图谱,从前期拿到任务,调研,技术选型,设计,实现,落地,上线,优化。有了解的朋友可以一起交流。
2023-07-01 15:57:46
341
1
原创 人生苦短,我用Python 九:Flask接口并发处理:多进程、多线程
让这个接口可以并发处理10个请求任务,每个任务中有7个子线程任务,这7个子线程任务,为的是加快,每个请求任务的处理速度。当收到一个请求时,它会创建7个子线程,并将每个子线程的目标函数设置为。任务,以加快每个请求任务的处理速度。每个子线程在自己的上下文中独立执行,以实现并行处理。每个进程和线程在自己的上下文中独立执行,以实现并行和加速处理。函数内部,你可以编写具体的处理逻辑,根据需要执行相应的操作。函数内部,你可以编写具体的处理逻辑,根据需要执行相应的操作。来并发处理任务,每个任务执行。
2023-06-30 16:33:06
9435
5
原创 力扣、每日一练:爬楼梯
通过解决这个题目,我们学习了动态规划的基本思想和应用。动态规划是一种高效解决问题的算法思想,通过将问题拆分成多个子问题,并保存子问题的解,可以避免重复计算,提高算法的效率。在解决具体问题时,我们需要定义好状态和状态转移方程,然后利用迭代计算的方式求解问题的解。同时,还需要注意边界条件的处理,保证算法的正确性。
2023-06-30 11:23:40
837
原创 力扣、每日一练:删除重复项
通过这个题目,我们学习了如何使用双指针的方法来处理数组中的元素。这种方法可以在不使用额外空间的情况下,对数组进行修改和操作。同时,我们也复习了数组和双指针的相关知识点。这个题目对于加深对数组和双指针的理解以及编程能力的提升都非常有帮助。
2023-06-30 11:13:07
493
原创 ChatGPT微调系列一:微调 流程
ChatGPT出来时间也不短了,最近听同事们说在面试时候,很多公司都会问,有没有微调GPT的经历,因此觉得,这东西需要掌握住,正好公司自己搭建的平台,api秘钥也是免费用,就趁着这个机会,好好琢磨下这个东西。第二:微调用的数据第三:微调的一些特殊用法第四:实际例子分析。
2023-06-29 17:51:15
6510
原创 力扣、每日一练:合并两个有序数组
通过解决这个问题,我们学习了如何利用双指针和数组的特性来合并两个有序数组。这种方法避免了使用额外空间,并以时间复杂度 O(m+n) 完成了合并操作。同时,这道题也让我们更加熟悉了Python语言中对数组的操作,如下标访问和指针移动。
2023-06-29 09:37:39
479
原创 力扣、每日一练:找不同
通过解决这个问题,我们学习了如何使用哈希表来统计字符出现的次数,以及如何在字符串中查找被添加的字符。此外,我们还巩固了对字符串和哈希表的操作。同时,这道题也让我们更加熟悉了Python语言的一些特性,如字典操作和遍历。
2023-06-29 09:30:28
373
原创 力扣、每日一练:回文数
通过解决这道题目,熟悉了字符串操作和回文数判断的方法。同时也加深了对指针的运用和掌握。这道题目还提醒了我们在解决问题时要从不同角度思考,并且能够灵活运用编程语言的特性来解决问题。
2023-06-28 09:19:21
382
原创 力扣、每日一练:两数之和
这道题考察的是哈希表的思想和实现方式,掌握了哈希表的基本概念和操作,对于许多算法问题都会有很大的帮助。此外,在实现过程中需要注意一些细节,例如在哈希表中存储的值应该是数组的下标,而不是数组的元素值。
2023-06-27 13:48:14
353
原创 MySQL在进行数据增删改查时候出现:not enough arguments for format string
具体来说,您可能需要检查您的SQL语句中占位符的数量与您提供的参数数量是否匹配。例如,如果你在格式字符串中有两个占位符{result}和{id},但是你只提供了一个值,则会出现该错误。但是,在 SQL 查询中,你需要确保传递的参数值与列的数据类型匹配,并且使用适当的转义字符以避免 SQL 注入攻击。例如,如果你在使用.format()方法时忘记提供足够的参数,或者位置不正确,则会出现类似的错误。在这两种情况下,Python都会尝试将格式字符串中的大括号解析为占位符,但是由于缺少必要的参数而失败,并抛出“
2023-06-27 11:48:53
1633
原创 【科普文章】ChatGPT3.5:什么是GPT3.5,它与GPT4的区别
ChatGPT3.5: 自然语言处理领域最先进的聊天机器人当今,自然语言处理技术已经成为了人工智能领域的重要分支之一。在这方面,聊天机器人是非常重要的应用之一。聊天机器人可以被广泛应用于智能客服、智能家居、社交媒体、智能助理等领域。而ChatGPT3.5则是自然语言处理领域最先进的聊天机器人之一。本文将介绍ChatGPT3.5的原理和应用。
2023-06-26 19:30:59
15173
2
原创 国产chatgpt:基于chatGLM微调nlp信息抽取任务
零样本和少样本是机器学习领域中常见的两个概念,特别是在图像识别、自然语言处理等领域中应用较为广泛。所谓的零样本学习是指模型在没有任何样本数据的情况下进行预测;而少样本学习则是指模型只有很少的样本数据时进行预测。schema = {
2023-06-26 14:44:15
7777
19
原创 国产chatgpt:基于chatGLM微调nlp分类任务
随着深度学习算法和计算能力的不断发展,越来越多的领域开始使用大型预训练语言模型,例如BERT、GPT-2和RoBERTa等。,来改进模型的性能和适应性。降低开发成本:直接使用已有的预训练模型和数据集,不需要从头开始构建自然语言处理应用程序,可以大大降低开发成本。这些模型可以直接在用户的应用程序中使用,也可以通过微调进行定制和优化以适应特定的任务。微调模型:基于已有的预训练模型,在自己的数据集上进行微调,得到适用于自己应用场景的模型。提供了大量高质量的预训练模型,可以直接使用已有的模型进行微调或者迁移学习。
2023-06-26 13:39:11
7309
14
原创 ChatGPT:如何利用ChatGPT微调分类任务
模型:这是一种专门针对中文语言的 GPT 模型,特别适用于各种文本生成任务,例如写作、聊天机器人、翻译等。模型:与 GPT-3 相比,GPT-2 是一种旧的模型,但仍然非常有效。模型:这是一个专为生成图像而设计的模型,它可以根据文字描述生成各种形状的图像。模型:这是一种具有编程能力的人工智能模型,可以理解代码并生成新的代码。较高的温度值会产生更多随机和多样化的输出,而较低的值则会生成更加保守和可预测的输出。:这是一个可选的字符串列表,你可以用它来指定模型何时应停止生成文本。它有助于控制生成的文本长度。
2023-06-26 10:09:02
1674
5
原创 【已解决】 Ubuntu 16.0.4重启后,共享文件夹丢失问题
文件是一个重要的配置文件,它包含了系统启动时需要挂载的所有文件系统的信息。每次系统启动时,Ubuntu会自动调用fstab文件,以便挂载指定的文件系统,从而将其作为磁盘驱动器使用。当您在Ubuntu中设置了共享文件夹后,Samba会在系统启动时加载,并将配置信息保存到。:通常情况下,fstab文件只能由root用户编辑,因为其中的信息关系到系统的稳定性和安全性。然而,如果您重新启动系统或虚拟机,这些配置信息可能会丢失,因此您需要重新设置共享文件夹以便在下次启动时正确加载Samba配置。
2023-06-25 12:00:10
2235
3
原创 ChatGPT:开启人工智能的新时代
随着人工智能技术的不断发展,自然语言处理成为了许多企业和研究机构关注的焦点。在此背景下,ChatGPT 技术应运而生,成为了推动自然语言处理领域发展的重要力量。Generative Pre-trained Transformer(简称 GPT)是一种基于深度学习的神经网络模型,它使用Transformer架构进行文本生成。与其他模型相比,GPT具有更高的准确性,并且可以生成如同人类所写的高质量文章。目前,GPT已经被广泛应用于自然语言处理、文本分类、机器翻译等各种领域。
2023-06-21 15:36:28
6513
3
原创 第一天,PyTorch张量的运算
方法,它将张量中所有元素都加上1,并直接改变了原始张量的值。这意味着,当我们执行a.add_(1)时,张量a中的每个元素都会增加1,而不会创建新的变量。:在深度学习中,我们通常需要对数据进行预处理和转换。:神经网络是深度学习的核心,它是由多个层组成的,每一层都包含了一些张量的运算。在神经网络中,张量的运算被广泛应用于计算输入和输出之间的权重、偏差、激活函数等。张量运算,包括算术、线性代数、矩阵运算(转置、索引、切片)、采样等。为此,我们需要使用各种张量的运算来计算模型的精度、召回率、F1得分等指标。
2023-06-21 10:28:53
1167
原创 torch.cat函数在二维,三维数据中拼接时候 dim维度 理解
当dim = 0时候,按行拼接(或者叫列合并),此时输出的结果中应当包含拼接数据的所有行当dim = 1时候,按列拼接(或者叫行合并),此时输出的结果中应当包含拼接数据的所有列。
2023-06-20 12:07:16
3337
2
原创 人生苦短,我用Python 八:函数封装时候进行类型提示(Type Hints)
类型提示(Type Hints),它是Python 3.5版本引入的一个功能。通过使用类型提示,你可以在函数定义中添加注释来指定参数和返回值的类型。这有助于提高代码的可读性和可维护性,并且还可以帮助IDE等工具提供更好的自动补全和错误检查功能。尽管类型提示不是强制执行的,但它已经成为Python社区中常见的实践之一。
2023-06-20 10:41:42
381
Python智慧教室:具备群体课堂专注度分析、考试作弊系统、动态点名等功能【源码】.zip
2023-11-06
大模型技术学习资料大全
2024-04-30
关于#MySQL#的问题,如何解决?
2023-06-28
TA创建的收藏夹 TA关注的收藏夹
TA关注的人