- 博客(61)
- 资源 (2)
- 收藏
- 关注
原创 PIKE-RAG 加入Ollama模型
原代码没有Ollama,为了用本地的Ollma, 增加一个类文件放在llm_client/ollama_llm_client.py目录下。
2025-03-26 16:47:20
158
原创 llamaindex+milvus+metadata filter sample
llamaindex+milvus+metadata filter组合
2025-03-13 21:45:09
411
原创 llamaindex 中 vectorstoreindex, chat_engines, query_engines, retrievaler, RetrieverQuery关系小结
llamaindex 中 vectorstoreindex, chat_engines, query_engines, retrievaler, RetrieverQueryEngine 等关联关系,官方文档中并没有说明
2025-03-13 09:36:39
940
原创 RAG必读的一篇论文:面向大语言模型的检索增强生成技术调查
原文:https://arxiv.org/abs/2312.10997https://www.toutiao.com/article/7353475944348205620/主要作者:Yunfan Gao、Yun Xiong、Xinyu Gao、Kangxiang Jia、Jinliu Pan、Yuxi Bi、Yi Dai,特别鸣谢 Jiawei Sun 和 Haofen Wang 所属机构:1. 同济大学上海智能自主系统研究院;2. 复旦大学计算机科学学院,数据科学上海重点实验室;3. 同济大学设计与
2024-04-10 09:01:47
5180
原创 llamaindex pack中的 resume screener 改造
最近在试JD匹配简历,发现llamaindex自带了llama hub的resume screener组件,但其与最新版llamaindex有些方法过期了,试图改造resume screener pack源代码。
2024-04-08 13:51:16
282
原创 利用Langchain 0.1 AzureOpenAI 基于文本问答示例
【代码】利用Langchain 0.1 AzureOpenAI 基于文本问答示例。
2024-03-14 21:48:22
695
原创 centos7.5下superset3.0 单机安装
最近想试用开源BI superset,网上好多文章很好,但版本低,照之安装易错。记录一路安装过程中的问题,已安装成功。运行环境:Centos7.5+miniconda+pythom3.9+superset3.0。
2023-09-29 22:48:40
953
2
翻译 在IDEA下运行flink环境及web ui,debug调试
即使有一个很好的入门或一个伟大的(和免费的)实践培训,也总是有关于如何开始、如何调试问题或如何在 IDE 中启动项目的问题。在本文中,我们介绍了在本地环境中使用 Apache Flink 的基础知识和一些典型陷阱。在本地运行作业时,日志级别非常详细,可能很难在 Flink 消息之间找到您的消息。有关更多信息,请参阅 官方文档中的测试 Flink 作业。你也可以在官方的 Flink 训练测试中找到很好的例子。在 IDE 中运行 Flink 作业的好处之一是能够像往常一样使用断点调试 Flink 作业。
2023-09-19 16:47:20
1142
原创 【黑苹果升级到ventura13】 Y7000P-2018升级到 ventura13
1. 用当前的EFI进系统,点击在线升级,若第一次不成功,再点击,多试几次。刚开始是3.92G,不成功时,再点击,将会看到12G的升级包。网上能轻松找到Y7000P-2018的EFI,但是里面没有WIFI驱动。3. 升级成功后,将EFI中的WIFI驱动替换。2. 在升级时,会重启4次。我的EFI包上传百度网盘。
2022-11-01 12:35:46
2382
6
转载 mysql 直接的递归查询
目前的mysql版本中并不支持直接的递归查询,但是通过递归到迭代转化的思路,可以在一句SQL内实现树的递归查询下面给一个小示例,后续在贴上调用的代码(代码会贴在最后请注意)MySQL递归查询所有子节点,树形结构查询--表结构CREATE TABLE `address` (`id` int(11) NOT NU...
2019-07-26 12:03:02
837
转载 ArchiMate教程
ArchiMate教程OpenGroup ArchiMate语言提供了一种用于表示企业体系结构的图形化语言,包括策略,转换和迁移规划,以及架构的动机和基本原理。该标准的设计尽可能紧凑,但仍可用于大多数企业体系结构建模需求。下图显示了ArchiMate Core框架的元素。什么是ArchiMate?ArchiMate规范是一种建模语言,它使企业架构师能够使用易于理解的视觉表示来描述,分析和...
2019-05-20 13:20:22
1126
转载 企业架构研究总结(20)——TOGAF架构开发方法(ADM)之架构愿景阶段
1.2 架构愿景(Architecture Vision)企业架构开发方法各阶段——架构愿景1.2.1 目标确保架构开发循环的进展被企业管理层认知和支持,并取得必要的管理线的支持和承认。在预备阶段中明确的架构框架的整体背景之下定义和组织架构开发循环。验证业务原则、业务目标、组织的战略业务驱动力,以及企业架构的主要性能指标(KPIs)。定义基线架构的范围,明确其所包含的组件以...
2019-05-16 17:26:40
533
转载 企业架构研究总结(19)——TOGAF架构开发方法(ADM)之准备阶段
1.1 准备阶段(Preliminary)企业架构开发方法各阶段——预备阶段1.1.1 目标 预备阶段的目标是:对进行企业架构活动的组织的背景和环境进行审查。明确企业架构的赞助人,以及其他将被创建企业架构这项业务指令所影响的主要干系人,并确定他们的需求和优先级、他们与组织的关系,以及他们之间所需的工作行为。确保所有将要被涉...
2019-05-16 17:21:50
373
转载 企业架构研究总结(18)——TOGAF总论及架构开发方法(ADM)概述
TOGAF(The Open Group Architecture Framework)可以说是当前最为流行的企业架构框架理论了,截止到作者写本书之时,福布斯排行榜上排名前50的企业中已经有很大一部分在使用这一企业架构框架了,并且中国企业对它的认可度也超过了50%。TOGAF可以说是企业架构理论从政府进入到社会各研究机构的一个典型案例,...
2019-05-16 17:17:06
475
转载 企业架构研究总结(10)——写在中间的感想
好几天没有接着更新这篇企业架构研究总结了,除了忙于其他事物之外,关于之前几篇文章的几条评论也让我思考良久,我觉得在继续对企业架构和企业架构框架理论进行进一步的介绍之前,有必要停下来对一些概念进行进一步的阐明。不过,这篇文章只是基于我个人理解而来,恐有所偏失,但欢迎批评指正。 对于企业架构是否仅对大型组织或企业才有意...
2019-05-16 17:13:57
362
转载 企业架构研究总结(9)——联邦企业架构之CIO委员会的企业架构实施指南(下)
开发基线企业架构 在开发基线企业架构这一过程中,各个企业或组织需要根据已经确定的架构目标、范围和所采用的架构框架对当前自身的状态进行各种制品的开发,这既包括针对核心架构制品的开发,也包括对支持性架构制品的开发,同时还包括针对其他由于特定需求而单独定义的架构制品(简报图表、会谈纪要等)的开发。在这份CIO委员会的这份联邦企业架构指南中,关于企业架构核...
2019-05-16 17:12:50
260
转载 企业架构研究总结(8)——联邦企业架构之CIO委员会的企业架构实施指南(上)
企业生命周期 FEAF为联邦企业架构的建设提供了方法论,但是该框架还只是在概念层面提出了联邦企业架构建设过程的各组成部分以及他们之间的关系,而对于如何以步进式的方式建设企业架构,FEAF的详细程度还是不够的。那么该如何使用架构框架理论为联邦政府以及各个机构建设企业架构呢?企业架构的建设、维护和使用又该如何融入到各个机构中?面对这些问题,2001年CIO委员...
2019-05-16 17:11:49
339
转载 企业架构研究总结(7)——联邦企业架构之FEAF的出现和构成(下)
企业架构研究总结(7)——联邦企业架构之FEAF的出现和构成(下) 基于前述关于FEAF第一粒度层次的描述,在第二粒度层次中原来模型中的架构驱动力、当前架构、目标架构以及架构模型的内容被进一步从业务和设计两个方面进行了细化:FEAF第二层粒度示意图 在第二粒度层次的细...
2019-05-16 17:10:19
366
原创 企业架构研究总结(6)——联邦企业架构之FEAF的出现和构成(上)
美国联邦政府可以说是企业架构应用的先行者和最大倡导者。通过企业架构的发展历史我们可以看出,早在上世纪九十年代以来,美国军方就对这种全局性的信息共享的理论开始了研究,并开发出符合其特色企业架构框架理论(DoDAF)。除此之外,在Zachman框架引入到美国联邦政府各部门之后,首先是美国国家技术标准研究所(NIST)于1989年发布了NIST企业架构模型(NI...
2019-05-16 17:05:24
431
转载 企业架构研究总结(5)——Zachman框架
Zachman框架起源于John Zachman先生在1987年完成的那篇著名的信息系统架构论文(《A framework for information systems architecture》 ),并一直发展至今。在这篇论文中Zachman先生以修建房屋为例从两个维度将与信息系统架构设计相关的各种元素归纳到如下表格之中:表格中的每一行代...
2019-05-16 17:04:11
353
转载 企业架构研究总结(4)——企业架构与企业架构框架概论
通过企业架构的发展历程我们可以看出,经过几十年的发展业界已经涌现出了很多企业架构以及企业架构框架理论。在本章中,笔者将挑选几种主要的企业架构和企业架构框架理论进行详细阐述。需要注意的是,虽然本章定名为“企业架构与企业架构框架”,但是由于企业架构的特性所致,其真实形态在不同的企业之间差异很大,即便是联邦企业架构也只是提供了五层参考模型而已,所以对于企业架构的...
2019-05-16 17:02:42
417
转载 企业架构研究总结(3)——企业架构的发展历程
企业架构研究总结(3)——企业架构的发展历程 学习任何一项理论,我认为最好的入门方式就是探究其历史根源以及发展进程,借此阐明该理论产生的真实原因,避免读者一开始陷入各种理论所共有的晦涩之漩涡而不能自拔,最终连为什么而学都理不清楚。学习企业架构和企业架构框架理论亦然。企业架构是自上个世纪七、八十年代发展起来的一套理论,在...
2019-05-16 17:01:32
836
转载 企业架构研究总结(2)——问题的由来和基本概念
企业架构研究总结(2)——问题的由来和基本概念 自上世纪中后叶以来,随着信息技术的发展,各个工业、制造业领域,甚至是在人们的日常生活领域中,自动化以及效率提升等方面均得到了长足的发展,因此各个领域也纷纷加大了对信息技术的投资,从而形成了一个良性的循环。可以说,借助于信息技术的发展,人们的工作方式得以从传统的“蓝领式...
2019-05-16 16:56:36
501
转载 企业架构研究总结(1)——参考资料列表
企业架构研究总结(1)——参考资料列表 在2010年公司有幸参与到了某公司的企业架构建设项目之中,但对于一直从事于企业信息化建设的我们来说,由于一贯以来的努力都集中于企业的数据建模、管理和访问这些方面,像企业架构这样一门牵涉颇广的学问对我们来说还比较陌生,因而一条漫长的学习曲线是无法避免了。笔者有幸参与到这一项目之中,在漫长的学习过程中,笔者感触...
2019-05-16 16:54:41
316
转载 MLAPP 第四章 高斯模型
第四章 高斯模型4.1 介绍本章主要开始介绍多变量的高斯模型或者叫做多变量的正态模型(MVN),在整本书中,可以说这个模型是非常常见的。这一章的数学的要求是比较高的,涉及到很多的线性代数和矩阵运算。我会尽量把我会的一些计算过程详细的写出来,因为书中有些计算过程可能作者看上去比较的简单,但是我们看的时候还是会比较吃力。4.1.1 符号符号这里就...
2019-04-10 15:17:51
2481
转载 偏差-方差
学习算法的预测误差, 或者说泛化误差(generalization error)可以分解为三个部分: 偏差(bias), 方差(variance) 和噪声(noise). 在估计学习算法性能的过程中, 我们主要关注偏差与方差. 因为噪声属于不可约减的误差 (irreducible error).首先抛开机器学习的范畴, 从字面上来看待这两个词:...
2019-04-08 15:23:08
4145
1
转载 周志华西瓜书六 神经网络二
如果你喜欢本文的话,不妨点赞、分享或者关注公共号「数据搬瓦工」,上面会同步更新文章。如何有错误之处,还望大家指点,我将及时修改。本文重点讲解神经网络的「反向传播算法(BP)」首先定义一些变量:L = 神经网络的层次数 = 第 l 层包含的单元数(不包括偏置单元)K = 输出层的单元数m = 样本数代价函数代价函数 J(θ) 度量的就是这个神经网络对...
2019-04-08 08:31:50
444
转载 周志华西瓜书五 神经网络一
如果你喜欢本文的话,不妨点赞、分享或者关注公共号「数据搬瓦工」,上面会同步更新文章。神经网络当我们有一个包含许多特征的复杂假设时,神经网络则是一种解决复杂假设问题的模型。神经元神经元是神经网络中最基本的单位。神经元是一个计算单元,神经元接收到来自其他神经元传递过来的输入信号,这些输入信号通过带权重的连接进行传递,然后通过激活函数的计算以产生神经元的输出。...
2019-04-08 08:30:47
706
转载 周志华机器学习四 过拟合与正则化
上图表示了拟合数据三种情况:欠拟合(左 2 图)、较好的拟合(左 3 图)、过拟合(左 4 图)欠拟合(Underfitting):模型没有很好地捕捉到数据特征,不能够很好地拟合数据。其产生原因通常是假设函数过于简单或者使用的特征不够。其中增加特征项是欠拟合的一种解决方案。过拟合(Overfitting):由于假设函数过度拟合训练集数据而失去了泛化能力,导致对新的数据预测不好...
2019-04-08 08:29:36
484
转载 周志华西瓜书笔记一 机器学习介绍
前言我是一个机器学习的入门者。看了很多前辈大神的推荐,从西瓜书(周志华老师《机器学习》)或者 Coursera 吴恩达机器学习视频入门比较好。我比较喜欢书籍,因为做起笔记比较方便。有输入同时有输出才能让学习效率更加好,所以边读边做笔记。下面我将按照西瓜书的章节来,如果有不对的地方,还望指导学习。正文首先,通过思维导图来描述一下西瓜书第一章的知识内容与结构。...
2019-04-08 08:25:05
1308
转载 线性代数
前言AI(人工智能)现在火的一塌糊涂,其实在AI领域,机器学习已广泛应用在搜索引擎、自然语言处理、计算机视觉、生物特征识别、医学诊断、证券市场分析等领域,并且机器学习已经是各大互联网公司的基础设施,不再是一个新鲜的技术。但当你真的开始学习机器学习的时候,就会发现上手门槛其实还挺高的,这主要是因为机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂...
2019-04-04 14:03:43
1730
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人