chapter1 向量究竟是什么？

最新推荐文章于 2024-04-27 12:01:37 发布

原创最新推荐文章于 2024-04-27 12:01:37 发布 · 264 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#计算机 #数学

学习笔记专栏收录该内容

21 篇文章

订阅专栏

本文探讨了不同学科背景下的向量理解方式，包括物理、数学及计算机专业的视角，并介绍了向量的基本运算如向量加法与数乘等概念。

接下来的一段时间,我都是以线性代数为内容

这只是学习记录，记录而已。

想看原视频，请点击原文。

向量究竟是什么？

在不同的学生眼里：
(1)物理专业学生：就是一个箭头啊，有方向有长度。↑↓←→

(2)数学专业学生：一个坐标系中的箭头。这里写图片描述 =(p1,p2,p3)

(3)计算机专业学生：不就是数组么？这里写图片描述

向量的加法:向量的移动，可以看做数轴上加法的拓展。

向量的数乘:对向量进行拉伸或者压缩，称为缩放。

是哦，虽然表现形式不一样，但都是向量，大家高中都学过吧？

那么，很多关于向量的性质就不言而喻了吧？例如向量的加法与向量的数乘什么的。

好吧，大家下去感受感受。

还是继续推3Blue1Brown的《线性代数的本质》(微信用户请点击阅读原文)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Niracler

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

线性代数的本质（一）——什么是向量

LFasd97的博客

09-19

2270

向量的几何理解我们所熟知的向量的样子是下面这样的 v⃗=[ab]\vec{v}= \begin{bmatrix} a \\ b \end{bmatrix}v=[ab] 直观的几何理解是这个向量v⃗\vec{v}v是从原点指向坐标为(-2, 3)的箭头，如下图这里向量的两个分量能够告诉我们如何从原点出发找到这样一个箭头，这里第一个分量告诉我们先沿着x轴正方向移动-2个单位，第二个分量告诉...

线性代数的本质——几何角度理解

软工科班，擅长Matlab、C++、微信小程序开发

09-18

1714

本课程从几何的角度翻译了线代中各种核心的概念及性质，对做题和练习效果有实质性的提高，下面博主来总结一下自己的理解。

参与评论您还未登录，请先登录后发表或查看评论

向量是什么——线性代数本质（一）

据说大佬都喜欢黑色！

07-11

1130

线性代数在很多领域都有应用 计算机科学物理电力工程机械工程统计 …… 学过线性代数的学生可能都会做以下计算，但他们却不知道为什么要这样计算，它们分别代表的含义是什么？学生们对于线性代数中的几何意义的理解是非常模糊的 matrix multiplication - 矩阵乘法 the Determinant - 行列式 cross products - 交叉乘积 eigenvalues - 特...

【线性代数本质】1：向量究竟是什么

快乐江湖的博客

09-25

1466

文章目录一：不同的人如何看待向量二：坐标系中的向量表示三：坐标系中向量加法和数乘（1）相加（2）数乘一：不同的人如何看待向量向量的概念我们再熟悉不过了，他们在不同人眼中是不一样的学物理的人认为，向量是空间里面的箭头，决定一个向量的是它的方向和长度，如果两个向量这两个特征相同，那么你可以在空间中任意移动二维向量三维向量学计算机的人认为，向量是有序的数字列表，试图通过一组数字（顺序不可颠倒）去描述（专业叫建模）描述某个对象对于学数学的人，他们觉得向量可以是任何东西，只要保证两个

线性代数的本质 -向量究竟是什么（二）

haquanwen的专栏

07-07

1728

引入一些书作为坐标是一种鲁莽的行为。线性代数中最基本的组成部分是向量，因此我们首先在“向量究竟是什么”这一问题上达成共识。一般来说有三种看待向量的观点：物理学的角度，向量是一个箭头，决定向量的是向量的长度和方向，比力，只要以上两个条件具备，你可以将向量移动到任何地方。处在平面上的项目是二维的，而处在空间中的向量是三维的。计算机专业的角度认为向量是一组有序的数字列表，比如房价...

01-向量究竟是什么?

qq_21476953的博客

03-14

370

chapter29 支持向量机的回归拟合.zip_支持向量回归_支持向量机；

07-15

利用支持向量机的回归拟合混凝土抗压强度预测，适合初学者的学习和参考。

chapter28_支持向量机_

10-03

支持向量机（Support Vector Machine，SVM）是一种在机器学习领域广泛应用的监督学习模型，尤其在二分类问题上表现出色，同时也可扩展到多分类任务。它的核心思想是找到一个最优超平面，使得两类样本点被最大程度地...

chapter13_PSO.rar_PSO_pso 支持向量机_pso优化支持向量机_向量机_支持向量机

07-15

在"chapter13_PSO.m"文件中，我们可以看到作者实现了一个使用PSO进行SVM参数优化的MATLAB代码示例，这为我们提供了深入理解和支持向量机参数优化实践的一个具体工具。通过阅读和运行这个代码，我们可以更好地掌握PSO...

matlab智能算法——chapter29 支持向量机的回归拟合——混凝土抗压强度预测.rar

10-10

首先，介绍了支持向量机的基本原理，包括线性可分支持向量机、非线性支持向量机以及软间隔的概念。接着，深入讲解了支持向量回归（Support Vector Regression, SVR）的核心思想，它是一种专门用于回归分析的支持向量...

matlab智能算法——chapter28 支持向量机的分类——基于乳腺组织电阻抗特性的乳腺癌诊断.rar

10-10

由于其在处理高维数据时的优势，以及在小样本数据集上表现出的良好的泛化能力，支持向量机被广泛应用于生物信息学领域，尤其是在癌症的早期诊断中。在乳腺癌的诊断研究中，使用乳腺组织的电阻抗特性作为诊断依据是...

计算机体系结构：向量体系结构介绍

04-27

2221

通过这种方式，程序员可以在循环中根据特定条件动态选择向量中的部分元素进行处理，无需中断向量流水线，从而保持高效的向量计算性能。第一个操作数是要载入数据的目标向量寄存器，即将从存储器中读取的双精度数据向量存储到该向量寄存器中。这种情况下，向量功能单元在执行指令时会获取标量值的一个副本，并将其与向量寄存器中的每个元素进行相应操作。尽管单次向量载入或存储可能需要较长的存储器延迟时间，但由于这些操作能够并行启动和独立执行，所以在等待某一批数据载入的同时，处理器可以继续处理已载入的数据或者启动下一批数据的载入。

线性代数-抽象向量空间

weixin_41479678的博客

05-13

425

向量的本质是什么几何上看，向量是空间里的箭头数学上看，向量是一组实数对但向量的本质到底是什么向量本质上更具有空间性我们实际要处理的空间通常独立于坐标系存在函数，实际也是一种向量（的集合）两个函数相加的过程：既是这一点出两个向量的加和由此可得出：（f+g）(x)=f(x)+d(x) 类似于向量的加法再来看函数的数乘类似于向量的数乘满足以下两个条件的函数。我们说他是线性的可加性表明先加和再变换和先变换后加和的结果一致成比性表明先缩放后变换和变换后再缩放的结果一致

计算机中的向量，embedding

weixin_33695082的博客

03-05

2590

向量（Vector），计算机编程语言用语，在如VB、C、C++、Pascal、Python或者其他编程语言中的向量，就是一个存放数据的地方，类似于一维数组和链表。至于向量，通常会被用在比较两个数据的差异上举个例子，我想知道“文章 A 和文章 B 的相似度”：那么我可能会收集这些信息：文章 A 和 B 的字数差异文章 A 和 B 中相同的单词及其数量文章 A 和 B 中完全相同的句子及其数量这些信息...

线性代数的本质（1）向量究竟是什么？

Cat的博客

06-19

1万+

引入一些数作为坐标是一种鲁莽的行为。----赫尔曼·外尔一、向量线性代数中最基础、最根源的组成部分就是向量。有三种解释什么事向量？物理专业学生的视角：向量是空间中的箭头，决定一个向量的是它的长度和它所指的方向，但是只要以上两个特征相同，你可以自由移动一个向量而保持它不变。处在平面中的向量是二维的。而处在我们所生活的空间中的向量是三维的。计算机专业学生的视角：向量是有序的数字列表。计算机专业学生的视...

理解矩阵和特征向量的本质

最新发布

04-29

<think>好的，我现在要解决用户的问题：如何使用LangChain将按章节分块的文档嵌入到向量数据库的具体实现方法。用户之前已经询问过按章节分块的方法，现在想进一步了解嵌入到向量数据库的步骤。首先，我需要回顾之前的对话。用户之前得到了一个使用RecursiveCharacterTextSplitter按章节分块的代码示例，现在需要将分块后的内容进行嵌入并存储到向量数据库。根据用户提供的引用内容，特别是引用[2]和引用[3]，用户可能需要一个完整的流程，包括加载文档、分块、嵌入、存储到向量数据库，以及查询的示例。接下来，我需要确定用户的具体需求。他们可能希望有一个端到端的代码示例，涵盖从分块到存储的每一步，可能还涉及不同向量数据库的选择，比如FAISS或Chroma。用户还可能关心如何保留章节的元数据，这在检索时可能有帮助。然后，考虑用户可能遇到的潜在问题。例如，如何处理不同格式的章节标题，如何调整分块大小，或者如何选择合适的嵌入模型。引用[2]提到使用本地模型（m3e-base），所以可能需要展示如何配置本地嵌入模型，比如HuggingFaceEmbeddings。另外，用户可能需要了解如何将分块后的文档与向量数据库集成，确保每个块都被正确嵌入和存储。需要确保代码示例中的每一步都清晰，包括加载文档、分块、初始化嵌入模型、创建向量库，以及保存和加载向量库的方法。还需要考虑用户提到的引用内容中的信息，比如离线运行、支持本地存储，这些可能在代码中需要体现，比如使用本地嵌入模型和本地向量数据库存储路径。最后，确保回答的结构清晰，分步骤说明，并提供相关问题以帮助用户深入理解可能遇到的扩展问题，比如如何处理分块后的元数据，如何优化检索结果等。需要验证代码示例的正确性，比如导入的模块是否正确，参数是否合理，以及是否包含必要的注释帮助用户理解。</think>以下是使用LangChain实现按章节分块的文档嵌入向量数据库的完整代码示例，包含分块、嵌入、存储全流程： ```python from langchain.text_splitter import RecursiveCharacterTextSplitter from langchain.document_loaders import TextLoader from langchain.embeddings import HuggingFaceEmbeddings from langchain.vectorstores import FAISS # 1. 加载文档 loader = TextLoader("legal_doc.txt", encoding="utf-8") documents = loader.load() # 2. 按章节分块（增强正则表达式） chapter_splitter = RecursiveCharacterTextSplitter( separators=[ r'\n第[一二三四五六七八九十百零]+章\s+[\u4e00-\u9fa5]+', # 匹配"第X章标题" r'\n\d+\.\d+\.?\d*\s+[\u4e00-\u9fa5]+', # 匹配"1.1.1 标题" r'\n(?:附录|附件)\s+[A-Za-z0-9]+' # 匹配附录/附件 ], chunk_size=1500, # 根据实际章节长度调整 chunk_overlap=50, # 章节间保留少量重叠 keep_separator=True, add_start_index=True # 保留原始位置信息[^2] ) chunks = chapter_splitter.split_documents(documents) # 3. 初始化嵌入模型（使用本地模型） embed_model = HuggingFaceEmbeddings( model_name="m3e-base", model_kwargs={'device': 'cpu'}, # GPU可用时改为'cuda' cache_folder="./models" # 本地模型存储路径[^2] ) # 4. 创建向量库 vector_db = FAISS.from_documents( documents=chunks, embedding=embed_model, metadatas=[{"source": "法律文档", "chapter": f"第{i+1}章"} for i in range(len(chunks))] # 添加元数据[^1] ) # 5. 持久化存储 vector_db.save_local( folder_path="./vector_db/legal_doc", index_name="legal_index" ) # 6. 加载测试 loaded_db = FAISS.load_local( folder_path="./vector_db/legal_doc", embeddings=embed_model, index_name="legal_index" ) # 示例查询 query = "合同法中对违约责任的认定标准是什么？" results = loaded_db.similarity_search(query, k=3) print(f"=== 相关章节检索结果 ===") for doc in results: print(f"章节位置：{doc.metadata['chapter']}") print(f"内容摘要：{doc.page_content[:150]}...\n") ``` 关键实现要点： 1. **分块增强**：正则表达式支持多级标题（如1.1.2），添加`add_start_index`保留原始位置 2. **元数据保留**：为每个分块添加章节编号和文档来源信息[^1] 3. **本地化部署**：使用m3e-base中文嵌入模型和FAISS向量库实现完全离线运行[^2] 4. **检索优化**：相似度搜索返回前3个最相关结果，展示章节元数据