使用 Gemma 2 构建 RAG的全过程（ Ollama 或 Hugginface ）

最新推荐文章于 2025-02-16 10:00:00 发布

原创最新推荐文章于 2025-02-16 10:00:00 发布 · 734 阅读

10 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #AIGC #产品经理 #人工智能 #语言模型

没错，这两天关于Gemma2 9B、27B开源的消息又刷屏了，如果你还不知道的话，可以搜搜看看，还是挺不错的。

▲ 从这组官方的对比数据看出，能力已经力压llama3，甚至gemma:27b的能力也接近了llama3 70b，看来模型真的是在往小了发展，越来越接地气，我们老百姓的普通电脑配置也能跑起来！

既然老百姓的普通电脑都能跑了（9B），那我们就介绍使用 Gemma 2 构建 RAG的全过程：

步骤一：下载和安装Gemma 2

首先，您需要在本地计算机上安装Ollama，这是一个终端应用程序，可以帮助您下载大型语言模型，例如Gemma 2。只需打开终端，复制并粘贴以下命令即可：ollama run gemma``2。这将把模型下载到你的计算机上。

我已经完成了这一步，现在我们继续在代码编辑器中安装必要的包。

# 要下载的软件包列表      ```python   # 安装所需的软件包   #!pip install transformers   #!pip install langchain-chroma   #!pip install langchain   #!pip install langchain_community   #!pip install langchainhub   #pip install langchain-huggingface   #pip install --upgrade --quiet langchain sentence_transformers   #!pip install -U "huggingface_hub[cli]"   #!huggingface-cli login

步骤二：加载和转换数据

接下来，我们将从一个网站加载数据，这里选择了关于LeBron James的网站。尽管有观众在我之前的视频中表示偏好其他球员，但我选择这个网站是因为它包含了复杂的数据，能够很好地测试模型的性能。我们将使用一个网络数据加载器来加载数据，并将其转换为一个名为Chroma DB的向量数据库。

from langchain_community.document_loaders import WebBaseLoader      # 加载数据   loader = WebBaseLoader("https://www.nba.com/player/2544/lebron-james")   data = loader.load()   data

将数据转换为向量数据库

from langchain.vectorstores import Chroma   from langchain_huggingface import HuggingFaceEmbeddings      # 使用 HuggingFace 的嵌入模型   embeddings_model = HuggingFaceEmbeddings() # 例如 sentence-transformers/all-mpnet-base-v2      # 创建 Chroma 向量数据库   vectorstore = Chroma.from_documents(documents=data, embedding=embeddings_model, persist_directory="./chroma_db")

步骤三：构建RAG管道

在这个步骤中，我们将导入所需的各种包，如chatolama、output parser、chat prompt等，并导入Transformers包。接着，使用chatolama加载Gemma 2模型，并从Lang chain Hub导入一个RAG prompt。我们会创建一个QA链，传入我们选择的LLM（Gemma 2）、检索器和RAG prompt，然后运行这个链，传入问题并检视结果。

from langchain_community.chat_models importChatOllama   from langchain_core.output_parsers importStrOutputParser   from langchain_core.prompts importChatPromptTemplate   from langchain.chains importRetrievalQA   from langchain import hub   from langchain_huggingface.llms importHuggingFacePipeline   from transformers importAutoModelForCausalLM,AutoTokenizer, pipeline      # 使用 ChatOllama 模型   llm =ChatOllama(model="gemma2")      # 拉取 RAG 提示模板   prompt = hub.pull("rlm/rag-prompt")      # 使用向量数据库创建检索器   vectorstore =Chroma(persist_directory="./chroma_db", embedding_function=HuggingFaceEmbeddings())      # 创建 RetrievalQA 链   qa_chain =RetrievalQA.from_chain_type(       llm,       retriever=vectorstore.as_retriever(),       chain_type_kwargs={"prompt": prompt}   )      # 提问并获取结果   question ="这些统计数据属于谁？"   result = qa_chain({"query": question})      # 输出结果   print(result["result"])

以上代码包含了所有步骤，从安装软件包、加载数据、创建向量数据库到创建 RAG 管道，并最终进行问答。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述