
大语言模型
文章平均质量分 78
预训练大语言模型,开源的中文LLM、英文LLM,大语言模型的垂直领域应用
szZack
写一点过往的积累。
展开
-
【大模型】 炸裂!!阿里开源大模型 Qwen/QwQ-32B 性能追平 DeepSeek-R1、o1-mini
【大模型】 炸裂!!阿里开源大模型 Qwen/QwQ-32B 性能追平 DeepSeek-R1、o1-mini原创 2025-03-06 12:11:16 · 937 阅读 · 0 评论 -
DeepSeek 开源周第二天开源项目 DeepEP!太强了!!
DeepSeek 开源周第二天开源项目 DeepEP!太强了!!原创 2025-02-25 23:18:21 · 153 阅读 · 0 评论 -
4*A100 部署 deepseek-r1-671B
4*A100 部署 deepseek-r1-671B原创 2025-02-25 23:01:21 · 843 阅读 · 0 评论 -
【大模型】 大模型 deepseek-ai/DeepSeek-R1-Distill-Qwen-7B
大模型 deepseek-ai/DeepSeek-R1-Distill-Qwen-7B原创 2025-02-15 09:11:41 · 843 阅读 · 0 评论 -
【embedding 模型】 大模型 RAG 模型:bge-m3
【embedding 模型】 大模型 RAG 模型:bge-m3原创 2024-10-29 13:38:34 · 3052 阅读 · 0 评论 -
【大模型】 大模型 Qwen/Qwen2.5-7B-Instruct
【大模型】 大模型 Qwen/Qwen2.5-7B-Instruct原创 2024-10-19 10:30:12 · 2187 阅读 · 0 评论 -
【大模型】 端侧大模型 Qwen/Qwen2.5-1.5B-Instruct
【大模型】 端侧大模型 Qwen/Qwen2.5-1.5B-Instruct原创 2024-10-19 10:27:45 · 3152 阅读 · 0 评论 -
【多模态大模型】 端侧多模态模型 Qwen2-VL-2B-Instruct
【多模态大模型】 端侧多模态模型 Qwen2-VL-2B-Instruct原创 2024-10-19 10:25:19 · 962 阅读 · 0 评论 -
【大模型】 大模型Agent
大模型Agent,四大核心部分:Action、Memory、Planning、Tools原创 2024-07-31 13:41:09 · 450 阅读 · 0 评论 -
【大模型】 Qwen2 来了,27 种语言支持,上下文长度支持最高达到 128K tokens
【大模型】 Qwen2 来了,27 种语言支持,最高达到128K tokens原创 2024-06-07 09:54:26 · 5853 阅读 · 1 评论 -
【大模型】 智谱 AI 的 GLM-4 来了,26 种语言支持,最高支持 1M 上下文长度(约 200 万中文字符)
智谱 AI 的 GLM-4 来了,26 种语言支持,最高支持 1M 上下文长度(约 200 万中文字符)原创 2024-06-05 11:13:58 · 1236 阅读 · 0 评论 -
【大模型】Llama3-8B报错_sentencepiece.SentencePieceProcessor_LoadFromFile(self, arg) TypeError:not a string
【大模型】Llama3-8B报错_sentencepiece.SentencePieceProcessor_LoadFromFile(self, arg) TypeError:not a string原创 2024-06-04 11:34:53 · 809 阅读 · 0 评论 -
【大模型】运行Qwen1.5大模型报错AttributeError: property ‘seen_tokens‘ of ‘DynamicCache‘ object has no setter
运行Qwen1.5大模型报错AttributeError: property 'seen_tokens' of 'DynamicCache' object has no setter原创 2024-05-11 09:29:11 · 1005 阅读 · 1 评论 -
【大模型】解决报错ValueError: Tokenizer class Qwen2Tokenizer does not exist or is not currently imported.
【大模型】解决报错ValueError: Tokenizer class Qwen2Tokenizer does not exist or is not currently imported.原创 2024-04-29 18:00:06 · 4177 阅读 · 0 评论 -
【大模型】大模型 CPU 推理之 llama.cpp
【大模型】大模型 CPU 推理之 llama.cpp原创 2024-04-02 07:17:37 · 3231 阅读 · 0 评论 -
【大模型】return _sentencepiece.SentencePieceProcessor_LoadFromFile(self, arg) TypeError: not a string
return _sentencepiece.SentencePieceProcessor_LoadFromFile(self, arg) TypeError: not a string原创 2024-03-27 13:55:21 · 524 阅读 · 0 评论 -
【大模型】非常好用的大语言模型推理框架 ipex-llm
非常好用的大语言模型推理框架 bigdl-llm,现改名为 ipex-llm原创 2024-03-27 09:24:29 · 1750 阅读 · 0 评论 -
无需 VPN 即可急速下载 huggingface 上的 LLM 模型
无需 VPN 即可急速下载 huggingface 上的 LLM 模型原创 2024-03-26 11:24:46 · 847 阅读 · 0 评论 -
【大模型】0.5B的大模型通义千问1.5-0.5B-Chat来了!!
通义千问1.5-0.5B-Chat原创 2024-02-17 19:56:54 · 4382 阅读 · 1 评论 -
Could not build wheels for pycocotools, which is required to install pyproject.toml-based projects
Failed to build pycocotoolsERROR: Could not build wheels for pycocotools, which is required to install pyproject.toml-based projects原创 2023-12-29 14:43:00 · 1037 阅读 · 0 评论 -
【大模型】LLM显存占用对比:Qwen-7B-Chat,Qwen-14B-Chat-Int8,chatglm3-6b
LLM显存占用对比:Qwen-7B-Chat,Qwen-14B-Chat-Int8,chatglm3-6b原创 2023-12-22 19:54:37 · 9989 阅读 · 1 评论 -
【大模型】chatglm3-6b 本地推理
chatglm3-6b 本地推理原创 2023-12-16 11:07:46 · 1038 阅读 · 0 评论 -
【大模型】通义千问safetensors_rust.SafetensorError: Error while deserializing header: HeaderTooLarge解决方法
通义千问safetensors_rust.SafetensorError原创 2023-12-16 09:48:18 · 14454 阅读 · 8 评论 -
【大模型】更强的 ChatGLM3-6B 来了,开源可商用
ChatGLM3-6B原创 2023-12-02 16:55:41 · 3532 阅读 · 0 评论 -
【大模型】更强的开源可商用的中英文大语言模型baichuan2来了,从零开始搭建
baichuan2原创 2023-09-10 17:26:39 · 1149 阅读 · 0 评论 -
【大模型】基于 LlaMA2 的高 star 的 GitHub 开源项目汇总
基于 LlaMA2 的高 star 的 GitHub 开源项目汇总原创 2023-08-24 09:54:07 · 5071 阅读 · 1 评论 -
【大模型】长度 32K 上下文的 ChatGLM2-6B-32K 来了,开源可商用
长度 32K 上下文的大模型 ChatGLM2-6B-32K 来了,开源可商用原创 2023-08-11 15:51:47 · 4891 阅读 · 0 评论 -
【大模型】开源且可商用的大模型通义千问-7B(Qwen-7B)来了
通义千问-7B(Qwen-7B)原创 2023-08-04 18:05:39 · 5686 阅读 · 1 评论 -
【AI实战】开源中文 llama2 来了,30 分钟搭建 130 亿参数大模型 Llama2-Chinese-13b-Chat
开源中文 llama2 来了,30 分钟搭建 130 亿参数大模型 Llama2-Chinese-13b-Chat原创 2023-08-01 10:48:32 · 11987 阅读 · 1 评论 -
【大模型】更强的 LLaMA2 来了,开源可商用、与 ChatGPT 齐平
Meta 发布开源可商用模型 Llama 2原创 2023-07-19 09:06:18 · 3331 阅读 · 0 评论 -
【AI实战】大模型 LLM 部署推理框架的 vLLM 应用
大模型 LLM 推理框架的 vLLM 应用原创 2023-07-18 09:27:31 · 9650 阅读 · 1 评论 -
【AI实战】ChatGLM2-6B 微调:AttributeError: ‘ChatGLMModel‘ object has no attribute ‘prefix_encoder‘
ChatGLM2-6B 微调:AttributeError: 'ChatGLMModel' object has no attribute 'prefix_encoder'原创 2023-07-12 15:22:38 · 6080 阅读 · 0 评论 -
【AI实战】快速搭建中文 Alpaca 33B 大模型 Chinese-Alpaca-33B
中文 33B 大模型 Chinese-Alpaca-33B原创 2023-07-06 17:54:03 · 1004 阅读 · 0 评论 -
【AI实战】llama.cpp量化cuBLAS编译;nvcc fatal:Value ‘native‘ is not defined for option ‘gpu-architecture‘
llama.cpp量化cuBLAS编译;nvcc fatal:Value 'native' is not defined for option 'gpu-architecture'原创 2023-07-06 15:20:21 · 2720 阅读 · 3 评论 -
【AI实战】llama.cpp 量化部署 llama-33B
llama.cpp 量化部署 llama-33B原创 2023-07-06 11:43:12 · 9637 阅读 · 3 评论 -
【AI实战】从零开始搭建中文 LLaMA-33B 语言模型 Chinese-LLaMA-Alpaca-33B
从零开始搭建中文 LLaMA-33B 语言模型 Chinese-LLaMA-Alpaca-33B原创 2023-07-05 20:00:00 · 5042 阅读 · 2 评论 -
【AI实战】最强开源 6B 中文大语言模型ChatGLM2-6B,从零开始搭建
最强开源7B中文大语言模型ChatGLM2-6B原创 2023-07-01 00:30:00 · 2549 阅读 · 0 评论 -
【AI实战】开源可商用的中英文大语言模型baichuan-7B,从零开始搭建
开源可商用的中英文大语言模型baichuan-7B,从零开始搭建baichuan-7B原创 2023-06-19 21:30:00 · 2815 阅读 · 0 评论 -
【AI实战】开源大语言模型LLMs汇总
开源大语言模型LLM汇总原创 2023-06-09 20:30:00 · 5216 阅读 · 3 评论 -
【AI实战】大语言模型(LLM)有多强?还需要做传统NLP任务吗(分词、词性标注、NER、情感分类、知识图谱、多伦对话管理等)
总体看来,LLM 在零样本的情况下, 选择合适的prompt就能实现很多传统NLP任务。LLM 尤其是现在的多模态模型,是真正通向通用人工智能的基石。原创 2023-06-07 10:02:37 · 3117 阅读 · 0 评论