
AICG
文章平均质量分 90
AICG学习
阳仔的屁仔
一个想在技术道路上有所建树、喜欢锻炼的程序员
展开
-
DeepSeek:Ollama
Ollama 是一个开源工具,专注于在本地计算机上快速、便捷地运行大型语言模型(LLMs),尤其擅长部署和优化 Meta 的 Llama 系列模型(如 Llama 2、Llama 3)及其他开源模型(如 Mistral、Phi-3)。它通过简化的命令行和 API 接口,让用户无需复杂配置即可在本地体验 AI 模型的生成、推理和对话能力。原创 2025-02-07 14:25:12 · 652 阅读 · 0 评论 -
DeepSeek:版本里程碑
(深度求索)作为一家专注于AGI(通用人工智能)技术研发的中国公司,已发布了多个版本的AI模型,涵盖自然语言处理、多模态理解及生成等领域。通过MoE架构降低计算成本(如DeepSeek v2的激活参数量仅为3B,性能接近70B密集模型)。:DeepSeek-MoE-16B(开源)、DeepSeek-V2(API服务)。:相同参数量下,生成质量显著提高,支持更长上下文(如128k tokens)。:7B参数开源模型(如DeepSeek-7B-Chat)。参数量:覆盖7B、67B等规模(B=十亿参数)。原创 2025-02-07 10:54:58 · 8285 阅读 · 0 评论 -
DeepSeek:开启AI探索之旅
DeepSeek的核心玩法在于其强大的智能交互能力。用户可以通过自然语言与AI进行对话,提出各种问题或请求。这种对话式的交互方式,让信息获取变得前所未有的简单和高效。在实际使用中,DeepSeek展现了出色的理解能力。它能够准确捕捉用户意图,即使面对模糊或不完整的提问,也能通过智能分析给出相关回答。这种交互体验打破了传统搜索引擎的关键词匹配模式,使信息获取过程更加自然流畅。对话过程中,DeepSeek支持多轮交互。用户可以根据回答进一步追问,系统会结合上下文提供更精准的信息。原创 2025-02-06 16:33:33 · 659 阅读 · 0 评论 -
跟阳仔一起学AI CNN 和 RNN
在人工智能的领域中,卷积神经网络(CNN)和循环神经网络(RNN)是两种极具影响力的神经网络架构,它们在处理不同类型的数据和任务中展现出了各自独特的优势。今天咱们就简单学习一下卷积神经网络(CNN)和循环神经网络(RNN)是两种常见的深度学习模型,它们在处理不同类型的数据时各有优势。原创 2024-06-06 10:11:37 · 919 阅读 · 0 评论 -
ChatGPT落地场景探索-数据库与大模型
本人有幸被优快云、InfoQ邀请参加2023年“可信数据库发展大会”。本年度的分享聚焦“自主、创新、引领”,7月4号是主会场分享。本次大会由中国通信研究院牵头、中国通信标准化协会、大数据技术标准推进委员会、InfoQ极传媒牵头,清华大学、华为、阿里云、腾旭云、浪潮等等国内顶尖学术研究院、企业共同参与分享的顶级学术盛宴。参与了大会也深切的感受到了国内顶级学府、研究院对于理论基础研究的深度和广度,以及国内顶级企业应用研究的成果,总之受益匪浅。原创 2023-07-06 10:16:21 · 2325 阅读 · 1 评论 -
基于 Quivr 搭建个人知识库
Quivr采用先进的人工智能技术来帮助您生成和检索信息,可以处理几乎所有类型的数据,包括文本、图像、代码片段等。创建项目比较简单,创建的时候有付费的和免费的,咱们练习直接白嫖就可以,果断选择免费方式。下面的图里是我本地按照创建的项目里的配置替换的,需要注意的是backend目录下的ANTHROPIC_API_KEY 是选择 Claude 的配置,我们可以删了。配置完完毕,接下来要初始化数据库了。下面的视频是5月下旬上线的最新的版本的演示视频,新的版本替换了操作UI,接下来我们尝试使用新版搭建自己的知识库。原创 2023-06-10 19:22:14 · 4000 阅读 · 4 评论