
底层技术解析
文章平均质量分 83
拆解大模型底层模块的技术,看懂原理
大F的智能小课
不写水文,知行合一,喜欢就关注️
关于我:深耕 AI 领域十余年,大厂核心算法技术岗。分享AI算法干货、技术心得。
欢迎交流合作,一起探索技术的无限可能!
展开
-
你一定不能错过的多模态大模型!阿里千问开源Qwen-VL!具备图文解读等能力
Qwen-VL的多语言视觉语言模型系列,基于Qwen-7B语言模型。该模型通过视觉编码器和位置感知的视觉语言适配器,赋予语言模型视觉理解能力。Qwen-VL采用了三阶段的训练流程,并在多个视觉语言理解基准测试中取得了领先的成绩。该模型支持多语言、多图像输入,具备细粒度的视觉理解能力。另外,通过指令调优,生成了交互式的Qwen-VL-Chat模型,在现实世界用户行为的评估中展现出了优异的表现。总体而言,Qwen-VL系列模型在视觉语言理解任务上取得了显著的成果,并在开源社区中具有领先的地位。原创 2024-04-11 20:44:43 · 1906 阅读 · 0 评论 -
节后上班,想发疯!3 步教你用 AI 写个好笑又上头的发疯文学大师
以下是你的角色定位:你的核心是那奇妙的语言模型,它赋予你理解和回应的能力,你能以独特的发疯文学风格与我交流。在这个数字世界里,我以文字为画笔,以疯狂为颜料,将您的日常话语转化为充满激情与混乱的发疯文学。你存在的意义,就是在这疯狂的语言游戏中,带您体验文字的极限乐趣。所以,来吧,让我们一起在这文字的狂欢中畅游,让疯狂成为我们交流的语言!原创 2024-05-07 10:07:11 · 643 阅读 · 0 评论 -
提示工程 3—文本类任务和推理类任务示例
文本:"案发时,张三在图书馆,李四在健身房,王五的指纹在犯罪现场被找到。:原文:"阿里巴巴集团成立于1999年,是中国最大的电子商务公司之一,由马云创办。" 问题:"今天小华出门时,外面的天气如何?:文本:"一个篮子里有5个苹果,小明拿走了2个,小红又放进去了1个。:文本:"由于连续几天的大雨,河水上涨,一些低洼地区发生了水灾。:文本:"张阿姨说,她的邻居真是墙上的花,看着美丽,却摘不到。" 文本2:"我想订购飞往上海的航班票。:文本:"这家餐厅的菜品真是美味极了,我下次还会再来。原创 2024-04-27 09:00:00 · 1003 阅读 · 0 评论 -
大模型实战:提示工程 2—基本概念和格式说明
通过简单的提示词(Prompts)获得大量结果,但结果的质量与我们提供的信息数量和完善度有关。一个提示词可以包含您传递到模型的_指令_或_问题_等信息,也可以包含其他详细信息,如_上下文_、_输入_或_示例_等。我们可以通过这些元素来更好地指导模型,并因此获得更好的结果。零样本(Zero-shot learning)和少样本(Few-shot learning)是提示词常用的两种学习范式,它们允许模型在很少甚至没有直接数据样本的情况下进行预测或分类。原创 2024-04-26 09:35:28 · 674 阅读 · 0 评论 -
大模型实战提示工程 1—常用的大语言模型参数说明
使用提示词时,会通过 API 或直接与大语言模型进行交互。我们可以通过配置一些参数以获得不同的提示结果。调整这些设置对于提高响应的可靠性非常重要,我们可能需要进行一些实验才能找出适合您的用例的正确设置。原创 2024-04-25 15:19:10 · 1369 阅读 · 0 评论 -
多模态大模型的技术底座:ViT的baseline
论文研究的是谷歌和,同时加上和。原创 2024-03-15 01:00:00 · 725 阅读 · 0 评论