LLM
文章平均质量分 78
大模型
TIM老师
Time Is Money
互联网大厂AI研究 & 8年时序算法 & LLM爱好者 & 量化初学者
欢迎点赞收藏关注交流讨论!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【区别】状态空间模型(SSM)和Transformer的核心区别
状态空间模型(SSM)和Transformer是两种主流的序列建模方法。SSM通过递归隐状态实现线性复杂度,适合长序列和实时处理,但依赖状态转移设计;而Transformer通过自注意力显式建模全局依赖,具有更强的语义交互能力,但计算复杂度为平方级。SSM参数高效,适合资源受限场景,而Transformer需大规模预训练。原创 2025-07-25 13:48:41 · 1090 阅读 · 0 评论 -
大语言模型训练数据格式:Alpaca 和 ShareGPT
在大规模语言模型(LLM)的开发中,训练数据的质量和格式起着至关重要的作用。为了更好地理解和构建高质量的数据集,社区发展出了多种标准化的数据格式。其中,Alpaca 和 ShareGPT 是两种广泛使用的训练数据格式,它们分别适用于不同的应用场景,并在指令微调、对话建模等领域发挥了重要作用。原创 2025-05-19 17:18:42 · 6660 阅读 · 0 评论 -
大模型部署到本地就是私有化部署吗?
大模型私有化的定义需要从部署方式和数据/模型控制权两个维度来理解,不能简单地仅以“部署位置”或“数据训练”单一条件判断。原创 2025-04-22 15:22:46 · 896 阅读 · 0 评论 -
大语言模型(LLM)如何赋能时间序列分析?
从文本接口到世界模型,LLM正逐步深入时间序列的核心战场。尽管面临噪声敏感、计算成本等难题,但其在可解释性、少样本学习和跨模态关联方面的潜力,可能重塑时序分析的未来范式。对于从业者而言,掌握“时序特征工程+LLM提示工程”的复合技能,将成为破解工业智能化痛点的关键。原创 2025-03-01 20:59:33 · 1853 阅读 · 0 评论 -
【已解决】|LLM|Qwen-Agent 不支持非流式输出
若还有疑问或建议,欢迎留言交流~原创 2025-02-19 16:15:26 · 1027 阅读 · 0 评论 -
【已解决】Qwen2:KeyError: ‘qwen2‘
Transformer版本过低,需要升级版本。原创 2024-06-19 11:01:56 · 4888 阅读 · 0 评论
分享