数据拾光者-优快云博客

原创 AI那些趣事系列112：一文看懂 AI Agent 工具调用、MCP 协议与多 Agent 协同

AI Agent 不是 “只会聊天的机器人”，而是能帮你 “动手做事” 的数字助手 —— 比如自动订机票、规划旅行、算家庭预算，甚至协调多个工具完成复杂任务。就算出现“不小心先订了酒店”的情况（比如Agent误操作），A2A也支持“回滚指令”：主Agent通过A2A协议向住宿预订Agent发送“取消预订”请求，酒店Agent调用平台的取消API（比如携程的免费取消接口），避免用户损失——这要求专业Agent在设计时，支持“执行”和“撤销”两种反向操作（A2A协议会定义“撤销任务”的标准格式）。

2025-12-03 20:54:38 640

原创中国巴菲特段永平 2025 专访深度学习笔记：普通人能抄的投资心法，藏在 “买公司” 和 “慢生活” 里

段永平举了个例子：“我孩子小时候想学编程，我没反对，但我告诉孩子：‘编程很难，你可能会遇到很多挫折，如果你决定学，就要坚持下去，不能半途而废。而他的投资生涯，更是把 “懂行” 发挥到了极致：2001 年左右，网易因财务问题股价跌到 1 美元以下，濒临退市，段永平重仓买入，后来网易股价涨了几百倍，这一笔投资就让他赚得盆满钵满；段永平相信苹果会出手机大屏，是因为段总相信苹果是非常重视用户体验的，用户需要手机大屏幕，所以苹果肯定会出大屏，尽管公司可能有决策失误，扛了三年才出，但是最终会走回正道。

2025-12-01 20:46:48 458

原创 AI那些趣事系列111：谷歌新范式Nested Learning：让AI告别“顺行性遗忘”，像人类一样日积月累地学习

比如先让HOPE学习“数学推理”，再让它学习“物理推理”，它能把数学推理中的逻辑方法，迁移到物理推理中，并且两个任务的准确率都能保持高水平；但谷歌的论文告诉我们：AI的进步，不仅仅是“量的积累”，更需要“质的飞跃”——从“拟合数据”到“积累知识”，从“静态系统”到“动态学习者”。再比如：一个大模型在预训练时学过“地球是圆的”，但如果在推理时你告诉它“最新研究发现地球是椭球体（更精准的表述）”，它能在当前对话中认可这个观点，但下次对话时，它还是会默认“地球是圆的”——新信息没有被“存下来”。

2025-11-27 20:52:30 399

原创 AI那些趣事系列110：一文读懂 Qwen 系列模型：Qwen 系列核心算法优化技术学习笔记

模型里有 128 个独立的 “专家层”（比如 “数学专家”“代码专家”“多模态专家”），路由器会给每个 token 打分（比如 “数学题 token” 给 “数学专家” 打 90 分，“代码专家” 打 30 分），只激活分数最高的 2 个专家；处理 “周杰伦的歌” 时，不会误拆为 “周杰 / 伦的歌”。如果把 Qwen 系列比作一个 “学生”，它的成长轨迹堪称 “学霸进阶史”—— 从只会处理文本的 “初学者”，到能看懂图片、听懂语音的 “多面手”，再到如今会 “思考”、效率超高的 “顶尖选手”。

2025-11-18 20:47:12 1047

原创黄金的“貔貅循环”：为何我们可能正站在一个历史性牛市的开端？

这篇文章把黄金涨价的底层逻辑扒得明明白白，没有复杂的 K 线图，没有晦涩的金融术语，却道破了一个关键趋势：美元信用褪色的时代，被冷落多年的 “旧神” 黄金，正在重新成为全球的 “信任锚”。选择数据月份：页面会列出最近 24 个月的国际储备资产数据，找到 “黄金储备（万盎司）” 这一栏（注意单位是 “万盎司”，1 万盎司≈3.11 吨，比如 2024 年 4 月的黄金储备是 7762 万盎司，换算后就是 7762×3.11≈2414 吨）；最后想说：黄金不是 “发财捷径”，但它是资产的 “安全垫”。

2025-11-18 20:39:10 803

原创 AI那些趣事系列109：LLaMA 系列模型核心算法优化技术学习笔记

通过这些技术突破，Meta 成功将大模型从 "实验室专属" 带入 "企业级应用" 和 "个人开发者" 领域，推动 AI 技术普惠。SwiGLU (x) = (x * σ(βx)) ⊗ W，其中 σ 为 Sigmoid 函数，β 为可学习参数，⊗为逐元素乘法。参数量提升 4 倍 (从 70B 到 280B)，但推理计算量仅增加 30%，实现 "大参数容量 + 高效率推理" 平衡。网页文本 (60%)、书籍 (20%)、代码 (10%)、学术论文 (5%)、其他 (5%)

2025-11-13 21:08:00 1138

原创 AI那些趣事系列108：一文轻松读懂 LLaMA 系列模型：从 Meta 开源爆款到 AI 生态基石

让它分析一篇学术论文，它能提炼核心观点，甚至指出潜在漏洞。简单说，它是 Meta（原来的 Facebook）开发的一款 “通用语言 AI大模型”—— 就像一个天生会 “读” 会 “写” 的智能大脑，能理解文字意思，还能生成连贯的内容。2025 年 4 月，Meta 发布的 LLaMA 4 堪称 “革命性升级”—— 它不再局限于 “文本处理”，而是变成了能看、能听、能记千万字的 “全能助手”，还一口气推出三个版本（Scout、Maverick、Behemoth），覆盖从边缘设备到企业级的所有场景。

2025-11-13 20:51:30 778

原创再读《穷查理宝典》：深度理解准备、纪律、耐心、决心八字真言

芒格从不会 “小打小闹” 地买股票，但他下重注前，一定会做足准备：比如投资富国银行前，他研究了富国银行几十年的财报，了解了它的风控体系、管理层风格、市场定位，甚至去调研了富国银行的网点，确认它的客户粘性很强。时隔两年再翻开这本书，却发现那些曾被我忽略的 “准备、纪律、耐心、决心”，才是贯穿他所有决策的核心 —— 它们不是孤立的步骤，而是一套环环相扣的 “底层功夫”，不仅能用来选股票，更能帮我们把人生的 “投资” 做对。耐心的核心，是 “认准一个方向，熬到开花结果”，而不是 “不停换方向，永远在起点”。

2025-11-05 21:20:47 914

原创 AI那些趣事系列107：大模型 Agent 陷入循环调用工具？从运维实战聊聊问题根源与破解之道

可以尝试在系统中添加一个简单的检测逻辑：如果 Agent 连续两次调用同一个工具，且工具返回的核心结果（比如告警组 ID、关键指标）完全一致，就判定为 “重复调用”，系统会阻止本次调用，并提示 Agent：“已获取相同结果，无需重复调用，请基于现有信息分析”。这是最简单也最有效的方法。这种“自主决策” 的特性，既是 Agent 的优势（灵活应对复杂场景），也埋下了 “循环调用” 的隐患 —— 如果大模型对 “何时停止调用工具” 的判断出现偏差，就可能像迷路的人反复绕圈一样，陷入无意义的工具调用循环。

2025-10-29 20:55:42 1110

转载 AI那些趣事系列106：大模型 Agent 的 “记忆瘦身术”：上下文压缩工程如何破解性能与成本困局？

当前遇到的问题是，生成折线图时，工具提示 “日期格式错误”，需要确认数据中的日期字段是否为 “YYYY-MM-DD” 格式。Agent 的上下文也是如此：任务过程中积累的历史对话、工具返回结果、中间计算步骤不断堆积，轻则导致大模型响应延迟，重则超出上下文窗口限制（比如 GPT-4 Turbo 的 128K 窗口，看似很大，处理多轮代码调试时仍会捉襟见肘），甚至推高 Token 消耗成本（按当前市场价，100 万 Token 成本约 1-5 美元，高频使用下是不小的开支）。

2025-09-23 20:56:31 578

原创 AI那些趣事系列105：大模型 Agent 上下文工程实践分享

比如 “上次订的晚上去上海的二等座” 和 “帮我订和上次一样的票” 的向量相似度很高，调用器就能关联到上次的信息。从技术拆解来看，上下文工程的实现本质是 “信息的全生命周期管理”—— 从 “采集（源头）” 到 “处理（整理）”，再到 “存储（仓库）”，最后到 “调用（使用）”，每个环节都围绕 “让 Agent 更高效、更精准地利用信息” 展开。短期关联能力：比如用户说 “帮我订明天去上海的票”，后续补充 “要靠窗的”，Agent 能关联 “上海” 和 “靠窗”，不用再问 “去哪个城市”；

2025-09-18 20:51:09 894

原创 AI那些趣事系列104：大模型 Agent：从 “一问一答” 到 “自主办事”，上下文工程是关键

未来，随着上下文工程的发展，Agent 会变得更 “聪明”：它能记住你的长期偏好（比如 “你喜欢喝美式咖啡，不加糖”），能处理更复杂的任务（比如 “帮你规划整个职业生涯”），甚至能和其他 Agent 协作（比如 “订票 Agent 和酒店 Agent 协作，完成你的旅行安排”）。大模型的 “上下文窗口” 是有限的 —— 比如 GPT-4 的上下文窗口是 128k tokens（大概相当于 10 万字），虽然看起来很多，但如果处理长任务（比如写一本 200 页的书、整理一年的聊天记录），很快就会 “装满”。

2025-09-17 19:27:50 1168

原创 AI那些趣事系列103：当AI开始“胡言乱语”---揭秘大模型幻觉的根源与破局之道

大模型在面对不确定问题时会选择“合理编造”而非说“不知道”，本质是评估体系在鼓励模型猜测，就像考试中“答对得1分，空题或者答错得0分，但是蒙题会有有概率答对从而得分”的规则，催生了学生的冒险行为。：模型的“胡言乱语”也分很多种，有的是低级的拼写错误（现已很少），有的是逻辑推理的失误（如计数错误），有的则是严重的事实虚构（如编造生日）。一个最简单的判断原则是：蓝色的柱子越贴近那条黑色的对角线，说明这个模型越“靠谱”，它知道自己知道什么，也不知道自己不知道什么。越靠近1（100%），表示它越“自信满满”。

2025-09-10 19:53:16 1026 1

转载三读《穷查理宝典》感悟

当跌过头的时候就是非常好的买点，如果能严格遵守纪律，碰到优质的股票到合适的买点就大胆狠狠地下注，应该会收不错的投资收益的。10.市场不总是有效的，尤其是大A，经常会出现标错赔率的赌注，比如10块多的小米和不到200的腾讯。如果选到优秀的股票，在高价的时候也并不会那么吸引人。还是小米和腾讯的例子，去年行情极差的时候当遇到200的腾讯，虽然我也只知道这是个很好的机会，但是还是被大环境影响了，觉得还会跌。5.借助大模型的力量，我们可以更高效的学习多元思维模型，去学习重点学科的重点知识，并应用在生活和投资中。

2025-06-26 16:18:26 681

原创广告行业中那些趣事系列102：DeepSeek核心技术之多头潜在注意力MLA详解

这一技术帮助该公司在有限的 GPU 资源（如2048块英伟达H800）和极短训练周期（约两个月）内完成了超大规模模型的训练，其训练成本仅为同类模型的3%-5%。显存利用率提升 3 倍以上：处理 32 路并发请求时，传统方法需要预留 32×2048 token 的连续显存，而分页机制通过块复用，实际占用仅为传统方法的 30%。就像类似操作系统的内存分页（4KB 页），将逻辑上的连续 KV 缓存映射到物理上离散的显存块。处理长文本时，块表可能指向 100 个离散的块，但这些块在显存中无需连续。

2025-04-21 16:07:50 1136

原创广告行业中那些趣事系列101：基于DeepSeek R1构建本地广告知识库实践

比如“DeepSeek（杭州深度求索人工智能基础技术研究有限公司）是一家专注于通用人工智能（AGI：Artificial General Intelligence）和大语言模型（LLM：Large Language Model）研发的创新型科技公司，成立于2023年7月。Ollama是一款开源跨平台工具，主要用于在本地设备上快速部署和管理大语言模型（如 DeepSeek-R1、Llama 2 等），支持智能对话、文本生成等功能。文本分割的粒度需要注意以下几点：需要对切割的粒度需要进行反复探索。

2025-04-21 15:46:36 1361

原创广告行业中那些趣事系列100：手把手零代码基于DeepSeek+飞书多维表格实现数据标注任务

我们要做的就是准备好需要标注的文本数据，然后进行简单配置就可以利用飞书的多维表格和DeepSeek R1牛逼的推理能力帮我们标注，真正大幅降低标注人力成本。这时候可以通过智能标签进行规整，继续点击+号，选择字段捷径中心下的智能标签，然后添加固定的两个标签“喜欢”和“不喜欢”，配置里的字段选择“DeepSeek R1.输出结果”，最后点击确定即可。比如我们希望对文本这一列的数据进行情感分类任务，可以这么写：“我是一个数据标注人员，想对这里的文本数据进行情感分类，请根据文本输出喜欢或者不喜欢”。

2025-04-21 15:38:29 1015

原创广告行业中那些趣事系列99：DeepSeek中非常重要的混合专家模型MoE技术详解

导读：本文是“数据拾光者”专栏的第九十九篇文章，这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本篇主要分享了DeepSeek模型中用到的非常重要的一个技术混合专家模型MoE，对MoE感兴趣的可以多交流。欢迎转载，转载请注明出处以及链接，更多关于自然语言处理、推荐系统优质内容请关注如下频道。知乎专栏：数据拾光者公众号：数据拾光者01 MoE发展历程Mixture of Experts（MoE...

2025-02-20 20:36:42 1436

原创广告行业中那些趣事系列98：一种用于文本分类数据标注的简单高效的提示压缩方法论文分享...

导读：本文是“数据拾光者”专栏的第九十八篇文章，这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本篇主要分享了我们在coling2025发表的一篇论文《A Simple yet Efficient Prompt Compression Method for Text Classification Data Annotation Using LLM》，为使用LLMs进行大规模文本分类标注提供了...

2025-02-13 20:57:21 1511

原创广告行业中那些趣事系列97：从理论到实践详解国货之光DeepSeek大模型

导读：本文是“数据拾光者”专栏的第九十七篇文章，这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本篇主要从理论到实践详解了国货之光DeepSeek，普通人也可以很简单的构建自己的DeepSeek大模型。欢迎转载，转载请注明出处以及链接，更多关于自然语言处理、推荐系统优质内容请关注如下频道。知乎专栏：数据拾光者公众号：数据拾光者最近铺天盖地的都是DeepSeek大模型的消息，作为国货之光，不仅...

2025-02-06 15:57:01 1872

原创总会用到的系列13：生娃你真的做好准备了么？

知乎专栏：数据拾光者公众号：数据拾光者家里的小面宝快两岁了，身边有朋友想让我分享下养娃需要做哪些准备，会经历什么样的变化。那就趁着这个机会，在2024年底写篇文章从奶爸的视角来分享下这两年的酸甜苦辣吧。01 生娃还是狠花钱我大概盘点下生娃前后的花费，截止到2岁前(以后的我也不知道)。这里只记录一下明确的花费，可能有遗漏，但真实绝对比这个花费多的多。主要分成生娃前和生娃后两个阶段吧。1.1 生娃前主...

2025-01-27 12:15:17 1305

原创从《穷查理宝典》中找到大A少亏钱的智慧

欢迎转载，转载请注明出处以及链接知乎专栏：数据拾光者公众号：数据拾光者最近一直在读《穷查理宝典》，结合自己在大A各种谜之操作的投资经历，整理成一篇读书笔记。有书中经典的名人语录，也有自己在投资中的感悟，不断反思。01 多读书第一个最重要的感悟就是要多读书，很多厉害的人都有阅读的习惯，并且阅读量巨大。尤其是历史和人物传记类的书籍要多读。有些特别好的书甚至建议反复阅读好几遍，每一遍都有会不同的体会。九...

2025-01-22 19:58:32 1586

原创广告行业中那些趣事系列96：手把手利用LLM和prompt技术来做自媒体高仿九边

导读：本文是“数据拾光者”专栏的第九十六篇文章，这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本篇主要介绍使用LLM和prompt技术来做自媒体，构建高仿九边。欢迎转载，转载请注明出处以及链接，更多关于自然语言处理、推荐系统优质内容请关注如下频道。知乎专栏：数据拾光者公众号：数据拾光者01 利用大模型和prompt技术来做自媒体一直非常喜欢九边的文章。有种很神奇的感觉，同样的人生道理，别人...

2025-01-21 20:51:41 1787

原创广告行业中那些趣事系列95：详细介绍智谱AI的大模型系列产品

导读：本文是“数据拾光者”专栏的第九十五篇文章，这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本篇主要介绍当前主流大模型公司的智谱AI的大模型系列产品以及他们最核心的GLM预训练框架。欢迎转载，转载请注明出处以及链接，更多关于自然语言处理、推荐系统优质内容请关注如下频道。知乎专栏：数据拾光者公众号：数据拾光者01 智谱AI介绍智谱AI（北京智谱华章科技有限公司）是一家源自清华大学计算机系技...

2025-01-15 21:10:32 1996

原创广告行业中那些趣事系列94：基于AI编程助手cursor零代码开发计算个税扣除的微信小程序...

导读：本文是“数据拾光者”专栏的第九十四篇文章，这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本篇主要介绍使用当前主流的AI编程助手Cursor来实现零代码开发一个微信小程序，实现计算交个人养老金能帮我们少交多少税。欢迎转载，转载请注明出处以及链接，更多关于自然语言处理、推荐系统优质内容请关注如下频道。知乎专栏：数据拾光者公众号：数据拾光者01 背景介绍上一篇介绍了AI编程助手cursor...

2025-01-08 21:13:31 1381

原创 35岁高龄程序员自救指南一电影《逆行人生》的反思

欢迎转载，转载请注明出处以及链接知乎专栏：数据拾光者公众号：数据拾光者徐峥的新电影《逆行人生》主要讲的是一个中年程序员被裁员后失业找不到程序员相关的工作只能去送外卖的事。对于同为程序员的我还是感触蛮大的。程序员行业虽然整体来看待遇还不错，但是僧多肉少的情况越来越严重，主要体现在需求端和供给端：需求端方面各种大小互联网公司的发展放缓，相应的新项目越来越少，对人力的需求也越来越少，很多大公司甚至都不怎...

2024-12-25 20:31:20 1622

原创广告行业中那些趣事系列93：学会用AI编程助手Cursor人人都能当程序员

导读：本文是“数据拾光者”专栏的第九十三篇文章，这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本篇主要介绍当前主流的AI编程助手Cursor，从理论到实践案例，帮助我们实现“会说即会写代码”，人人都能当程序员。欢迎转载，转载请注明出处以及链接，更多关于自然语言处理、推荐系统优质内容请关注如下频道。知乎专栏：数据拾光者公众号：数据拾光者01 常用的AI编程助手介绍随着LLM大语言模型大火，L...

2024-12-13 21:15:30 2499

原创广告行业中那些趣事系列92：详解当前非常火的LLM热门模型LLAMA1

导读：本文是“数据拾光者”专栏的第九十二篇文章，这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本篇主要介绍当前LLM非常火的LLAMA1模型，由META发布，是LLM界非常流行的模型。欢迎转载，转载请注明出处以及链接，更多关于自然语言处理、推荐系统优质内容请关注如下频道。知乎专栏：数据拾光者公众号：数据拾光者01 LLAMA 1介绍LLAMA 1是Meta在2023年2月发布的大语言模型，...

2024-12-06 19:57:50 1781

原创总会用到的系列12：寒武纪纳入上证50后还能买上证50基金么？

01 背景介绍最近大A将“寒*武*纪”纳入了上证50，这个被称为“中国版英伟达”的股票引来大家各种质疑。之所以这个股票备受争议，是因为市值2340亿，2024年前三季度营收只有1.8亿，扣非净利润-8.6亿，且连续8年亏损。同时前3个季度研发才投入6.59亿，同比-8.13%。2023年研发费用11.2亿，同比-26.6%。23年公司研发人员数量，同比-37.6%，只有752人。像这种从哪个角度看...

2024-12-04 21:09:08 2250

原创广告行业中那些趣事系列91：实践智能客服场景FAQ任务

导读：本文是“数据拾光者”专栏的第九十一篇文章，这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本文主要详细介绍了NLP任务中常见的实践智能客服场景FAQ任务欢迎转载，转载请注明出处以及链接，更多关于自然语言处理、推荐系统优质内容请关注如下频道。知乎专栏：数据拾光者公众号：数据拾光者01 FAQ任务相关介绍在智能客服场景中，对于用户频繁问到的业务问题进行自动回答(简称FAQ任务)是很重要的一...

2024-11-27 21:19:00 1508

原创广告行业中那些趣事系列90：从理论到实践多模态学习模型CLIP

导读：本文是“数据拾光者”专栏的第九十篇文章，这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本文主要从理论到实践详细介绍了OpenAI推出的多模态学习模型CLIP。欢迎转载，转载请注明出处以及链接，更多关于自然语言处理、推荐系统优质内容请关注如下频道。知乎专栏：数据拾光者公众号：数据拾光者01 背景介绍之前做广告聚类项目时，需要根据广告的素材图片和文案两种模态数据进行聚类操作，从而给广告打...

2024-11-27 21:16:00 1336

原创广告行业中那些趣事系列89：NLP中常见的文本相似度算法介绍

导读：本文是“数据拾光者”专栏的第八十九篇文章，这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本文主要详细介绍了NLP任务中常见的文本相似度算法。欢迎转载，转载请注明出处以及链接，更多关于自然语言处理、推荐系统优质内容请关注如下频道。知乎专栏：数据拾光者公众号：数据拾光者01 文本相似度算法应用场景文本相似度算法在多个领域和场景中都有广泛的应用，以下是一些主要的应用场景：信息检索：在搜索引...

2024-11-27 21:14:00 1876

原创广告行业中那些趣事系列88：从理论到实践NER任务

导读：本文是“数据拾光者”专栏的第八十八篇文章，这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本文主要从理论到实践详细介绍了NLP中常见的NER任务。欢迎转载，转载请注明出处以及链接，更多关于自然语言处理、推荐系统优质内容请关注如下频道。知乎专栏：数据拾光者公众号：数据拾光者01 NER任务介绍1.1 NER定义命名实体识别（Named Entity Recognition，简称NER），...

2024-11-27 21:11:00 1332

原创广告行业中那些趣事系列87：基于LangChain-Chatchat构建本地知识库问答应用

导读：本文是“数据拾光者”专栏的第八十七篇文章，这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本文主要调研了LangChain-Chatchat项目，可用于构建本地知识库问答应用。欢迎转载，转载请注明出处以及链接，更多关于自然语言处理、推荐系统优质内容请关注如下频道。知乎专栏：数据拾光者公众号：数据拾光者01 LangChain-Chatchat项目介绍Langchain-Chatchat...

2024-11-27 21:08:00 1721

原创广告行业中那些趣事系列86：Smote算法及其变形原理和实现

导读：本文是“数据拾光者”专栏的第八十六篇文章，这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本文主要使用Smote算法来缓解样本不均衡问题，介绍了Smote算法及其变形原理和实现。欢迎转载，转载请注明出处以及链接，更多关于自然语言处理、推荐系统优质内容请关注如下频道。知乎专栏：数据拾光者公众号：数据拾光者01 数据不均衡问题概述在实际生产中，可能会碰到一种比较头疼的问题，那就是分类问题中...

2024-11-27 21:06:00 1459

原创广告行业中那些趣事系列85：论文《Sample Optimization For Display Advertising》调研

导读：本文是“数据拾光者”专栏的第八十五篇文章，这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本文主要调研了论文研究召回任务中负样本的选取优化策略。欢迎转载，转载请注明出处以及链接，更多关于自然语言处理、推荐系统优质内容请关注如下频道。知乎专栏：数据拾光者公众号：数据拾光者本篇主要调研了一篇2020年的论文《Sample Optimization For Display Advertisi...

2024-11-27 21:02:18 1412

原创广告行业中那些趣事系列83：基于LLaMA Factory做一个AI版听泉鉴宝

导读：本文是“数据拾光者”专栏的第八十四篇文章，这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本文主要调研LLaMA Factory框架以及如何利用该框架来构建一个AI版听泉鉴宝。欢迎转载，转载请注明出处以及链接，更多关于自然语言处理、推荐系统优质内容请关注如下频道。知乎专栏：数据拾光者公众号：数据拾光者01 背景介绍前一段时间有个叫"听泉鉴宝"(目前叫"听泉赏宝")的火起来了，半年多涨粉...

2024-11-07 21:04:00 1302

原创广告行业中那些趣事系列84：基于LLaMA Factory做一个AI版听泉鉴宝

导读：本文是“数据拾光者”专栏的第八十四篇文章，这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本文主要调研LLaMA Factory框架以及如何利用该框架来构建一个AI版听泉鉴宝。欢迎转载，转载请注明出处以及链接，更多关于自然语言处理、推荐系统优质内容请关注如下频道。知乎专栏：数据拾光者公众号：数据拾光者01 背景介绍前一段时间有个叫"听泉鉴宝"(目前叫"听泉赏宝")的火起来了，半年多涨粉...

2024-11-07 21:04:00 1507

原创广告行业中那些趣事系列83：关于pairwise 和 listwise approach那些事

导读：本文是“数据拾光者”专栏的第八十三篇文章，这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本文主要调研了推荐系统中关于pairwise 和 listwise approach。欢迎转载，转载请注明出处以及链接，更多关于自然语言处理、推荐系统优质内容请关注如下频道。知乎专栏：数据拾光者公众号：数据拾光者01 排序学习框架1.1 排序学习的基本流程在信息检索中，对每一个给定的query－d...

2024-11-07 21:02:00 1143

原创广告行业中那些趣事系列82：大模型应用调研之给雅思作文打分

导读：本文是“数据拾光者”专栏的第八十二篇文章，这个系列将介绍在广告行业中自然语言处理和推荐系统实践。本文主要调研了大模型应用在雅思作文打分场景中的实践。欢迎转载，转载请注明出处以及链接，更多关于自然语言处理、推荐系统优质内容请关注如下频道。知乎专栏：数据拾光者公众号：数据拾光者本篇主要是调研了大模型应用在雅思作文场景中的应用实践，主要调研了雅思作文一些公开实用的数据集，还调研了一些大模型应用在雅...

2024-11-07 21:00:00 917

C#实现打字游戏功能齐全完成代码

SPP-Template.zip

软件开发规范及计划书格式

实现简单的打字游戏

Ext Js权威指南（2/2）

Ext Js权威指南（1/2）

空空如也