百度智能云生成式AI资深认证工程师考试题库
试卷总分:100分(80分通过)|题量:50题

- Post-pretrain阶段的数据集,一般是什么格式?( )
选项:
A. 纯文本无标注
B. Prompt+Response问答对形式
C. Prompt+Chosen+Rejected
D. Prompt+多Response排序
答案:A
解析:Post-pretrain阶段使用无标注纯文本数据,用于继续预训练模型的语言理解能力。 - 以下哪个不是工作流预置画布的类型?( )
选项:
A. 空画布
B. 知识库问答
C. API接入
D. 代码执行
答案:D
解析:工作流预置画布类型包括空画布、知识库问答、API接入,代码执行需自定义组件实现。 - 在模型精调的最佳实践中,对于数据量,更多的数据总是能带来更好的模型效果。( )
选项:
A. 正确
B. 错误
答案:B
解析:数据量需平衡质量与规模,低质量数据堆砌可能导致过拟合或噪声干扰。 - 在千帆平台的在线测试功能中,以下哪个参数用于控制生成文本的多样性?( )
选项:
A. 温度
B. 多样性
C. 重复惩罚
D. 系统人设
答案:A
解析:温度(Temperature)参数通过调整概率分布平滑度控制文本多样性。 - 在百度智能云千帆AppBuilder中,以下哪一项不是应用组件的功能?( )
选项:
A. 文档问答
B. 表格问答
C. 对话
D. 提供IAAS云资源
答案:D
解析:应用组件聚焦AI能力(如问答、对话),IaaS资源由底层云平台提供。 - 在进行Prompt优化时,如果开启了“质量优化”功能,以下哪个说法是正确的?( )
选项:
A. 优化时间会加长
B. 优化时间会缩短
C. 优化效果会降低
D. 对优化时间无影响
答案:A
解析:质量优化需额外计算资源,会增加优化时间。 - 在千帆ModelBuilder上,下列哪一项是DPO的训练数据集格式?( )
选项:
A. Prompt+Response
B. 纯文本
C. Prompt+Chosen+Rejected
D. Prompt+多Response排序
答案:C
解析:DPO(Direct Preference Optimization)需偏好数据(Chosen/Rejected)。 - 在百度智能云千帆AppBuilder进行应用开发时,以下哪些模型可用于知识问答环节?( )
选项:
A. ERNIE-4.0-8K
B. ERNIE-3.5-8K
C. ERNIESpeed-AppBuilder
D. ERNIE-2.0-Large
正确答案:A、B、C
解析:
ERNIE-4.0-8K 和 ERNIE-3.5-8K 是百度智能云官方文档中明确列出的预置大模型,适用于知识问答场景。
ERNIESpeed-AppBuilder 是专为AppBuilder优化的轻量模型,支持知识库问答功能。
ERNIE-2.0-Large 是早期版本模型,未在平台预置模型列表中,不适用于当前知识问答组件。 - 在微调大模型时,常用的学习率调整策略是哪一个?( )
选项:
A. 学习率衰减
B. 梯度裁剪
C. 随机梯度下降
D. 指数加权移动平均
答案:A
解析:学习率衰减可避免训练后期震荡,提升收敛效果。 - 在调用Stable-Diffusion-XL服务时出现请求超时,以下哪种方式是正确的处理方法?( )
选项:
A. 忽略超时提示,继续等待服务响应
B. 检查网络连接是否正常
C. 如果未部署该服务,需要先部署本模型为服务,再调用部署好的服务
D. 立即联系技术支持寻求帮助
答案:C
解析:超时通常因服务未部署或资源不足,需先检查服务状态。 - 在LoRA微调中,参数秩的选择会受到哪些因素的影响?( )
选项:
A. 数据集大小
B. 模型的复杂度
C. 任务的复杂度
D. 计算资源
正确答案:A、B、C、D
解析:
数据集大小:数据量越大,模型需要学习的模式越复杂,可能需要更高的秩来捕捉这些模式。
模型的复杂度:更复杂的模型(如参数量更大的模型)可能需要更高的秩来保持微调的灵活性。
任务的复杂度:复杂任务(如多跳推理)需要更高的秩来适应参数更新。
计算资源:秩越高,计算开销越大,需根据资源限制调整。 - 创建应用后如何操作可以让应用拥有手写识别的能力?( )
选项:
A. 优化角色指令
B. 添加知识库
C. 添加组件
D. 优化提示词
答案:C
解析:手写识别需通过添加OCR组件实现。 - 在大模型微调中,通常会微调模型的哪些部分?( )
选项:
A. 全部模型参数
B. 只微调最后几层参数
C. 只微调部分参数
D. 只微调嵌入层
答案:C
解析:微调通常更新部分参数(如适配层),保留预训练权重。 - 大模型SFT时,对于数据集需要考虑哪些因素?( )选项:
A. 数据格式
B. 数据规模
C. 数据质量
D. 数据的真实性正确答案:A、B、C、D
解析:
● 数据格式:需统一格式(如JSONL),确保模型可读取。
● 数据规模:数据量需充足,但需平衡质量与数量。
● 数据质量:低质量数据(如噪声、错误标注)会误导模型学习。
● 数据的真实性:真实业务数据能更好反映模型实际效果。 - 在模型精调的最佳实践中,对于数据准备阶段,以下哪项不是关键步骤?( )
选项:
A. 收集原始数据
B. 数据清洗
C. 数据扩充
D. 模型部署
正确答案:D
解析:
a. 模型部署属于训练后的生产环节,与数据准备无关。
b. 关键步骤包括收集原始数据(A)、数据清洗(B)、数据扩充(C)。 - 在百度智能云千帆AppBuilder中,关于知识库检索策略的描述,以下哪项是正确的?( )
选项:
A. 知识库检索只支持全文检索策略
B. 高级检索策略主要基于关键词匹配
C. 全文检索和高级检索都不能用于知识库检索
D. 用户可以根据需要调整知识库检索的召回数量和匹配分
答案:D
解析:平台支持自定义召回数量和匹配阈值。 - 在百度智能云千帆AppBuilder的应用配置页面,用户可以通过哪些方式生成应用配置?( )
选项:
A. 手动填写配置表单
B. AI自动生成配置
C. 随机生成配置
D. 上传配置文件
正确答案:A、B
解析:
a. 手动填写配置表单:用户可通过界面表单逐项配置应用参数。
b. AI自动生成配置:平台支持通过自然语言描述自动生成配置(如输入“创建文档问答应用”)。
c. 排除选项:
ⅰ. C. 随机生成配置:平台无此功能,配置需用户明确指定。
ⅱ. D. 上传配置文件:当前仅支持界面操作,不支持文件导入。 - Post-pretrain模型训练方法的主要优势是什么?( )
选项:
A. 可适用于特定任务
B. 训练效率高
C. 拥有特殊领域知识能力
D. 能够得到一个强大的通用语言模型
答案:D
解析:Post-pretrain提升通用语言理解能力,为下游任务打基础。 - 在千帆平台中,自定义参数可以保证全部生效。( )
选项:
A. 正确
B. 错误
答案:B
解析:部分参数(如系统保留参数)不可自定义修改。 - Prompt评估功能支持哪些评估方法?( )
选项:
A. 语义相似性
B. Regex匹配
C. 精确匹配
D. 以上全部
答案:D
解析:平台支持语义相似性、正则匹配和精确匹配三种评估方式。 - 将应用发布至文心智能体平台后,通过哪些场景可以触达该应用?( )
选项:
A. 仅通过搜索
B. 仅通过信息流
C. 搜索和信息流
D. 电子邮件推广
答案:C
解析:应用可通过百度搜索和信息流场景分发。 - 当你启用文心智能体平台分发应用时,哪些应用配置项会进行审核?( )选项:A. 应用头像B. 工具组件C. 开场白D. 模型配置正确答案:A、B、C解析:
a. 应用头像:需审核是否包含违规或侵权内容(如敏感图像)。
b. 工具组件:需检查组件功能是否符合平台安全规范(如API调用权限)。
c. 开场白:需审核文本是否合规(如无虚假信息或不当引导)。
d. 排除选项:
ⅰ. D. 模型配置:属技术参数,不涉及内容安全审核。 - 在百度智能云千帆AppBuilder中,思考模型主要用于哪个环节?( )
选项:
A. 任务规划
B. 知识问答
C. 总结生成回复结果
D. 选择应用依赖的大模型服务
答案:A
解析:思考模型负责任务分解和规划(如Agent工作流)。 - 在提交模型训练运行时,如果提示模型数量已达上限,说明当前运行的模型数量已经超过了系统允许的最大值。( )
选项:
A. 正确
B. 错误
答案:A
解析:系统限制并发训练任务数,超限需终止部分任务。 - 大模型的推理速度通常比小模型更快,因为大模型有更强的表达能力。( )
选项:
A. 正确
B. 错误
答案:B
解析:大模型参数量大,推理速度通常慢于小模型。 - Perplexity(困惑度),可以用来衡量大语言模型预测一个语言样本的能力,一个模型推理时的Perplexity数值越低,准确率也就越低,代表模型表现欠佳。( )
选项:
A. 正确
B. 错误
答案:B
解析:困惑度越低,说明模型预测越准确。 - 在进行模型评估时,以下哪些操作是不支持的?( )
选项:
A. 支持对两个模型进行效果好坏的对比
B. 支持对同一模型在不同prompt/参数配置下的效果好坏对比
C. 支持选择平台数据集或预置数据集作为评估数据集
D. 支持选择训练集作为评估数据集
答案:D
解析:评估集需独立于训练集,避免数据泄露。 - 千帆平台提供的在线测试功能支持同时测试多少个服务?( )
选项:
A. 1~3个
B. 1~6个
C. 1~10个
D. 无限制
答案:B
解析:在线测试最多支持同时对比6个服务。 - Post-pretrain模型适用于哪些自然语言处理任务?( )
选项:
A. 文本分类
B. 图像识别
C. 情感分析
D. 智能客服
答案:A、C、D
解析:Post-pretrain模型适用于文本类任务,图像识别属CV领域。 - 在模型精调的过程中,关于训练数据集的说法正确的是?( )选项:A. 数据量越大越好,不考虑数据质量B. 数据来源最好是线上真实业务数据C. 如果数据不足,可以直接使用大模型生成的数据,无需人工审查D. 训练集和评估集的内容可以重复正确答案:B解析:
a. B. 数据来源最好是线上真实业务数据:真实业务数据能更好反映模型实际效果,是精调的最佳实践。
b. 排除其他选项:
ⅰ. A. 数据量越大越好:错误,低质量数据堆砌可能导致过拟合或噪声干扰。
ⅱ. C. 直接使用大模型生成数据:错误,生成数据需人工审查,避免引入错误标注。
ⅲ. D. 训练集和评估集重复:错误,评估集需独立于训练集,避免数据泄露导致评估失真。 - 下列哪一种微调方法是使用低秩分解的方法进行微调的?( )
选项:
A. 全量微调
B. LoRA
C. Prefix-Tuning
D. P-Tuning
答案:B
解析:LoRA通过低秩矩阵分解减少微调参数量。 - 在千帆ModelBuilder中,非平台存储的数据集在进行数据管理、标注、处理时,用户无需自行保证数据地址的有效性。( )
选项:
A. 正确
B. 错误
答案:B
解析:用户需确保外部数据地址长期有效,否则可能导致处理失败。 - 在进行模型评估时,评估数据集的选择必须完全与训练数据集相同。( )
选项:
A. 正确
B. 错误
答案:B
解析:评估集需独立于训练集,以检验泛化能力。 - LoRA微调的主要目标是什么?( )
选项:
A. 保持预训练模型的大部分参数不变
B. 完全重置预训练模型的参数
C. 将预训练模型转换为新任务的完全新模型
D. 删除预训练模型的所有层并添加新层
答案:A
解析:LoRA通过更新低秩矩阵保持原模型参数冻结。 - 下列哪些因素可能会影响大模型微调的性能?( )
选项:
A. 数据集的大小
B. 模型的复杂度
C. 初始学习率的设置
D. 迭代轮次
答案:A、B、C、D
解析:以上因素均可能影响微调收敛速度和最终效果。 - 发布至网页版demo的应用,如果访问地址意外泄露,以下哪种做法是推荐的?( )
选项:
A. 不采取任何措施,等待问题自行解决
B. 立即重新生成访问地址
C. 通知所有用户更改其访问地址
D. 暂停应用的运行,直到问题解决
答案:B
解析:重新生成地址可快速阻断未授权访问。 - 在模型训练过程中,如果手动终止训练任务,以下哪项说法是正确的?( )
选项:
A. 任务终止后,计费将继续进行
B. 任务终止后,可以立即重启训练任务
C. 任务终止,计费也将会终止,且无法重启训练任务
D. 任务终止与否,对计费和重启训练任务无影响
答案:C
解析:终止任务即停止资源占用,计费终止且不可恢复。 - 在AppBuilder中,使用run(.)方法可以向对话中发送消息,并接收对话机器人的回复。( )
选项:
A. 正确
B. 错误
答案:A
解析:run(.)方法用于交互式对话流程控制。 - 使用AppBuilder-SDK开发应用前,首先需要执行的操作是什么?( )
选项:
A. 开通组件服务
B. 调用组件
C. 安装SDK
D. 获取密钥
答案:C
解析:安装SDK是开发环境配置的第一步。 - 百度智能云千帆AppBuilder的产品架构主要分几个层次,为不同开发能力的用户和开发场景提供服务?( )
选项:
A. 一个层次
B. 两个层次
C. 三个层次
D. 四个层次
答案:C
解析:架构分为低代码、专业开发、深度定制三个层次。 - 在百度智能云千帆AppBuilder中创建应用时,哪些元素是可以配置的?( )
选项:
A. 应用的名称和描述
B. 角色指令
C. 组件和知识库
D. 模型配置和追问配置
答案:A、B、C、D
解析:以上均为应用配置的核心模块。 - 百度智能云千帆AppBuilder平台对新用户赠送的免费应用资源有使用期限限制。( )
选项:
A. 正确
B. 错误
答案:A
解析:免费资源通常有30天有效期限制。 - 在配置API节点时,可以支持非标准的HTTP请求。( )
选项:
A. 正确
B. 错误
答案:A
解析:平台支持自定义HTTP方法和头部。 - 在千帆ModelBuilder的数据集管理中,以下哪些操作是支持的?( )
选项:
A. 对已建立的数据集进行版本迭代
B. 删除不再需要的数据集版本
C. 导入本地数据文件到数据集
D. 以上功能都支持
答案:D
解析:平台提供完整的数据集生命周期管理。 - 在百度智能云千帆AppBuilder中,知识库检索只支持全文检索策略。( )
选项:
A. 正确
B. 错误
答案:B
解析:支持全文检索、高级检索(语义匹配)等多种策略。 - 在LoRA策略中,秩的大小要依据下列哪一项?( )
选项:
A. 学习率的大小
B. 数据集的真实性
C. 训练任务的复杂度
D. 梯度累计步数
答案:C
解析:秩的大小需匹配任务复杂度,复杂任务需更高秩。 - SFT之后,哪些指标可以用来分析和观察SFT的效果?( )
选项:
A. BLEU
B. rouge-N(1/2/L)
C. Perplexity
D. TrainingLoss
答案:A、B、C、D
解析:以上指标均可用于评估SFT效果(BLEU/ROUGE评估生成质量,Perplexity评估预测能力,TrainingLoss监控训练稳定性)。 - 强化学习往往需要以下三个基本要素:策略(policy)、动作空间(actionspace)、奖励函数(reward)。( )
选项:
A. 正确
B. 错误
答案:A
解析:三要素是强化学习框架的核心组成部分。 - 在设计Prompt时,为什么要保证语法、用词以及标点的准确性?( )
选项:
A. 为了提高模型的运行速度
B. 为了美观和整洁
C. 为了引导模型生成更准确的内容
D. 为了符合语言规范
答案:C
解析:准确的Prompt可减少模型歧义理解,提升输出质量。 - 关于后付费配额的变更,以下哪些说法是正确的?( )
选项:
A. 平台支持灵活变更配额
B. 可在已购买后付费配额的前提下扩增TPM额度
C. 配额变更后立即生效,无需等待时间
D. 两次降配TPM额度操作至少间隔60分钟
答案:A、B、D
解析:配额扩增可实时生效,但降配需间隔60分钟(C错误)。
1590

被折叠的 条评论
为什么被折叠?



