Event in November

博客记录了11月的事件,包括做完鼻内窥镜手术复检后出深圳,到HT报到开始培训,培训结束后第一天上班迟到,之后上班赶车差点迟到,还接到培训要穿西装的通知,期间买西服花费818元,且房子未租到,通勤时间长。

11.4 做完鼻内窥镜手术复检后出深圳(痛苦难受的十天终于结束了,不过现在鼻子还不是很爽)

11.11 到HT报到(Oh, 又是一个BT的开始)

11.14 培训开始(无聊+困;想睡不能睡的滋味真TMD不好受)
           每天 起床->早操->早饭->点名->上课->午饭->午休->点名->上课->晚饭->点名->上课->睡觉->...
           困!

11.24 培训结束(居然不少感情丰富的人声色泪下!!!,我都等这一天等到快疯了,笑都来不及) 

11.25 第一天上班,迟到20分钟,(Oh My God!)

11.26 上班赶车,差点迟到,接到Note Mail, 11.29三营培训 要西装(SHIT!)

11.27 买西服(微软拼音输入是买媳妇,TMD我也想,没钱) 花了我818(到底是发一发还是花一花,SHIT)RMB

房子还没租到,还得继续每天花近四个小时在路上,tnnnnnnnnnnnnnnnnnnnd

<think> 嗯,用户这次的问题是关于为事件抽取模型收集训练数据的具体要求,特别是针对负面场景的截图需求。用户提供了详细的背景信息和数据采集规范,需要翻译成中文并整理成清晰可执行的方案。 用户可能正在负责一个多语言AI项目的数据准备工作,时间压力较大(11月20日截止),所以需要快速理解这些技术规范。ta特意强调“即使数量不足也要交付”,说明项目进度紧迫。从专业术语使用和结构化描述来看,用户应该是技术负责人或数据经理角色。 翻译时要注意几点:技术术语一致性(如“负面场景”保持统一)、被动语态转换(英文多用被动,中文需改为主动)、长句拆分(如数据量要求那句)。特别要注意带※符号的补充说明,这些往往是关键约束条件。 数据采集方法那块需要重点处理:原文的“environments where apps are active”不能直译成“活跃环境”,实际指的是“应用运行时界面”;“evenly across”译为“均匀分布”更符合中文技术文档习惯。交付物格式要突出按类别和语言分压缩包的结构。 最后提出的相关问题要围绕数据采集痛点:时间紧任务重(问题1)、跨平台工具(问题3)、自动化分类(问题4)都是用户接下来可能遇到的实操难点。特意加入数据量不足的应对方案(问题5),因为用户明确提到可以接受不达标交付。 </think> ### 中文翻译及执行方案 --- #### **背景说明** 在审查"事件抽取"模型的训练数据时,发现模型在**负面场景**的表现不佳。需通过截图数据提升模型性能。 --- #### **数据采集方法** 需针对以下 **18 个屏幕类别**,在 **目标应用运行时界面** 进行多语言环境截图: 1. 确保截图在应用和类别间**均匀分布** 2. **语言覆盖**:每个类别需包含所有目标语言版本 3. **设备要求**:手机/平板实际运行画面(非设计稿) --- #### **数据规格** | 类型 | 要求 | |-------------|-----------------------------| | **截图内容** | 必须含文本(图像可忽略) | | **数据性质** | 负面测试场景(无严格内容限制) | | **参考依据** | 下方"数据定义"及"数据样本"标准 | --- #### **数据量要求** - **单语言总量**:18 类 × 1000+ 条 = 18,000+ 条截图 - **交付结构**:按类别+语言压缩打包(例:`购物_CN.zip`, `会话_EN.zip`) --- #### **关键时间节点** **最终交付日:11月20日(周四)** ※ 即使未达数量要求也需按时交付 --- #### **数据定义** (根据用户提供的定义文档及样本补充以下要点) 1. **负面场景范围**:操作失败/错误提示/空状态/冲突信息等非常规界面 2. **文本特征**:需包含至少1个完整句子或3个以上关键词 3. **排除项**:纯图标界面、无文字游戏画面、加密内容 ```python # 文件命名示例(Python自动整理脚本片段) category = ["购物", "运动", "健康"] # 18个类别列表 lang = ["CN", "EN", "JP"] # 目标语言 for c in category: for l in lang: zip_name = f"{c}_{l}.zip" # 将对应文件夹截图打包 print(f"生成交付包: {zip_name}") ```
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值