
数据偏见
文章平均质量分 86
澳鹏Appen
这个作者很懒,什么都没留下…
展开
-
为什么AI模型需要合乎道德的数据
另一种预防PII问题的方法是,与Quadrant合作,使用我们的Geolancer程序,该程序可以在将上传的目标点和图像数据集提供给客户之前,自动将其从上传的目标点和图像数据集中删除。为确保我们所使用的数据的采集合乎道德,我们利用我们的全球众包人员采集数据,他们涵盖不同群体,这样就能防止模型中出现偏见。招募中立的第三方来采集数据,并采取适当的保障措施,以确保采集的数据来自多样化的、有代表性的标注员,所有使用模型的人将同样受益。如果采取了上述所有措施,确保数据的采集和使用是负责任的,则模型的训练将合乎道德。原创 2024-04-10 14:01:43 · 438 阅读 · 0 评论 -
AI数据质量监控:数据质量的关键KPI都有哪些?
这些类型的测试让项目负责人能轻松识别不符合项目需求的标注者,并从正在训练的模型中除去他们以及他们所处理的数据。审核员是经验丰富的标注人员,他们能够始终高质量工作,评估已完成标注的数据,检查标注是否正确。保证数据高质量的一种基本方法是使用专门的标注人员,他们能够准确标注数据,并严格遵守项目要求。通过我们的托管服务,众包人员通过严格的预筛选标注测试,确保他们能够根据项目要求准确地标注数据。这个流程由审核员完成,他们遵循相同的预筛选过程,以证明他们可以合乎项目要求,并防止标注不良的数据被用于训练模型。原创 2024-04-03 15:32:08 · 845 阅读 · 0 评论 -
在整个价值链构建负责任的 AI
在整个价值链构建负责任的 AI:从数据到部署,以合乎伦理道德的方式构建 AI构建合乎伦理道德的 AI 是所有人工智能企业的责任,这一点再怎么强调都不为过。负责任或合乎伦理道德的 AI 能够做到公正、公平,并能改善AI服务人群的生活质量。在实践中,这要求 AI 实践者将伦理道德框架应用于构建 AI 的每项工作之中,确保所涉及的人员、流程和工具服务于这项更重大的使命。在整个 AI 价值链中,负责任的 AI 应该在一些关键接触点发挥作用。原创 2024-03-06 12:00:51 · 854 阅读 · 0 评论 -
什么是以人为本的AI?
AI技术蓬勃发展,有望极大改善我们的日常生活。因此,人工智能专家经常围绕在我们社会中利用人工智能的最佳方式展开对话,并由此得出了以人为中心的AI方法。以人为中心的AI意为不是用机器代替人类,而是用机器来优化人类的体验。在以人为中心的AI中,人工输入始终是设计和构建的中心。这种方法利用了人和机器各自的优势,使人和机器能够相辅相成,减少盲点。以人为中心的AI是以人类福祉为出发点,专注于无缝集成到我们生活中的技术,以改善我们的整体体验。这是一种可以缩小人机差距的方法,对双方都有益。原创 2024-03-06 12:00:07 · 555 阅读 · 0 评论 -
以人为本的AI技术升级
在构建“以人为本的技术”时,我们的目标有两方面:一方面是在保证数据质量的情况下优化标注流程,另一方面是减少重复性的无意义操作,来减轻标注员的负担。智能标注的辅助功能可以在标注前、标注中和标注后,帮助人工标注员提高工作效率和保证标注质量。换言之,与没有进行初始标注的数据相比,在移交给标注员进行最终标注之前由机器学习模型完成初始标注的数据产生的标注质量更高。在自动驾驶汽车的一个图像像素标注项目中,使用机器学习模型进行初始标注后,我们所有试验的标注员生产力提高了91.5%,标注质量提高了10%。原创 2024-03-06 11:56:06 · 881 阅读 · 0 评论 -
负责任的训练数据:三个重要方面
毫无疑问,人工智能(Artificial Intelligence)技术一定会在接下来的几年中持续快速发展,并与我们的日常生活愈发密切地联系在一起。现在,企业必须要承担起责任,实施负责任的AI,以最大限度地提高透明度,减少偏见,并指导AI技术的道德应用。毕竟,运行良好的AI应该公平地为每个人提供服务。有关负责任的政策和协议,当前制定的决策将决定AI的未来,进而决定AI将如何塑造我们的未来。数据是这些工作的基础;它是直接影响模型性能的各项AI技术的核心。原创 2023-08-09 11:30:07 · 845 阅读 · 0 评论 -
什么是训练数据?
算法从数据中学习。算法从得到的训练数据中找到关系,形成理解,做出决策,并评估信心。训练数据越好,模型的表现就越好。实际上,与算法本身一样,的质量和数量与数据项目的成功有很大关系。现在,即使您已经存储了大量结构良好的数据,它也可能并未以某种作为模型训练数据集的方式进行标记。例如,自动驾驶汽车不仅需要道路的图片,还需要带标记的图片,其中所有的车、行人、街道标志都要有标注。情绪分析项目需要用标签来帮助算法理解某人何时在使用俚语或讽刺。聊天机器人需要实体提取和仔细的语法分析,而不仅仅是原始语言。原创 2023-08-09 11:17:00 · 1493 阅读 · 0 评论 -
人工智能数据获取与数据管理指南
AI治理是监督一家企业AI使用和实施的框架。对于如何定义这一框架,不同企业受其所在行业、企业内部条例、监管规定以及当地法律的影响。在任何情况下,都不存在放之四海而皆准的方法;各企业应根据自身需求选择最适合的方案。原创 2023-08-02 15:48:03 · 1017 阅读 · 0 评论 -
贯穿AI生命周期各阶段的道德问题:数据标注部分
为解决AI训练数据集中的偏见问题,企业的一个简单做法是,确保其数据标注员获得优厚的报酬和公平的待遇。在数据准备阶段,至关重要的是要有训练有素、享有优厚报酬的员工,他们可以识别无意识的偏见,就能帮助尽可能多地消除偏见。高质量的数据造就高质量的AI模型。如果不能通过添加更多代表性数据来解决数据缺口问题,用于训练AI模型的数据就会存在数据缺口,模型随之就会生成不太准确的结果。并非所有的数据集都是平等的,但我们希望帮助您驾驭AI生命周期中复杂的数据道德问题,这样您就可以为AI模型创建最好、最有用且最可靠的数据集。原创 2023-07-12 15:56:32 · 440 阅读 · 0 评论 -
聊聊AI部署中数据准备阶段的偏见问题
合乎道德的AI始于那些为训练AI模型而标注和清理数据的人原创 2022-10-26 12:06:25 · 797 阅读 · 0 评论 -
点击下载 | 世界经济论坛全新推出深度AI洞察报告
过去的五年间,人工智能领域发展迅速,如何确保负责任的AI应用成为人们当下面临的紧迫挑战。近日,世界经济论坛(World Economic Forum)推出全新洞察报告《AI治理之旅:发展和机遇》(The AI Governance Journey: Development and Opportunities),报告旨在通过业界权威专家建议,共同探讨AI应用的最佳实践。我们比任何时候都需要负责任的AI随着人工智能越来越多地出现在我们生活的方方面面,有关AI伦理道德的讨论也层出不穷。...原创 2021-12-15 18:28:57 · 4292 阅读 · 0 评论 -
突破AI工业化瓶颈,专业数据服务平台化是关键
原文转载自:云科技时代作者: 吴宁川一份最新的全球《2021人工智能与机器学习现状》调研报告显示:2021年,53%的AI团队报告预算在50万美元到500万美元之间(而2020年约为三分之一),这个强烈的信号表明AI对于各行各业各种规模企业的成功变得越来越重要。这份由全球领先的AI数据服务平台公司澳鹏(Appen)连续第7年发布的AI现状年度报告还强调,在2020年由于新冠疫情,各规模的企业都加速推进了AI战略,并且在2021年还将继续保持这种势头。在中国,AI技术应用开始全面覆盖日常生活、科学研究转载 2021-07-09 15:28:08 · 187 阅读 · 0 评论 -
避免人工智能存在“歧视”,要从这8大方法入手
想必你听过很多关于人工智能出现的“歧视”案例、例如:人工智能把一个过马路的婴儿推车识别成危险交通工具、人脸识别软件无法识别出有色人种、人工智能只筛选男性的简历等等。机器与人类不同,算法没法撒谎,如果真的存在“歧视”,就会归因于训练模型的数据。由数据驱动的模型如何避免偏见渗入是人工智能面临的一大挑战。克服与避免 AI 偏见的八大方法AI 中的算法偏见是一个普遍存在的问题,它虽然不可能完全消除,但却可以通过科学的方法积极地避免这种偏见。我们将在本文中围绕如何应对AI中的偏见问题展开深入的讨论。如何避免AI原创 2021-04-08 12:05:21 · 1183 阅读 · 0 评论