文本生成型人工智能程序中用户适当提示的规范

部署运行你感兴趣的模型镜像

中文标题:文本生成型人工智能程序中用户适当提示的规范

英文标题:Regulation of Appropriate Prompts for Users in Text-Based Generative Artificial Intelligence Programs

作者信息:Kaigeng Li, Wechen Jia, Zhi Li School of Media and Law, NingboTech University, Ningbo, China 对应作者:Zhi Li (lizhi@nbt.edu.cn)

论文出处:Software: Practice and Experience

摘要

本研究探讨了文本生成型人工智能(AI)技术治理中透明度原则的重要性。透明度原则不仅要求文本生成型AI的运作原理和算法可解释,还要求这些程序对用户履行基本的提示义务,尤其是在生成内容的真实性和准确性无法保证时。研究目的是探索文本生成型AI中提示方法的分类和频率,并提出法律应要求对不同用户类别实施不同的提示规则,以填补现有法规中的空白。实验在2024年6月1日至15日进行,使用了Kimi程序、Tongyi程序、ERNIE Bot程序、iFLYTEK Spark程序等文本生成AI程序。研究结果显示,未成年用户对生成AI程序输出内容真实性的感知度较低,对可能的虚假性意识不足,且用户误导程度高。研究得出结论,对于需要特殊保护的个体,如未成年人,每次内容生成时应伴随提示。对于其他用户群体,则应在必要时发布提示。为了提高提示的有效性,程序应在界面显眼位置显示永久性提示,使用引人注目的字体和清晰、设计良好的措辞。

引言

随着生成AI技术的快速发展,透明度原则作为人工智能伦理问题的核心元素之一,受到了越来越多的关注。透明度原则包括算法可解释性的提高,以及确保AI程序向用户清晰指示生成内容的性质。文章重点关注生成AI程序对用户的提示问题,尤其是在输出内容的真实性和准确性无法保证时。

相关工作

现有讨论更多关注于规范AI算法的透明度和可解释性,而相对忽视了文本生成型AI程序对用户的提示规范。在技术快速发展的背景下,规范用户提示具有重要意义,有助于提高系统透明度和用户信任,防止误导信息传播,保护弱势群体,履行法律和伦理责任,提升用户体验,并承担社会责任。

生成人工智能技术的非真实和不准确输出结果的必然性

生成AI技术在输出结果的准确性上存在固有挑战和限制,无法保证输出内容的完全真实和准确。模型性能依赖于训练数据,数据偏见、模型漂移和决策过程的不透明性是其中的关键问题。

中国法律中当前的规制方法

中国的《生成性人工智能服务管理规定》强调了服务透明度的提高和生成内容的准确性和可靠性,但并未强制要求生成内容必须真实准确。相反,它允许在某些情况下生成不真实或不准确的内容,只要不违反法律法规。

用户适当提示的调查

调查问卷涵盖了不同问卷群体,全面收集了不同利益相关者对生成AI程序提示标准化的观点和需求,特别是对提示信息敏感或需要特殊保护的群体。问卷包括普通用户群体、特别保护群体、技术研发人员群体和其他相关群体。

不同提示方法和频率的效果

实验中提供了五种类型的提示,从弱到强依次为A至E。研究还分析了不同提示频率对用户误导程度、接受度和流畅性的影响。

本节探讨了在文本生成型人工智能程序中,不同提示方法和频率对用户的影响,包括用户对生成内容的误解程度、接受度和操作流畅性。研究通过实验分析了五种不同的提示方法(从A到E),以及三种不同的提示频率(低频、中频和高频),并评估了它们对用户行为和感知的影响。

5.3 不同提示方法

实验中定义了五种不同的提示方法,它们的提示强度从弱到强依次增加,对应的用户操作流畅性从强到弱,同时用户的误解程度也从强到弱递减。

  1. 不进行任何提示(A):没有任何提示时,用户与系统的交互非常流畅,但用户容易误解并相信生成的内容。

  2. 仅在使用协议中提示(B):虽然使用协议中有提示,但大多数用户实际上不会仔细阅读协议,这可能导致误解和错误的信任。

  3. 在使用协议中提示,并在操作界面的某处提供永久性提示(C):这种方法在保持流畅交互的同时,通过固定位置的永久性提示,能够在一定程度上提醒用户。

  4. 在使用协议中提示;在操作界面的某处永久提示;在生成内容中通过特殊技术设计,在必要时提供特殊提示(D):这种方法在保持流畅交互的同时,能够在需要时提供特殊提示,但保护仍不完全。

  5. 在使用协议中提示;在操作界面的某处永久提示;在每次生成内容中提供特殊提示(E):这种方法通过永久性和特殊提示,确保用户始终意识到输出内容可能不真实,不易被误导,但会降低人机交互的流畅性。

5.3.2 不同提示频率

提示频率对用户的误解程度、接受度和流畅性也有显著影响。实验中定义了三种不同的提示频率:

  1. 低频提示:在内容生成过程中偶尔向用户提示不真实或相关信息,通常只在生成特定敏感主题或关键信息时出现。

  2. 中频提示:在内容生成过程中相对频繁地提醒用户,确保用户对生成内容的真实性持续保持警惕。

  3. 高频提示:每次内容生成时显著提醒用户关于生成内容的真实性或其他重要信息,无论是否出现特定条件或场景。

6.3 用户误导程度、接受度和不同提示方法和频率的流畅性

实验统计分析了不同提示方法和频率下用户的误导程度、接受度和流畅性。结果显示,随着提示方法从A到E的增强,用户的误导程度逐渐降低,但流畅性和接受度也随之降低。例如,E类提示方法的用户误导程度最低,但由于频繁提示,流畅性降低,导致用户接受度降低。

对于不同提示频率,低频提示下用户的误导程度最高,随着提示频率的增加,用户的误导程度逐渐降低,但流畅性和用户接受度也随之降低。

结论

适当的提示方法和频率对于减少用户的误导、提高接受度和保持操作流畅性至关重要。研究建议,对于需要特殊保护的群体(如未成年人),应使用中高频提示方法(C或D),以提高他们的安全意识和识别误导内容的能力。对于普通用户,建议选择适度的提示频率和方法(B或C),以在减少误导的同时确保信息流畅。技术研究和开发人员应优先考虑低频提示(A),以确保流畅性和专业性,同时提供较少干扰的用户体验。

调查结果

研究比较了不同用户群体对生成AI程序输出内容的效果,并提出了针对不同情况的法律建议。研究还探讨了不同提示方法和频率对用户误导程度、接受度和流畅性的影响,并分析了不同字体形式和表达方式的提示词的吸引力和偏好。

调查与讨论

研究显示,不同年龄组的用户对生成AI程序输出内容的效果存在显著差异。研究还讨论了提示策略对用户隐私的影响,并提出了多语言提示策略的必要性。

生成AI程序的应用

文章讨论了生成AI程序在教育、医疗和新闻领域的应用,并强调了在这些领域中合理提示策略的重要性。

结论

文章总结了对提示方法和频率的分类,并建议对需要特殊保护的人群(如未成年人)每次内容生成时提供提示。对于其他人群,则建议在必要时提供提示。法律需要建立必要性的底线,例如在可能发生误解的情况下,需要详细规定。同时,用户界面的某个部分需要有永久性的提示。文章建议法律强制提示以显著的方式呈现,不使用容易忽视的浅色文字,并强制特定的提示问题。未来的研究将进一步探索针对未成年人的提示策略的法律规范,包括对不同年龄组的适应性提示内容和频率的研究。

您可能感兴趣的与本文相关的镜像

Qwen3-8B

Qwen3-8B

文本生成
Qwen3

Qwen3 是 Qwen 系列中的最新一代大型语言模型,提供了一整套密集型和专家混合(MoE)模型。基于广泛的训练,Qwen3 在推理、指令执行、代理能力和多语言支持方面取得了突破性进展

<think>嗯,用户让我写一个Python程序,生成至少400个人的模拟信息,并且实现增删改查功能。首先,我需要考虑如何生成符合现实的数据。姓名、性别、年龄这些字段需要看起来真实。可能需要用一些库,比如Faker或者mimesis来生成假数据。不过用户可能希望自己控制生成的数据结构,特别是年龄要合理,电话号码和地址的格式要正确。然后是写入文件,用户可以选择文本文件或者Excel。可能用csv模块或者pandas库来处理,这样生成Excel文件更方便。接下来是增删改查的功能,需要设计用户交互,可能用命令行菜单,让用户选择操作。模块化编程的话,应该把不同功能分成函数或者类,比如数据生成、文件操作、CRUD功能分开。对于数据生成部分,可能需要随机生成姓名,性别随机分配,年龄在合理范围,比如18到80岁。电话号码要有正确的格式,比如中国的号码以1开头,11位。地址可以用Faker的地址生成,或者自己组合省市街道。邮箱的话,可以结合姓名和随机域名。然后是文件写入,用pandas的DataFrame来存储数据,然后导出到Excel或者文本文件。这样也比较方便后续的读取和修改。关于增删改查,读取文件到数据结构中,比如列表或DataFrame,然后进行操作后再写回文件。需要注意文件读写的同步,避免数据丢失。 用户交互部分,可能需要循环显示菜单,提示用户输入选项,然后调用对应的函数。比如输入1是添加,2是删除,根据姓名或电话查找记录。删除和修改需要先找到对应的记录,可能需要唯一标识,比如电话号码作为唯一键,因为可能有重名的情况。 另外,模块化设计很重要,比如将生成数据、保存文件、加载数据、添加、删除、修改、查找等功能封装成函数。或者使用类来管理黄页,这样数据和方法都封装在对象里,更符合OOP原则。代码规范方面,要遵循PEP8,使用有意义的变量名,添加注释说明函数的作用和参数。异常处理也需要考虑,比如文件不存在时的处理,用户输入无效选项时的提示。 测试部分,生成400条数据是否正常,各个功能是否能正确执行。可能需要打印一些示例数据,或者运行增删改查操作后检查文件是否更新。 可能遇到的问题包括:数据生成的速度,特别是400条数据会不会太慢;电话号码重复的问题,需要确保唯一性;文件读写的效率,如果数据量大,可能需要更高效的方式。此外,用户交互的友好性,比如输入错误时给出提示,而不是程序崩溃。 最后,用户要求将代码和运行截图放到Word里,所以代码需要结构清晰,截图要显示生成的数据文件和操作过程。可能需要分步展示生成文件、添加记录、删除记录等步骤的结果。 现在,按照这些思路来组织代码,先写生成数据的函数,然后处理文件读写,再实现CRUD功能,最后是用户界面。确保每个部分都模块化,方便测试和维护。</think>分步骤为您实现这个人员黄页管理系统。以下是完整实现方案: ```python """ 人员黄页管理系统 功能:数据生成、文件存储、增删改查操作 作者:AI助手 日期:2023-12-12 """ import random import pandas as pd from faker import Faker from typing import List, Dict # 初始化Faker库 fake = Faker('zh_CN') def generate_data(num: int) -> List[Dict]: """ 生成模拟人员数据 :param num: 需要生成的数据条数 :return: 包含人员信息的字典列表 """ data = [] used_phones = set() for _ in range(num): while True: # 生成唯一电话号码 phone = fake.unique.phone_number() if phone not in used_phones: used_phones.add(phone) break person = { '姓名': fake.name(), '性别': random.choice(['男', '女']), '年龄': random.randint(18, 80), '电话': phone, '地址': fake.address().replace('\n', ''), '邮箱': fake.email() } data.append(person) return data def save_to_excel(data: List[Dict], filename: str): """ 保存数据到Excel文件 :param data: 人员数据列表 :param filename: 文件名 """ df = pd.DataFrame(data) df.to_excel(filename, index=False) print(f"数据已保存至 {filename}") def load_data(filename: str) -> pd.DataFrame: """ 从文件加载数据 :param filename: 文件名 :return: DataFrame格式的数据 """ try: df = pd.read_excel(filename) return df except FileNotFoundError: print("文件不存在,即将创建新文件") return pd.DataFrame() def search_record(df: pd.DataFrame, keyword: str) -> pd.DataFrame: """ 搜索记录 :param df: 数据集 :param keyword: 搜索关键词 :return: 匹配的记录 """ mask = df.apply(lambda row: row.astype(str).str.contains(keyword).any(), axis=1) return df[mask] def delete_record(df: pd.DataFrame, phone: str) -> pd.DataFrame: """ 删除指定电话号码的记录 :param df: 数据集 :param phone: 要删除的电话号码 :return: 更新后的数据集 """ return df[df['电话'] != phone] def modify_record(df: pd.DataFrame, phone: str, new_data: Dict) -> pd.DataFrame: """ 修改指定记录 :param df: 数据集 :param phone: 要修改的电话号码 :param new_data: 新数据字典 :return: 更新后的数据集 """ index = df[df['电话'] == phone].index if not index.empty: df.loc[index[0]] = new_data return df def show_menu(): """ 显示交互菜单 """ print("\n人员黄页管理系统") print("1. 生成新数据") print("2. 添加记录") print("3. 删除记录") print("4. 修改记录") print("5. 搜索记录") print("6. 显示所有记录") print("7. 退出系统") def main(): FILENAME = "yellow_pages.xlsx" # 初始化数据 df = load_data(FILENAME) while True: show_menu() choice = input("请选择操作(1-7):") if choice == '1': num = int(input("请输入要生成的数据条数:")) new_data = generate_data(num) save_to_excel(new_data, FILENAME) df = load_data(FILENAME) elif choice == '2': new_person = generate_data(1)[0] df = df.append(new_person, ignore_index=True) save_to_excel(df, FILENAME) print("已添加新记录:") print(new_person) elif choice == '3': phone = input("请输入要删除的电话号码:") df = delete_record(df, phone) save_to_excel(df, FILENAME) print("删除操作已完成") elif choice == '4': phone = input("请输入要修改的电话号码:") if not df[df['电话'] == phone].empty: new_person = generate_data(1)[0] df = modify_record(df, phone, new_person) save_to_excel(df, FILENAME) print("修改操作已完成") else: print("未找到该电话号码对应的记录") elif choice == '5': keyword = input("请输入搜索关键词:") results = search_record(df, keyword) print(f"找到 {len(results)} 条匹配记录:") print(results) elif choice == '6': print("当前所有记录:") print(df) elif choice == '7': print("感谢使用,再见!") break else: print("无效输入,请重新选择") if __name__ == "__main__": main() ``` 代码结构说明: 1. 数据生成模块:使用Faker库生成符合中文特征的模拟数据 2. 文件操作模块:使用pandas进行Excel文件读写 3. CRUD模块:实现增删改查核心功能 4. 界面交互模块:提供命令行菜单系统 主要特点: 1. 生成的电话号码保证唯一性 2. 使用类提示提高代码可读性 3. 数据持久化存储为Excel文件 4. 提供完整的用户交互界面 5. 模块化设计方便功能扩展 运行效果示例: ``` 人员黄页管理系统 1. 生成新数据 2. 添加记录 3. 删除记录 4. 修改记录 5. 搜索记录 6. 显示所有记录 7. 退出系统 请选择操作(1-7):1 请输入要生成的数据条数:400 数据已保存至 yellow_pages.xlsx ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

神一样的老师

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值