【学习笔记】LLM for Education

文章探讨了ChatGPT和大型语言模型(LLM)如何影响教育,提出机遇与挑战,如AI辅导工具的应用、幻觉问题和教育资源平等,呼吁教育者应积极拥抱变化,引导学生正确利用这些技术。
部署运行你感兴趣的模型镜像

前言

一篇来自Nature的文章,探讨了教育行业的不同参与者,如何抓住LLM这个变革性的工具带来的机会,重新改造这项自人类文明诞生以来就存在的行业。文中提出了当前LLM所带来的机遇与挑战,以及讨论了未来教育领域该何去何从。


Paperhttps://www.nature.com/articles/d41586-023-03507-3
FromNature

Introduction

LLM对教育的冲击已经不可阻挡,不论是学生,老师,还是教育机构,乃至教育工具提供商,都应该积极地把握LLM带来的机会,彻底地改变学习和教学的方式,才能应对教育行业即将发生的改变。
教育心理学家Beghetto设计了一系列以创造力为主题的聊天机器人,并将其托管到亚利桑那州立大学的平台上。这些机器人可以扮演各种角色,用于鼓励学生的创造力。Beghetto将这些聊天机器人和一群研究生以及教学专家进行了对话,得到了积极的反馈,一位参与者说,他们以前曾尝试使用ChatGPT来辅助学习,但发现它并不实用,这与Beghetto的聊天机器人不同。
LLM的兴起同样造成了需要教育工作者的担忧,他们认为学生会更容易作弊。因此,Beghetto团队正在探索如何发挥LLM的潜力,作为加强教育的工具,节省学生和老师的时间,让他们更专注于讨论和学习。为了让一对一辅导模式能够大规模应用,Wolfram Research公司目前正在开发一种基于LLM的辅导软件,这种人工智能合作伙伴可以用来引导学生一步一步地解决问题,激发批判性思维,或者像Beghetto的实验那样,提高用户的创造力,扩展思维的边界。

The risks are real

自从ChatGPT推出以来,其在教育领域的应用大部分都是负面的。因为它的回答写的很好,因此学生会常常依赖ChatGPT帮他们做作业,或者快速获取答案,而不去明白其中的道理。此外,ChatGPT还会输出错误的信息,从而误导学生,这就是LLM的幻觉问题。
虽然GPT-4被认为是表现最好的LLM,但是研究发现,它并不擅长回答大学水平的教科书问题,即使是对问题进行分解进行解答也只能带来适度的提升。
image.png

Embracing LLMs

尽管困难重重,一些研究人员和教育工作者还是看到了LLM的巨大潜力。有的公司使用ChatGPT的替代品,有的公司想方设法减少不准确性和幻觉,有的公司则通过指令微调等方法来让LLM学习特定学科的知识。所谓“高风险,高回报”,许多教育专家都认为对于LLM强大的能力,社会需要帮助学生了解LLM的优势和风险,而不是一味地禁止他们使用这项技术。2023年9月,联合国教科文组织发布了一份题为《生成式人工智能教育和研究指南》的报告。其主要建议之一是教育机构在使用 ChatGPT 等工具支持学习之前先对其进行验证。
一些公司销售MagicSchool和Eduaide等商业助手,这些工具基于LLM,帮助学校教师规划课程活动并评估学生的作业。此外,学术界也开发了其他工具,比如宾夕法尼亚州立大学计算机科学家Rebecca Passonneau团队创建的PyrEval,用于阅读论文并提取关键信息,并且还能为学生撰写的物理论文进行评分,帮助学生对自己的作业内容进行反思。
在这里插入图片描述

Introducing the AI tutor

一些机构直接使用AI来辅导学生,除了ChatGPT,Khanmigo可能是使用最广泛的基于LLM的教育工具。通过使用GPT-4提供的能力,Khanmigo可以在学生完成练习时为他们提供提示和辅导,从而节省教师的时间。它的呈现形式与ChatGPT不同,它以弹出式聊天机器人形式出现在学生的电脑屏幕上,当学生将自己的问题发送到GPT-4之前,Khanmigo会自动添加一个提示,让GPT-4不要直接给出答案,而是提出很多问题,引导学生自己得到答案。
Khanmigo目前仍处于试验阶段,在有助于学习的问题和难到让学生放弃的问题之间存在着微妙的界限,关键就是在于如何找到这条界线。虽然Khanmigo已经有超过2.8万名教师和学生用户,但是它在问答的过程中,有时候会出错,有时候会直接给出答案。这表明,Khanmigo还有很多值得改进的地方。

Augmenting retrieval

另一种创建AI学习助手的方法是将LLM和严格认证的外部知识语料库结合在一起。比如AI公司Merlyn Mind正在其开源Corpus-qa LLM中使用检索生成方法(RAG),这个LLM面向教育领域。在回答问题时,它会参考特定的语料库,从而减少幻觉和其他错误,此外,如果问题没有高质量的回答,就会坦白说自己不会,并努力做出更好的回答。
image.png
华东师范大学的研究人员创建了一款名为EduChat的教育大模型,将论文评估、对话式辅导和情感支持结合在一个大语言模型中。该团队以开放源代码的形式分享了这一工具。尽管EduChat仍处于早期阶段,但它是一个专用的教育LLM,而不是在现有通用模型基础上的套壳工具,这一点值得注意。

Will it catch on?

AI真的能改变教育吗,它是否会造成现有的教育资源不平等?并且如何确保LLM提供的信息不带偏见,并确保模型考虑到代表性不足群体的知识和观点?也许目前无法对这些问题给出准确的答案,但是LLM与人类的努力紧密相连,现阶段必须重新思考在哦教育领域如何教学和评估学习。

总结

LLM对教育领域的冲击已经势不可挡,必然会改变教育领域的发展走势,与其闭关锁国,不如学会拥抱,勇于面对LLM对教育领域的挑战,充分挖掘LLM的潜能和优势,才是现如今教育领域面对LLM冲击下的必要措施。

您可能感兴趣的与本文相关的镜像

GPT-oss:20b

GPT-oss:20b

图文对话
Gpt-oss

GPT OSS 是OpenAI 推出的重量级开放模型,面向强推理、智能体任务以及多样化开发场景

### 关于人工智能 LLM 模型中的 Token 概念 #### 什么是 Token? 在大规模语言模型LLM)中,Token 被定义为模型可以理解和生成的最小意义单位[^1]。它是自然语言处理中最基础的数据单元之一,用于连接人类可读的文本与计算机可操作的数字表示形式。具体来说,Token 的表现形式可以根据不同的标记化方案有所变化,可能是完整的单词、子词甚至是单个字符。 #### Token 的作用 Token 在 LLM 中扮演着至关重要的角色,它充当了原始文本数据和数字化表达方式之间的桥梁[^2]。通过将输入文本拆解成一系列 Tokens 并赋予每种 Token 数值化的标识符,使得复杂的自然语言能够被转化为适合神经网络训练和推理的形式。这种转化不仅提高了效率还增强了灵活性,因为不同长度或结构的内容都可以统一映射到固定维度的空间里进行运算。 #### 不同类型的 Token 表现形式 根据具体的实现方法和技术需求,Tokens 可能呈现多种形式: - **整词级别**:每一个独立存在的词语作为一个单独的 Token; - **子词级别**:较长或者少见词汇会被进一步切分为更短的部分,例如 "playing" -> ["play", "ing"] 或者按照 BPE(Byte Pair Encoding)算法得到的结果; - **字符级别**:极端情况下每个字母都视为一个独特的 Token; 这种方法的选择直接影响到了最终效果以及资源消耗情况,在设计阶段就需要综合考虑各方面因素做出权衡决策[^3]. #### 流式输出机制下的 Tokens 应用场景 当涉及到实时交互式的应用场景时(如聊天机器人),为了提供更加流畅用户体验,则采用了所谓的“流式响应”。这意味着不是等到整个句子完全生成后再返回给用户查看而是逐字/逐句地逐步展现出来——而这背后正是依赖于一个个连续产生的 Tokens 来完成这一过程. ```python def generate_tokens(input_text, tokenizer): tokens = tokenizer.encode(input_text) return tokens def decode_to_string(tokens_list, tokenizer): output_str = tokenizer.decode(tokens_list) return output_str ``` 上述代码展示了如何利用预训练好的分词器对象`tokenizer`, 将一段字符串转换为其对应的 token ID 列表 (`generate_tokens`) 和反之从 token IDs 解码回原生文字串(`decode_to_string`)的功能. ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

HERODING77

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值