
LLM
文章平均质量分 70
hallo128
专业:统计学,985硕,北京理工大学。现对AIGC中的扩散模型感兴趣,做论文的公式推导和项目代码实现。
B站定期更新视频,知识交流,共同进步,也欢迎大家提供一些好的文献或者项目代码。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
How FAR ARE WE FROM AGI?(ICLR AGI Workshop 2024)概览
这些模型显示了非凡的能力,有时在特定领域与人类的能力相当,甚至超过人类的能力,暗示着图灵测试的某种形式正在通过。我们正在看到这些模型扩展的有希望的迹象,如人工智能代理利用工具,从外部数据库检索,显示推理能力,通过编写代码竞争复杂的任务,多模态学习与文本和图像等。影响的关键问题变得至关重要,例如,将 AGI 的价值观与人类的多样化信念集合相一致,导航道德困境,确保 AGI 能够做出道德决策,并解决生成性 AI 的安全风险。然而,尽管这些进展很有希望,但目前的 LLM 和真正的 AGI 之间的差距仍然很大。原创 2024-09-29 11:13:30 · 1299 阅读 · 0 评论 -
model_flops: 计算模型的浮点运算数(FLOPs)
【代码】model_flops: 计算模型的浮点运算数(FLOPs)原创 2024-09-21 22:55:06 · 593 阅读 · 0 评论 -
【LLM】吴恩达『微调大模型』代码笔记(03_Instruction_tuning_lab_student)【如何进行推断函数定义】
通过 AutoTokenizer 从预训练模型 EleutherAI/pythia-70m 加载分词器(tokenizer)。# 通过 AutoModelForCausalLM 从同样的预训练模型 EleutherAI/pythia-70m 加载因果语言模型(Causal LM),该模型用于生成文本# 定义一个函数 inference,用于进行推理。原创 2024-09-21 20:51:17 · 855 阅读 · 0 评论 -
面向开发者的LLM入门教程(学习笔记02):提示原则
提示词执行以下操作:首先,用一句话概括三个反引号限定的文本。第二,将摘要翻译成英语。第四,输出包含以下键的 JSON 对象:英语摘要和人名个数。要求 GPT 生成三本书的标题、作者和类别,并要求 GPT 以 JSON 的格式返回给我们,为便于解析,我们指定了 Json 的键。如果任务包含不一定能满足的假设(条件),我们可以告诉模型先检查这些假设,如果不满足,则会指出并停止执行后续的完整流程。将Prompt加以改进,该 Prompt 前半部分不变,同时。虚假知识:模型偶尔会生成一些看似真实实则编造的知识。原创 2024-09-18 15:37:59 · 546 阅读 · 0 评论 -
面向开发者的LLM入门教程(学习笔记01)
大语言模型(LLM) 的更强大功能是能通过 API 接口调用,从而快速构建软件应用程序。原创 2024-09-18 14:48:52 · 747 阅读 · 0 评论