
深度学习
文章平均质量分 94
zhengddzz
编程知识千千万万,我们将会为各位揭开编程的神秘面纱!
展开
-
ChatGPT揭秘:深入了解技术原理
2022年11月30日,OpenAI发布了一款具有多种能力的通用大模型ChatGPT,开启了人工智能新时代的序幕。ChatGPT不仅可以生成文本、回答问题、摘要、翻译,还可以与用户进行自然和流畅的对话,根据用户的输入创造出各种有趣和有创意的内容。截止到2023年4月底,ChatGPT的全球注册用户已达1.5亿,每月的网站访问量约为1.6亿。ChatGPT被誉为是消费者应用中用户增长最快的记录保持者,它在发布后仅用了5天就吸引了100万的用户。原创 2024-03-21 20:38:15 · 1126 阅读 · 0 评论 -
大模型文本生成——解码策略(Top-k & Top-p & Temperature)
在大模型训练好之后,如何对训练好的模型进行解码(decode)是一个火热的研究话题。在自然语言任务中,我们通常使用一个预训练的大模型(比如GPT)来根据给定的输入文本(比如一个开头或一个问题)生成输出文本(比如一个答案或一个结尾)。为了生成输出文本,我们需要让模型逐个预测每个 token ,直到达到一个终止条件(如一个标点符号或一个最大长度)。在每一步,模型会给出一个概率分布,表示它对下一个单词的预测。转载 2024-03-19 16:16:53 · 2475 阅读 · 0 评论 -
深度解读 ChatGPT基本原理
它最早是由Google在 2017 年提出,它的目的就是解决传统训练模型,就是循环神经网络中存在的效率问题和并行计算问题。架构它还可以通过堆叠多个层来构建深度学习模型,所以它也是一种深度学习模型,它能够堆叠,所以它就能够不断的来扩大规模,进一步提高模型的性能,现在最新的研究表示,模型越大,它就越有可能出现更多的涌现能力(不知道什么能力就突然被解锁了),就好比今天这个模型还不能对话,随着模型的参数越来越大,层数越来越多的时候,它突然可能就拥有了和你流畅对话的能力,这是一个很不可思议的事情。原创 2024-03-19 16:12:50 · 1576 阅读 · 0 评论 -
设计一基于Text generation web UI的语言模型部署与远程访问的方案
Text generation web UI可为类ChatGPT的大型语言模型提供能够快速上手的网页界面,不仅可以提高使用效率,还可满足私有化部署,或对模型进行自定义。目前,该Web UI已经支持了许多流行的语言模型,包括LLaMA、llama.cpp、GPT-J、Pythia、OPT、GALACTICA等.原创 2024-03-03 05:00:00 · 1866 阅读 · 0 评论 -
TensorFlow 的特点和应用场景介绍
TensorFlow 提供了许多高级抽象和预定义模型,这些功能可以帮助开发者快速构建、训练和部署各种类型的深度学习模型。Keras API:Keras 是 TensorFlow 中的高级神经网络API,提供了简单而直观的接口,使得构建神经网络模型变得容易。Keras API 支持快速搭建各种深度学习模型,包括全连接神经网络、卷积神经网络、循环神经网络等,同时还提供了丰富的层和激活函数等组件。预训练模型。原创 2024-02-23 18:49:52 · 1228 阅读 · 1 评论