
工程师技能
文章平均质量分 93
一名攻城狮的基础技能
故事挺秃然
攻城狮的故事挺秃然!!!
展开
-
我的创作纪念日
强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能代理(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。多样性除了从原始数据中获取,也可以通过prompt_template方式构建,对prompt指令进行数据增强,比如中文翻译英文的指令可以拓展为,中译英,翻译中文为英文等相同语义的指令。RLHF的成功取决于人类提供的反馈的质量,根据任务和环境,反馈的质量可能是主观的和可变的。原创 2024-01-18 10:32:58 · 1053 阅读 · 0 评论 -
Markdown文档语法以及数学公式【实践】
Markdown(md)文档的语法以及LaTex数学公式的编写原创 2023-05-13 12:52:41 · 891 阅读 · 0 评论 -
Git从底层到命令的综合【实践】
学习Git,从底层开始了解git的命令语句所执行的操作。看完文章,你能够快速掌握Git。虽说,大模型(LLMs)不断飞速发展,他们展现的基础能力,能超过基础人员的认知,但是在逻辑、思维能力上LLms是达不到,因此,开发人员,更应该扎实基础,在此基础上,不断提高个人的认知以及构思能力。近期,在不断的重温基础知识,厚积才能薄发。原创 2023-05-16 17:59:23 · 366 阅读 · 0 评论