- 博客(111)
- 收藏
- 关注
原创 解读 GPT 官方最佳实践:6 大策略 17 个技巧
这些技巧不仅可以帮助我们更有效地使用 GPT,也提供了一种新的思考角度,让我们能更好地理解这一复杂而又强大的 AI 工具。希望大家在使用 GPT 的道路上能从中受益,更有效地解决问题,创造价值。
2023-07-28 11:23:16
2047
原创 GPT一键化身「AI助理」——自定义指令功能
最近GPT又更新了一个超实用的功能——自定义指令,启用后,你可以给GPT设置一些固定指令,让它记住或扮演某个角色,比如客服、律师、投资管理师、老师、营养师......接下来,再次点击个人信息,找到定制说明(Custom instructions),到这里,就可以设置你的专属自定义指令了。3)让它扮演营养师,推荐适合的购物清单对话测试除了这些,像我们之前给大家分享的一些超级指令,现在可以直接预设给GPT了。除了新增自定义指令这个功能之外,自下周开始,GPT-4的消息发送数量将翻一倍,提升到50次/3小时。
2023-07-26 10:13:40
3216
原创 OpenAI推动人工智能治理向前发展
他们承诺建立或加入一个论坛或机制,通过该论坛或机制,他们可以开发、推进和采用前沿人工智能安全的共享标准和最佳实践,如NIST人工智能风险管理框架或与红队、安全和社会风险相关的未来标准。这些报告应包括进行的安全评估(包括在危险能力等领域,只要这些评估有责任公开披露),对适当使用领域有影响的绩效的重大限制,讨论模型对公平性和偏见等社会风险的影响,以及为评估模型的部署适宜性而进行的对抗性测试的结果。作为我们建立安全和有益的AGI的使命的一部分,我们将继续试点和完善具体治理实践,专门针对我们生产的高性能基础模型。
2023-07-25 11:53:15
485
原创 如何让写作论证精彩、充满说服力和愉悦感?
如果你之前没有大量的阅读、写作经历,你可能脑子里就时没有很多素材,但没关系,现在有一个伟大的发明,搜索。比如你的写作范围基本就是“个人成长、事业发展”,所以你要的案例都是这方面相关的,这一点明确之后,平时就会注意积累,在生活中跟朋友聊天时,在上班时对同事们的观察,在看书看文章时,在看电影时,都要刻意去寻找跟个人成长、事业发展相关的精彩案例。某一天,你过红绿灯时,一位盲人站在路口不知所措,你正准备去帮他时,一位小姐姐跑过去扶着盲人过了马路,你心里会有遇到“同类”的感觉,因为她做了你认为对的事情,这就是共鸣。
2023-07-25 09:56:22
402
原创 用人类意识加持的AI加速科学发展,xAI目标的可行性报告
为了生成每个随机游走序列,模型 (i) 以一个有价值的属性(例如铁电性)作为序列中的第一个节点开始游走,(ii) 随机选择提到该属性的一篇文章(超边),(iii) 从那篇文章中随机选择一个材料或作者作为下一个节点,然后通过随机选择与新选择的材料或作者有关的另一篇文章开始第二步,并重复这个马尔可夫过程 (Markov process)预定次数。对于前面提到的所有三种电化学特性、COVID-19疗法和疫苗,以及上面考虑的100种疾病中的大多数,研究发现日期和专家密度之间的相关性是负的、显著的和实质性的。
2023-07-24 14:42:27
401
1
原创 为什么AI工程师现在开始崛起
从超过2亿美元的庞然大物Langchain,到由Nvidia支持的Voyager,显示了代码生成和重用的不可置疑的重要性(我最近参加了与Harrison举行的链式应用与自主智能体的网络研讨会,在那里我扩展了代码核心与LLM核心应用的论点)。6年前,Andrej Karpathy撰写了一篇非常有影响力的文章,描述了“软件2.0” - 将精确建模逻辑的“经典栈”手工编码编程语言与“机器学习”神经网络的新栈进行对比,后者近似逻辑,使软件能够解决比人类能够建模的问题更多。,实际上提供了“AI研究即服务”的API。
2023-07-22 09:15:31
132
原创 大语言模型
这些嵌入捕获了词之间的语义关系,语义相似的词在嵌入空间中位置邻近。此外,角色的Diffusion模型允许用户通过Stable Diffusion的图片到图片过程,创建一个基于自己外观的南方公园角色,并作为平等参与的智能体加入模拟。由于大多数南方公园剧集的转录是GPT-4训练数据集的一部分,它已经对角色的个性、谈话风格以及节目的整体幽默感有很好的把握,无需再进行定制微调。不连续任务的例子有,需要开创性的观点或创造性应用公式的数学问题,撰写笑话或谜语,想出科学假说或哲学论点,或开拓出一种新的写作流派或风格。
2023-07-22 09:12:50
645
原创 ChatGPT开放自定义系统级别的指令,可设置偏好变成专属助理
我们可能会使用您的自定义说明来提高用户的模型性能,但您可以通过数据控件禁用此功能。通过与22个国家的用户的对话,我们加深了对可转向性在使我们的模型有效反映每个人的不同背景和独特需求方面所起重要作用的理解。例如,如果您在说明中指定您居住的城市,并使用帮助您预订餐厅的插件,则该模型在调用插件时可能包括您的城市。OpenAI为其大型语言模型接口ChatGPT引入了自定义指令,旨在为用户提供更加量身定制和个性化的体验,可以设置您的偏好,ChatGPT将在未来的所有对话中记住它们。OpenAI官方消息。
2023-07-21 11:13:07
528
原创 谁是Al生成内容的作者?从法律视角的探讨
然而,随着人工智能技术的发展,相关的法律规定可能会发生变化。另一方面,人工智能的开发者或使用者可能会主张他们是这些内容的作者,人工智能的开发者可能会主张他们拥有这些内容的版权,因为他们创建了生成这些内容的算法和模型。在版权法中,作者通常被定义为作品的创造者,是作品的原始所有者,并享有对作品的各种权利。一方面,人工智能是生成这些内容的工具,但它既不是自然人,也不是法人,因此在现行的《著作权法》体系下,人工智能难以被视为作者。人工智能是一种工具,它可以根据预设的算法和模型,以及输入的数据,生成各种内容。
2023-07-20 08:59:54
276
原创 650亿参数大模型预训练方案开源可商用,LLaMA训练加速38%
650亿参数大模型的预训练方案,发布即开源。训练速度较传统方案提升38%。这就是由Colossal-AI最新发布的类LLaMA基础大模型预训练方案。要知道,在“百模大战”背景下,谁拥有自家大模型,往往被视为核心竞争力。在这个节点下,愿意开源大模型的公司少之又少。但自己从头训练一个大模型,对技术、资金都有很高要求。由此,Colossal-AI最新的开源动作,可以说是应时势所需了。并且它还不限制商业使用,开箱即用仅需4步。具体项目有哪些内容?一起往下看~
2023-07-20 08:55:36
400
原创 OpenAI科学家Jason Wei关于人工智能的回复
原因是,当你处于能力的边缘时,学习会发生得最快,而由于(2)和(3)是为你量身定做的,它们会让你的学习速度更快。我认为我从研究中学到的最多的就是做研究,而达特茅斯的一个好处就是教授们会尽量抽出时间来指导你或对你的工作给予反馈,即使他们并不是你想研究的领域的专家。我个人的观点是,从事自己喜欢的研究非常重要,因为从长远来看,你会做得更好。很难说多学数学不好,但我是这么认为的(这只是我的观点):在深度学习的历史上,有两件简单的事情经受住了时间的考验,而且几乎总是有效:更大的模型和更多的数据。我想我理解你的感受。
2023-07-19 10:06:04
309
原创 Wix推出AI生成式工具
Newsguard是一家提供审查新闻来源工具的公司,已经曝光了数百个广告支持的网站,这些网站的名称听起来通用,其名称以生成人工智能创建的错误信息为特色。查找创意机构的目录Top Design Firms在2022年进行的一项调查发现,近27%的小企业仍然没有网站,低流量,随后添加“高级”功能和成本,是他们网站面临的首要挑战。Abrahami说:“人工智能网站生成器利用我们的领域专业知识和近十年的人工智能经验来调整模型,以生成高质量的内容、量身定制的设计和布局。即使是以最佳意图使用的生成人工智能也会出错。
2023-07-19 08:41:58
211
原创 中国开源大模型们纷纷商用免费,这步走对了
而商业可用开源可以让国产模型进一步摆脱只论benchmark评分的阶段,进入了是骡子是马拉出来溜溜的阶段,真正的具体的不同的场景,到底推理表现如何,灾难遗忘的问题如何解决,现实环境数据飞轮启动以后是否能提速追逐,将是每个人都能实实在在看到的。于是,当闭源的模型与开源生态注定会越来越多的在解决同样的问题时,闭源用一种大力出奇迹的方式证明路线可能性和天花板之后,开源会真正把它变得易用和可用,在大模型的技术原理越来越没有秘密的趋势下,开源的吸引力会继续变强。尤其是,它还可以实时整合许多最新的、多样化的知识。
2023-07-18 09:03:22
373
原创 人工智能系统将家用机器人的解决问题技能提高了80%
因为每个人的家都是不同的,机器人应该是适应性强的问题解决者,而不仅仅是食谱的追随者。在正常情况下,家用机器人遵循预定义的执行任务的配方,这并不总是适合多样化或不断变化的环境。正如麻省理工学院所描述的那样,PIGINet是一个神经网络,它吸收了“计划、图像、目标和初始事实”,然后预测任务计划可以完善以找到可行的运动计划的概率。“我们未来的目标是进一步完善PIGINet,在确定不可行的行动后提出替代任务计划,这将进一步加快可行任务计划的生成,而无需大数据集从头开始培训通用规划师。
2023-07-18 08:55:36
122
原创 SepVAE:一种对比VAE,用于将病理模式与健康模式分离开来
对比分析VAE(CA-VAEs)是一类变分自编码器(VAEs),旨在将背景数据集(BG)(即健康受试者)和目标数据集(TG)(即患者)之间的共同变异因素与仅存在于目标数据集中的因素分离开来。关键思路:该方法将潜在空间分为显著特征集(即仅适用于目标数据集)和公共特征集(即存在于两个数据集中)。为了实现这一目标,论文提出了两个关键的规则化损失:在共同表示和显著表示之间的解缠绕项以及在显著空间中的背景和目标样本之间的分类项。相比于当前领域的研究状况,提出了一种新的解决方案,能够更好地区分健康数据与病理数据。
2023-07-17 10:07:41
270
原创 AI生成的内容污染互联网,我们该如何拿来写作?
这个问题一方面可以通过给GPT投喂你自己创作的内容来改善,可以使用类似的指令:学习以下的文案的用词、断句、语言、风格、态度。这个问题是注定会出现的,因为从源头去看,Al的训练源于大量的文本数据,这就意味着Al所产生的内容的准确性和质量,至多只能达到其训练数据的平均水平。在实践中,你应当将AI视为一种辅助工具,而非完全可靠的信息源,它的主要作用是帮助你提升创作效率,而不是替代人的思考和判断。因为AI并不能理解创作的目标和读者的需求,更重要的,Al写不出带有你人设的东西,这些独特性的内容,还是需要你自己写。
2023-07-17 10:06:54
321
原创 GPT-4最新细节曝光:从架构、基础设施、训练数据集、成本、视觉到MoE
一波巨大的模型即将到来。然而,对于给定的分区布局,芯片间通信所需的时间下降得较慢(或根本不下降),因此随着芯片数量的增加,它变得越来越重要,成为一个越来越重要的瓶颈。较小的批量大小通常可以实现较低的延迟,但较小的批量大小也会导致更差的利用率,从而导致每个令牌的总成本(以芯片秒或美元计)更高。令牌到令牌的延迟的普遍变化以及在进行简单的检索任务与更复杂的任务时的差异似乎表明这是可能的,但是变量太多,无法确定。更多的芯片和更高的批量大小是最便宜的,因为它们可以增加利用率,但这也引入了一个第三个变量,即网络时间。
2023-07-15 10:36:33
390
原创 生成语言模型真实性评估基准测试数据
生成语言模型的事实性评估基准》 Dor Muhlgay、Ori Ram、Inbal Magar、Yoav Levine、Nir Ratner、Yonatan Belinkov、Omri Abend、Kevin Leyton-Brown、Amnon Shashua、Yoav Shoham 在将语言模型(LM)部署到特定领域之前,重要的是要衡量它在该领域中生成事实不正确信息的倾向。现有的事实生成评估方法仅关注于来自于语言模型本身的事实,因此无法控制评估的事实集,并且可能低估罕见和不太可能的事实。
2023-07-15 10:31:46
608
原创 AI 与自动化:更多的自动化,全新的自动化方式?
但如果使用机器制造一双鞋变得更便宜,那么鞋子就会更便宜,更多的人可以买鞋子,他们有更多的钱可以花在除此之外的其他东西上,并且我们会发现我们需要或想要新的东西,并创造新的工作岗位。每一次 ChatGPT 的更新,都会给我们带来大量新的能力,这些能力往往会逐步应用在改变我们现有工作流程上,因此我是比较看好这一波 AI 在自动化(RPA)领域的价值的,不过要将一个新技术真正应用直至取代复杂的工作流程,我觉得还需要不少的时间,但应该是接下来很大的一个机会。实际上,我们仍在探讨争论的问题,但每个人都同意,
2023-07-14 13:59:17
2060
原创 AI自媒体的精彩总结
我们可以将AI配置为“热点分析师”,在热点发生后,将事件提供给Al,让它为你找到切入的角度。可以使用类似的【prompt】:请帮我分析某一热点事件,从心理、社会等层面来分析该热点,为我产出三个可以写文章的角度,要求观点鲜明,不用追求客观,一定要有独特的观点。你可以将一篇同行的文章输入到AI,让AI进行总结或者分析,这可以帮助你了解同行的写作风格、观点,甚至找到你可以进行深入研究的点。当然,想要产出优质的内容,几个prompt是远远不够的,还需要不断地微调和训练,反正GPT也不反抗,尽情PUA它就是了。
2023-07-14 13:49:05
374
原创 基于 NNCF 和 Optimum 面向 Intel CPU 对 Stable Diffusion 优化
基于隐空间的扩散模型 (Latent Diffusion Model),是解决文本到图片生成问题上的颠覆者。Stable Diffusion 是最著名的一例,广泛应用在商业和工业。Stable Diffusion 的想法简单且有效: 从噪声向量开始,多次去噪,以使之在隐空间里逼近图片的表示。但是,这样的方法不可避免地增加了推理时长,使客户端的体验大打折扣。众所周知,一个好的 GPU 总能有帮助,确实如此,但其损耗大大增加了。就推理而言,在 2023 年上半年 (H1’23),一个好 CPU 实例 (
2023-07-13 10:03:36
1295
1
原创 马斯克在与创业公司OpenAI竞争的新竞标中公布了xAI
现在唯一可以知道的是,现任人工智能安全中心(Center for AI Safety)主任Dan Hendrycks将担任xAI的顾问——人工智能安全中心是一家总部位于旧金山的非营利组织,其宗旨是“减少与人工智能相关的社会风险”。“探索宇宙本质”这个使命,和大部分AI公司都不相同,显示出这可能是一家不走寻常路的公司。xAI在官网里表示,其独立于X Corp(Twitter、特斯拉等公司的母公司),但xAI“将与 X (Twitter)、特斯拉和其他公司密切合作,在实现我们的使命方面取得进展。
2023-07-13 10:01:38
196
原创 任务型对话对话策略学习的强化学习方法
类似地,戴氏(Dai et al.)等人虽对对话管理的进展和挑战进行了综述,但由于其研究兴趣的涵盖面广,故其中涉及到有关DPL中RL方法的讨论相当有限。而且,RL对话系统在五个核心的RL要素,即环境、策略、状态、行动和奖励方面通常有不同的设置。在管道途径中,DPL是联系DST模块和NLG模块的中间纽带,直接关系到对话系统的成败,故相当重要。第二种是模组途径:将系统分为四个相互依存的的组成部分:自然语言理解(NLU)、对话状态追踪(DST)、对话策略学习(DPL)和自然语言生成(NLG),如图1所示。
2023-07-12 14:59:05
380
原创 Google DeepMind首席执行官Demis Hassabis访谈录
人工智能伴随着挑战和问题,尤其是有一个巨大的组织结构图移动和一系列高风险的决定要做。我很高兴你在这里。让我们从Google DeepMind本身开始。Google DeepMind是谷歌的一个新部分,由谷歌的两个现有部分组成。有谷歌大脑,这是我们熟悉的人工智能团队,因为我们报道了由杰夫·迪恩运营的谷歌。还有DeepMind,这是你创立的公司。你在2014年把它卖给了Alphabet。你在谷歌之外。直到刚才,它还是在控股公司Alphabet结构中作为一家独立的公司运营。从头开始。为什么DeepMind和G
2023-07-12 14:54:06
296
原创 如何借助大语言模型编写更好的代码
例如,您可以要求它编写一个排序算法,用Python启动Web服务器的代码,根据数据库模式编写SQL查询,或者生成Matplotlib的数据可视化命令。为此,您可以使用一个新的聊天会话,并在提示中向ChatGPT提供任务的概述、您目前已完成的步骤、您目前已生成的代码以及您希望它遵循的一些一般准则。通过清理之前与LLM的交互中的混乱内容,您提供了一个更清晰的上下文,并提高了模型生成的代码的准确性。一个成功的方法是首先给ChatGPT一个逐步的程序逻辑概述,让它了解您想要编写的程序的逻辑。
2023-07-11 16:37:00
345
原创 MOSS-RLHF实现大模型和人类价值观对齐
FudanNLP 团队通过大量、详实工作,设计实验充分探索了大模型 RLHF 的完整工作流程,仔细剖析了 RLHF 中的强化学习 PPO 算法的内部工作原理以及它在整个 RLHF 中的作用,并研究各种优化方法如何影响训练过程。项目主要作者 FudanNLP 组博士生郑锐补充到:"在开展 RLHF 项目的过程中,我们发现 PPO 算法是模型稳定训练的关键,而 RM (reward model) 的质量决定了模型性能的上限,在本次开源的 RM 基础上,我们也将继续努力探索如何构造更高质量的 RM。
2023-07-11 16:19:32
1270
原创 GPT API+自动化提高生产力
假设我们在playground里面输入客户的问题,GPT会回复答案,那如果我们把表单给客户,客户填写了问题,就是我们这里需要的变量,我们找到Google表单里面的变量,这里我们选取在表单中的字段名称,就是“问题"字段。无论是类似的自动化工具平台,还是GPT,应用都太广了,不能局限在玩一玩上面,更主要的是应用到我们的工作学习中,帮助我们降本增效,帮助我们提高生产力,帮助我们商业变现。于是,我们就实现了从接收客户问题,到GPT处理回复客户的内容,再到自动发送邮件给客户,—整个业务就完成了,—句代码都没有。
2023-07-10 14:37:45
509
原创 Monica - ChatGPT侧边栏助手
可以在edge的插件商店直接搜到的一个插件,浏览网页的时候就在页面侧边,很方便随时点开,需要使用邮箱注册,免费用户每天可以提问30次,但GPT-4和联网等功能都需要付费,可以通过邀请免费获得一些ai聊天次数,我的邀请码是:https://monica.im/?并且像Excel-Chatgpt,sql-Chatgpt,Mini-Chatgpt,claude,brad等提供的能力,我们会一直保持关注,或许在将来您也可以在Monica上看到这些功能。作为你的副驾驶,Monica在侧边栏能够回答任何复杂的问题。
2023-07-08 09:31:20
2587
原创 一文看懂ChatGPT与存算一体化
ChatGPT开启大模型“军备赛”,存储作为计算机重要组成部分明显受益:ChatGPT开启算力军备赛,大模型参数呈现指数规模,引爆海量算力需求,模型计算量增长速度远超人工智能硬件算力增长速度,同时也对数据传输速度提出了更高的要求。XPU、内存、硬盘组成完整的冯诺依曼体系,以一台通用服务器为例,芯片组+存储的成本约占70%以上,芯片组、内部存储和外部存储是组成核心部件;存储是计算机的重要组成结构,“内存”实为硬盘与CPU之间的中间人,存储可按照介质分类为ROM和RAM两部分。存算一体,后摩尔时代的必
2023-07-08 09:07:17
459
原创 AI大爆炸至少将持续十年
2020年,智源成立大模型攻坚团队,2021年推出了“悟道2.0”大模型,参数量达1.75万亿,是GPT-3.5的近10倍,是当时中国首个、全球最大的万亿级模型。如果我们看杰弗里 · 辛顿(Geoffrey Hinton)或者是杨立昆(Yann LeCun)这样的人,我们应该从他们身上学到的是,他们对于自己所做研究的热爱,不会因高潮低潮而改变。张宏江一直对年轻人充满信心,“一代比一代强,他们的包袱比我们身上的包袱少,有自信,知识面比我们宽,全球的视野比我们在他那个年纪的时候要强太多。为什么中国没有做到?
2023-07-07 09:43:54
181
原创 基础大模型能像人类一样标注数据吗?
相同的偏好标签也可以用模型输出获取,用以构建两两模型间的 Elo 排序 (Elo 排序 是常用于象棋或游戏中的一种通过两两对比构建全局排行榜的方法,排名越高越好)。这些从 RLHF 而来的数据被用来训练一个奖励模型,用以评判哪个回答是更好的,但为模型输出结果进行打分和排名的这一思想已经演变成了一种更通用的模型评测工具。训练模型的过程会发生很多意想不到的趣事,所以我们需要对各个开源模型做一个更严格的对照实验,看看偏好收集过程如何转化为当今盛行的 GPT-4/ChatGPT 偏好评估,以及与它们的差异对比。
2023-07-07 09:38:50
429
原创 Agent System 是什么?
CoT 已经成为提升复杂任务模型性能的标准提示技术,它通过让模型“逐步思考”,利用更多的测试时间,将困难的任务拆解为更小、更简单的步骤。该方法假设特定领域的 PDDL 和适当的规划师可用,可以帮助 Agents 更好地规划和执行任务,提高任务完成的效率和质量。• 反思和细化:Agents 可以对过去的行为进行自我批评和反省,从错误中吸取经验教训,并为接下来的行动进行分析、总结和提炼,这种反思和细化可以帮助 Agents 提高自身的智能和适应性,从而提高最终结果的质量。
2023-07-06 09:27:26
540
原创 高清还原你大脑中的画面
因此,经过改进的 EEG 特征嵌入可以与 CLIP 的图像和文本嵌入很好地对齐,并更适合于 SD 图像生成,从而提高生成图像的质量。实际上,如图 6 右下角所示,即使在没有预训练的情况下,使用 CLIP 对齐 EEG 特征仍然可以得到合理的结果,这凸显了 CLIP 监督在该方法中的重要性。为了增强 EEG 特征与 Stable Diffusion 的兼容性,研究人员进一步通过在微调过程中减少 EEG 嵌入与 CLIP 图像嵌入之间的距离,进一步对齐了 EEG、文本和图像的嵌入空间。
2023-07-05 08:34:26
161
原创 AI绘画结合GPT 把Ai绘画与摄影玩明白
而摄影则需要捕捉现实中的瞬间,尽管后期处理可以改变一些元素,但基本的形象是由被摄物决定的。摄影的出现在19世纪中叶,挑战了绘画作为记录现实的主要方式,推动了艺术家寻找新的创作手法,这就导致了现代艺术的出现。许多摄影师的作品都受到了绘画的影响。特写,快照美学,超高清画面,一个美丽的女孩,18岁,在海边奔跑,蓝天白云,脸上带着微笑,超细节,宾得k1000,体积光,柯达彩色胶片拍摄,摄影师川内凛子 (Rinko kawauchi) 。总的来说,绘画和摄影是两种独特的艺术形式,它们既相互竞争,又相互影响。
2023-07-05 08:34:04
1755
原创 Stable Difussion能做什么?
每个词元随后将转换为一个包含768个数值的向量,我们称之为标签(Embedding)(是的,就是那个你在SD GUI工具中所使用的Embedding)。我们为什么需要标签?如果你将降噪强度(denoising strength)设置为1,那你获得的图片其实就等价于纯粹使用文本指令运行文本生成图片工具所得到的结果,因为此时这两种功能使用的初始潜空间图像都是一个完全随机的噪声图。标签的使用是有魔法的。训练的过程也是一样的,训练流程中生成的并不是噪声图像,而是潜空间中的张量(即一个4x64x64的噪声图)。
2023-07-04 09:17:28
2067
原创 悟道·天鹰 Aquila + 天秤 FlagEval,打造大模型能力与评测标准双标杆
更多维度的评测数据集也在陆续集成中。天秤(FlagEval)大模型评测体系及开放平台,旨在建立科学、公正、开放的评测基准、方法、工具集,协助研究人员全方位评估基础模型及训练算法的性能,同时探索利用AI方法实现对主观评测的辅助,大幅提升评测的效率和客观性。AquilaCode-7B “文本-代码”生成模型,基于 Aquila-7B 强大的基础模型能力,以小数据集、小参数量,实现高性能,是目前支持中英双语的、性能最好的开源代码模型,经过了高质量过滤、使用有合规开源许可的训练代码数据进行训练。
2023-07-04 08:45:25
368
原创 基于Transformer视觉分割综述
南洋理工大学和上海人工智能实验室几位研究人员写了一篇关于 Transformer-Based 的 Segmentation 的综述,系统地回顾了近些年来基于 Transformer 的分割与检测模型,调研的最新模型截止至今年 6 月!技术的角度进行细致分类。例如,会对同时修改元架构的解码器端的方法进行分类,分为基于图像的 Cross Attention,以及基于视频的时空 Cross Attention 的建模。基于该元架构,本综述把相关的方法进行归纳与总结,系统地回顾了近期的方法。
2023-07-03 10:09:07
1121
原创 英伟达新SOTA可对未知物体进行6D追踪和3D重建
最后,内存池中的所有具有姿态的帧用于学习基于 SDF 表示的神经物体场(在单独并行的线程中),该对象场建模物体的几何和视觉纹理,同时调整它们先前估计的姿态,以鲁棒化 6D 物体姿态跟踪。与单帧姿态估计方法类似,这些方法在不同的假设条件上进行,例如训练和测试使用相同的物体,或者在相同类别的物体上进行预训练。物体可以在整个视频中自由移动,甚至经历严重的遮挡。然而,与所有以往工作不同的是,英伟达的追踪和重建协同设计采用了一种新颖的神经表示,不仅在实验证实中实现了更强大的跟踪能力,还能够输出额外的形状信息。
2023-07-03 09:57:43
417
原创 大型语言模型作为属性化训练数据生成器
与此同时,主攻数学问题的 AI 也在不断发展壮大:一个名为 LeanDojo 的开放平台提供了一套基于大型语言模型的开源定理证明器,消除了在机器学习方法用于定理证明时存在的私有代码、数据和大量计算需求等障碍,为机器学习方法在定理证明领域的研究提供了便利。对于给定的分类任务,首先通过LLM的帮助,以交互式、半自动化的方式识别属性维度及其对应的属性值。大型语言模型作为属性化训练数据生成器,提出一种使用多样化属性提示的数据生成方法,可以生成具有多样性和属性的训练数据,从而提高了模型的性能和数据生成的效率。
2023-07-02 11:52:17
753
原创 能说会画 VisCPM:SOTA 开源中文多模态大模型
VisCPM 是一个开源的多模态大模型系列,支持中英双语的多模态对话能力(VisCPM-Chat模型)和文到图生成能力(VisCPM-Paint模型)。两个模型在指令精调阶段使用的数据相同,VisCPM-Chat-zhplus 在预训练阶段额外加入了 20M 清洗后的原生中文图文对数据和 120M 翻译到中文的图文对数据。与 VisCPM-Chat 一样,得益于 CPM-Bee 的双语能力,VisCPM-Paint 可以仅通过英文图文对训练,泛化实现良好的中文文到图生成能力,达到中文开源模型的最佳效果。
2023-07-02 11:51:55
417
降低AI度提升SEO效果 训练GPT撰写 SEO文章.pdf
2023-08-03
如何训练 ChatGPT 撰写seo文章.pdf
2023-08-03
43个有趣而且价值高的prompt.pdf
2023-08-03
如何驾驭ChatGPT: 掌控有效对话
2023-08-02
GPT-4在医学中的超强潜力.pdf
2023-08-01
通俗解构语言大模型的工作原理
2023-08-01
如何用Markdown语言编写Prompt
2023-07-27
写出爆文的秘籍-读者思维
2023-07-27
如何使用AI写出爆文?
2023-07-26
利用神级提示词让AI成为超级老师 帮助小白快速入门Python
2023-07-25
如何打造AI自媒体IP
2023-07-22
Stable Diffusion 用简单语句生成高质量图片保姆级教程
2023-07-21
ChatGPT热点项目 人人可迁移的热点复制能力
2023-07-20
Chat2DB数据分析AI工具开源
2023-07-19
讲透prompt 变现和职业化
2023-07-19
ChatGPT和Claude生成文章教程
2023-07-18
快速制作AI创意海报的方法
2023-07-18
Midjourney绘画赚钱的6种方式
2023-07-15
讲透如何正确的ChatGPT提问
2023-07-15
知乎运营从0到1全方位陪跑教程
2023-07-14
微信动态背景图制作 AI一键让照片说话
2023-07-13
ChatGPT AI编程玩法拆解
2023-07-12
4个场景搞定百分之九十九职场写作
2023-07-11
如何利用ChatGPT辅助写作
2023-07-11
如何用 ChatGPT 创作高质量小红书笔记提高效率
2023-07-08
零基础用Al做出一部3D动画电影 保姆级攻略
2023-07-07
每天10分钟 用AI做旅游笔记赚钱玩法教程
2023-07-07
零基础自建Stable Diffusion绘图教程-AutoDL
2023-07-06
保姆级 Lora 炼丹教程
2023-07-06
AI 赛博机车图玩法教程
2023-07-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人