AI
文章平均质量分 74
AI 研习所
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
2.4K star的GOT-OCR2.0:端到端OCR 模型
GOT-OCR2.0作为AI 2.0时代的重要产品,通过端到端设计、一体化架构和对多场景复杂内容的识别能力,为用户提供了精准、高效的OCR解决方案。无论是在文档数字化、场景文本识别还是复杂数据处理方面,它都展现出卓越的性能,是开发者和研究人员不可或缺的工具。GOT-OCR2.0是一款新一代的光学字符识别(OCR)技术,标志着人工智能在文本识别领域的重大进步。作为一款开源模型,GOT-OCR2.0不仅支持传统的文本和文档识别,还能够处理乐谱、图表以及复杂的数学公式,为用户提供了更加全面和高效的解决方案。原创 2024-09-23 10:35:46 · 1395 阅读 · 0 评论 -
变天了,Reflection 70B出世-打败 Claude 3.5/GPT4o
一个新模型横空出世,值得注意!世界顶级开源模型 Reflection 70B,在诸多指标上打败了 Claude 3.5/GPT4o.特别是推理能力超强.重模型使用 Reflection-Tuning 进行训练,使 LLM 能够修复自己的错误。这个模型的技术有可能和GPT5相似。而 405B 版本将于下周上市——它有望成为世界上最好的型号。原创 2024-09-09 13:42:51 · 631 阅读 · 0 评论 -
OpenAI开发ChatGPT“反作弊神器”,99.9%超高命中率,还没上线
检查内容是否用了ChatGPT,准确率高达99.9%!OpenAI又左右互搏上了,给AI生成的文本打水印,高达99.9%准确率抓「AI枪手」作弊代写。其能够精准识别出论文或研究报告是否由ChatGPT撰写,甚至能追溯其使用的具体时间点。它能专门用来检测是否用ChatGPT水了论文/作业。早在2022年11月(ChatGPT发布同月)就已经提出想法了。但是!这么好用的东西,却被内部雪藏了2年,现在都还没对外公开。原创 2024-08-08 16:24:00 · 864 阅读 · 0 评论 -
智谱 AI 开源视频生成模型CogVideoX:单张 4090 显卡即可推理
随着大型模型技术的持续发展,视频生成技术正逐步走向成熟。以Sora、Gen-3等闭源视频生成模型为代表的技术,正在重新定义行业的未来格局。而近几个月,国产的AI视频生成模型也是层出不穷,像是快手可灵、字节即梦、智谱清影、Vidu、PixVerse V2 等。就在近日,智谱AI秉承“以先进技术,服务全球开发者”的理念,宣布将与“清影”同源的视频生成模型——CogVideoX开源,以期让每一位开发者、每一家企业都能自由地开发属于自己的视频生成模型,从而推动整个行业的快速迭代与创新发展。原创 2024-08-06 18:07:11 · 1939 阅读 · 0 评论 -
阿里发布“神笔马良版Sora”:寥寥数笔,动画自成
基于OpenSora框架,创新两种运动处理模块如下图所示,Tora包括一个Spatial-Temporal Denoising Diffusion Transformer,(ST-DiT,时空去噪扩散变换器)、一个Trajectory Extractor(TE,轨迹提取器)和一个Motion-guidance Fuser(MGF,运动引导融合器)。原创 2024-08-06 17:57:10 · 949 阅读 · 0 评论 -
AI视频生成器,堪称自媒体人的神器
Vozo Rewrite & Redub 是一款创新的视频编辑工具,可以通过简单的提示重写视频脚本、然后这个工具会自动给视频重新配音、翻译语音并口型同步,然后生成新的视频。无论是将经典视频转变为病毒视频宣传片,还是将普通视频变成喜剧,或是将一种语言翻译成多种语言,Vozo 都能在几秒钟内完成。原创 2024-07-25 18:43:00 · 925 阅读 · 0 评论 -
科普:从神经网络到 Hugging Face——神经网络和深度学习简史
活中没有什么可怕的东西,只有需要理解的东西。—— 居里夫人深度信念网络2006年,加拿大多伦多大学教授杰弗里·辛顿在研究如何训练多层神经网络,他已经在神经网络领域默默耕耘了三十多年,尽管在这个领域他算得上是泰斗级的人物,但由于神经网络在人工智能行业一直不被看好,所以他的研究成果一直不为业界所重视。辛顿出生于英国伦敦,他的家族出过不少知名学者,创立布尔代数的逻辑学家乔治·布尔便是他的曾曾祖父。他的祖父是位科普作家,父亲是昆虫学家。辛顿比周围的人都要聪明,但他的求学之路却颇为曲折,先是在大学攻读建筑学,转而又选原创 2024-03-29 16:27:12 · 1416 阅读 · 0 评论 -
牛,The O-one ——通过语音交互控制电脑的开源语言模型
The O-one :一个创新的开源语言模型计算机 可以让你通过语音交互来和你的计算机进行对话,完成询问、指令下达等任务。4、学习新技能:通过用户指导,O1可以学会新的操作技能,如发送Slack消息等。最牛皮的是,O-one是开源的,他们公布了代码、CAD图纸、以及其他信息,你完全可以自己做一个。2、日程和活动管理:可以远程访问你的电脑设备查询天气、查看日程、添加活动至日历,并自动发送活动相关信息。3、邮件与文件处理:能够访问你的邮件,管理邮件,例如自动发送包含指定文件的邮件给特定联系人。原创 2024-03-22 18:42:50 · 1288 阅读 · 0 评论 -
国产之光?Kimichat大模型200万字超长上下文突破
在今年2月初,又获得了一笔10亿美元的A轮融资,融资方有大家熟知的阿里巴巴、红杉中国、小红书、美团等资本,现今估值超25亿美元。:支持对多种文件格式的解读,包括PDF、Word文档、Excel电子表格、PPT幻灯片、文本文件和图片等,最多支持50个文件,每个文件大小可达100MB。:Kimi Chat可以作为一个智能搜索引擎,帮助用户快速找到所需的信息,并提供相关文章的简要概括。:用户可以提供网页链接,Kimi Chat能够解析链接中的内容,并根据用户的问题提供详细的解读。原创 2024-03-22 18:33:28 · 1030 阅读 · 0 评论 -
效果炸裂 StreamMultiDiffusion:使用区域文本提示实时生成图像
操作示例:用户首先上传需要修复的旧照片,然后在破损的区域输入“修复”作为提示,在希望添加花朵的区域输入“五彩缤纷的花朵”。- 操作示例:设计师在海报模板的相应区域内输入文本提示:“夜空中的烟花”、“音乐符号”和“跳舞的人群”。引入了一种新的绘画范式,用户不仅可以绘制颜色,还可以绘制具有特定语义的内容,例如“蓝天”、“绿草”等,从而在创作过程中加入更丰富的意义层次。用户可以实时与系统交互,根据自定义的文本提示在特定区域生成图像,这个过程是动态且即时的,为用户提供了高度互动的体验。原创 2024-03-21 15:34:20 · 548 阅读 · 0 评论 -
GPT-4.5 Turbo:意外曝光且可能在六月份推出
这与OpenAI以往发布新模型后立即提供使用的做法不同,这可能是为了与近期推出的竞争对手模型,如Anthropic的Claude 3竞争,后者在多个领域的表现已经达到或超过了GPT-4。GPT-4.5 Turbo:更大的处理范围和最新信息预览文本中提到的“上下文窗口”指的是模型能够一次性处理的数据量,GPT-4.5 Turbo能处理高达256,000个Token,是之前GPT-4 Turbo 128K处理能力的两倍,大约相当于200,000个词。不过,这次泄露的信息中并没有提及到这方面的能力。原创 2024-03-14 00:01:51 · 824 阅读 · 0 评论 -
点一下即可任意调整静态图片:这个开源AI图片项目你需要了解一下
合成满足用户需求的视觉内容通常需要对生成对象的姿势、形状、表情和布局进行灵活而精确的控制。现有的方法通过手动注释的训练数据或先前的3D模型来获得生成对抗网络(GAN)的可控性,这通常缺乏灵活性、精确性和通用性。在这项工作中,我们研究了一种强大但较少探索的控制GAN的方法,即以用户交互的方式“拖动”图像的任何点以精确地到达目标点,如图所示。基于特征的运动监督,它驱动控制柄点向目标位置移动;新的点跟踪方法,它利用判别GAN特征来保持控制柄点的位置。原创 2024-03-12 18:50:55 · 964 阅读 · 0 评论 -
字节AIGC场景发力,云雀大模型+扣子智能体,快速构建专属AI应用
这里还是真心希望国内大厂能够迎头赶上,国外的一些习惯,语言,和网络因素,其实导致体验并不流畅。我们看到这里系统给了我们一些常用的插件,我们可以选择默认的插件,也可以自己创建插件,还是很丰富的。这里有个问题,上传知识库的时候,需要一个文件一个文件的上传,不然会报错,这个问题,目前还没修复。可以看到,不仅可以得到一个类似原生的GPTS的智能体,还能把能力结合到微信和飞书的生态,可谓是更符合国人的使用习惯了。我们创建了,插件,上传了知识库,可以自定义工作流,然后配置一下开场白,和常见问题,基本就可以发布了。原创 2024-02-06 18:33:41 · 1237 阅读 · 0 评论 -
书生浦语2-对话-20B大模型部署实践
书生·浦语2.0是一个大语言模型,是商汤科技与上海 AI 实验室联合香港中文大学和复旦大学发布的新一代大语言模型。原创 2024-02-02 18:56:51 · 1163 阅读 · 0 评论 -
Nijijourney V6版本动漫图像生成模型发布
这是一个最先进的AI,可以绘制任何二次元风格的绘画!无论您是在寻找可爱的Q版角色还是充满动感的动作场景,niji・journey 都能将您的想象变为现实。计划在2月底的全面发布中引入一系列新功能,如vary(Region 调整图片的某个部分)、pan(移动)和zoom(缩放),进一步增强用户体验和创作灵活性。Niji V6致力于理解并将各种主题转化为动漫风格的视觉作品,即使是一些平时动漫里不常见的主题。如果你想要的不只是动漫风格,Niji V6还有一个“RAW模式”,可以生成看起来更真实的图片。原创 2024-02-01 17:12:53 · 1093 阅读 · 0 评论 -
超越GPT4 Turbo?科大讯飞发布星火认知大模型3.5版本
在SuperCLUE-Math6中文数据多步推理测评基准上,讯飞星火V3.5取得80.44的高分,较上一代讯飞星火V3.0有43.05分的提升;讯飞星火V3.5在SC-Math6基准上准确率表现优异,取得78.81分,位列在榜国内模型中第二。从结果上来看,讯飞星火V3.5在数学多步推理能力上处于国内第一梯队但与GPT4还有一定差距。其中随着推理步骤的增加,讯飞星火V3.5在深入推理方面表现不俗,同时有很好的指令遵循能力。1月30日,科大讯飞举行星火认知大模型V3.5升级发布会。原创 2024-01-31 17:37:42 · 571 阅读 · 0 评论 -
盘点热门的GPTS智能体,生产力远超原生ChatGPT4
OPENAI开放了GPTS智能体商店,类似于appstore的应用商店,在GPTS商店里面你可以发现并创建自定义版本的ChatGPT,这些版本结合了指令、额外知识和任何技能组合!GPTS智能体不仅可以通过API的方式将你的私有化的数据和能力,搭配上AI的能力,给用户提供更强大的服务。使用用于创建、编辑和样式优化的工具增强您的写作。获取有关旅行、锻炼、时尚、美食等方面的提示。原创 2024-01-30 16:55:51 · 687 阅读 · 0 评论 -
TinyLlama-1.1B(小羊驼)模型开源-Github高星项目分享
TinyLlama项目旨在在3万亿tokens上进行预训练,构建一个拥有11亿参数的Llama模型。经过精心优化,我们"仅"需16块A100-40G的GPU,便可在90天内完成这个任务🚀🚀。训练已于2023-09-01开始。原创 2024-01-11 17:50:28 · 1964 阅读 · 0 评论 -
智谱AI大模型ChatGLM3-6B更新,快來部署体验
如果你的 GPU 显存有限,可以尝试以量化方式加载模型,使用方法如下:model = AutoModel.from_pretrained("THUDM/chatglm3-6b", trust_remote_code=True).quantize(4).cuda()模型量化会带来一定的性能损失,经过测试,ChatGLM3-6B 在 4-bit 量化下仍然能够进行自然流畅的生成。ChatGLM3-6B 的基础模型 ChatGLM3-6B-Base 采用了更多样的训练数据、更充分的训练步数和更合理的训练策略。原创 2024-01-10 16:24:32 · 1199 阅读 · 0 评论 -
MATHPILE:一个高质量的大规模的数学语料库
2、多样性:MathPile 从广泛的来源汇集数据,包括教科书(包括讲义)、arXiv、维基百科、ProofWiki、StackExchange 和网页。它涵盖了适合 K-12、大学、研究生水平和数学竞赛的数学内容。这些数据经过一系列严格的处理过程,包括数据预处理和预过滤、语言识别、清理和过滤,以及去重。4、数据文档:为了增强透明度,提供详细的数据记录,包括数据集表格和质量注释,提高透明度并允许用户根据需要定制数据。项目的数据收集和处理努力包括复杂的预处理、预过滤、清洁、过滤和去重,确保语料库的高质量。原创 2024-01-09 18:28:33 · 986 阅读 · 0 评论 -
斯坦福开发WikiChat:几乎不会产生幻觉的模型
当它需要回答问题时,会先在维基百科上找到相关的、准确的信息,然后再给出回答,保证给出的回答既有用又可靠。2、与GPT-4的比较:当涉及到头部知识(即常见或流行的主题)、尾部知识(即不常见或较少被讨论的主题)和最近的知识(即最新发生的事件或信息)时,WikiChat相比于GPT-4在事实准确性上分别提高了3.9%,38.6%和51.0%。3、与基于检索的聊天机器人的比较:与之前最先进的基于检索的聊天机器人相比,WikiChat不仅在事实准确性上表现更好,而且在提供信息量和吸引用户参与方面也表现得更加出色。原创 2024-01-08 18:18:29 · 1081 阅读 · 0 评论 -
VCoder:大语言模型的眼睛
分割图可以帮助模型识别和理解图像中不同物体的边界和形状,而深度图则提供了物体距离相机远近的信息。3、改善对象感知任务:VCoder通过提供额外的感知模态输入(如分割图或深度图)显著提高了MLLMs的对象感知能力。这包括更准确地识别和计数图像中的对象。对比GPT-4V:实验表明,GPT-4V在所有对象识别任务中的表现一致,但在与VCoder的比较中,GPT-4V在对象级感知方面落后于VCoder。在处理复杂场景中的对象计数和识别任务时,VCoder展示了更高的准确性,尤其是在场景中有许多实体时。原创 2024-01-05 18:03:30 · 651 阅读 · 0 评论 -
GPT-Pilot:AI开发者的伴侣
GPT Pilot 一个真正的AI程序员,它可以从零开始构建整个应用程序,它能自己编写代码、配置开发环境、管理开发任务、调试代码,你还可以随时和它聊天提问帮助你解决开发难题。你只需要在一旁监督开发过程即可...GPT-Pilot旨在提高开发效率,减少重复性工作,使开发者能够专注于更复杂和创造性的任务。原创 2024-01-04 13:47:22 · 739 阅读 · 0 评论 -
模型训练不再数据顾虑,微软研究团队使用【合成数据】来训练模型
这在传统数据收集方法中很难实现。通过这种方法,微软的研究团队能够生成大量高质量的合成数据,用于训练和改进大型语言模型,从而提高文本嵌入的质量。这种方法的优势在于它不依赖于大量的标注真实数据,从而减少了数据收集和处理的工作量,同时还能提供丰富多样的训练材料。传统上,要让计算机做好这件事,我们需要给它看很多很多的例子(这就是所谓的训练数据),让它学习怎样把文本转换成它能理解的形式。这些实验结果表明,使用合成数据训练的大型语言模型在多语言、多任务场景中都能取得优异的性能,证明了合成数据方法的有效性和实用性。原创 2024-01-03 18:02:13 · 581 阅读 · 0 评论 -
一款集成 GPT 问答、Midjourney 绘画等一站式服务的免费开源系统
进入到源码文件夹:cd HubFrontend运行命令安装依赖:yarn运行:yarn start打开 http://localhost:8080 即可查看效果。如果您想将源码部署为您自己的系统并进行赚钱,或者基于本系统进行二次开发,可参考下文。支持一键部署到 Vercel,一键部署到 Netlify。安装 Node.js、git、yarn。原创 2024-01-02 17:36:58 · 520 阅读 · 0 评论 -
开源项目推荐:Frooodle/Stirling-PDF
各种主要的 PDF 操作都可以支持。比如拆分、合并、转换格式、重新排列、添加图片、旋转、压缩等等。这个本地托管的网络应用最初完全由 ChatGPT 制作,后来逐渐发展,增加了许多功能,以满足你对 PDF 的各种需求。所有的文件和 PDF 要么只在客户端处理,要么只在服务器内存中暂存,用于执行任务,或者仅在执行任务时保存在临时文件中。项目地址:https://github.com/Frooodle/Stirling-PDF。一个本地的处理 PDF 的工具,界面是 Web UI,可以支持 Docker 部署。原创 2023-12-27 15:11:00 · 1160 阅读 · 0 评论 -
DreamTuner :通过单张图片实现主题驱动的图像生成
2、风格主题一致:在 DreamBooth 数据集上的评估显示,通过主题编码器和自主题注意力,生成了精细化的参考,使 DreamTuner 能够成功生成与文本输入一致且保留关键主题细节的高保真图像。为了确保帧间的连贯性,自主题注意力同时使用参考图像和生成图像的前一帧,分别赋予不同的参考权重。•你将获得一系列根据你的描述生成的新动漫角色图像,这些图像既保留了原始角色的风格,又融入了新的场景和表情。•这个过程中,它会保留原始参考图像的关键特征(如角色的风格和特点),同时根据你的描述添加新的元素和场景。原创 2023-12-25 18:35:12 · 1373 阅读 · 0 评论 -
OPenAi首席科学家:只要能预测下一个token,就能帮助人类创建AGI
但是这需要人们真正投入到机器人技术的研发中,建造成千上万的机器人,从它们那里收集数据,并找到一种逐步改进的方法,让机器人能够执行一些基本有用的任务。随着数据的积累,可以训练出更加高效的模型,使机器人能够执行更复杂的任务。Ilya认为,只要能够准确预测下一个token,AI就有可能推测出一个具有卓越洞察力、智慧和能力的人可能会采取的行为,即使这样的人实际上不存在。我相信随着技术的发展,不同的研究小组或者项目会选择不同的路径和方法,但是一旦这些长期的工作开始显现成果,这个领域又会重新趋向于收敛。原创 2023-12-22 16:35:45 · 583 阅读 · 0 评论 -
让泰勒·斯威夫特唱周杰伦的稻香,来看看这个开源项目
Amphion 支持多种神经声码器,包括基于GAN的声码器(如MelGAN、HiFi-GAN)、基于流的声码器(如WaveGlow)、基于扩散的声码器(如Diffwave)等。还支持声音转换、歌声合成、文本到音频、文本到音乐等功能!该工具包支持多种模型和架构,如FastSpeech2、VITS、Vall-E、NaturalSpeech2等,用于不同的音频生成任务。🎵Amphion 支持的音频生成任务涵盖了从文本到音乐的广泛领域,每个任务都有其独特的应用和技术要求。应用:用于创造音效、音乐片段、音频故事等。原创 2023-12-20 11:12:46 · 630 阅读 · 0 评论 -
Lobe Chat - 一键免费部署您的ChatGPT/LLM Web 应用程序,UI太惊艳了
无论是想要沉稳的深蓝色、活泼的桃粉色,还是专业的灰白色,用户都可以在LobeChat中找到适合自己风格的颜色选择。在 LobeChat 代理市场中,创作者可以发现一个充满活力和创新的社区,该社区汇集了众多精心设计的代理, 它不仅在工作场景中发挥着重要作用,而且在学习过程中也提供了极大的便利。LobeChat 支持文本转语音 (TTS) 和语音转文本 (STT) 技术,使我们的应用程序能够将文本消息转换为清晰的语音输出, 允许用户与我们的对话代理进行交互,就像他们在与真人交谈一样。原创 2023-12-19 13:17:36 · 2073 阅读 · 0 评论 -
OpenAI发布官方提示工程指南和示例
比如,先写一个关于主题背景的部分,然后再写关于主要观点的部分。比如,如果你想要简短的答案,就直接说“给我一个简短的回答”。提供清晰的指令,减少模型猜测的需要。有时候,让AI先“思考”一下,然后再回答问题,可以得到更好的答案。如果你有关于你要写的主题的具体资料或例子,给AI看看。通过与黄金标准答案的对比,可以有效地监控和提高AI模型的输出质量。• 模型查询与事实对比:使用模型查询来生成答案,然后检查这个答案中包含了多少个所需的事实。使用黄金标准答案评估模型输出”是一种有效的方法,用于确保AI模型的回答质量。原创 2023-12-18 18:54:33 · 1115 阅读 · 0 评论 -
“过度炒作”的大模型巨亏,Copilot每月收10刀,倒赔20刀
同时,数据的版权和许可成本也可能增加。据《华尔街日报》10月9日报道,微软首批生成式AI产品中的GitHub Copilot正在亏损,对于目前在 AI 大模型商业应用维度走在最前沿的微软而言,它在推出的帮助程序员创建、修复和翻译代码服务的 GitHub Copilot 且拥有 150 万用户的基础上,向使用者收取每月 10 美元亦或者是每年 100 美元的费用之际,还贴了不少了钱。同时,使用这些大模型工具的人越多,相关企业需要支付基础设施的费用就越高,正因如此,贴本的买卖也开始了。原创 2023-10-13 18:03:22 · 934 阅读 · 0 评论 -
OpenAI科学家谈GPT-4的潜力与挑战
大语言模型有潜力通过不断从失败的实验中学习来提高解决问题的能力,但 GPT-3 和 GPT-4 之间的能力仍然存在显着差距,并且尝试弥合与当前模型的差距可能是无效的。📢通过将注意力机制拆分为单独的头,利用多台机器和芯片,并使用 GSP MD 方法进行无需通信的并行化,借助 Jax 的前端工具 PJ 将阵列轴映射到硬件,可以实现大型语言模型的并行化。🧠 具有新鲜视角的人工智能领域的新人通常可以带来有影响力的想法和工作,因为他们不受经验丰富的人可能已经尝试过但发现不成功的直觉和想法的束缚。原创 2023-10-12 14:29:26 · 525 阅读 · 0 评论 -
还在傻傻用PS?Adobe亮出大杀器“Firefly”,一句话让AI自动帮你P图
除了 Firefly Web 应用程序之外,Adobe 还拥有更广泛的 Firefly 系列创意生成式 AI 模型,此外,Adobe 旗舰应用程序和 Adobe Stock 中还有由 Firefly 提供支持的各种功能。Firefly主打的卖点就是谦卑和安全,Adobe一直强调,Firefly只是艺术家的辅助工具,不可能取代艺术家的工作,同时也格外注重保护艺术家权益,着力解决AIGC应用过程中的版权问题,公司称Firefly生成的作品均可安全商用,如有客户面临版权索赔,Adobe会提供支持。原创 2023-09-14 14:16:19 · 461 阅读 · 0 评论 -
AgentVerse:清华等高校联手发布AI多智能体协作模拟框架
在游戏中,智能体可以参观商店,在健身房训练他们的神奇宝贝,并相互互动。作为玩家,可以扮演其中智能体的角色,随时与其他智能体互动。当给定两段不同的文本时,各个智能体可以利用分配给他们的角色,自主地辩论生成文本的差别,并给出对生成质量的判断。囚徒困境是一种思想实验,它向两个完全理性的代理人提出两难的挑战:他们可以与伴侣合作以实现互惠互利,也可以背叛他们的伴侣(“缺陷”)以获得个人奖励。它可以很容易的模拟多种社会实验场景,例如:NLP课堂、囚徒困境、软件设计、数据库诊断、Pokeman等。原创 2023-09-13 14:45:01 · 418 阅读 · 0 评论 -
苹果开发“Apple GPT”AI科技迎来新格局
Ajax平台的创建是为了“统一机器学习开发” ,取名Ajax是因为基于Google Jax机器学习框架构建,苹果创建 Ajax 框架的部分目的是为机器学习开发奠定基础,以跟上生成式 AI 技术的快速发展。苹果对人工智能持有非常谨慎的态度,库克曾表示,尽管人工智能的浪潮正在席卷整个科技行业,但在部署之前需要经过彻底的安全测试。目标是明年推出消费级产品。苹果 CEO 库克曾在二月份的电话财报会议上表示,「我们看到了人工智能的巨大潜力,几乎能够影响我们所做的一切,包括我们拥有的每一款产品和每一项服务。原创 2023-07-23 23:47:09 · 834 阅读 · 0 评论 -
AI在生物学领域的突破,一定要看看这个系统
开源代码是公开的,研究人员强调,它很容易运行。BioAutoMATED是一个自动化的机器学习系统,可以为给定的数据集选择和构建合适的模型,甚至可以处理数据预处理的艰巨任务,将长达数月的过程缩短到几个小时。即使有机器学习专家,选择合适的模型,为模型格式化数据集,然后对其进行微调,也会极大地改变模型的性能,这需要大量的工作。柯林斯实验室生物工程博士杰奎琳·瓦莱里是该论文的第一位合著者,她说:“为我们的数据集找出合适的模型需要数周的努力,这对很多想使用机器学习或生物学的人来说真的是一个令人望而却步的步骤。原创 2023-07-22 20:21:34 · 230 阅读 · 0 评论 -
只用1块A100,就能训练自己的Llama-2模型
在优化步骤中,使用查询和生成的响应对来计算序列中每个令牌的对数概率。这是通过已经训练过的模型和一个参考模型来完成的,参考模型通常是微调之前的预训练模型。两个模型输出之间的KL散度被用作额外的奖励信号,以确保生成的响应不会偏离参考语言模型太远。要了解详细的示例,请查看项目examples/scripts/sentiment_tuning.py中的示例Python脚本。使用一个函数、模型、人工反馈或它们的组合来对查询和生成的响应进行评估。如果你想从源代码运行库中的示例,还需要安装一些额外的库。原创 2023-07-21 18:18:34 · 759 阅读 · 0 评论 -
草图一键变精品 AI作图0门槛
对于Stable Doodle的使用场景,T2I-Adapter为预训练的文本到图像模型(SDXL)提供了辅助引导,使其能够理解草图的轮廓,并根据由模型定义的轮廓和提示生成图像。Clipdrop利用Stability AI的尖端生成人工智能技术,提供无与伦比的用户友好图像编辑工具,处于AI图像解决方案的前沿。Stability AI发布了Stable Doodle,这是一款将简单的草图转换为动态图像的工具,为各行各业的专业人士和爱好者提供了无限的图像可能性。它可以精确控制AI图像生成过程。原创 2023-07-20 11:04:35 · 378 阅读 · 0 评论 -
基于GPT Code Interpreter的自动化金融数据分析
接下来对于ARIMA模型参数选择的回答,GPT先回复了用于参数选择的代码,其中基于ADF检验p值小于0.05判断序列平稳,决定差分阶数d=0,再绘制ACF、PACF图初步判断MA阶数q、AR阶数p,再通过比较p、q分别取 0,1,2,3,4 时的AIC值,确定使得AIC值最小的组合为ARIMA(2,0,0),从而确定了模型参数,展现出了完整的统计知识和清晰的思维逻辑。在以上例子中,GPT可以在一次回答中完成提问中的全部要求,后台运行 python代码呈现输出结果,并自己调试代码直到代码全部跑通为止。原创 2023-07-19 13:47:51 · 358 阅读 · 1 评论
分享