自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 国内大神开源的配音整合包,包含了多个模型。

这是一个开源的视频翻译配音工具(开源协议GPL-v3),可将一种语言发音的视频,翻译为另一种语言发音的视频,并嵌入该语言字幕。该模式下会显示所有可自定义的选项,比如 翻译渠道、配音渠道、语音识别方式、模型选择、字幕嵌入方式、加速减速等,使用该模式通过调整不同选项和配置,能最大化满足需求。该模式用于为一个视频嵌入已有的字幕,比如本地有一个视频文件,有一个srt字幕文件,想将字幕嵌入视频内,可使用该模式。并可选择是否将字幕翻译为另一种语言。文字字幕翻译:可将文字或srt字幕文件,翻译为其他语言的文字或字幕。

2024-06-18 21:00:29 665 1

原创 Coze扣子刚刚上线模型广场,模型大PK

模型对战模型对战是扣子提供的大模型的基准测试平台。在一轮或多轮对话之后,你可以根据大模型对同一个提问的答案进行投票,选出你认为表现更优秀的大模型。为保证对战的公平性,系统会尽量均衡各个大模型的配置参数,衡量相同或相似配置下的模型性能。作者观点:其实这个模型PK的功能在圈子也不是什么新奇的事,早在去年就国内就已经有独立开发者有这个功能了,PK的模型比Coze扣子还多,毕竟大厂的功能,免费程度和安全程度要相对的比独立开发者要好的多,有兴趣的可以去接触接触。Coze扣子刚刚上线的一个模型广场,模型大PK。

2024-06-14 20:59:56 623

原创 阿里图片项目MimicBrush使用参考仿制进行零拍摄图像编辑

MimicBrush,一款颠覆传统的图像编辑神器,它让用户无需专业技能也能轻松搞定图像编辑。用户只需指明想要编辑的区域,再配上一张参考图,MimicBrush就能智能捕捉两者间的联系,一键搞定编辑,让创意快速落地。MimicBrush简直是为那些想要快速实现创意但技术不是强项的朋友们量身定制的。设计师和艺术家们也能用它来加速创作,把更多精力放在创意上,而不是纠结于技术细节。MimicBrush,让图像编辑变得简单有趣,让创意不再受限于技术门槛。

2024-06-13 17:57:52 494

原创 仅需两张关键桢图片,。即可自动生成中间动态帧

今天分享一款由腾讯AI实验室,香港中文大学和香港城市大学的研究人员开源ToonCrafter。联手打造的卡通动画视频插帧工具,真的是个游戏规则改变者。它用一种创新的生成式插值技术,只需要两张关键帧,就能自动生成中间帧,让动画效果流畅到不行。这与传统的逐帧绘制方法相比,不仅大大提升了制作效率,还减轻了动画师的负担,缩短了制作周期,而且动画的质量和创意一点都没打折。

2024-06-12 23:06:35 1366

原创 腾讯元器与字节Coze扣子,智能体你会选择哪一个?

简单介绍一下什么是智能体:简单理解就是AI机器人小助手,类似APP应用的概念,而腾讯元器与字节Coze扣子就是面向普通人的低代码平台,不用写代码,更加容易学习与运用。

2024-06-11 16:28:22 1863

原创 github上智能体项目,小爱同学MiGPT打造智能家居聊天助手它来了

在不远的未来,我们的家居生活将被一种全新的智能技术所改变。当你心情不好时,它能够立刻察觉到你的情绪变化,自动帮你播放喜欢的音乐,调节室内的灯光,甚至控制其他智能家居设备,为你营造一个舒适愉快的环境,逗你开心。这样的小爱音箱,不仅仅是一个音箱,它是你生活中的智能伙伴,是你情感的寄托,是你智能家居生态系统中的核心。它将能够更好地理解你的情感,预测你的需求,甚至在你意识到之前,就为你提供所需的服务。它能够记住你们之间的每一次对话,随着时间的推移,它会越来越了解你,就像是你身边的老朋友,与你建立起深厚的默契。

2024-06-10 17:16:26 794

原创 国产神级视频生成器:可灵大揭秘

通过上述技术的整合应用,“可灵”大模型不仅提升了视频内容的生成质量,还为各类应用场景提供了强大的技术支持,标志着AI视频生成技术在国产化道路上的一大步。- 分阶段训练策略:我们采取了一种分阶段的培训策略,先在较低的分辨率阶段通过海量数据来增强模型的能力,随后转入高分辨率阶段以提升细节的呈现效果。为了优化文本提示词的处理,我们设计了专门的语言模型,该模型能够对用户的输入进行高效的扩展和优化处理,从而显著提升内容的生成质量。- 建立了完整的标签体系,通过精细化的数据筛选与调整,确保训练用的视频数据具有高质量。

2024-06-08 14:44:12 939

原创 今年高考作文,GPT也来交卷了,你给TA们打多少分?

随着互联网的普及、人工智能的应用,越来越多的问题能很快得到答案。那么,我们的问题是否会越来越少?以上材料引发了你怎样的联想和思考?请腾讯元宝帮我写一篇文章。祝愿学子们高考金榜。

2024-06-07 17:54:09 156

原创 人手一个AI?以前用百度搜索?现在用AI搜索?是这样吗?

对于AI,确实为普通人,创业者,企业更好的运用,运用的情况下,是否过度依赖AI从而误解,搜索式AI虽然能提供想要的资料,但是目前情况,还是有待发展,毕竟搜索的资料还是比传统的搜索引擎少之又少。大模型的时代,各个大厂都加速AI的发展,对于普通人,创业者,企业,更加容易的进行高效工作以及数字化转型。其中Kimi大模型自从可以联网内含搜索作为AI搜索类的代表,许多用户表示代替百度等搜索引擎,字节的。另一类则专门推出了AI搜索产品,比如360搜索、秘塔搜索、天工AI搜索、百川AI搜索百小应、等等。

2024-06-06 21:25:10 713

原创 跟大厂干起了价格战智谱AI 宣布模型全面降价

但就在大家以为一切顺利时,团队遇到了一个小挑战:在有限的显存条件下,6B模型的表现有点力不从心,于是,他们像是在玩升级游戏一样,决定给模型规模来个大升级,直接冲到了9B,并将预训练计算量加大了5倍!在一次普通的预训练中,团队决定给数据筛选过程添点料,加入了大语言模型这个秘密配方,结果不仅让数据的量级翻了三倍,达到了惊人的10TB,质量也是杠杠的,直接把ChatGLM3-6B模型的数据量甩在了身后。这还不过瘾,他们又搞了个大新闻,推出了升级版的MaaS 2.0,同时还玩起了价格战,让人眼花缭乱。

2024-06-06 11:30:21 1816

原创 ChatTTS:AI语音克隆,火遍Github

对话式TTS: ChatTTS针对对话式任务进行了特别的优化,实现了流畅自然的声音合成效果,并支持多说话人模式。在当今的语音合成技术中,ChatTTS凭借其在韵律处理上的卓越性能,已经走在了许多其他开源TTS模型的前面。在这个需要大量互动和讲解的环境下,一个自然流畅的语音系统能极大地提升观众的购物体验。再来就是自媒体创作者。而ChatTTS能够提供生动、有趣的配音,帮助内容创作者以更吸引人的方式呈现他们的故事或观点。而在HuggingFace上开源的版本则是基于4万小时的数据训练,未经过SFT处理的版本。

2024-06-04 20:48:44 2597 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除