- 博客(131)
- 收藏
- 关注
原创 全球首款音乐推理大模型Mureka O1:中国造
Mureka O1+V6双模联手,带来了全球首款具备CoT思维链的音乐模型,同时还是全球首款开放API服务及模型微调的音乐生成平台。对,就是大家熟知的天工AI的母公司。昆仑万维,作为很早就开拓海外市场的AI公司,业务遍及中国、东南亚、非洲、中东、北美、南美、欧洲等一百多个国家和地区。Mureka音乐制作,支持英语、中文、日语、韩语、法语、西班牙语、葡萄牙语、德语、意大利语和俄语10种语言。Neon Dreams”,不到1分钟,一首歌曲就诞生了,从歌手到歌词再到音色,Mureka一键搞定。
2025-03-28 13:44:43
776
原创 Cursor 新版抢先体验,自定义agent模式来袭 + 界面优化,网友:界面很好,别再碰它了。
此外,许多用户喜欢同时在聊天室和编辑器中工作,但在 v0.46 中,官方取消了此功能,现在,使用聊天选项卡,你可以同时运行多个聊天室,只需单击一下即可在它们之间切换。现在,你可以直接在编辑器中使用基于使用量的定价来查看每次聊天的费用,只需打开显示聊天历史记录的窗口,然后将鼠标悬停在 $ 符号上即可查看详细信息。当你接近最大上下文窗口大小时,Cursor将显示一个小提示,建议你开始新的聊天会话,如果你选择继续,你的最旧消息将被汇总以保持聊天继续进行。从“设置”→“功能”→“聊天”→“完成时播放声音”启用。
2025-03-28 12:31:00
992
原创 Mistral杀回来了,Small 3.1发布,性能完胜Gemma 3,4090可跑。
号称 “小 3.1”,但能力不 “小”。“ 还有,有些地方 Mistral Small 3.1 只是勉强赢了 Gemma3-it-27b,之前 3.0 可是碾压的啊,这啥情况?反方表示,GPT-4 级别大模型的 “底蕴” 还是在那儿,小模型就算加了 RL 也比不了, “隐含知识” 就是值钱。对此,网友表示:“ 最近的模型,都喜欢挑对自己有利的测试,Mistral 更狠,直接无视中国的模型…对比的模型也怪怪的。Mistral Small 3.1 参数多、支持多语言、多模态,还没啥限制,就是推理能力差点意思。
2025-03-18 14:59:30
946
原创 过了把3D建模的瘾。。MCP让Cursor控制Blender,小白也能一句话建模
Blender 只是个例子,下一步,Unity3D、PS、PR、AE 这些,是不是也能通过 MCP,实现这种 AI 辅助学习?所以,这不仅仅是现在AI能控制Blender这样的软件能做出什么效果,更重要的是,它代表了一种新的可能,一个很有前景的方向。有了MCP,AI不再只是「读懂」代码,而是能真正理解团队的节奏,接入外部工具,甚至直接执行任务。
2025-03-13 07:34:10
1119
原创 Cursor 新版本要来了,释放Claude 3.7全部潜力,估值百亿引热议,前Apple工程师:招人要会用AI。
有分析师指出,虽然按照目前的增长速度,66倍的ARR(年度经常性收入)倍数是合理的,但Cursor目前的收入更像是试点收入(ERR)。为了缓解这个问题,社区提出了一些临时解决方案,包括使用规则系统来约束模型行为,以及在每次提示中添加明确的指令,要求模型不要偏离任务。具体表现为在处理 Auth 2.0 任务时,模型会频繁偏离主题,修改无关代码(如 SVG 图标),并创建不必要的文件,就好像。的问题,处理任务时会修改无关代码,创建多余文件” ,该帖子获得 21 次回复和 1.8k 次浏览,热度不低。
2025-03-11 21:06:20
905
原创 最新MCP托管平台:让Cursor秒变数据库专家,一键对接Github,开发效率暴增
Supbase是什么:Bolt + Supabase:1分钟实现APP的登陆功能、连接数据库(Bolt、Cursor、BaaS、AI全栈)所以通过这种方式,我们今天来演示三个实用的MCP工具,分别是:Github、Supbase、Neon。当然,以上MCP服务都支持本地设置,往期文章有介绍类似的,托管平台只是一种方案。Neon和Supabase,两款基于PostgreSQL的云服务,各有特色。检查连接、获取API信息、搜索仓库,这些基础功能都没问题。他给你提供一个链接,输进去之后你的MCP就配置好了。
2025-03-09 23:09:41
1905
原创 Cursor + MCP:效率狂飙,一键克隆网站、自动调试错误,社区:每个人都在谈论MCP。
你现在在一个next.js项目中,调用firecrawl去复刻这个网站:https://pidgeon.news/?工作流程是这样的:遍历页面,提取元素,下载资源,重建结构。核心是分析网页的DOM结构和资源。它能读取浏览器控制台和网络日志,用Replicate生成UI资源,连接Supabase数据库和Figma设计。先在本地运行网站,然后让Playwright去访问,它会把看到的情况都记录下来,帮我们发现问题。AI 需要与现实世界的数据建立联系,MCP 即将变得极为重要,开发工具正在走向一个全新的时代。
2025-03-07 16:16:25
2650
原创 接入 Deepseek 能让百度文库焕发第二春吗?
在执行上,借助混合专家模型(MoE)和检索增强生成(RAG),合理分配和调用多个不同尺寸模型,实现跨模态、跨格式内容生成。来源@机器之心:飞书中的每个表格都相当于一个 prompt 输入框,你可以把需求和背景当作一列数 据粘贴进去,DeepSeek-R1 就能按这个队列全自动处理了。OpenAI 研究主管 Karina Nguyen 所说,‘ 我心目中的终极 AGI 界面是一张空白画布(Canvas)’,它随着人类的偏好不断演变,自我变形,你自己上传的、它生成的,还是混合的文档,都能用 AI 处理。
2025-03-01 22:55:09
695
原创 速来!白嫖满血版 DeepSeek、邀请获 3000万Tokens
✨从火山方舟接入DeepSeek API服务, 享受大流量+低延迟+低成本服务:延迟低至20ms内,提供高达 500 万 TPM 的全网最高的初始限流,并且全网首家提供超过 50 亿初始离线tokens!每邀请一位好友注册,双方至高可得145元代金券,可抵扣超过3000万 DeepSeek R1 输入tokens!多邀多得,上不封顶!✨邀约活动同步进行中,邀请可拿3000万tokens,畅享671B DeepSeek R1!✔邀请新用户付费,获赠100元代金券,约可抵扣2500万R1模型输入tokens。
2025-02-21 16:32:28
349
原创 Qwen-2.5 + ClaudeDev + Aider:这套免费的AI编程工具链,简直太棒了!
现在,我将使用Hyperbolic端点,所以选择OpenAI兼容选项,但你也可以选择ollama本地选项。选择API端点、API密钥和模型名称。完成后,点击“完成”按钮并保存。现在我们可以开始使用它了。让我通过创建一个简单的Todo应用来展示。我们让它生成一个简单的HTML、CSS和JS的Todo应用程序。你可以看到它正在生成代码,现在我们等待一下。生成的页面运行得很好。这很棒,虽然不如Claude,但可用,而且Hyperbolic有免费的积分,所以你可以免费发送大量请求。
2024-09-22 14:46:49
1327
原创 Duix AI 太上瘾,让我熬夜体验的AI女友
就是那种直接 和你喜欢的人打电话的感觉,享受各种无理要求产生的对话趣味,而且对象可以定制, 《Her 》般 完美伴侣体验的AI 女友。只需轻轻点击屏幕,AI女友任你选择,野蛮女友你别跑,知心姐姐请你喝咖啡, 这么多,你问我选哪个,我当然全都要,下班了,很累,百无聊赖,于是,我随意的按下了和她的通话键,然后,一阵轻松的旋律传入耳中~总体来说,这是一个非常酷的项目,Duix.AI 这个APP,给我的感觉相当真实,精准。▲ 你有没有在脑海中想象过,自己和最喜欢的角色或人物会发生怎样的对话?
2024-07-30 22:44:30
1293
原创 办公编程提速神器:小浣熊AI助手,Copilot替代品、数据分析能力很强(免费、酷炫且易用)
代码小浣熊基于商汤领先的大语言模型,不仅具备强大的代码编写能力,还具有卓越的中文理解能力,能够通过自然语言交互降低编程开发门槛,大大提高工作效率。还有一个值得说的好处是它进行这些数据操作的时候,相关的代码是直接在左边显示出来的,这样我们除了自己可以参考学习外,也可以对不正确的地方进行修改,总之,多多少少可以提升效率。借助最新的大模型函数调用能力,代码小浣熊与IDE深度集成,实现了大语言模型与IDE的互操作,为开发者提供更流畅的编程体验。
2024-06-30 18:49:54
1916
原创 文生视频新王登场:Luma官宣免费、电影级大片生成,Sora?可灵?SD3.0?(内附网址)
Dream Machine能够理解视频的主题、风格和情感等创意因素,并自动选择最佳的拍摄角度、镜头转换和叙事节奏,营造出独特的意境和艺术氛围。这款工具生成的画面非常清晰细腻,质量极高,可以模拟专业的光影变化、镜头语言和特效渲染,输出的视觉效果堪比专业影视作品。:AI 能够理解视频的主题、风格和情感等创意因素,自动选择最佳拍摄视角、镜头转换和叙事节奏,营造出独特的艺术氛围。:支持在生成过程中实时调整文本和图片,即时更新视频内容,实现创意的快速迭代,并通过学习用户反馈不断优化生成效果。,都达到了电影级的水准。
2024-06-15 14:38:54
1126
原创 Qwen-Agent:Qwen2加持,强大的多代理框架 - 函数调用、代码解释器以及 RAG!
等,进一步支撑你的行动,以提升本文的帮助力。
2024-06-15 14:37:58
3981
1
原创 Mi-gpt:将小爱音箱接入 ChatGPT ,智能家居 Agent,播放音乐,调节灯光,逗你开心
类似于小爱技能,无需每句话都以“小爱同学”开头。
2024-06-15 14:37:07
4465
原创 FinGPT:12.3k 星星!金融领域的开源大模型来了!
FinGPT允许您对模型进行微调以适应特定的金融任务。# 加载预训练的FinGPT模型# 定义训练数据{"text": "这是一个积极的新闻", "label": "positive"},{"text": "这是一个消极的新闻", "label": "negative"}# 定义训练参数# 进行微调。
2024-06-15 14:36:18
1729
原创 Coolify:24.2K 星星!使用全新、开源免费且自托管的替代方案,部署应用程序的最佳工具(停止使用 Vercel)
Coolify的功能几乎与Vercel一样强大:你可以将GitHub仓库连接到它,几秒钟内就能设置好一切,从SSL证书到数据库备份都能管理,还提供一些分析工具。6. 安装和使用Coolify的步骤:安装Docker,克隆Coolify的GitHub代码,在服务器上运行,创建账户,添加项目和资源,部署网站。5. Coolify几乎与Vercel一样易用,支持多种语言,集成Git,管理SSL证书和数据库备份,还具有一些分析工具。来说还不错,但随着规模扩大,费用会迅速增加,特别是当你需要后端服务和数据库时。
2024-06-15 14:35:17
1047
原创 AI Vs 作家?Groqbook: AI写书神器,使用 Groq 和 Llama3 几秒生成一本完整的书籍!
Llama3-70b,利用较大的模型生成书籍结构,使用较小的模型创建内容。** Groqbook ** 是一个基于 Streamlit 的应用程序,它可以通过一个简单的提示使用 Groq 上的 Llama3。要使用 Groqbook,你可以访问 groqbook.streamlit.app 上的托管版本。🌟Groqbook可以通过一个简单的提示使用 Groq 上的 Llama3 来生成书籍。它应该仅用于生成娱乐用途的书籍。生成的书籍内容不仅结构合理,语言也非常连贯,类似于人类作者撰写的非小说类书籍。
2024-06-15 14:34:22
1602
2
原创 你可以直接和数据库对话了!DB-GPT 用LLM定义数据库下一代交互方式,数据库领域的GPT、开启数据3.0 时代
🤖️ DB-GPT 是一个开源的AI原生数据应用开发框架。让围绕数据库构建大模型应用更简单,更方便。Hello,大家好。今天介绍DB-GPT,这是一个11.8k Star的开源项目,挺精彩的!DB-GPT目的是构建大模型领域的基础设施,通过开发多模型管理(SMMF)Text2SQL效果优化、RAG框架以及优化、框架协作、AWEL(智能体工作流编排)等多种技术能力,在开始介绍这个项目之前,首先我想提个问题:通用模型真的能解决所有问题吗?我们是否需要领域模型?展望未来,多模型之间将如何协作与交互呢。
2024-06-08 19:49:08
2992
原创 CopilotKit:开源 Copilot 框架,部署应用内 AI 代理,使用 Langchain 自动执行任何任务!
🌟 ** : **构建应用感知的AI聊天机器人,可以“看到”当前的应用状态并在应用内执行操作。AI聊天机器人可以与您的应用前端和后端以及第三方服务(如Salesforce、Dropbox等)进行对话,支持生成式UI。几秒钟内开始使用:🌟 ** : **任何的替代品,具有AI辅助文本生成功能。自动完成 + AI编辑 + 从头生成。基于用户数据和Copilot应用上下文。只需将textarea更改为。🌟为代理提供实时应用上下文,让代理在应用内执行操作。🌟。
2024-06-06 18:43:47
1434
原创 Verba:终极 RAG 引擎 - 语义搜索、嵌入、矢量搜索等!
Verba是一个完全可定制的个人助手,用于查询和与您的数据交互,无论是在本地还是通过云部署。解决文档中的问题,交叉引用多个数据点,或从现有知识库中获取见解。Verba结合了最先进的 RAG 技术与 Weaviate 的上下文感知数据库。根据您的个人使用情况,在不同的 RAG 框架、数据类型、分块与检索技术以及 LLM提供商之间进行选择。
2024-06-06 18:42:32
1280
原创 世界模型:我用AI智能体帮我填写简历表格并申请求职!(开源)
Hello,大家好啊,我是Aitrainee,今天想分享一个新开源的大型动作模型框架:LaVague。这是一个开源的大型 ** 操作模型 **我们希望构建一个数据集,供 AI 社区使用,以构建更好的大型操作模型,从而实现更好的 Web Agents。注意,这些示例使用我们的默认 OpenAI API 配置,您需要在本地环境中设置 OPENAI_API_KEY 变量,并提供有效的 API。要在 Google Colab 中查看 LaVague 的端到端示例,请参见我们的 快速浏览笔记本。
2024-06-06 18:34:00
1001
原创 8.7k Star!Khoj:你的AI第二大脑、开源RAG Copilot、平替 MS Copilot与ChatGPT
关于自己托管部署的话,也就是自己安装khoj,你可以到这个链接(好处就是你不必使用官方的体验地址,因为那个免费的使用是受限的,付费才能体验更多的功能)除此以外,我们在网站设置页面可以看到它提供多种数据输入方式,比如你上传的本地文档以及notion中的数据,同时也支持切换不同的lm基础模型。:Obsidian 提供了丰富的插件支持,用户可以根据自己的需求安装和使用各种插件,扩展软件的功能。:用户可以在笔记之间创建双向链接,从而建立起一个类似于知识图谱的结构,方便信息的关联和检索。:您的个人数据保持本地状态。
2024-06-06 18:32:11
3662
原创 14.8k Star!CrewAI:部署一支由你指挥的人工智能代理大军,股票分析、发布帖子、支持Ollama!
等,进一步支撑你的行动,以提升本文的帮助力。
2024-06-06 18:30:47
1934
原创 1.8k Star!RAGApp:在任何企业中使用 Agentic RAG 的最简单方法!
* RAGApp ** ,顾名思义,就是一个开源的 RAG 应用程序,可以让你和 PDF、DOC、电子表格等文档聊天。启动容器后,在浏览器中访问 http://localhost:8000/admin 来配置 RAGapp。代理,比如财务代理、股票代理、编码代理、一般聊天代理等等。配置起来与OpenAI 的自定义GPTs一样简单,但可以使用 Docker 在你自己的云基础架构中部署。注意 : 在开发过程中查看管理 UI,请访问 http://localhost:3000/admin。
2024-06-06 18:27:46
885
原创 Draw-A-UI:你的前端可以直接用笔画出来!通过绘画创建 Web 应用 | 感觉就像魔术一样(附教程)
🌟Draw-a-UI可以平替 OpenUI和v0。它用 AI 把转换成前端代码,支持很多框架,比如Tailwind、NextJS、React 和 Vue,还能把 Figma 文件变成 HTML。GitHub: https://github.com/SawyerHood/draw-a-ui 嘿,大家好!。这是一个改变 UI 开发游戏规则的神器!你可以用它轻松绘制线框,然后一键转换为 Tailwind 或 JavaScript代码。这是一个新的。
2024-06-06 18:24:43
1188
原创 ChatTTS webUI & API:ChatTTS本地网页界面的高效文本转语音、同时支持API调用!
有API真的是帮大忙了,就可以随心操作了,往期文章在这里,话不多说,今天这个 ** ChatTTS-ui ** 也是一个开源项目。这是一个能让你在网页上直接使用ChatTTS进行语音合成的项目,还提供API接口供你调用,项目地址在 GitHub。项目绑定的扩展项目,通过调用 ChatTTS API 接口功能,使用 Streamlit 作为 Web 界面的前端库。🌟一个简单的本地网页界面,直接使用ChatTTS将文字合成为语音,同时支持对外提供API接口。亲爱的读者朋友们,你们好。
2024-06-06 18:23:36
5225
原创 SWE-Agent:普林斯顿大学开源,和Devin一样的软件工程师!
SWE-agent 的工作原理是通过设计简单的 LM-centric 命令和反馈格式,让大模型更容易浏览仓库、查看、编辑和执行代码文件。3. 确认问题后,它会一步步找到解决方案,查看代码,找到问题所在,修复问题,最后发出拉取请求。:当编辑命令发出时,我们会运行一个 linter,如果代码语法不正确,编辑命令不会通过。1. 当 SWE-agent 收到一个问题时,它会提出一个计划,比如首先复制所描述的错误。2. 它会创建一个新的文件来重现这个错误,然后运行代码看看能不能遇到同样的问题。
2024-06-06 18:21:39
894
原创 六位一线AI工程师总结Agent构建经验,天工SkyAgents的Agent构建实战。
🌟我们给人类新手明确的目标和具体的计划,而不是模糊的开放式指示,对Agent也应该这样做。最成功的Agent开发者可能也是工程师团队的管理者,因为给AI制定计划的过程和管理初级员工的方式类似。▲ 六位一线AI工程师分享自身总结,公开大模型应用一年心得我们给人类新手明确的目标和具体的计划,而不是模糊的开放式指示,对Agent也应该这样做,详细展开的话,总的来说有下面两点在任务中需要提供多样化的输出,比如根据用户之前购买过的产品推荐新产品时,仅仅通过提高模型的温度参数可能并不足够,甚至会带来一些问题。
2024-06-06 18:18:36
1502
原创 全球首创4090推理!昆仑万维开源Skywork-MoE模型:2千亿参数架构、训练与评估(技术浅析)
相较于EP对GPU数量的限制和ETP在千卡集群上的低效,EDP可以较好地解决大规模分布式训练MoE的并行痛点,同时EDP的设计简单、鲁棒、易扩展,可以较快地实现和验证。对于计算负载较高的模型,从头训练可能更有效;DeepSpeed为大规模模型提供了强大的优化支持,MoE架构通过专家模块提升了模型的处理能力,而Upcycling技术将二者结合,显著提高了模型的训练和推理效率。为了解决混合专家模型(MoE)训练困难和泛化性能差的问题,Skywork-MoE相较于Mixtral-MoE,设计了两种训练优化算法。
2024-06-06 18:17:06
2084
原创 12k Star!Continue:Github Copilot 开源本地版、开发效率和隐私保护兼得、丰富功能、LLM全覆盖!
您还知道该问题与文件“readme.md”和“helloNested.py”有关,因此您键入“@readme”和“@hello”来查找并选择它们。您输入“@issue”并选择您正在处理的问题。每个上下文提供程序都是一个插件,这意味着如果您想引用此处未看到的某些信息源,您可以请求(或构建!等,插件可在Vscode、JetBrains中直接下载,立即体验无缝且安全的本地开发环境,让你的开发效率和隐私保护兼得!上下文提供程序允许您键入“@”并查看内容的下拉列表,这些内容都可以作为上下文提供给 LLM。
2024-05-31 22:07:19
2114
原创 1.8k Star!RAGApp:在任何企业中使用 Agentic RAG 的最简单方法!
* RAGApp ** ,顾名思义,就是一个开源的 RAG 应用程序,可以让你和 PDF、DOC、电子表格等文档聊天。启动容器后,在浏览器中访问 http://localhost:8000/admin 来配置 RAGapp。代理,比如财务代理、股票代理、编码代理、一般聊天代理等等。配置起来与OpenAI 的自定义GPTs一样简单,但可以使用 Docker 在你自己的云基础架构中部署。注意 : 在开发过程中查看管理 UI,请访问 http://localhost:3000/admin。
2024-05-31 22:06:39
899
原创 6k Star!ChatTTS:开源领域最强的文本到语音转换(TTS)模型!
chat T T S 是一款强大的对话式文本转语音模型。它有中英混读和多说话人的能力。chat T T S 不仅能够生成自然流畅的语音,还能控制[laugh]笑声啊[laugh],停顿啊[uv_break]语气词啊等副语言现象[uv_break]。这个韵律超越了许多开源模型[uv_break]。请注意,chat T T S 的使用应遵守法律和伦理准则,避免滥用的安全风险。可以去谷歌colab上可快速运行这些。
2024-05-30 17:27:41
11622
1
原创 1.1k Star!天工Skywork-13B:性能全面超越LLaMA2、0门槛商用、消费级显卡进行部署和推理!
保留字是指模型中特别需要保留的词汇,如“重要人物的名字”或“地点名称”。这些词在生成和理解过程中需要特殊对待。
2024-05-30 17:24:35
1512
原创 在gitee上导入了一个GitHub的仓库,想要每天强制同步一次,有什么办法设定自动任务?
要每天强制同步一次Gitee和GitHub上的仓库,可以通过以下几个步骤设置自动任务。:在GitHub仓库中配置一个GitHub Actions工作流,每天同步一次Gitee仓库。:设置Gitee的WebHook,每次GitHub仓库更新时自动触发同步。:在你的服务器上创建一个定时任务,每天执行一次同步命令。
2024-05-21 15:59:19
1457
原创 最新开源AI搜索引擎!Perplexica:Perplexity AI平替、100%本地、Ollama接入各类大模型、学术搜索
Perplexica 是一个开源的人工智能搜索工具或人工智能搜索引擎,深入互联网以找到答案。受 Perplexity AI的启发,它是一个开源选项,不仅搜索网络,还能理解您的问题。它使用高级机器学习算法,如相似度搜索和嵌入,以精细结果,并提供带有引用来源的清晰答案。使用 SearxNG 保持当前并完全开源,Perplexica 确保您始终获取最新信息,而不会损害您的隐私。想了解更多关于它的架构和工作原理?您可以在 这里 阅读。
2024-05-21 09:37:45
6822
1
原创 17.9k Star!Langflow :LLM开源低代码工具、拖放式UI定制AI Agent,支持与LangChain协作!
等,进一步支撑你的行动,以提升本文的帮助力。
2024-05-21 09:27:06
2258
计算机视觉-单目相机标定-图像像素坐标到世界坐标的转换·python实现
2023-12-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人