AI Repos
1、ai-chatbot
Vercel 开源的一款 AI 聊天机器人:AI ChatBot。项目基于 Next.js 和 Tailwind CSS 构建,界面清晰简洁,具备完整的 AI 聊天功能。有需要搭建自己 AI 聊天机器人的开发者,可以从这个项目里面学到不少东西。
2、MagicQuill
一款简单好用的交互式图像编辑 AI 工具,只需要简单的笔画和添加提示词,就能轻松完成图像编辑任务,如添加新元素、移除物体、画面调色等操作。并提供了丰富画布工具集,包括拖拽、旋转、调整画笔大小等,同时可选择不同绘画模型适配多种图像风格。只需要 8GB 显存,即可运行使用该工具,感兴趣的可通过 Docker 部署使用。
3、neurapress
NeuraPress 是一个现代化的 Markdown 编辑器,专注于提供优质的微信公众号排版体验。响应式设计,支持移动设备。搭配 DeepSeek和微信公众号助手使用,碎片时间也能用手机发有排版的文章了。
AI News
1、WarpTuber:快手 LivePortrait 驱动的即时 VTubing 工具
WarpTuber 是一个基于快手 LivePortrait 的即时 VTubing 工具。它允许用户通过摄像头,将自己的脸部表情和面部动作即时‘套’到一张照片或角色图像上,从而创造出会动的虚拟形象。
2、Silent Branding Attack:基于生图模型的数据投毒
Silent Branding Attack 是一种新的数据投毒技术,专门针对文生图模型。这种技术独特之处在于,它不需要使用任何明确的提示词,就能在生成的图像中无缝嵌入特定品牌,并且看起来非常自然。一把双刃剑,既能用于品牌推广,也能用于恶意攻击。目前,仅发布了研究论文,代码即将开源。
3、Mistral Small 3.1:多模态模型
Mistral Small 3.1 是 Mistral Small 3 的升级版本,拥有 24B(240 亿)参数,旨在提供高效、低延迟和高性能的生成式 AI 解决方案。该模型在 Apache 2.0 许可证下发布,允许用于商业目的。该版本主要新增了对图像理解的支持,上下文长度从原来的 32k 提升至 128k 令牌,可在单张 RTX 4090 显卡或配备 32GB RAM 的 Mac 上运行,比同参数量的 Llama 3.3 70B 在相同硬件上快 3 倍。这个模型在多个基准测试中表现优异,超越了同级别模型 Gemma 3 27B 和 GPT-4o Mini 等。
4、快手 ReCamMaster:单目视频重运镜技术
ReCamMaster 是快手团队开发的一项单目视频重运镜技术。它能够通过控制相机视角和运动路径,将已有的视频素材“重新拍摄”,生成全新的动态视角,而无需额外的拍摄设备或复杂的后期制作。
5、Piece it Together:拼图魔法
“Piece it Together”(简称 PiT)是一款创新的视觉概念生成工具,它能够将用户提供的各种“部件”智能整合,形成一个有意义的整体。
6、AI冲击致美国程序员就业降至1980年来新低
美国劳工统计局数据显示,受AI技术影响,计算机编程就业人数降至1980年以来最低,远低于历史峰值70万,目前仅剩一半。过去45年总就业增长75%,但编程岗位自2023年起12个月均值下降27.5%,与ChatGPT等工具兴起相关。未来十年,软件开发预计增17%,编程却减10%。专家认为AI取代简单编码任务,但IBM CEO预计仅20%-30%可自动化,程序员将转向复杂工作,AI提升生产力。Meta CEO称AI可替代中级编码。
7、昆仑万维Skywork R1V多模态推理模型开源,挑战AI新高度
昆仑万维推出中国首个工业界开源多模态推理模型Skywork R1V,公开权重与技术报告。该模型融合视觉与逻辑推理,在MATH500和AIME测试中得分94.0和72.0,在MMMU和MathVista视觉推理基准中获69和67.5,媲美闭源大模型。三大技术创新包括文本推理迁移、多模态混合训练及自适应思维链蒸馏,提升效率与精度。Skywork R1V的开源将加速多模态AI发展,赋能全球研究与产业应用。
8、Anthropic MCP升级“流式HTTP”,速度效率双提升
Anthropic推出MCP重大升级,引入“流式HTTP”替代传统HTTP+SSE传输方案,大幅提升数据传输速度与效率。新技术突破远程传输限制,保留MCP原有功能优势,为开发者带来更快、更易用的体验。业内称其如“高速公路”般流畅,标志着Anthropic在AI技术优化上的又一突破,开发者对此反响热烈。
9、Cursor发布Claude Max:20万字上下文+200次工具调用震撼登场
Cursor推出Claude Max,基于Claude3.7,支持20万字超大上下文和200次工具调用,专为大规模代码项目设计。它能一次性加载整个代码库,深度理解结构,提升效率与创造力。收费按使用量计算,每次请求及工具调用$0.05,全额使用达$10,适合专业开发者及高预算用户,不含Pro套餐,需额外开启计费模式。普通任务可依赖现有模型,Claude Max定位高端需求。
10、阿里全面推进AI化,欲打造超抖音的杀手级应用
阿里CEO吴泳铭推动全业务“AI化”,2025年绩效将依AI增长评估。核心电商部门联合通义千问工程师开发高效功能,同时研发AI原生应用,或年内推出。知情人士称,阿里欲打造超越抖音的杀手级应用。吴泳铭在财报会上透露,未来三年将聚焦电商、科技、互联网平台三大业务,加大AI基础设施、基础模型及应用投入,升级现有业务,抓住AI时代机遇。阿里云和AI投入预计超过去十年总和。