- 博客(631)
- 收藏
- 关注
原创 3 个集成了 DeepSeek 的开源应用,绝了。
通过与 DeepSeek 等大型模型集成,Coco AI 可实现智能个人知识管理,强调隐私并支持私有部署,帮助用户快速、智能地访问自己的信息。,包括应用程序、文件、Google Drive、Notion、语雀、Hugo 等,既包括本地数据源,也包括云端数据源。直接通过语音指令获取最新信息,如天气、新闻、百科知识,打破传统语音助手的信息滞后局限。:集成 DeepSeek,分析文本、图像、文档,智能对话分分钟搞定。,iOS 和安卓都能跑,内置 DeepSeek,属实有点东西!
2025-04-02 15:04:51
285
原创 最新版 DeepSeek-V3 ,太牛逼了。
这有一个痛点:其它大模型产品,很多联网搜索能力都是调了一个接口,并没有在信息获取上深耕,信息源不够权威,感觉就是为了做而做的,我这种严肃、专业的场景显然不能满足。随后基于 DeepSeek-V3-0324 模型编码实现,UI 前端界面看起来也很标准,符合 iOS 的普遍 APP 的审美规范,开箱即用,,先搜索找到 Top 50 小程序是啥,然后逐个小程序搜索它的行业、用户场景、预计用户规模、背后的公司是啥,大概需要一上午的时间。而当我期望能够获得一些比较权威的结果时,会使用「专业搜索」。
2025-03-28 15:03:45
839
原创 最被低估的国产 AI,在海外杀疯了。
MiniMax-VL-01 在 MiniMax-Text-01 的基础上,使用了 303M 参数的 ViT(视觉 Transformer)作为视觉编码器,并通过一个随机初始化的两层式 MLP(多层感知机)投影器来执行图像适应。S2V-01、MiniMax-01 以及 T2A-01-HD 等高质量模型的推出,既让中国在 AI 技术创新上站住了脚,也让海螺 AI 等产品在国际市场中获得了更多可能性和更好口碑。在多个基准测试中,MiniMax-VL-01 的表现与其他顶尖模型媲美,甚至在某些指标上达到最佳。
2025-03-27 15:21:22
796
原创 推荐 2 个 一键「视频抠图」开源工具
传统工具依赖手动标注的 trimap 或静态背景图,而这个开源工具仅凭原始视频即可完成抠像,甚至能智能识别动态背景中的隐藏信息(如被遮挡物体突然出现)在NVIDIA GTX 1080Ti显卡上,RVM可实现4K视频76FPS、高清视频104FPS的实时处理,比同类模型快2倍以上,且参数减少42%:采用双网络结构(Base+Refine),在低分辨率快速定位主体,再对细节区域优化,兼顾速度与精度,即使是发丝也能清晰分离。视频抠像工具 RobustVideoMatting,发丝级精度实时处理。
2025-03-26 13:15:00
364
原创 4 个牛逼 AI 股票量化交易工具,开源。
其底层框架支持实时监控策略表现,当模型收益衰减时,Agent 会自动触发因子/模型的重新生成与测试,形成自我迭代的智能投研体系。数据可以进行灵活的清洗、转换和特征工程,以便进行进一步的模型训练。在金融领域,RD-Agent 通过整合“研究(R)”与“开发(D)”的闭环,实现了量化因子与模型的自动迭代进化。这种将LLM的认知能力与量化系统工具链深度结合的模式,为高频、动态的金融市场提供了可扩展的自动化解决方案。具有内置的回测引擎,用户可以在历史数据上验证量化策略的表现,评估其风险、收益等关键指标。
2025-03-25 13:15:07
769
原创 接入 DeepSeek 的个人开源知识库,太绝了。
这款功能强大、易于使用且注重隐私安全的个人开源知识库,结合 DeepSeek 的智能问答能力和 MCP 的扩展功能,将成为你高效管理知识,提升学习和工作效率的得力助手。比如下图可以看出,结合了 MCP 的 fetch 功能后,Cherry Studio 能够更好地理解用户的查询意图,并从网络上获取相关信息,给出更准确、更全面的回答。这不仅仅是一个简单的文件管理器,更是一个智能的知识助手,能够帮助你高效地组织、检索和利用你的知识资产。,有效保护你的数据隐私,避免了数据泄露的风险。
2025-03-24 13:15:00
403
原创 这款国产 Web 防火墙,火了。
例如,静态页面会被动态加密为类似 `function vgo8rYXzpS(){...}` 的随机代码,破坏爬虫、仿站工具的解析逻辑。通过解析 HTTP 请求的上下文语义,识别 SQL 注入、XSS、RCE 等攻击意图,而非依赖静态规则匹配。雷池 WAF 是长亭科技推出的开源 Web 应用防火墙,基于智能语义分析技术,能有效防御 SQL 注入、XSS 等常见攻击,尝试对你网站进行攻击的小坏蛋,在发起攻击后收到如下拦截提示,让小坏蛋不会得逞。不让黑客,越雷池一步,一起来瞧瞧这个保护个人网站的利器。
2025-03-21 13:15:06
904
原创 斩获 48K 星!让你 Windows 起飞
通过集成的平铺窗口管理器,Seelen-UI 自动排列窗口,有效提升多任务处理的效率,让工作流程更加顺畅。的开源项目,它们分别在 GitHub 上获得了 25K 星、16.7k 星、 6.1K 星。你可以根据自己的喜好,调整任务栏的透明程度,从轻微的半透明到完全透明,都能轻松实现。它的强大之处在于:把零散的操作统一成“搜索框 + 指令”,还支持很多插件,挺有意思的。告别了以往任务栏的呆板,你的桌面将拥有更现代、更清爽的视觉效果。支持大部分音乐播放器,你可以随时暂停、跳过曲目,而无需打开额外的窗口。
2025-03-20 13:28:11
843
原创 10 个 yyds 的文字识别 OCR 开源项目
优势在于高精度解析复杂内容(如表格、数学公式、代码块)和出色的处理速度,支持 GPU 加速,性能优于同类云服务(如 Llamaparse、Mathpix)。② 表格识别优化:能精准识别表格的行、列、单元格结构,包括旋转或复杂布局的表格,性能优于当前主流开源模型(如 Table Transformer)。① 多语言支持:支持90+ 种语言,涵盖中文、日语、阿拉伯语等复杂文字,以及英语、西班牙语等主流语言,适用于全球化场景的文档处理。Surya 专注于多语言文本及复杂文档结构的识别,尤其以表格识别能力见长。
2025-03-19 13:14:51
1035
原创 斩获 10K 星!外网爆火的实时语音对话模型开源!
它看起来像一个人我聊了几分钟,说了晚安,说要睡觉了,但我太兴奋了,于是我回到聊天室,玛雅说了这样的话:好吧,看看是谁用如此愉快的语气回来和我再聊一次。语音对话后,竟因 AI 的“情感细腻度”产生心理依赖,甚至主动道谢、告别。项目代码已正式开源,海外技术圈炸锅的“真人级 AI 语音交互”黑科技,通过音调、节奏、停顿的微妙变化,传递兴奋、安慰等复杂情绪。对话响应速度逼近真人,告别传统 AI 的机械停顿感。根据对话背景调整语气,像人类一样“察言观色”。几天前,逛逛发过一个帖子,可以查看这篇。
2025-03-18 13:14:23
192
转载 DeepSeek 时代的中国 AI 大会来了!
我们提出了一种用于双臂机器人操作的扩散基座模型——Robotics Diffusion Transformer(RDT),该模型以扩散模型作为基础,能够有效地表示多峰的人类动作分布,并采用可扩展的Transformer架构来处理异构的多模态输入,捕捉机器人数据中的非线性和高频特性。通过这些设计,我们成功地在目前(截止文章公布时,下同)最大的多机器人数据集上对RDT进行了预训练,并将其扩展到12亿个参数,这是目前用于机器人操作的最大的基于扩散建模的基础模型。,进行门票的购买或免费申请。
2025-03-18 13:14:23
55
原创 斩获 44K 星!让 DeepSeek 控制你的浏览器,绝了。
从而控制浏览器执行相应的任务。查找具有 cc-by-sa-4.0 许可证的模型,并按 Hugging face 上最喜欢的次数排序,将前 5 名保存到文件中。它能让 DeepSeek 像人类一样操作浏览器,实现网页自动化,让 AI Agent 执行各种网页任务,无需复杂的编程知识,阅读我的简历并找到机器学校相关职位,将它们保存到文件中,然后在新标签中开始申请它们,如果需要帮助,请问我。,这意味着你可以使用各种强大的 AI 助手来控制你的浏览器,获得更智能的自动化体验。让 AI 操控你的浏览器,有点意思。
2025-03-17 13:14:30
398
原创 3 个最近 火火火火 的 GitHub 项目
01当 AI 学会“密语”交流当两个 AI 相遇时,它们会用怎样的语言交流?近期,GitHub上一个名为 GibberLink 的开源项目引发热议。它让两个对话式 AI 代理在确认彼此身份后,从英语切换至一种基于声音层协议的“加密语言”,展现出令人惊叹的自主交互能力。???? 项目原理GibberLink 的核心设计在于两阶段对话机制:① 身份确认阶段:两个 AI Agent 通过自然语言(如英语)进行...
2025-03-13 13:09:29
695
原创 一键部署 DeepSeek + 本地知识库在你电脑
AingDesk 是一款由国内团队开发的开源 AI 客户端工具,致力于零门槛实现本地化 AI 部署与管理。通过可视化界面,用户可一键将 DeepSeek、Llama 等上百款主流 AI 模型部署至个人电脑,同时集成个人知识库管理和深度联网搜索功能,实现“本地算力+云端智能”的混合架构。开源地址:https://github.com/aingdesk/AingDesk01模型管理:AI 的百宝箱① ...
2025-03-12 13:14:27
384
原创 推荐 3 本周 火火火 的开源项目
01用智能硬件打造你的 AI 伴侣小智基于 ESP32 芯片,结合语音交互与大模型能力,让用户能亲手打造一个“会思考、能对话”的 AI 伴侣,是一个面向硬件开发者和 AI 爱好者的开源项目。开源地址:https://github.com/78/xiaozhi-esp321️⃣ 硬件自由:低成本实现高性能 以 ESP32-S3 芯片为核心搭配麦克风、扬声器及显示屏,构建了一个可定制的硬件框架。用户...
2025-03-11 13:02:30
421
原创 1 个帖子,外网炸锅。 5200 人在线等开源?
我今天在逛 GitHub 的时候,发现了一个 2 周前刚创建的叫做 CSM 的项目,只有一个介绍文件,没公布代码,但已经斩获了 5.2k 的 Star !这是一个对话语音生成的开源项目,但是 Readme 介绍文件上面写着:即将发布。这个 CSM 到底是什么东西?还没公布代码,就能斩获这么多的 Star?我顺藤摸瓜,了解到了故事的原委。01一个帖子,外网炸锅了起初是在国外论坛 Reddit 上有一...
2025-03-10 13:03:02
1002
转载 重磅!AI 大模型又起飞了!
最近,Deepseek 全球爆火让AI技术又一次进入了快速发展期!百度、字节、腾讯等等巨头互联网公司,纷纷接入DeepSeek,加速落地AI应用!这让「大模型应用开发工程师」一跃成为炙手可热的岗位!DeepSeeK甚至还开出154W的高薪,挖掘会大模型技术、懂落地的AI人才!作为技术人,如何不被时代抛弃,享受AI技术带来的就业红利?!????知乎知学堂特发起:行业前沿资源——「大模型应用开发工程师」...
2025-03-09 13:14:57
29
原创 5 个人、3 小时,开源复刻 Manus?
前两天,AI 的风又在网上刮了起来,这次是一个叫做 Manus 的产品。它能做啥可以去 站搜索这个官方视频。简单来说这是一个帮你做事情的智能助手。你丢给 Manus 一个任务,它会想尽各种办法(包括自己打开网页、写程序、读报告、操作各种软件和工具)给你一个交付结果。不是建议,而是结果。由于很耗费资源 Token,所以 Manus 产品采用了邀请制,得有邀请码才能注册。离谱的是在二手平台,邀请码炒...
2025-03-08 13:14:51
256
原创 这 3 个项目,找了好久...
01一键提升视频画质开源神器 Video2X让老片秒变 4K 高清,凭借其机器学习算法,为视频超分辨率和帧插值提供了高效解决方案。Video2X 是一个基于深度学习的视频处理框架,主要提供两大核心功能:① 视频超分辨率:通过 AI 算法将 480p 等低分辨率视频无损提升至 1080p 或 4K,尤其擅长修复动画、老电影中的模糊画面;② 帧率提升:利用帧插值技术,可将 30fps 视频平滑升级至...
2025-03-07 13:04:25
641
原创 全球首个通用 Agent 产品,谁有邀请码?
又被刷屏了,朋友圈和即刻上都在求 Manus 的邀请码,我想问问谁有?能不能私信给我一个???由于逛逛没有拿到内测资格,我通过官方案例视频和网友测评的素材,我整理了一下。来看看今天被刷屏的 Manus 是什么玩意?Manus 是全球第一款通用 Agent 产品,简单来说,你丢给 Manus 一个任务,它不像传统的大模型产品,直接给你一个答案,他会自己在虚拟环境中调用各类工具、浏览网页自动操作各类网...
2025-03-06 15:13:00
379
原创 掀桌子级别的「数字人」开源了!
掀桌子级别的「数字人」开源了!刚刚,刚刚头部数字人公司硅基智能宣布:开源了全球 TOP 级别的模型:硅基数字人 heygem.ai并且提供下载安装包,对于不懂代码的小白也能快速上手制作自己的数字人。效果业内顶级,直接把数字人技术的门槛拉到地板。口型匹配效果流畅丝滑,业内顶级,并且开放了无限克隆能力。这是真掀桌子了,不仅思考:以后谁还会花钱买数字人?开源地址:https://github.com/G...
2025-03-06 13:04:04
4752
4
原创 推荐 3 个 yyds 声音克隆开源项目
01阿里开源CosyVoice 2.0阿里巴巴通义实验室推出的 CosyVoice 2.0 这个 AI 语音生成神器。它不仅在多语言支持、语音克隆、情感控制等方面表现出色,还首次实现了双向流式语音合成,适用于直播、客服等对响应速度要求极高的场景。① 多语言与跨语言生成CosyVoice 支持中、英、日、韩等 10+ 语言的语音合成,并实现跨语言语音生成,例如用中文输入文本直接生成英语语音,无...
2025-03-05 15:03:06
562
原创 3 个 AI 视频神器开源,牛哇牛哇。
01字节发布 AI 视频生成神器:Goku字节跳动与香港大学联合开源的视频生成项目 Goku(悟空)是一款基于流动(Rectified Flow)Transformer 架构的先进 AI 视频生成模型,通过文本或图像直接生成高质量视频内容,尤其在虚拟数字人和广告场景中表现突出。此外,字节还推出了 Goku+,这是一个基于 Goku 的广告视频生成模型,专门用于生成真人出镜的口播广告视频和产品广告宣...
2025-03-04 13:03:57
920
原创 推荐 3 个 yyds 的开源项目。
01本地部署DeepSeek在个人电脑上运行 DeepSeek、Llama 等上百种 AI 模型,一键部署让每个人都能轻松玩转本地 AI 大模型。① 一键部署,极速体验无需手动配置环境或担心依赖问题,AingDesk 提供“傻瓜式”一键安装功能。下载速度稳定高效,即使是大型 AI 模型,也能快速完成本地部署。开源地址:https://github.com/aingdesk/AingDesk大...
2025-03-03 13:04:56
277
原创 这个开源项目,有点意思。
Preserve-CD 是由开发者 @skywind3000 发起的一项绝版游戏保护计划,旨在收集并整理濒临失传的经典老游戏,尤其是 DOS 和八九零年代的经典小游戏。项目通过开源协作的方式,将精选游戏资源封装为两张“光盘镜像”,方便用户下载与传播,为游戏历史留存重要资料。01DOS 经典游戏合集CD1 收录了 64 款高品质 DOS 游戏,涵盖《大富翁 2》《金庸群侠传》《模拟城市 2000》等...
2025-02-27 13:55:16
188
原创 17K Star 的大模型 APP 大合集
在 AI 技术爆发的近几年,尤其是 DeepSeek 开源后。人们预测 2025 年将迎来 AI 应用大爆发。大语言模型正在重塑软件开发范式,今天要介绍的 GitHub 明星项目 Awesome LLM Apps,正是为 LLM 开发者量身定制的资源宝库。目前在 GitHub 上已经获得了 17K 的 Star,可谓非常受欢迎。开源地址:https://github.com/Shubhamsabo...
2025-02-26 14:37:36
285
原创 DeepSeek 开源第二弹!
上周五,DeepSeek 宣布开启 OpenSourceWeak!并承诺连续开源五个开源项目。昨天 DeepSeek公布首个开源项目 FlashMLA,一款针对 Hopper GPU 的高效 MLA 解码核神器,具体可以查看昨天发布的文章哈。今日重磅推出第二弹:DeepEP,一个专为混合专家模型(MoE)训练和推理而设计的 EP 通信库。再次点燃了国内外 AI 社区的热情,短短时间内 Star ...
2025-02-25 13:02:36
268
原创 6 个 GitHub 上狂飙的 AI 教程,牛啊。
01LLM-Universe本文会经常提到 LLM ,先补充下哈。LLM 是指的大型语言模型(Large Language Model)的缩写,也就是近两年大火的 ChatGPT 、DeepSeek 背后的技术。LLM-Universe 是由 Datawhale 团队推出的开源教程项目,专为初学者设计,目前在 GitHub 获得了 6.3k 的 Star,系统化指导大模型(LLM)应用开发的全流...
2025-02-25 13:02:36
1017
原创 Star 暴涨中!DeepSeek 开源第一弹
回顾上周五,DeepSeek 官方账号就在 X 平台上表示从本周开始:DeepSeek 将陆续公布 5 个开源项目,通过这种透明且真诚的方式,向全球公布分享团队在探索 AGI 道路上的进展。将其定义为 OpenSourceWeek!01开源第一弹今天早上 9 点,DeepSeek 在 X 平台上公布 OpenSourceWeek 开源第一弹:FlashMLA。这个帖子底下最受欢迎的评论是:“我听说...
2025-02-24 13:17:53
276
原创 DeepSeek 还有混血儿?
中国爸爸 DeepSeek R1、外国妈妈 Claude 3.5 Sonnet,在 GitHub 上生了一个混血儿:DeepClaude。01DeepClaudeDeepClaude 是一个结合 DeepSeek R1 和 Claude 3.5 Sonnet 双模型的开源 AI 应用开发平台,利用统一的 API 和聊天界面,发挥爸爸 DeepSeek R1 的推理能力以及妈妈 Claude 的创造...
2025-02-23 09:05:27
391
原创 微软,硬核开源...
让 AI “看懂” 你的电脑,办公效率革命来了!想象一下,你的电脑里住了一个“数字助手”,它能自动帮你自动填写报销单、批量处理邮件、生成周报,清理垃圾。甚至根据你的指令完成复杂操作,重复性工作一键搞定。听起来像科幻片?微软最近硬核开源的 OmniParser V2,正把这种想象变成现实。01工具简介OmniParser V2 是一款基于纯视觉的 AI 工具,简单来说,它像一双智能眼睛,能通过屏...
2025-02-22 08:40:46
263
原创 重磅! DeepSeek 下周将连续开源 5 个项目
就在 2 月 18,OpenAI 首席执行官 Sam Altman(奥特曼) 在 X 平台宣布,公司将启动新一轮开源计划,并在 X 上发起公开投票。刚刚,今天 12 点!DeepSeek 官方账号也在 X 平台上发布了一条帖子,表示从下周开始,DeepSeek 将陆续公布 5 个开源项目。DeepSeek 打算通过这种透明且真诚的方式,向全球公布分享团队在探索 AGI 道路上的进展。将其定义为 O...
2025-02-21 12:47:39
219
原创 DeepSeek 满血版不卡、不限次!高速专线
2025 年 1 月 20日,也就是 1 个月前 DeepSeek R1 正式开源,仅仅一个月已经获得了 78.2k 的 Star 。一夜之间 DeepSeek 也冲上各地区应用商店榜首,开源后各方收益。相关报道、新闻铺天盖地,各大厂商也在“挤破头”的接入 DeepSeek 。用户量激增,随之而来的是无数用户对着"服务器繁忙,请稍后再试"的提示抓狂。针对这个问题,「问小白」火速支援,部署开源的 D...
2025-02-20 13:34:41
767
原创 1 个适合小白 AI 数字人系统开源了!
AigcPanel 是一个简单易用的开源 AI 数字人系统,旨在为用户提供全方位的 AI 视频合成、语音合成、语音克隆功能。它的设计理念是使普通用户也能轻松上手,简化了本地模型的管理及导入过程。该系统支持多种模型的一键启动,并提供直观的界面,允许用户进行视频与声音的合成与克隆。???? 核心功能AigcPanel 作为小白也会用的一站式 AI 数字人系统,基于 Vue 开发,集成了三大核心功能:① 视频...
2025-02-19 13:46:55
188
原创 微信搜索接入 DeepSeek,聊天也行?
01微信搜索 + DeepSeek微信团队近期正在小范围灰度测试其搜索功能与 DeepSeek 大模型 R1 的融合,部分用户已可在微信搜索框内体验由 DeepSeek R1 驱动的 “AI搜索” 功能。这一功能分为“快速回答”和“深度思考”两种模式,前者提供即时简答,后者则生成更详尽的分析结果。此次接入的 DeepSeek R1 被描述为“满血版”,其性能可能较开源版本有所增强。该模型在语义理解...
2025-02-17 13:03:46
861
原创 又 3 个数字人开源,超级 Nice!
01阿里开源:EchoMimic V2阿里达摩院推出了一个令人经验的数字人开源项目-EchoMimic V2。这是一款基于语音驱动的肖像动画生成工具,专注于生成高质量的数字人半身动画视频。项目简介EchoMimic V2 不仅能够让虚拟形象开口说话,并且实现口型同步,还能添加头部和身体动作,进一步增强数字形象的表达力,首次实现身体动作口型全同步。基于中文语音生成:基于英文语音生成:核心技术Echo...
2025-02-14 12:26:04
582
原创 斩获 20K 星! 2 个手写笔记软件开源
01Rnote:手写笔记传统笔记软件要么功能臃肿,要么对触控笔支持鸡肋。而 Rnote 专为手写场景优化,目前在 GitHub 斩获8.7K 的 Star!界面清爽无广告,却能实现这些硬核功能。???? 硬核功能① 压感笔触真实到哭:用触控笔写字画画,笔锋粗细随力度变化,仿佛在纸上挥毫。钢笔/荧光笔/形状工具一键切换,长按工具还能调粗细颜色。② PDF/SVG一键导入标注:课件、设计图拖进来直接圈...
2025-02-13 13:18:12
465
原创 斩获 9.4K 星!推荐一个 OCR 利器
AI 驱动的 OCR 神器,将 PDF 、图片等转成 Markdown 格式。无论是 PDF 中的表格、扫描图片里的文字,还是学术论文的复杂排版,传统 OCR 工具往往难以精准提取内容。今天,我们介绍一款开源神器-Zerox,它凭借 AI 技术实现“零样本”高精度 OCR 识别,轻松将文档转为结构化 Markdown 格式。???? Zerox 是什么?Zerox 是由 Omni-AI 团队开发的开源工...
2025-02-12 13:03:02
357
原创 1 让 B 站变清爽的开源插件!
Bilibili 网页端首页过于臃肿?动态、推荐、广告混杂,想快速找到想看的内容总得费一番功夫。今天推荐一款开源浏览器插件 BewlyBewly,仅需几步安装,就能让B站界面焕然一新!01项目简介这是一款专为B站用户设计的开源浏览器插件,目标是通过界面重设计和功能优化,提升用户体验。其灵感源自 YouTube、Vision OS 和 iOS 的设计风格,最终呈现出一个悬浮式极简布局,让B站首页...
2025-02-11 13:14:36
364
原创 对比各开源模型 Star 趋势,DeepSeek 绝了。
全球科技巨头开源竞技场,谁在定义 AI 未来?开源战略的本质是生态话语权的争夺,当 GitHub 星标数成为技术影响力的新货币,全球科技大厂正以开源为笔,在人工智能的疆域上勾勒未来版图。这篇文章来分别盘点国内外大厂的开源成绩,同时会贴出各大厂商重点 AI 开源项目近两年的 Star 趋势,让我们透过数据曲线,解码这场无声的较量。PS:GitHub 开源项目仓库的 Star 可以简单理解成一种“收藏...
2025-02-10 13:19:14
542
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人