
AI日报
文章平均质量分 84
go2coding
关注机器学习,人工智能
展开
-
OpenAI Canvas功能正式向所有ChatGPT用户开放
OpenAI于12月11日宣布,Canvas功能现已向所有ChatGPT用户开放,旨在提升写作和编码项目的效率。用户可以在网页版以及Windows 10和11版本中使用该功能,未来还将推出Mac和移动平台版本。Canvas允许用户处理编辑和修改工作,提供丰富快捷键、Python代码执行及错误修复建议,同时支持定制GPT和评论功能,增强人机协作。首席执行官山姆·阿尔特曼表示,Canvas将使作品更具风格。原创 2024-12-11 08:50:29 · 1195 阅读 · 0 评论 -
Meta发布Llama 3.3 AI大模型
Meta于12月6日发布了其最新的AI大模型Llama 3.3,该模型拥有700亿参数,但在性能上可媲美4050亿参数的Llama 3.1,具有更高的效率和更低的成本。Llama 3.3优化了多语言支持,支持8种语言,采用自回归模型架构,结合监督式微调和基于人类反馈的强化学习。模型具备128K的上下文长度和多个工具集成支持,并加强了安全防护措施,降低滥用风险。原创 2024-12-09 08:45:44 · 1362 阅读 · 0 评论 -
OpenAI发布完整版o1模型及ChatGPT Pro订阅
OpenAI于12月6日启动为期12天的新品发布周期,首次推出完整版o1模型,并推出月费200美元的ChatGPT Pro订阅。该服务允许无限使用o1、GPT-4o及Advanced Voice等功能,同时提供独家o1 Pro版本,旨在为复杂问题提供更优解答。常规的20美元Plus套餐仍然可用,包含新功能抢先体验和更强大的模型访问。原创 2024-12-06 09:12:51 · 1236 阅读 · 0 评论 -
OpenAI CEO宣布12场直播发布新产品
OpenAI CEO阿尔特曼宣布将于每个工作日进行一场直播,共计12场,内容将涉及新产品发布和演示。其中,新款文本转视频工具Sora备受期待,有望在2024年底前发布。Sora曾在测试阶段引发争议,部分艺术家因抗议“无偿劳动”泄露该模型。OpenAI在数据来源方面饱受批评,尚未确认Sora是否使用公共YouTube视频进行训练。目前,谷歌也推出了文本转视频模型Veo,正进行私人预览。原创 2024-12-05 09:14:46 · 729 阅读 · 0 评论 -
腾讯混元大模型上线,开源文生视频能力
腾讯于12月3日宣布混元大模型正式上线,并开源其文生视频生成能力,支持中英文输入,参数量达130亿。该模型可生成超写实的高质量视频,拥有良好的光影反射效果。腾讯采用DiT架构,提升语义理解,支持更细致的描绘。目前,开发者可通过“腾讯元宝 App”申请试用,开源内容包含模型权重和推理代码,便于开发生态插件。原创 2024-12-04 08:45:00 · 506 阅读 · 0 评论 -
ChatGPT两周年:变革与挑战并存;马斯克指控OpenAI及微软反竞争行为
ChatGPT自推出以来,已吸引2.5亿活跃用户,并助推全球科技公司总市值增长8万亿美元。OpenAI在两周年之际,正寻求新一轮融资,以支持每年高达50亿美元的支出。与此同时,马斯克对OpenAI提起诉讼,指控其不当竞争和转变盈利性质,要求法院颁发禁令。OpenAI计划在2025年推出新智能体,目标是10亿用户,但面临激烈市场竞争和成本上升等挑战。原创 2024-12-02 08:45:38 · 1000 阅读 · 0 评论 -
阿里发布QwQ-32B-Preview模型,推理能力强劲;月之暗面Kimi与清华大学发布Mooncake开源项目
摘要:AI模型企业Anthropic近日为其Claude聊天机器人推出“自定义样式”功能,用户可以根据具体场景调整文本生成风格。Claude现在提供“正式”、“简洁”和“解释性说明”三种预设样式,并允许用户上传自己的写作示例以进一步定制。GitLab极狐的AI技术产品主管表示,这一功能使得团队在多种场合下都能有效使用Claude,提升了文档撰写和项目管理的效率。原创 2024-11-29 08:51:06 · 1001 阅读 · 0 评论 -
Anthropic发布AI模型统一协议
Claude AI开发商Anthropic于11月25日推出开源协议Model Context Protocol,旨在为各类AI工具与模型数据库提供标准化对接接口。该协议允许AI工具通过单一协议访问多种数据源,提升模型响应速度与生成质量。Anthropic指出,现有数据隔离问题限制了模型性能,每新增数据源往往需定制集成方案。该协议包括规范、SDK及开源代码库,已被Block、Apollo等公司应用,方便开发者快速对接。原创 2024-11-27 08:46:34 · 727 阅读 · 0 评论 -
TikTok推出免费生成式AI视频制作平台
TikTok近日发布了“Symphony Creative Studio”,一款面向广告主和内容创作者的免费生成式AI视频制作平台。该平台允许用户上传品牌素材并自动生成短视频,具备视频编辑、字幕添加、翻译及语音合成等功能。支持30多种语言的翻译,并可调节发音与人物口型以实现同步。此外,平台未来将增加微调短视频及品牌专用广告台词等功能,以提高广告主的创作效率。原创 2024-11-25 08:55:05 · 1057 阅读 · 0 评论 -
谷歌Gemini推出个性化记忆功能;DeepSeek推出全新推理模型R1-Lite
谷歌近日为Gemini Advanced用户推出“记忆”功能,使AI能够记住用户的生活细节和个人偏好。这一功能类似于ChatGPT,能够根据用户的喜好提供个性化服务。例如,若用户曾提到喜欢某种菜系,Gemini会在推荐餐馆时据此调整建议。目前,该功能仅在网页版上线,需订阅Google One AI Premium,iOS和安卓用户尚未体验。用户可以随时管理和删除记忆信息,谷歌承诺不将这些信息用于模型训练。原创 2024-11-21 08:45:16 · 766 阅读 · 0 评论 -
微软在Ignite 2024发布Copilot+新功能
微软在Ignite 2024大会上宣布,Microsoft 365 Copilot将利用Copilot+ PC中的NPU本地运行AI模型,减少网络依赖。此功能将提升用户在Outlook和Word中的AI写作辅助体验。同时,Windows Recall功能因安全问题推迟,微软承诺改进其安全性。新发布的Windows Copilot Runtime为开发者提供了图像处理API,计划在2025年推出,预计将吸引更多应用程序使用这一技术。原创 2024-11-20 08:45:57 · 1107 阅读 · 0 评论 -
AI实验室发展遇阻,领导人对未来持乐观态度
近期有传言称OpenAI、谷歌和Anthropic等AI实验室在开发先进模型时遇到困难,原因是训练数据不足。对此,OpenAI CEO Sam Altman和Anthropic CEO Dario Amodei表示不同意见,认为仍有不少方法可克服障碍。前谷歌CEO埃里克・施密特预测未来五年内大型语言模型将快速迭代,性能持续增长,但同时也警告潜在风险增加,包括新型攻击和生物病毒的威胁。原创 2024-11-19 09:22:26 · 362 阅读 · 0 评论 -
马斯克诉OpenAI新进展:加入微软等被告
埃隆·马斯克再次升级对OpenAI的诉讼,新增微软等被告,诉状揭示了他与OpenAI早期的矛盾,包括未能成为CEO。邮件中,OpenAI首席科学家伊利亚·苏斯克沃表达了对马斯克可能掌控AGI的担忧,认为这种结构可能导致独裁。苏斯克沃对OpenAI现CEO萨姆·阿尔特曼的动机也表示怀疑,显示出内部矛盾加剧。原创 2024-11-18 08:57:51 · 820 阅读 · 0 评论 -
OpenAI计划2025年推出自主AI智能体“Operator”
OpenAI公司宣布将在2025年1月推出名为“Operator”的自动化AI智能体,能够独立控制计算机并执行多种任务。此举标志着自主AI的发展潜力,竞争对手Anthropic和谷歌也在推出各自的AI产品。OpenAI首席执行官山姆・阿尔特曼在Reddit论坛上表示,未来将有更强大的模型出现,认为“智能体”将成为下一个技术突破,预计2025年将是智能体系统进入主流市场的关键年份。原创 2024-11-14 09:01:05 · 676 阅读 · 0 评论 -
格雷格・布罗克曼正式重返OpenAI
OpenAI联合创始人兼前总裁格雷格・布罗克曼在X平台宣布重返OpenAI。布罗克曼曾在Sam Altman离职后也选择辞职,董事会对此没有解释。据报道,他与Altman保持合作并将担任一个新职位,专注于重大技术挑战。此前,OpenAI的多位高层离职,包括前首席技术官Mira Murati和联合创始人Ilya Sutskever,他们已创办自己的AI初创公司。原创 2024-11-13 08:47:12 · 746 阅读 · 0 评论 -
阿尔特曼:AGI 和 ASI 将在未来几千天内到来
OpenAI CEO 阿尔特曼在访谈中预言AGI将在2025年到来,并预测ASI将在几千天内降临。他强调,利用10,000个GPU的个人能够创办价值数十亿美元的公司,并指出如今是创办科技公司的最佳时机。阿尔特曼认为,快速发展的技术将带来巨大的创新机会,同时他也分享了对AGI发展的看法,描述了不同层级的智能体,并强调创业者应专注于与AI相关的项目,迅速行动。原创 2024-11-11 08:51:07 · 717 阅读 · 0 评论 -
OpenAI收购chat.com域名;OpenAI推出“预测输出”功能,大幅提升响应速度
OpenAI CEO萨姆・阿尔特曼在X平台上宣布收购域名chat.com,现已自动跳转至ChatGPT官网。该域名此前由HubSpot创始人Dharmesh Shah以1000万美元购入,并于2023年3月以1550万美元转手。Shah认为基于聊天的用户体验将是软件领域的重要趋势,得益于生成式人工智能的发展。OpenAI的确认标志着其在用户交互领域的进一步扩展。原创 2024-11-07 08:50:38 · 352 阅读 · 0 评论 -
腾讯开源首个文图生3D大模型Hunyuan3D-1.0
腾讯混元于11月5日开源了Hunyuan3D-1.0,这是首个同时支持文本生成和图像生成的3D开源大模型。该模型采用两阶段生成方法,可以在10秒内生成3D资产。第一阶段使用多视角扩散模型生成多视角图像,第二阶段利用前馈重建模型快速重建3D资产,具有强大的泛化能力和可控性,适用于多种尺度的物体。原创 2024-11-06 08:49:48 · 721 阅读 · 0 评论 -
英伟达与马斯克洽谈对xAI投资
据报道,芯片巨头英伟达正在与埃隆·马斯克就其人工智能公司xAI的潜在投资进行谈判。xAI推出的大语言模型Grok发展迅速,已在社交媒体平台X上部署。英伟达首席执行官黄仁勋对xAI持支持态度,称其团队用19天建立了超级计算机集群,显著超出常规时间需求。同时,xAI正与投资者商谈筹集数十亿美元的资金,估值在400亿到450亿美元之间。原创 2024-11-05 08:50:01 · 635 阅读 · 0 评论 -
OpenAI推迟新模型发布,聚焦现有技术
OpenAI首席执行官萨姆·奥特曼表示,下一个大型人工智能模型可能不会在今年发布,因公司优先开发当前专注于推理与难题解决的技术。他透露将推出一些出色的新版本,但不会称为GPT-5。此外,OpenAI推出了新搜索功能ChatGPT Search,与竞争对手展开竞争,同时回应了关于图像生成模型DALL-E和视频生成模型Sora的疑问,强调对模型安全性和计算能力的完善。原创 2024-11-04 08:46:54 · 451 阅读 · 0 评论 -
雷军回应AI克隆声音恶搞事件;小米发布澎湃OS 2 AI新特性
国庆期间,网友利用AI技术克隆雷军的声音,恶搞吐槽不文明行为,引起广泛关注。雷军对此表示困扰和不适,希望大家停止这种行为,但认为AI技术本身是实用的。恶搞内容包括对大学生的劝导、捐款、撞人等情节,相关短视频平台已逐步下架部分内容。原创 2024-10-30 08:51:57 · 817 阅读 · 0 评论 -
Apple Intelligence计划2025年支持中文
苹果公司宣布将扩展Apple Intelligence,预计在2025年4月支持中文等多种语言。首批功能将在iOS 18.1、iPadOS 18.1和macOS Sequoia 15.1中推出,用户需将设备语言设置为美式英语。12月起将增加对澳大利亚、加拿大、英国等地英语的支持,明年将陆续添加中文、法语、德语等多种语言。需要注意的是,目前尚未明确国内用户能否使用Apple Intelligence的各项功能。原创 2024-10-29 08:45:09 · 578 阅读 · 0 评论 -
字节跳动在欧洲设立AI研发中心
字节跳动计划在欧洲设立AI研发中心,正在积极招聘LLM和AI领域的人才。此外,字节跳动近期在董事会中加入了法国富商泽维尔·尼尔,显示其拓展欧洲市场的决心。此前,该公司已宣布将在马来西亚投资约100亿林吉特建立AI中心,并额外投资15亿林吉特扩建数据中心设施,显示其全球布局战略。原创 2024-10-28 08:47:34 · 649 阅读 · 0 评论 -
苹果将于10月28日推出Apple Intelligence功能
苹果公司预计于10月28日发布“Apple Intelligence”功能,首个版本将与iOS 18.1同步推出,非中国大陆及欧盟用户可先行体验。苹果软件负责人克雷格·费德里吉表示,将采取多阶段发布策略,初始版本聚焦基本功能,如文本摘要AI工具、通知摘要及照片处理,同时强调隐私保护和本地处理。未来版本将引入更多AI功能,并计划明年支持多语言。原创 2024-10-24 08:47:10 · 800 阅读 · 0 评论 -
Anthropic发布Claude 3.5新模型,具备计算机操作能力
10月22日,Anthropic推出了Claude 3.5 Sonnet和Claude 3.5 Haiku,升级版Sonnet具备更强的编程能力及“计算机使用”新功能,能模拟人类与计算机的交互。这一进展标志着AI代理技术的演变,尽管其在执行任务时表现不够可靠,仍吸引了用户关注。Anthropic希望通过逐步开放安全模型,改善AI代理的可靠性与安全性。原创 2024-10-23 08:44:59 · 593 阅读 · 0 评论 -
英伟达开源超强模型Nemotron-70B;OpenAI推出Windows版ChatGPT桌面客户端
英伟达近日开源了新型AI模型Nemotron-70B,迅速超越GPT-4o和Claude 3.5 Sonnet,成为AI社区的新宠。该模型在多项基准测试中表现优异,采用混合训练方法和人类反馈强化学习,模型权重已在Hugging Face发布。Niemotron-70B的开发基于Llama-3.1,且开源数据集加强其训练效果。分析指出,英伟达的策略是提升硬件需求以维持市场领先,尤其是在激烈的AI竞争中。原创 2024-10-18 08:50:48 · 1117 阅读 · 0 评论 -
OpenAI研究揭示ChatGPT的性别和种族偏见
OpenAI发布了一项新研究,指出ChatGPT在回应用户时,可能会根据姓名推断性别和种族特征,从而反映训练数据中的社会偏见。例如,女性名字获得的回复更友好,而男性名字则偏向使用专业术语。研究显示,在开放式任务中,刻板印象的出现概率更高。尽管有害回复的出现率低于0.1%,但这种偏见仍然可能影响用户体验和社会公平。未来将扩展研究以涵盖更多人口统计属性和语言环境。原创 2024-10-17 08:46:08 · 831 阅读 · 0 评论 -
微软顾问揭露真实的AI诈骗手法
微软解决方案顾问萨姆・米特罗维奇分享了他险些被AI诈骗的经历,黑客伪装成谷歌支持,诱使他泄露Gmail账号信息。米特罗维奇收到来自“谷歌”的电话,声称账号有可疑活动,并推荐点击链接重置密码。他警告称,这种诈骗手法越来越复杂,即使经验丰富的用户也可能受害。他呼吁用户保持警惕,进行基本的身份验证,并在必要时寻求可信任的帮助。原创 2024-10-16 08:46:06 · 299 阅读 · 0 评论 -
微软副总裁Bubeck离职加盟OpenAI
微软生成式人工智能研究副总裁Sébatien Bubeck于10月14日宣布离职,加入ChatGPT制造商OpenAI,继续推进通用人工智能的开发。微软表示将与Bubeck保持合作关系。他在微软工作了10年,之前曾任普林斯顿大学助理教授,专注于大型语言模型的智能提升和AGI的研究。Bubeck的合著者仍在微软,继续开发相关模型。原创 2024-10-15 08:42:21 · 650 阅读 · 0 评论 -
特斯拉发布Robotaxi无人驾驶出租车
特斯拉发布了无人驾驶出租车CyberCab和无人驾驶货运车RoboVan,展示了其自动驾驶技术在车辆运营领域的应用前景。特斯拉CEO马斯克表示CyberCab的车辆成本预计较低,并计划在2026年投入生产,2027年前大规模铺开,但运营成本仍需降低才能实现盈利。特斯拉Robotaxi项目的商业模式包括车主提供车辆模式和特斯拉自有车辆模式,并面临监管机构批准FSD监督版的挑战。原创 2024-10-12 08:41:42 · 376 阅读 · 0 评论 -
OpenAI元老级人物Luke Metz官宣离职
OpenAI的核心成员Luke Metz宣布离开公司,结束其两年任期。他与曾离职的后训练团队负责人Barret Zoph和新任接替者Liam Fedus均为ChatGPT和o1模型的重要贡献者。Fedus将接任Zoph的职位,三人均曾在谷歌工作。OpenAI正经历人事变动,使后训练团队换将,未来动向引发关注。原创 2024-10-11 08:47:38 · 786 阅读 · 0 评论 -
2024诺贝尔化学奖揭晓,聚焦蛋白质研究,google成为大赢家
2024年诺贝尔化学奖授予David Baker、Demis Hassabis和John M. Jumper,前者因计算蛋白质设计而获一半奖项,后者因开发AI模型预测蛋白质结构而获另一半。Baker成功创造出一种全新蛋白质Top7,而Hassabis和Jumper的AlphaFold2模型已能预测几乎所有已知蛋白质结构。这些成果对生命科学领域具有重要影响。原创 2024-10-10 08:51:21 · 990 阅读 · 0 评论 -
英伟达DGX B200工程版交付OpenAI
英伟达于10月9日宣布向OpenAI交付首批DGX B200工程版,该平台集成了八个NVIDIA Blackwell GPU,专为企业提供全面的人工智能解决方案。DGX B200具有强大的计算能力,能够高效处理大规模语言模型和自然语言处理任务。同时,微软Azure也成为首个运行该系统的云服务,采用了优化的AI服务器和先进的散热技术。原创 2024-10-09 09:11:51 · 397 阅读 · 0 评论 -
OpenAI Sora团队负责人Tim Brooks离职加入谷歌
OpenAI文生视频大模型Sora团队负责人Tim Brooks于10月4日宣布离职,加入谷歌DeepMind。他将专注于视频生成和世界模拟器方面的工作。Tim Brooks拥有加州大学伯克利分校的博士学位,曾为Pixel手机提供AI支持,也曾在英伟达研究视频生成模型,是OpenAI文生图模型DALL・E的主要研究员。原创 2024-10-08 08:57:02 · 792 阅读 · 0 评论 -
阿尔特曼否认将获得OpenAI股权传闻
OpenAI首席执行官山姆·阿尔特曼在公司全体会议上否认了自己将获得大量股权的传闻,称“根本不是事实”,并表示目前没有此类计划。OpenAI董事会主席布雷特·泰勒则提到,董事会曾讨论过股权补偿问题,但尚未作出最终决定。此前有报道指出,OpenAI考虑让阿尔特曼持有7%的股份,并计划重组为营利性企业,同时寻求新一轮融资,估值可能超过1500亿美元。原创 2024-09-30 08:41:09 · 1017 阅读 · 0 评论 -
苹果退出OpenAI融资谈判
据《华尔街日报》报道,苹果公司已决定不参与OpenAI的新一轮融资,计划筹集约65亿美元(约454.98亿元人民币)。OpenAI正进行从非营利到盈利性公司的转型,并得到多个投资者支持,包括Thrive Capital、Tiger Global Management以及阿联酋国有企业MGX。值得注意的是,如果OpenAI未能在两年内完成转型,投资者有权要求退款。与此同时,微软和英伟达仍在积极洽谈参与此次融资。原创 2024-09-29 08:48:36 · 993 阅读 · 0 评论 -
Meta发布AR眼镜Orion限量版
在Meta Connect 2024大会上,Meta宣布Ray-Ban智能眼镜将通过软件更新提升智能体验,包括“Reminders”功能、二维码扫描和实时语言翻译。新功能将支持英语、法语、意大利语及西班牙语翻译,并计划推出实时视频处理。同时,与EssilorLuxottica合作推出的透明镜框限量7500副,展示内部技术。Zuckerberg表示,智能眼镜的需求超出预期,预计将取代部分手机使用。原创 2024-09-27 08:48:29 · 1356 阅读 · 0 评论 -
Meta推出Llama 3.2 AI模型,支持多模态和边缘计算;OpenAI首席技术官穆拉蒂宣布离职
Meta于9月25日发布Llama 3.2 AI模型,具备开放性和可定制性,支持开发者实现边缘人工智能和视觉应用。该系列包含多模态视觉模型(11B和90B)及轻量文本模型(1B和3B),并支持指令微调。Llama 3.2模型擅长于图像理解、文本生成和各种语言任务,适用于企业级应用和移动设备,为多种行业提供更广泛的解决方案。原创 2024-09-26 08:50:02 · 1102 阅读 · 0 评论 -
OpenAI发布多语言MMMLU数据集;火山引擎发布AI视频生成大模型豆包
OpenAI在Hugging Face上推出了多语言大规模多任务语言理解(MMMLU)数据集,旨在评估大型语言模型在各种语言和任务中的表现。该数据集涵盖广泛的主题与学科,支持多种语言,包括简体中文,提供了测试模型深层认知能力的框架。MMMLU数据集的发布将有助于提升模型在高资源与低资源语言中的表现,解决人工智能界的多样性与文化包容性问题。原创 2024-09-25 08:44:05 · 548 阅读 · 0 评论 -
AI 玩《黑神话》获胜超人类;AI社交App火速上架,百万虚拟粉丝引热议
阿里巴巴研究团队提出了新型VARP智能体框架,使AI在《黑神话・悟空》中取得了超过人类的胜率。该智能体利用视觉语言模型(VLM)直接处理游戏截图,通过自动生成Python代码实现操作。尽管在简单和中等战斗场景中胜率达到90%,但在复杂的任务上,如面对幽魂时表现不佳。此外,AI无法实时处理每一帧画面,也容易受到游戏环境的限制。相关研究数据和代码将发布。原创 2024-09-23 08:49:48 · 1042 阅读 · 0 评论