本次主要是针对2.3-2.9之间的LLM 论文和相关新闻进行摘要总结。
1 新闻
- Gemini 2.0现已对所有人开放。Google DeepMind推出了更新的Gemini 2.0 Flash和实验性的Gemini 2.0Pro,通过Google AI Studio和Vertex AI为开发人员提供了更高的性能。该版本包括2.0 Flash Lite,以提高成本效益,并通过新的强化学习技术加强了安全性,突显了Gemini在多模态推理和编码方面的增强能力。
- 前OpenAI科学家Sutskever的超级智能初创公司的估值可能达到200亿美元。由Ilya Sutskever共同领导的安全超级智能公司(SSI)认为,一轮融资可能会使其估值达到200亿美元。与其他人工智能公司不同,SSI只专注于开发“安全的超级智能”,而不创造商业产品。
- 阿里巴巴的Qwen团队发布了可以控制PC和手机的AI模型。阿里巴巴的Qwen团队发布了Qwen2.5-VL AI模型,在视频理解和文档分析方面超越了OpenAI和谷歌等竞争对手。这些模型可以在Qwen Chat和Hugging Face上访问,可以分析文本、图像和视频,并控制PC和手机上的应用程序。
- 字节跳动推出OmniHuman-1:AI将照片转换为逼真的人类视频。ByteDance推出了OmniHuman-1&#x