
人工智能
文章平均质量分 95
RTE开发者社区
这个作者很懒,什么都没留下…
展开
-
Ava:6 分钟语音聊天免费生成 MBTI 报告;字节发布图像理解与生成统一模型 Mogao丨日报
我们欢迎更多的小伙伴参与。原创 2025-05-09 18:12:36 · 916 阅读 · 0 评论 -
从开发者视角解读 Google Cloud Next 25
我们欢迎更多的小伙伴参与。原创 2025-04-15 18:58:55 · 925 阅读 · 0 评论 -
Google 发布 Gemini 2.5 Pro 模型:思考+多模态;Vibe Coder :通过语音对话实现「氛围编程」丨日报
我们欢迎更多的小伙伴参与。原创 2025-03-26 16:02:45 · 917 阅读 · 0 评论 -
TEN 现已接入智谱 GLM-Realtime丨社区来稿
GLM-Realtime API 能够提供实时的视频通话功能,具有跨文本、音频和视频进行实时推理的能力,AI 可以进行流畅的通话,人可以实时打断 AI。除了实时音频交互外,Realtime 还可通过手机或 AIPC 的摄像头与人互动,通过共享电脑屏幕阅读页面信息,通过视频流理解对话当前的环境。体验中心:https://open.bigmodel.cn/trialcenter/audiovideocall/experience。原创 2025-02-21 18:04:17 · 972 阅读 · 0 评论 -
Hume 语音模型 OCTAVE:实现情感语音合成、声音克隆和多角色对话生成;通义开源多模态说话人识别项目 3D-Speaker
我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。素材来源官方媒体/网络新闻。原创 2024-12-24 18:18:46 · 1100 阅读 · 0 评论