- 博客(93)
- 收藏
- 关注
原创 RAG v.s. KAG 检索增强生成 or 缓存增强生成
RAG的工作原理是将用户的查询转换为嵌入向量,在预先构建的向量数据库中搜索相关信息,并将检索到的内容与用户的原始查询一起输入模型,以生成更准确的响应。这种方法虽然有效,但需要复杂的设置,并可能引入额外的延迟和检索不准确的问题。总之,随着LLM技术的不断进步,CAG方法为开发者提供了新的途径,利用扩展的上下文窗口和缓存机制,简化系统架构,提高响应速度和准确性。例如,谷歌的Gemini 2.0 Flash模型支持高达100万标记的上下文窗口,使得预加载大量数据成为可能,进一步提升了模型处理复杂任务的能力。
2025-04-05 07:54:13
177
原创 软件自由的兴衰 SaaS 已死?
很多年前,在你们大多数人出生之前,软件世界曾经是一个乌托邦。如果你想使用某个程序,你只需要走进商店,买一个装着CD或软盘的盒子,把软件安装到电脑上,然后它就永远属于你了。但后来,某一天,魔鬼本人在一家软件公司当上了产品经理。他露出狡猾的微笑,推出了一个新概念:软件即服务(SaaS)。这个新模式意味着,当你“购买”软件时,你实际上并不拥有它——你只是每月支付租金,一直到生命的终点。企业界对此欢呼雀跃,利润飙升至前所未有的高度。随着时间的推移,公司们变得越来越贪婪,想尽办法从用户身上榨取更多的钱。
2025-03-15 05:10:52
611
原创 被遗忘的系统传奇 Linux
看似普通,但在背后,它实际上触发了系统调用,检查权限,并操控硬件以在屏幕上显示文本。在一个由主流操作系统主导的世界里,有一股强大而神秘的力量一直潜伏在阴影中——对于坚持使用 Linux 的人来说,它不仅仅是一个操作系统,而是一种。发起该项目,提供了与 Linux 内核交互的关键工具。但仅有内核是不够的,还需要基础工具来操作系统。发布,使任何人都可以修改、分享,甚至从中获利。成为了最常见的用户界面,让用户能够控制系统。要理解 Linux,必须先了解它的“祖先”。它奠定了许多操作系统的基础,并通过。
2025-03-15 02:54:27
558
原创 如何使用 GPT-4o 翻译播客声音
在翻译和配音任务中,了解“语言”和“书写系统”的区别至关重要,尽管这两个术语有时可以互换使用。语言(Language)指的是口头或书面沟通的系统。例如,印地语(Hindi)和马拉地语(Marathi)是两种不同的语言,但它们都使用**天城文(Devanagari script)书写。同样,英语(English)和法语(French)是不同的语言,但它们都使用拉丁字母(Latin script)**书写。书写系统(Script)指的是用于书写语言的字符或符号。
2025-03-07 01:57:23
887
原创 REST 和 GraphQL
REST(R)会给你所有的信息,即使你不需要,而 GraphQL(G)则允许你只获取自己想要的数据,且不会多给。他会把自己知道的一切都告诉你,不管你是否需要。而 G 则比较内敛,只会分享必要的信息,但如果你有额外的需求,他也愿意提供更多。就像我的两个同事 R 和 G,REST 和 GraphQL 各有所长。关键在于理解它们的区别,从而为你的项目选择合适的方案。客户端可以进行过滤和排序,但可能仍会收到不必要的数据。GraphQL 可以作为 REST API 的一层,增强灵活性,而无需完全替换它。
2025-03-06 06:34:30
340
原创 GPT-4.5
OpenAI 正式发布 GPT-4.5——迄今为止最强大的 AI 模型的研究预览版。从今天起,它向Pro 用户和开发者开放,引发了全球 AI 爱好者的热烈讨论。OpenAI 团队表示,GPT-4.5 是他们迄今为止最大、最强的模型,在预训练和后训练方面实现了重大突破。通过扩展无监督学习,GPT-4.5 增强了识别模式、建立联系和创造性洞察的能力,尽管它并不是专门为推理任务设计的。早期测试者表示,与 GPT-4.5 交互的体验更加自然。
2025-03-01 01:29:37
1617
原创 Claude 3.7 Sona 的崛起
大家一直在等这个视频!一位以风趣且深刻见解著称的 AI 评测者承认,他已经花费了数百万个 token 进行测试。他的评价?这一版本超越了前代产品,提升了代码能力,并引入了一种受 DeepSeek R1 和 OpenAI 模型启发的“思考模式”。但最让科技界震惊的是 Claude Code 的推出——一个命令行界面(CLI)工具。该工具允许开发者在项目中无缝编写、测试和执行代码,形成一个无限循环的反馈流程。一些人认为,这甚至可能完全取代人类程序员。编程圈瞬间炸锅。开发者纷纷感叹:“完了,我们没了。
2025-02-26 06:23:38
481
原创 Scale AI 数据标注 RLHF
从本质上讲,Scale AI 提供 数据标注和注释 服务,帮助企业训练 人工智能(AI) 和 机器学习 模型。如今的 AI 并不会“独立思考”——它仅根据训练数据生成输出。因此,高质量的训练数据是 AI 发展的基石,而这正是 Scale AI 的核心业务。该公司因其在 自动驾驶汽车公司、政府机构和大型企业 方面的工作而备受关注。然而,它的成功之路并非一帆风顺,快速崛起的背后也隐藏着许多人不知道的阴暗面。Scale AI 的故事,是 硅谷创新、野心和争议 的典型案例。
2025-02-26 05:34:40
577
原创 Grok 3 的崛起:AI 的新时代
AI 正在飞速发展,Grok 3 无疑是这一竞争中的重要角色。它的不受审查特性和对实时数据的直接访问,使它与众不同。但同时,它的基准测试透明度和道德问题仍存争议。随着 AI 争霸战愈演愈烈,有一件事是可以确定的:马斯克、奥特曼和扎克伯格之间的竞争,只会变得更加激烈。
2025-02-25 02:05:05
408
原创 AI如何改变世界
如果世界上所有重大问题——气候变化、不治之症、塑料污染——都有一个微小的解决方案呢?一个小到肉眼无法看到的答案?这或许已经成为现实。科学家们刚刚取得了一项突破性的发现,他们成功破解了上个世纪最大的生物学难题之一:如何确定蛋白质的结构。过去60多年里,成千上万的生物学家辛苦研究,仅确定了15万种蛋白质的结构。而如今,仅仅15名研究人员,在短短几年内就利用人工智能,预测出了2亿种蛋白质的结构——几乎涵盖了自然界中所有已知的蛋白质。他们是如何做到的?这一突破为何能影响生物学之外的众多领域?
2025-02-22 04:20:04
473
原创 量子革命:微软推出全新“不可思议”芯片
微软突然宣布了一款突破性的 量子计算芯片,名为 Myerona One。但这不是普通的量子芯片,而是一个 完全新的物质形态!过去,我们熟知的物质形态只有四种:固态、液态、气态和等离子态。但现在,微软声称他们创造了一种 全新的物质形态,即 拓扑超导体,也被称为 “拓扑计算机”(Topo-computer)。如果微软的技术属实,这将是 与晶体管发明同等重要的突破。
2025-02-22 04:03:43
254
原创 分步教程:使用 i18next 本地化 React 网站
你已经构建了一个支持动态切换英语和西班牙语的 React 应用!全球用户现在可以使用自己偏好的语言访问你的应用 🌍。通过本指南学习如何为 React 应用添加多语言支持,实现动态语言切换和翻译管理。欢迎在评论区告诉我你希望看到的下一个 React.js 教程主题!
2025-02-19 02:24:15
816
原创 React:UI开发的革新者
然而,React的成功不仅仅在于它本身的功能,更在于其庞大的生态系统。而React的魅力在于它的简洁性:一个组件本质上就是一个JavaScript函数,它返回一个类似HTML的语法,称为。React还引入了props的概念,可以轻松地向组件传递数据,并且当数据发生变化时,React会自动更新UI。对于需要内部状态的组件,React提供了state hook,一个简单的函数用于存储值并动态更新它们。如今,React仍然是网页开发领域的佼佼者,它的简洁性、灵活性和强大的社区支持让它保持领先。
2025-02-19 02:19:12
423
原创 人工智能时代与编程能力的衰退
这种依赖是危险的,特别是在 AI 商业化趋势下,许多公司希望程序员订阅 AI 服务,而不是真正培养开发能力。许多经验丰富的开发者也发现,自己对 AI 产生了依赖,面对难题时不再努力思考,而是直接求助于 AI。如果 AI 让我们丧失了这种独立性,我们就不再是程序员,而只是“代码搬运工”。有些开发者开始尝试**“无 AI 编程日”**——强迫自己在这一天不使用 AI,阅读文档,独立调试。学习编程的过程本就应该充满挑战,如果跳过这个过程,未来可能会付出更大的代价。AI 不是坏东西,它是一个强大的工具。
2025-02-11 05:29:36
157
原创 印度人看深圳
接下来,我们对中国的科技发展有了更深的体会。我们的出租车司机并没有使用Google Maps,而是使用了一款中国本土的导航软件,不仅显示路线,还能实时显示交通信号灯、测速摄像头和每一个红绿灯。在深圳租一套市中心外的一居室公寓,价格在3,500-5,100元人民币(约40,000-57,500印度卢比),如果在市中心,价格则飙升到7,100-10,100元人民币(约80,000-1.15万印度卢比)。90年代,深圳成为制造业中心,而今天,它已经发展为全球领先的科技创新城市,诞生了华为、腾讯、大疆等科技巨头。
2025-02-11 05:20:19
1092
原创 Scale AI 创始人兼 CEO采访
为了展示竞争的激烈程度,王的团队发布了一项名为《人类最后的考试》的测试基准,旨在挑战 AI 的极限。随后,DeepSeek 推出了 DeepSeek R1 模型,而王的评估显示,这款模型已登上排行榜首位。尽管美国的出口管制限制了中国获取像 NVIDIA H100 这样的高性能芯片,但王透露,中国实验室拥有数万枚这样的 GPU,远超外界预期。尽管美国拥有 NVIDIA GPU 等尖端技术,而中国似乎缺乏这些资源,但中国的 AI 高管声称,他们正以惊人的速度缩小差距,甚至用更少的资源实现更高的创新。
2025-01-27 12:46:07
616
原创 DeepSeek R1
最近,关于AI的讨论有两种观点:一种人觉得AI的创新已经停滞,另一种人觉得AI会越来越强大,甚至帮助人类实现未来科技的梦想。虽然没人知道AI的未来会怎么样,但可以确定的是,像DeepSeek R1这样的工具让我们更容易接触到先进的技术。如果你对AI感兴趣,可以通过一些学习网站,比如Brilliant.org,学习Python编程和AI基础知识。的开源AI模型,它的性能和OpenAI的顶级模型差不多,甚至在数学和编程方面表现更好。更重要的是,它是完全免费的,你可以随意使用它来做项目,甚至赚钱。
2025-01-23 07:56:53
724
原创 2025年CES科技盛会——震撼揭示未来科技
这是一款真正由太阳驱动的汽车,具备超高效率和延长续航里程的特点。即使在日落时分,车辆也能实时显示太阳能充电数据,其未来感设计和可持续承诺让它成为CES的一大亮点。与其他需要手动操作的车型不同,这款车让你完全不用操心驾驶,真正做到“无需目视”。LG展示了一个可以弯曲的显示器,只需按一个按钮,屏幕就能从平面变成曲面。他们还有一款透明电视,像一件艺术品,但价格高达6万美元,真的太梦幻了。Unitree展示了一款人形机器人,能走路、握手,还能挥手打招呼。它很小巧,但功能强大,有大屏幕、立体声,还能连接电视。
2025-01-12 01:13:45
270
原创 CES 2025
同时,电动车的创新如比亚迪的Yang Wang U9,其悬架甚至能跳过障碍,展示了出行与科技交汇的惊人潜力。未来,AI可能会直接生成个性化影视剧,无需好莱坞的编剧和导演——对于当前困难重重的影视行业来说,这也许是一种讽刺。然而,仅仅四小时车程外,另一种混乱正在上演。在罪恶之城(拉斯维加斯)的中心,超过十万人和全球最大的科技公司齐聚一堂,参加一年一度的CES展会——一场展示未来科技和奇思妙想的盛宴。每年一月,CES都以科技的魅力让人眼花缭乱,从情感支持机器人到AI育儿助手,各种令人瞠目结舌的发明应有尽有。
2025-01-12 00:39:56
296
原创 2025 技术趋势预测
尽管许多人称其为革命性成果,怀疑者却指出其局限性:高昂的计算成本、偶尔在简单任务上的错误,以及平庸的展示(比如构建一个基础的 Python 应用)。尽管如此,小明警告程序员要快速适应,因为像 Devon 这样的机器人和 AI 代理人的兴起意味着传统技术职业的范围正在缩小。毕竟,作为一个大型语言模型,他的训练数据截止在某个时间点,要预测之后的事情是个挑战。美联储的图表显示,自 2022 年的高峰以来,软件职位的招聘大幅下降。小明提醒我们,在这一切中,真正的财富不是金钱或设备,而是我们建立的联系。
2025-01-06 09:18:02
456
原创 微软的AI转型故事
纳德拉的战略布局虽然沉稳,但并非毫无争议。微软与OpenAI的合作近期传出裂痕,引发了市场对双方未来关系的关注。微软在AI领域是否能够独立实现技术突破,也成为外界关注的焦点。尽管如此,这位CEO对未来充满信心。他认为,AI不仅是一场技术革命,更是一场文化和战略的全面变革。而他所带领的微软,将在这个时代继续书写属于自己的新篇章。在纳德拉的带领下,微软用实践证明了科技与文化变革的力量。AI时代才刚刚开始,而这场漫长的竞争,将塑造出更加多元的科技世界。
2024-12-24 07:28:14
841
原创 OpenAI Day 12
马克博士上台后,介绍了O3的厉害之处。比如在数学比赛中,O3的成绩几乎接近满分,解决了许多难题。但今天,O3创下了新纪录,表现和专家一样好!今天,主持人宣布了一个新消息:推出一个更强大的模型O3,还有一个小巧版的O3 Mini。虽然它们还不会马上公开,但研究人员可以先测试这些模型,帮助改进。然后,Huran博士介绍了O3 Mini,它不仅强大,还更省时间和成本。她现场展示了这个模型如何编写代码,还可以给自己评分,非常智能!他们推出了一种新技术,帮助模型更好地区分安全和不安全的内容,并邀请研究人员加入测试。
2024-12-21 06:08:40
160
原创 OpenAi Day 11
这是发布会的第十一天,整个房间充满了激动的氛围。凯文·惠勒走上台,带着微笑开场:“欢迎来到第十一天的发布会。我是凯文,负责OpenAI的产品开发,显然我的水平被右边这两位绅士完全碾压了。”他点头向同事示意,他们穿着节日气息满满的西装,看起来绝非临时在亚马逊上买的。演讲正式开始,凯文详细介绍了他们在桌面应用开发方面的巨大进展。“六个月前,我们推出了Mac桌面应用,仅仅几个月前,我们又发布了Windows应用。
2024-12-20 07:40:56
942
原创 求职市场变化
根据Google Trends的分析,搜索“UX设计师岗位”的兴趣度显著下降。如果你真的热爱UX设计,现在正是抓住机会的好时机。我注意到,不仅是小公司,连大型科技公司(如Google和Meta)也增加了实习机会。两年前,这些实习岗位几乎不存在,而如今,这些公司愿意投资于年轻且经验较少的人才。AI技术正在迅速渗透设计领域,许多公司需要能够在AI限制下进行设计的UX设计师。这些行业相对抗衰退,更加稳定。如果希望找到稳健的工作,可以优先考虑这些领域。同时,要警惕“幽灵职位”,将精力集中于与自身目标契合的岗位。
2024-12-20 05:53:51
284
原创 用户体验(UX)设计一职
近年来,用户体验(UX)设计成为一项热门且高薪的职业。许多新人被这个行业吸引,因为它不需要编程技能,更多依赖创造力,非常类似于平面设计。然而,与平面设计不同的是,UX设计师的薪资更高,平均收入达到94,000美元(根据Glassdoor数据)。此外,许多UX工作允许在家办公,这也让它更加吸引人。然而,正如俗话所说,金玉其外,败絮其中,进入这个领域之前有一些关键点需要考虑。那么,UX设计值得一试吗?让我分享我的观点。我已经尝试进入这个行业一年半了。
2024-12-20 02:02:04
803
原创 谷歌 VR 眼镜 - Android XR
该平台专为头戴式设备和智能眼镜优化,为开发者提供强大的工具,同时减少了开发的阻碍。Android XR 的目标是让人工智能的整合变得无缝,将虚拟世界和现实世界融为一体,不显得突兀但又极具直觉性。谷歌认为,现在是推出这项技术的最佳时机。例如,在一个陌生的城市中,不用再掏出手机,用户只需通过眼镜询问方向或翻译。头戴式设备和智能眼镜各司其职:头戴式设备适合观看比赛等特定场景,而智能眼镜则是全天候的助手,为用户提供持续的价值。未来,似乎已触手可及。,一个旨在扩展现实的平台,让用户以创新的方式探索、连接和创造。
2024-12-14 01:34:21
708
1
原创 28 岁年薪300万的程序员成长之路
他学会拒绝无法帮助自己成长的项目,并通过有效的“向上管理”确保自己的目标与经理保持一致。他质疑现有流程,寻求创新的解决方案,并实现了可量化的成果,例如在谷歌广告部门显著提升收入。他很快意识到,在谷歌取得成功的关键在于理解公司的文化和掌握晋升的路径。他承认拥有稳定的团队和支持性的经理是他的幸运,但他也强调,抓住机会并进行有意识的职业规划同样重要。小明的职业旅程为所有立志发展的工程师提供了一个范例,证明只要努力、策略与适应能力兼备,从初级工程师到高级职员的晋升之路不仅可行,还能充满成就感。
2024-12-13 07:37:33
441
原创 量子革命 Google Willow
如果黑客掌握了量子计算机,他们可以轻松破解现有的加密技术,暴露我们的数据和数字资产。一旦量子计算机的错误率降低到足够低,它们就可以迅速扩展,带来好的一面,也可能带来灾难性的影响。当两个量子比特纠缠时,不管它们之间有多远,一个量子比特的状态会直接影响另一个。你可以把量子比特想象成一个盒子,里面有一只猫,在你打开盒子之前,这只猫可能是“活的”也可能是“死的”。传统计算机使用二进制的“0”和“1”来处理信息,每个比特就像开关,开或关。来完成计算,相当于传统计算机的逻辑门,但利用的是量子物理的“魔法”。
2024-12-13 00:03:14
428
原创 技术面试 - 作弊
Interview.io的一项研究发现,尽管使用AI的候选人在标准问题上表现优异,但在定制或修改的问题上成功率急剧下降。更糟糕的是,AI生成的代码看起来正确,但经不起审查,容易暴露。在编程的复杂世界里,有两种人通常让人难以信任:那些不在代码注释中诚实表达的人,以及那些不讲真话的人。近年来,远程工作的普及和人工智能的进步不仅改变了行业,也引发了一个令人担忧的趋势:技术面试中的作弊现象。在竞争激烈的市场中,这种巧妙的手段可能帮助一些人获得高薪开发职位,但一旦被发现,其后果可能是灾难性的。
2024-11-27 11:37:39
668
原创 苹果 - 智能
苹果推出了一项通知摘要功能,希望通过AI为用户简化多条信息。然而,这项功能在实际使用中并不如想象中那么有用。用户常常发现,原始通知信息已经足够清晰,反而被“简化”后变得啼笑皆非。很多用户最终选择关闭这一功能。录音功能本身令人兴奋,尤其是准确的转录和高质量的摘要。然而,令人费解的是,这项功能并未整合到苹果的默认语音备忘录应用中。用户必须通过笔记应用才能使用,增加了不必要的复杂性。
2024-11-27 01:42:45
273
原创 Nvidia 印度 AI 峰会
软件开发发生了重大转变:从传统编码(软件1.0)转向机器学习(软件2.0)。过去,开发者编写算法处理输入并生成输出。现在,机器学习使计算机能够从大量数据中学习,创建近似函数的模型。这一变化颠覆了软件行业,使GPU成为训练深度学习模型和运行神经网络的不可或缺的工具。
2024-11-24 06:23:42
630
1
原创 埃隆·马斯克和他的公司 xAI 打造了世界上最强大的超级计算机——“科洛萨斯”
科洛萨斯的“数据大厅” 是其核心所在,这里采用创新的三层设计:上层负责供电,下层负责冷却,中间则是 GPU 集群。埃隆·马斯克相信,AGI 是解开人类最深奥问题的钥匙,并能够重塑我们的存在。令人惊叹的是,这座设施仅用了 122 天就建成,展现出极高的效率与雄心。传统电网的细微波动对 AI 训练造成干扰,而特斯拉电池将电网输入的电力平稳地释放,消除了这些问题,提高了效率。科洛萨斯不仅仅是一台计算机,它是一次宣言,象征着科技如何重新定义人类的成就边界,甚至重塑我们对现实的理解。Grok 最近获得了。
2024-11-24 06:10:02
501
原创 OpenAI o1 Beta
探索高级推理和问题解决模型。OpenAI 的 o1 系列模型是新的大型语言模型,经过强化学习训练,能够进行复杂推理。o1 模型在回答问题前会进行思考,可以在响应用户之前生成一长串内部推理过程。o1 模型在科学推理方面表现出色,在编程竞赛题(Codeforces)中排名前 89%,在美国数学奥林匹克(AIME)选拔赛中跻身美国前 500 名学生之列,并在物理、生物和化学问题(GPQA)的基准测试中超过了人类博士水平的准确率。
2024-11-22 07:16:47
1092
原创 你的AI新朋友 - Nvidia 日本AI峰会
机器人不仅需要力量,更需要智慧。黄仁勋对此深表认同,他兴奋地描绘了未来的画面:“想象一下,每个人都拥有一个个人AI助手,从规划旅行到教育学习,它都可以帮你完成。这不仅是一个助手,更像是一个成长中的‘第二自我’,能够记录你的点滴、理解你的需求。随着技术进步,机器人将在医疗方面带来革命性的变化,比如帮助医生进行诊断和治疗,这将拯救无数人的生命。他停顿了一下,回忆着童年的美好,“在日本,我们叫它‘铁腕阿童木’。黄仁勋微笑着总结:“到那时,每个人都会拥有自己的‘数字伙伴’,它是一个能够陪伴你一生的导师和朋友。
2024-11-19 03:50:26
557
原创 科技行业的变迁 - 裁员何时是头
在这场裁员潮中,一个独特的故事引起了广泛关注:前Cloudflare员工布列塔尼·皮奇(Brittany Pietsch)发布了一段记录她被解雇的实时视频,该视频迅速走红,激起了人们对科技行业工作不稳定的讨论。女性受影响尤为严重,尽管她们仅占科技行业员工总数的三分之一,但却占了裁员人数的一半以上。公司对具备AI技能的员工的需求激增,进一步改变了科技行业的就业格局。与美国严格的H-1B签证制度不同,加拿大的移民政策提供了更清晰的永久居留路径和更大的工作灵活性,这使其成为被裁科技人才的理想选择。
2024-11-18 05:22:51
442
原创 对PolyMarket的突袭
这间公寓的主人是26岁的Shane Copeland,一个有着凌乱头发的年轻人,也是一个加密货币狂热者。他运营着一个名为PolyMarket的网站——一个允许用户押注全球事件结果的平台,如美国是否会确认外星人存在、猴痘疫情是否会爆发,甚至2024年总统大选的赢家。然而,这次,他成了联邦调查的焦点。它的创新模式吸引了许多用户,但它的运作方式落入了FL的灰色地带,因为在美国,未受监管的赌注市场是非法的。根据《财富》杂志的调查,PolyMarket存在市场操纵的迹象,报告的交易量与实际链上活动之间也存在差异。
2024-11-15 08:59:08
448
原创 当微软windows的记事本被AI加持
最近,微软的产品经理们在完成了其他AI功能更新后,将目光投向了记事本,为其增加了生成和重写文本的AI模型。当然,令人印象深刻的工具不止Spark,StackBlitz推出的Bolt也是一款强大的AI平台,用户可以在浏览器中几秒内开发和预览完整应用。Tauri则发布了2.0版本,这是一款跨平台工具,能够以最小的文件大小创建桌面和移动应用程序,不像Electron这样的庞大框架。Next.js也推出了版本15,对默认的缓存路由设置进行了改进,改变了上一版本的预设,使框架的功能更加简化。
2024-11-13 06:06:20
1475
原创 Voice Translation of Audio Files into Different Languages Using Gpt-4o
您是否曾经想将播客翻译成您的母语?翻译和配音音频内容可以使其更便于全球观众理解。借助GPT-4o的全新音频输入和音频输出模式,这一过程变得比以往更简单。本指南将引导您使用OpenAI的GPT-4o音频模式API将英语音频文件翻译为印地语。GPT-4o简化了音频内容的配音过程。以前,您需要将音频转换为文本,然后将文本翻译成目标语言,最后再将其转换回音频。现在,通过GPT-4o的语音对语音功能,您可以通过音频输入和输出一步完成此任务。本《手册》中关于语言和书写脚本的术语说明。
2024-11-05 23:19:59
1356
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人