18号房客-优快云博客

原创推动多语言语音科技迈向新高度：INTERSPEECH 2025 ML-SUPERB 2.0 挑战赛

ML-SUPERB 2.0 在评估机制上进行了创新，模型评估指针除了传统的语音识别和语言识别错误率外，还强调模型在每种语言上都具备稳定性能，真正做到对所有语言的友好支持，激励研究者关注小众语言与弱势语言的平等支持，最终实现“No Language Left Behind”。通过凝聚全球研究者与开发者的力量，挑战赛将加速多语言语音技术的创新与普及，为语音技术的应用场景带来更多可能性。●训练集：涵盖 141 种语言的丰富语音数据，从主流语言到稀有方言，为参赛者提供多元化的语言资源以训练模型。

2025-01-08 16:53:00 797

原创 AI华佗？港中大、深圳大数据研究院提出医疗推理大模型HuatuoGPT-o1

通过这种方法，研究人员提出了 HuatuoGPT-o1，这是一种能够生成长思维链（CoT）以识别错误、尝试不同策略并优化答案的医学大型语言模型（LLM）。同时，该团队推出了 HuatuoGPT-o1，这是一款能够进行复杂推理的医学 LLM，仅使用 40K 个可验证问题，其表现就优于医学专用基线。医学领域虽然不同于数学，但鉴于医疗保健的高标准，它也需要强大的推理能力来提供可靠的答案。为了解决这个问题，香港中文大学，深圳市大数据研究院的研究人员提出了可验证的医学问题，使用医学验证器来检查模型输出的正确性。

2025-01-08 16:52:17 1041

原创全球首个神经连接机械腿，截肢者恢复自然行走，还带空间感

拥有这种神经接口的患者能够以正常速度行走，上下台阶和斜坡，并且无需思考就能绕过障碍物，这是自然的、下意识的行为，」MIT Media Lab 教授、论文合著者 Hugh Herr 说道。」最新发表的研究中值得注意的是，参与者人数比以前的研究要多，其中包括七名接受治疗的患者和七名接受对照的患者。在传统的膝下截肢过程中，这些成对肌肉的相互作用被打乱。这里的主要发现之一是，截肢肢体的神经反馈只需稍有增加，就可以获得明显的仿生神经可控性，达到允许人们直接神经控制行走速度、适应不同地形和避开障碍物的程度。

2025-01-06 11:37:38 931

原创 18个月326项能力，这家大厂猛猛上新生成式AI，如今纯靠Prompt就搞定企业级应用了

有 Amazon Bedrock 的 30 多个顶尖大模型，企业用户能以极地的试错成本拓展业务赛道，有了 Amazon Q 这样的 AI 助手和 320 多项生成式 AI 能力的加持，企业的生产力提升显得「易如反掌」。当然，这种从简单到复杂的迅速成长，与大模型在各行各业的落地经验反哺是分不开的。要想实现新技术的大规模落地，人们面临着一系列新的挑战 —— 不仅需要大模型服务背后的 AI 算法能力必须优秀，而且还是一场从算力到数据，框架到模型，开发到部署的全流程技术体系的考验。」，可以在多次交互中保留记忆。

2025-01-06 11:36:39 1105

原创北大、港理工革新性LiNo框架：线性与非线性模式有效分离，性能全面超越Transformer

此外，LiNO 在面临不同噪声水平的挑战时，依然展现出了卓越的鲁棒性和可靠性，如图 5 所示，这不仅验证了其设计的稳健性，也进一步证实了在时间序列预测模型中区分线性与非线性模式对于提升预测鲁棒性的重要性。但是这样只能获取简单的线性模式，而且得到的非线性模型或者说 Seasonal 项事实上是由未充分提取的线性模型，待提取的非线性模式，以及序列中的噪声所组成的，应该被称为 Residual（残差），而不是 Seasonal。上图中红色的序列可以被表征为其下方的两种线性和两种非线性模式的加和。

2025-01-05 11:49:24 799

原创 Science子刊 | GPT4、Llama等LLM可以调节粒子加速器？仅50%性能优化，未来可期

为此，研究人员比较了 14 种不同的 LLM（包括 Gemma、GPT 4、Llama 2 、Vicuna 7B 、Mistral、Starling-LM 等主流大模型的不同版本）和 4 种不同的提示模板（调整提示、解释提示、思路链提示和优化提示），并评估了基于 LLM 的方法与其他调谐算法（包括 RLO 和 BO）的比较。考虑到 14 种不同的开放权重和商业 LLM 以及 4 种不同的提示的组合，研究人员发现 34 种 LLM 提示组合中只有 18 种能够成功实现本文中考虑的横梁参数调整任务的优化。

2025-01-05 11:48:04 1046

原创没有博士学位却开启了GPT时代，奥特曼盛赞Alec Radford，爱因斯坦级天才

他的第一个实验是使用 20 亿条 Reddit 评论来训练语言模型，虽然失败，但 OpenAI 给予了足够的试错空间，也成为后续一系列革命性突破的开始，如大家熟知的初代 GPT，还主导了 GPT-2 的研发等。2024 年年末，在 OpenAI 赚尽眼球的 12 天连发的最后一天前，Alec Radford 即将离开 OpenAI 的消息传出，但没有任何消息透露这是否与 OpenAI 的组织结构调整有关。遗憾的是，对于他之后的职业计划，我们所知的仅仅是他将成为一位独立研究者。

2025-01-02 20:26:05 1431

原创 AI幻觉能助力科学重大突破？诺奖得主Baker用得可香了

现在，人工智能幻觉正在重新激发科学的创造性。他们认为生成人工智能模型的想象不是虚幻的，而是有希望的——有可能实现，与科学方法早期阶段的猜想没有什么不同。尽管如此，专家在采访中表示，与聊天机器人及其同类的幻觉相比，科学人工智能的想象力具有巨大的优势。他们说，最根本的是，创造性的爆发源于自然和科学的铁一般的事实，而不是人类语言的模糊性或以偏见和谎言而闻名的互联网的模糊性。然后，正如 2021 年的论文所报道的那样，当基因被插入微生物体内时，微生物产生了 129 种科学和自然界未知的新型蛋白质，顿悟时刻到来了。

2025-01-02 20:24:32 881

原创 26年前老年机跑Llama2，每秒39个token：你的AI PC，也可以是Windows 98

通过这种方式，普通人几乎可以在任何设备上训练和运行人工智能模型 —— 而这个疯狂的 Windows 98 运行大模型只是一个演示，展示了在（严重）有限的资源下我们可以做些什么。虽然没有达到 ChatGPT 的速度，但让任何现代人工智能模型在二十多年前的 CPU 硬件上运行，都是朝着我们的使命迈出的重要一步。一个 7B 参数的 BitNet 模型只需要 1.38GB 的存储空间，小到足以安装在大多数硬件上，甚至是几十年前的 PC（我们使用的 PC 只有 1.6GB 的硬盘驱动器）；

2025-01-01 14:47:55 984

原创拿下近3亿元融资后，爱诗上线新模型，AI视频生成速度杀入10秒大关

（低角度跟踪拍摄，18 毫米镜头，汽车漂移，留下光线和轮胎烟雾的痕迹，创造出视觉冲击力极强的抽象构图，摄像机低角度追踪拍摄，捕捉这辆橄榄绿色的时尚肌肉车驶近弯道的瞬间，随着汽车急速漂移，镜头变得更加风格化，在周围城市灯光和镜头光晕的照射下，旋转的车轮和滚滚的轮胎烟雾在漆黑的沥青路面上形成了光与色的交错，城市景观 —— 黄色出租车、霓虹灯和行人 —— 成为一个模糊的抽象背景。PixVerse V3.5 生成的画面极具张力，怪物可怕的形象让恐怖氛围拉满，远处的闪电划破夜空照亮整个城市，形成强烈的光影对比。

2025-01-01 14:46:28 1381

原创粉毛小姐姐竟是AI？谷歌新玩具Veo2快把Vlog界整疯了

该网友还表示，AI 技术确实已经融入内容创作和娱乐中，但他并不希望看到 AI 生成的纪录片、现场报道等内容。众所周知，为了方便用户打开，化妆品的包装盒上方会有微微外鼓的设计，Veo 2 就连这么微小的细节都复刻出来了。更让人讶异的是，小哥从天桥底下钻出的那一刻，光影瞬间改变，是不是真实到没边了？但细看就会发现博主的手指有瞬间的变形和虚化，特效文字还是出现乱码。一个干净的背景，一个架起的话筒，主理人在镜头面前滔滔不绝。以下这几个视频，来猜猜哪个是 AI 生成的，哪个是真实的 Vlog。

2024-12-31 20:13:25 608

原创 AI能力权威认证！用友大易入选最佳大模型产品及应用TOP20

YonGPT是用友融合企业各个领域专业知识和各类行业商业KnowHow，经过大量业务数据的预训练和精调的企业服务大模型，为企业提供智能化的人机协作、业务洞察、商业决策支持和智能运营服务，是深懂企业服务的垂类大模型。用友大易依托于YonGPT的强大功能，探索并实现AI技术在招聘方面的深度应用和商业价值，助力企业实现招聘的提效增质。展望未来，作为国内AI招聘解决方案领域的先行者，用友大易无疑将持续深化在AI在人力资源领域的探索，致力于前沿科技与实际应用场景的深度融合，为企业人才配置注入更为强劲的AI驱动力。

2024-12-31 20:11:45 369

原创推动智能决策，AutoML技术在腾讯广告推荐场景的探索与应用

广告推荐系统的表现直接影响用户体验和商业收益，如何在海量数据中精准捕捉用户需求并提供个性化推荐，成为广告推荐场景面临的重要挑战。为了解决该场景中的数据稀疏、冷启动等问题，腾讯机器学习平台部对 AutoML 相关技术进行了深入的研究，发表了一系列具有创新性的学术论文。

2024-12-30 09:43:56 1122

原创字节整新活！照片+音频让蒙娜丽莎秒变播客主理人

近期陆续有一些工作开始关注研究交互式的人像生成，但它们都需要显式地指定「说话」或「倾听」的状态，且无法像真人一样在多轮对话中实现自由的听说行为以及无缝的状态切换。近日，字节跳动提出了一套面向二元对话场景的交互式人像生成技术 INFP，该方案仅需输入一段双轨对话音频（分别来自智能体本身和对话伙伴的说话内容），即可实时驱动单张肖像照片生成相应的对话视频，且能够在多轮对话中生成自然的人物行为和反馈，例如表情、眼神、口型、姿态变化以及流畅的说话 - 倾听状态切换。交互式人像生成 INFP 字节跳动。

2024-12-30 09:43:02 712

原创像拼乐高一样设计新药，EPFL、牛津团队AI方法精确设计优化分子3D结构

模型通过五轮优化，将分子对目标激酶 BIKE（PDB 编号 4w9w）的结合得分从 -7.2 提升至 -13.9，同时降低了对非目标激酶 MPSK1（PDB 编号 2buj）的结合倾向，从 -10.8 降低至 -8.7。这种异构体间的差异只能通过反射敏感的模型来检测，证明了 SE(3)- 等变性在手性药物设计中的重要性。瑞士联邦理工学院（EPFL）、剑桥大学、康奈尔大学、牛津大学的联合研究团队开发的AI系统 DiffSBDD ，就像是一位经验丰富的分子建筑师，能够精确设计和优化药物分子的 3D 结构。

2024-12-28 10:19:14 1006

原创直逼记录极限，机器学习助力开发全新钙钛矿电池原料

为了更好地理解观察数据中的结构-性质关系，团队构建了一个 ML 模型，将代表性的分子描述符与器件的 PCE 相关联。为了获得准确的趋势，在均匀的器件条件下表征这些分子的性能，需要对其中的标准器件进行基于 PTAA 的优化。考虑了特定原子在报道中与钙钛矿具有积极的相互作用，与影响空穴传输的因素，如分子刚性和共轭，他们选择在101个实验分子数据点的随机10倍交叉验证上训练了不同的ML模型。贝叶斯优化考虑了模型的预测不确定性，以平衡探索，例如寻找新的有潜力的分子和利用改进已知的高性能分子。

2024-12-28 10:17:47 1022

原创云原生后端开发（一）

云原生后端开发是现代软件开发的重要趋势，采用了微服务、容器化、服务网格、无服务器计算等多种技术。这些技术使得应用可以在云平台上更高效地运行，具备高度的可扩展性、弹性和自动化管理能力。然而，随着云原生架构的复杂性增加，如何管理微服务、处理服务间通信、确保安全性等仍然是开发者需要面对的重要挑战。

2024-12-24 17:31:53 1362

原创 Spring Boot 应用开发入门（一）

通过 Spring Boot，你可以快速构建一个 Web 应用，减少了许多繁琐的配置和样板代码，专注于业务逻辑的实现。Spring Boot 集成了许多常用功能，如 Web 开发、数据库支持、集成测试等，使得开发过程更加高效和简洁。更多内容可以访问我的博客。

2024-12-24 17:30:19 777

原创 macOS开发环境配置与应用开发教程（一）

macOS 提供了一个非常适合开发的环境，无论是 iOS/macOS 应用开发、Web 开发，还是 Python、Android 开发，macOS 都能很好地支持。通过配置合适的开发工具和环境，如 Xcode、VS Code、Homebrew、Docker 等，你可以快速高效地进行开发。更多内容可以访问我的博客。

2024-12-24 17:27:12 1123

原创 ide使用技巧与插件推荐（一）

不同的 IDE 提供了不同的功能和插件支持，了解和使用 IDE 的快捷键、代码重构功能、调试工具和插件，可以显著提升开发效率。根据你的开发需求，选择合适的 IDE，并配置合适的插件，可以让你在日常工作中更加高效。

2024-12-24 17:25:26 806

原创高级sql技巧进阶教程

掌握高级SQL技巧不仅能帮助你写出更复杂的查询，还能帮助你提高查询效率，优化数据库性能。你可以通过使用窗口函数、递归查询、条件聚合等技巧来处理复杂的业务逻辑，同时通过索引优化、分区表等技术提升查询性能。在实际开发中，要根据数据量、查询需求和性能要求灵活选择和使用这些技巧。更多内容可以访问我的博客。

2024-12-24 17:14:41 926

原创大数据治理入门教程

大数据治理是确保数据质量、安全性、合规性和可用性的关键过程。通过建立完善的数据治理框架、策略和流程，企业能够更好地管理和利用其数据资产。在实施大数据治理时，企业不仅需要选择合适的工具和平台，还要注重团队协作和持续改进。更多内容可以访问我的博客。

2024-12-24 17:12:27 843

原创人工智能学习框架入门教程（一）

不同的人工智能任务适用于不同的学习框架。深度学习框架如 TensorFlow 和 PyTorch 主要用于大规模的深度神经网络任务，机器学习框架如 Scikit-learn 和 XGBoost 主要用于传统的机器学习任务，而强化学习框架如 OpenAI Gym 提供了丰富的环境支持，用于训练和评估强化学习模型。选择框架时需要考虑项目的需求、任务的类型以及团队的技术栈。更多内容来源。

2024-12-24 17:09:11 1050

原创计算机视觉-人工智能（AI）入门教程一

访问更多内容来源计算机视觉算法有很多种，适用于不同的任务，包括边缘检测、特征检测、目标检测、图像分割等。随着深度学习的发展，CNN 和其它基于神经网络的方法在许多任务中取得了很大的成功，尤其是在大规模图像分类、目标检测和图像生成等领域。选择合适的算法和模型可以大大提高视觉任务的效果。

2024-12-24 16:00:05 958

原创一个简单的机器学习实战例程，使用Scikit-Learn库来完成一个常见的分类任务——鸢尾花数据集（Iris Dataset）的分类

数据加载与预处理：加载鸢尾花数据集并进行标准化处理。模型训练与评估：训练了4个常见的机器学习模型（KNN、SVM、决策树和随机森林），并通过和评估了各个模型的性能。模型预测：使用训练好的模型对新数据进行了预测。KNN：适合用于小型数据集，计算复杂度较高。SVM：对于中小型数据集效果不错，但训练时间较长。决策树：易于理解和解释，但容易过拟合。随机森林：通过集成多棵决策树，通常表现良好，减少了过拟合的风险。在实际的机器学习项目中，你可以根据任务的特点选择合适的模型，并不断调整参数以优化模型的表现。

2024-12-24 15:56:59 1010

原创一个简单的深度学习模型例程，使用Keras（基于TensorFlow）构建一个卷积神经网络（CNN）来分类MNIST手写数字数据集。

运行该代码后，你将看到一个训练过程，显示训练损失和准确率。同时，在训练结束后，你可以通过评估模型在测试集上的表现，了解其准确率。例如，模型的测试准确率可能会达到98%以上，这表示模型能很好地识别MNIST数据集中的数字。这个例程展示了如何使用TensorFlow/Keras构建一个基本的卷积神经网络来进行图像分类。通过数据的加载、预处理、模型的构建、训练以及评估，你可以了解深度学习在计算机视觉中的基本应用。

2024-12-24 15:55:00 864

原创自缘身在最高层？OpenAI o1 pro竞赛级评测结果新鲜出炉

DeepSeek - R1 - Lite 的正确率为 0.611（33/54），o1 - preview 的正确率为 0.574（31/54），其他模型如 QwQ - 32B - Preview、K0 - math、InternThinker - Alpha 的正确率则相对较低，分别为 0.519（28/54）、0.426（23/54）、0.315（17/54）。最后，加强对模型可解释性的研究，探索有效的方法和技术，使模型的推理过程更加透明、可理解，增强用户对模型的信任和应用的可靠性。

2024-12-24 15:51:28 939

原创 AAAI 2025｜时间序列演进也是种扩散过程？基于移动自回归的时序扩散预测模型

ARMD 模型受经典的自回归移动平均（ARMA）理论启发，重新定义了时间序列的扩散过程：如图一所示，与传统的基于噪声的扩散方法不同，ARMD 将时间序列的演进看成是一个扩散过程，并采用了基于链式扩散的方式。经过在七个广泛使用的时序预测数据集上的大量实验，ARMD 模型的表现超越了现有的基于扩散的时间序列预测模型，并且和最先进的端到端时间序列预测模型取得了相当的效果。，使其逐渐接近历史序列。在 ARMD 中，时间序列的演进被概念化为一个扩散过程，时间序列的每一步都可以看成是扩散模型的一个状态，如图二所示。

2024-12-24 15:49:38 1294

原创从未见过现实世界数据，MIT在虚拟环境中训练出机器狗，照样能跑酷

目前机器人学科的主流方向是通过扩大真实世界中的数据收集来尝试实现通用具身智能，但是和其他的基础模型，比如初版的 StableDiffusion 相比，即使是 pi 的数据都会少七八个数量级。因此获取足够的数据对于提升机器人的性能至关重要，但在当前实践中，针对新场景和新任务获取数据是一个从头开始不断重复的手动过程。研究者的愿景是完全在生成的虚拟世界中训练机器人，而核心在于找到精确控制语义组成和场景外观的方法，以对齐模拟物理世界，同时保持对于实现 sim-to-real 泛化至关重要的随机性。

2024-12-10 19:49:37 452

原创大模型「标王」硬气：不做Sora ，要帮更多企业做出Sora

百度创始人李彦宏曾在百度世界 2024 大会上透露，截至 11 月初，百度文心大模型的日均调用量达到 15 亿，相较一年前首次披露的 5000 万次，增长了约 30 倍。没有「专业选手」，用户也能基于「一见」视觉大模型平台训练出和百度原厂效果一样的视觉模型，因为「一见」凝结了七年的行业实践，积累了丰富的模型、算子和场景化模型产线。市场也用真金白银投了票。大模型又是 AI 公有云的细分领域，作为国内率先抢跑大模型的云厂商，2023 年百度智能云在大模型平台市场份额为 19.9%，也位居第一。

2024-12-10 19:48:37 678

原创实现solidworks和CAD图纸Web在线预览功能

在之前的一个项目中需要实现solidworks工程图和模型的网页在线浏览。然后客户的要求既然实现了图纸的在线预览那office文档也一起做掉。不同用户登录可以协同编辑同一个文件不会冲突编辑内容实时回显。我找了个低配的阿里云服务器部署了一下给大家测试效果。我测试了很多开源接口最后选型了onlyoffice。支持所有的solidworks文件和cad文件。基本思路是再上传文件后立刻调用传化为网页格式。在文档上传的时候调用组件转化为web格式。测试了很多方式最后实现了比较完美的模式。

2024-12-09 11:39:24 709

原创媲美OpenAI事实性基准，这个中文评测集让o1-preview刚刚及格

另外，各模型在不同主题上的表现差异显著，特别是中文社区的大模型（如 Doubao-pro-32k, GLM-4-Plus, Qwen-Max, Deepseek）在 “中国文化（CC）” 主题上明显优于 GPT 或 o1 模型，而在科学相关主题（如 ETAS 和 NS）上，o1 则具有显著优势。整个构建和标注过程中，初步生成了 10,000 对问答对，经过难度评估和多轮验证，最终只保留了约 3,000 对高质量的问答对，确保了数据集的高质量和严谨性，希望为评估 LLM 的事实正确性提供正确的引导。

2024-12-09 11:37:01 670

原创实测昆仑万维对话AI「Skyo」，会读诗、知晓雷军摆拍

模型与应用两手抓，两手都要硬。同样地，此后出现的一系列对标 GPT-4o 的产品，如谷歌 Gemini Live、法国开源 AI 研究实验室 Kyutai 的 Moshi 等，虽然都宣称要打造自然流畅的 AI 对话，但从用户反馈来看，依然存在着一些直接影响对话体验的短板，比如可用性差、中断频繁和延迟严重等。自 GPT-4o 之后，语音交互场景的 AI 具备了前所未有的感知能力，在更智能化、更多面手之外，不仅响应延迟明显降低了，还能准确读懂用户的情感语调，如兴奋、高兴或悲伤，并以逼真的方式模仿和回应。

2024-12-09 11:35:27 1039

原创困扰数学家近60年的搬沙发难题疑似被解决！119页论文证明最优解，百万网友围观

那么 R 的面积 Q (S) 就是 S 面积的上限，如果是 Gerver 沙发 G，则 Q (S) 与 S 的精确面积相匹配。然后，移动沙发 S 面积的上界 Q (S) 相对于 S 的最大值如下所示：作者使用 Brunn-Minkowski 理论将 Q 表示为凸体元组 (K,B,D) 空间 L 上的二次函数（上图 1.2），并使用 Mamikon 定理建立 Q 在 L 上的全局凹性（下图 1.13）。Gerver 沙发由 18 条不同的曲线段组成，其中包括圆弧、圆的渐开线以及圆的渐开线的渐开线等多种曲线。

2024-12-08 19:15:55 698

原创如何搭建影视站并创建收费机制

只要有片源接口那么就可以用定时任务实时更新。然后后台配置一下定时任务每日更新最新片源。环境是php 7+ MySQL5+我搭建了demo大家也可以测试下。之前一直想看美剧下了很多app。直接运行install.php。然后定时任务里采集当天就可以了。羊毛战纪第二季就是叫末日地堡了。这个就不说了回车就可以饿了。在后台点采集-自定义接口。试了很多类似的开源程序。测试下最新的片是否齐全。后来想还是自己搭一个。2、git直接拉代码。按提示一路回车就可以。

2024-12-08 19:13:54 565

原创用LLaVA解读数万神经元，大模型竟然自己打开了多模态智能黑盒

在进行神经元探测时，我们发现不同于先前的 LLM 工作，往往激活最强烈的神经元并不是与高层级概念直接相关的，而是许多低层级的感知神经元。通过探究发现，造成模型输出 Yes 的罪魁祸首并不在图像的理解能力上，模型能够很好的找到需要关注的点，并准确的找到各个国家的名字。然而，在文字上面，我们发现模型过分的关注了 Bolivia 这一词，导致了最后的输出产生幻觉。3. 更准确的自动解释流程 —— 由于模型的局限性，许多神经元的解释往往存在错误，随着多模态大模型的推理能力逐渐增强，我们相信这一问题将会被慢慢攻克。

2024-12-08 10:12:12 825

原创突破！自然语言强化学习(NLRL)：一个可处理语言反馈的强化学习框架

以国际象棋为例，系统会先分析局势（“白方控制中心点，黑方王翼薄弱”），提出计划（“开展王翼进攻，同时固守中心”），最后给出具体建议（“Nf3-e5，威胁 f7 并加强中心控制”）。例如，在迷宫导航任务中，系统可能会这样分析：“向右移动是最优选择，因为：1）根据之前的探索经验，右侧路径更可能通向目标 2）即使这条路不是最短路径，也为我们保留了回退的选项 3）相比向上移动可能遇到的死胡同，这个选择风险更小。在现实世界中，反馈信号往往是多维度、多模态的，例如教练的口头指导、视觉示范，或是详细的文字说明。

2024-12-08 10:10:24 728

原创实现solidworks和CAD图纸Web在线预览功能

在之前的一个项目中需要实现solidworks工程图和模型的网页在线浏览。然后客户的要求既然实现了图纸的在线预览那office文档也一起做掉。不同用户登录可以协同编辑同一个文件不会冲突编辑内容实时回显。我找了个低配的阿里云服务器部署了一下给大家测试效果。我测试了很多开源接口最后选型了onlyoffice。支持所有的solidworks文件和cad文件。基本思路是再上传文件后立刻调用传化为网页格式。在文档上传的时候调用组件转化为web格式。测试了很多方式最后实现了比较完美的模式。

2024-12-07 10:44:59 900 1

原创微软「AI伴侣」Copilot Vision，让你用嘴浏览网页，还能和你一起打游戏

他指出，现在人们常用的计算机图形界面就是为不懂编程的人设计的，而十年之后，这些东西将被 AI 接替，因为 AI 助手或 AI 伴侣将有能力理解有关你的一切，不管是情绪状态还是日程安排，又或是兴趣爱好、个人知识图谱、人际关系。此外，一旦用户结束与 Vision 的会话，有关用户所说内容以及用户与 Copilot 共享的上下文的所有数据都将被删除。当您选择启用 Copilot Vision 时，它会查看您正在浏览的页面，并与您一起阅读，然后你们可以一起讨论遇到的问题。一是底层 LLM，它具备网络上的知识。

2024-12-07 10:41:24 422

原创亚马逊云科技用生成式AI，向开发的复杂性动手了

生成式 AI 技术的爆发直接改变了数据团队和开发团队的合作方式，逐渐走向无缝协作的境界，目前的显著挑战在于数据孤立且分散在各个系统中，他们必须构建和维护复杂的数据管道，而且由于访问控制不一致，团队难以有效地访问和使用数据。如今 Amazon S3 微服务数量已经达到了 300+ 个，通过微服务架构将整个应用拆解为多个独立、功能明确的子服务，与 S3 的交互被大幅简化，相应的数据存储在独立的 S3 存储桶中，有助于数据隔绝管理，还能轻松扩展存储容量、确保高可用性和数据持久性。

2024-12-07 10:40:11 958

空空如也

空空如也