- 博客(25)
- 资源 (3)
- 收藏
- 关注
原创 OmniParser omnitool使用记
是在被控的windows操作软台系统里 运行 win11setup/setupscripts/server/main.py,特别是 Validation errors: Windows Host is not responding 这个错误。3. 最好在一个机器上运行;装vm也是折腾了很久,自动下载win,可以解决一些问题。运行的是一个probe服务,就是5000端口这个服务. 成功后,说到了要点,包括坑。1.执行了一个简单的功能。
2025-03-07 14:18:49
389
原创 用WSL2装dockurr/windows时提示没有KVM的解决方法
我们需要打开组策略管理,按照以下路径:本地计算机策略 > 计算机配置 > 管理模板>系统 > Device Guard进行设置。可能禁用了组策略里面的Device Guard虚拟化安全设置。打开 基于虚拟化的安全设置为“已开启”或者“未设置”。win10下面的 wsl2 显示不支持kvm时,
2025-02-28 14:50:17
186
原创 大模型作为农艺师助理?使用大型语言模型回答农业考试
在我们的评估中,我们还采用了 RAG(检索增强生成)和 ER(集成精炼)技术,它们结合了信息检索、生成能力和提示策略来提高 LLM 的性能。我们的分析强调了 GPT-4 能够在考试中取得及格分数以获得更新农艺师认证的学分,正确回答了 93% 的问题,并且优于早期的通用模型,后者的准确率达到了 88%。我们还利用来自巴西农业局 (Embrapa) 的强大数据集和来自印度的研究生课程考试,探索了模型解决一般农业相关问题并为巴西和印度农民生成作物管理指南的能力。
2025-02-25 10:04:20
106
原创 农业中的生成式 AI
农业中的角色农民种子、购买和管理的决策投入提供者 / 农艺师与农民和顾问沟通,输入购买决策消费者营养和有机、可持续农产品CPG/零售商购买决策、可持续性食品制造 / 供应链与农民就价格和食品标准进行协调银行家与农民就贷款和保险进行沟通政策制定者让农民可以访问政策文件研究员 / 数据科学家AI 工作流自动化。
2025-02-24 09:21:01
21
原创 探索 LLM 在各种行业的使用
场景:一家公司希望使用使用自己的文档、自定义数据构建的自定义 LLM。这需要客户数据处理管道进行微调或 Retrieval Augmented Generation (RAG)。该公司还希望使用可以将 LLM 与其现有记录系统集成的插件,并向内部或外部客户提供交互式反馈。生成的答案符合行业的隐私和道德标准以及公司政策。
2025-02-21 09:56:28
55
原创 OmniParser V2:将任何 LLM 转变为计算机使用代理
但是,使用通用 LLM 模型作为 GUI 代理面临几个挑战:1) 可靠地识别用户界面中的可交互图标,以及 2) 理解屏幕截图中各种元素的语义,并将预期作与屏幕上的相应区域准确关联。OmniParser 通过将像素空间的 UI 屏幕截图“标记化”为屏幕截图中可由 LLM 解释的结构化元素来缩小这一差距。这使 LLM 能够在给定一组已解析的可交互元素的情况下执行基于检索的下一个作预测。,它在检测较小的可交互元素方面实现了更高的准确性和更快的推理速度,使其成为 GUI 自动化的有用工具。
2025-02-20 16:41:55
241
原创 微软发布开源OmniParser V2.0,操控电脑智能体
OmniParser V2.0是一款基于纯视觉的GUI智能体解析和识别屏幕上可交互图标的AI工具。它通过大规模的交互元素检测数据和图标功能标题数据的训练,在检测较小的可交互UI元素时准确率更高、推理速度更快,延迟降低了60%。
2025-02-20 16:29:12
153
原创 超越Everything的文档内容开源搜索工具
dnGrep是一款专为Windows系统设计的开源搜索工具,它的强大之处在于能够跨多种文件类型进行深度搜索,是一款「全局文本搜索神器」,包括文本文件、Word文档、Excel表格、PowerPoint演示文稿、PDF文档,甚至是「压缩文件中的文件内容」。软件支持中文,解压后,双击 dnGREP.exe 即可打开,在 Settings-Options 中可设置语言为中文。
2025-02-20 16:25:33
194
原创 LatentSync:用于口型同步的音频条件潜在扩散模型
我们提出了 LatentSync,这是一个基于音频条件潜在扩散模型的端到端口型同步框架,没有任何中间运动表示,与以前基于像素空间扩散或两阶段生成的基于扩散的口型同步方法不同。此外,我们发现,由于不同帧之间的扩散过程不一致,基于扩散的口型同步方法表现出较差的时间一致性。TREPA 使用大规模自监督视频模型提取的时间表示,将生成的帧与真实帧对齐。参考帧和掩码帧在通道上连接,噪声潜伏值作为 U-Net 的输入。在训练过程中,我们使用一步法从预测的噪声中获得估计的干净潜在值,然后对其进行解码以获得估计的干净帧。
2025-02-19 15:53:49
347
原创 DeepSeek-R1在NPU下部署
详情请参考 [DeepSeek模型量化方法介绍](https://gitee.com/ascend/msit/tree/br_noncom_MindStudio_8.0.0_POC_20251231/msmodelslim/example/DeepSeek)- `/path/to/DeepSeek-R1` 表示DeepSeek-R1原始权重路径,`/path/to/deepseek-R1-bf16` 表示权重转换后的新权重路径。
2025-02-19 13:23:43
825
原创 昇腾服务器之初见
综上所述,昇腾服务器凭借其卓越的性能、惊人的稳定性和用户友好的设计,成为了我工作中不可或缺的助手。期待在未来的项目中,继续利用这一强大的平台,推动更多的技术创新和突破。无疑,昇腾服务器为我开启了更加广阔的技术探索之路。53192794。
2024-09-27 17:48:33
350
原创 odoo17安装小记
2.安装时, Postgres附带一起安装比较好。用默认, 要记下数据库的用户名和密码。3. 初始登录的用户和密码, 是你初始创建时输入的邮箱地址和密码。
2024-09-27 17:42:01
206
原创 read binary waveform file created by a LeCroy Oscilloscope matlab
%if fid==-1returnend;% HIFIRSTelse% LOFIRSTend;% filesend% Channeltmp=['off';
2024-07-31 13:11:09
380
原创 关于中药对眼睛的作用随记
1. 地黄和五味子都可以减缓远视,自己的实践。地黄可以耐久视,但注视腻胃。中药配伍的对症是关键。3. 打坐,禅定才是根本的,目前发现唯一有益无害的方法。佛像几千年来的示现。2. 中药对身体都有正负作用,四大不容易调和。
2024-07-29 15:25:55
90
原创 Codeium VisualStudio22 代码助手
Codeium这个是找到可以用的一个代码助手,开源,注册时需要科学上网。使用时是OK的, 开源 所有有希望自己改进一下。
2024-07-29 15:04:46
200
原创 wpf开源的style之我所见
1. MaterialDesignInXamlToolkit 是真style, 不是继承类,2.MahApps.Metro, wpfui 内容也丰富,很多重写了类,
2024-07-04 09:13:31
98
原创 pip安装时,可以使用国内镜像
pip install pypiwin32 -i https://pypi.tuna.tsinghua.edu.cn/simple/
2024-07-04 09:09:28
501
dockurr-windows.tar dockurr/windows docker镜像
2025-02-27
1. Download this file: https://cdn-media.huggingface.co/frpc-gradio-0.3/frpc-windows-amd64.exe
2025-02-21
ChromeDriver.exe
2025-02-20
pythonnet_netstandard-python_3.6_win.zip
2020-07-06
cudnn-10.2-windows7-x64-v7.6.5.32.zip
2020-06-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人