自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 vllm和llama.cpp哪个性能好

而llama.cpp 需转换为GGUF格式,但支持更广泛的硬件平台,实测在Pixel5手机端仍能保持1token/s的推理速度。基准测试显示,在处理共享前缀请求时,vLLM在A100上的吞吐量可达158,596token/s,缓存命中率75%。而llama.cpp 在同等模型参数下,通过4级量化可使推理速度提升2.3倍,内存占用减少65%。在端侧设备实测中,Ollama(基于llama.cpp )的推理延迟比原生llama.cpp 降低50%。

2025-02-25 14:03:01 398

原创 yolo12有哪些优势

YOLOv12 通过注意力机制和混合架构的突破,在保持实时性的同时显著提升了检测精度,尤其在小目标、密集场景和复杂光照条件下的表现突出。其设计思路为后续实时检测模型的发展提供了重要参考方向。如需技术细节,可参考原论文或开源代码实现。

2025-02-24 21:59:55 462

原创 ollama和llama.cpp区别

两者本质是互补关系:llama.cpp 提供底层推理能力,Ollama 在其基础上构建易用性。若追求极致控制选前者,注重效率与便捷性选后者。更多技术细节可参考来源。

2025-02-21 09:59:52 457

原创 vLLM原生支持昇腾,加速大模型推理创新,社区尝鲜版本首发!

2025年2月,经过vLLM社区与昇腾的持续合作和共同努力,vLLM开源社区已官方支持昇腾,并创建vLLM Ascend这一社区维护的官方项目。这意味着用户可直接在昇腾上无缝运行vLLM,开发者可通过vLLM调用昇腾进行模型适配。vLLM社区创建了vllm-project/vllm-ascend项目提供昇腾的官方支持vLLM Ascend使能vLLM在昇腾平台进行大模型推理,包含以下多个特征:vLLM Ascend原生支等在内的主流开源大模型类型,如系列、系列、系列等。

2025-02-20 20:57:17 503

原创 ollama如何部署deepseek

以下是部署 Ollama、DeepSeek 和 OpenWebUI 的完整指南。

2025-02-20 11:07:45 283

原创 llama.cpp如何部署deepseek

以下是使用llama.cpp 部署DeepSeek模型的完整指南。

2025-02-20 09:16:05 1890

原创 2025年学习Python Web或Python爬虫,能否获得高薪岗位?

爬虫工程师需熟悉网络协议(HTTP/HTTPS)、前端技术(HTML/CSS/JavaScript)及反爬对抗(验证码识别、IP代理池);:如成都、郑州等地的高级爬虫工程师(10k-15k/月),需掌握分布式爬虫、反爬策略(如JavaScript逆向、TLS协议分析)、数据库优化等核心技术,薪资显著提升。:如青岛某公司的爬虫开发岗(6k-8k/月),要求基础Python技能与数据解析能力,薪资偏低且竞争激烈。:从“数据采集”转向“数据治理”,学习数据清洗、存储及分析(如Pandas/Spark)。

2025-02-19 21:38:15 1437

原创 海康威视发布基于观澜大模型的文搜存储产品:安防监控效率的智能化跃迁

这一创新产品通过深度融合大参数量、大样本量的图文多模态大模型与嵌入式智能硬件,实现了自然语言与视频图像的跨模态信息检索,标志着安防监控行业迈入智能化新纪元。该模型通过图文多模态数据的持续预训练,具备强大的视觉感知与认知能力,能够精准理解用户输入的开放语义描述(如“穿红色衣服”“骑电瓶车未戴头盔”),并快速匹配视频图像中的目标特征。同时,该产品也预示了安防行业的未来趋势——AI大模型与边缘计算的深度结合将催生更多普惠型智能解决方案,推动行业从“看得见”向“看得懂”升级。

2025-02-18 17:09:55 785 1

原创 常用的样本标注工具有哪些?

链接:LabelImg GitHub https://github.com/HumanSignal/labelImg。链接:MarkTool GitHub https://github.com/chosendai/MarkTool。链接:doccano GitHub https://github.com/doccano/doccano。链接:Brat GitHub https://github.com/nlplab/brat。链接:CVAT官网 https://www.cvat.ai/

2025-02-18 13:09:44 1233

原创 2025年,百度一下,还有人用吗?

综上所述,尽管百度仍有用户使用,但其搜索质量下降、广告干扰增加以及市场份额被超越等问题,使得用户逐渐转向其他搜索引擎。2023年开始,微软必应在中国区桌面端市场份额超越了百度,成为第一大桌面搜索引擎。根据多方信息显示,百度仍然有一定用户基础,但用户活跃度和满意度明显下降。百度搜索结果中充斥着大量虚假信息和广告信息,影响了用户对搜索结果的信任。仍有部分用户在使用百度搜索,但广告多和内容质量下降让他们感到不满。有些用户认为,百度的主要用户群体可能是文化程度偏低的人。广告信息越来越多,影响了搜索体验。

2025-02-12 14:57:15 523

原创 AI智慧安防对社会发展的影响

在智慧社区中,智能安防系统的应用越来越重要,它通过物联网的保障与创新,为居民提供了更加安全和便利的生活环境。同时,智能安防系统也可以对家庭成员进行追踪,尤其是对于有特殊需求的人群,比如年老或残疾的亲属,通过这种追踪功能,可以更方便地进行照顾和救助。例如,对于政府机构来说,智能安防系统可以提供更精确的监控和追踪功能,帮助政府更好地维护社会安全和稳定。对于公共场所,如商场、电影院、体育场馆等,智能安防系统可以实时监控和预防火灾、洪水等灾害,及时发现和应对紧急事件,最大程度地减少人员伤亡和财产损失。

2025-02-11 21:23:21 432

原创 大模型微调有没有技术含量?

针对大模型计算成本高的问题,需掌握参数高效微调方法(如LoRA、Adapter、Prefix-tuning),这些技术涉及低秩分解、适配器模块设计等复杂操作。:大模型微调常需多卡并行,涉及数据并行、模型并行、混合并行等技术,需要掌握分布式训练框架(如DeepSpeed、Megatron-LM)。:在微调过程中,如何保留预训练模型的通用知识,同时学习新任务,需要设计正则化策略(如弹性权重固化EWC)或渐进式学习。:对小规模数据集,需通过数据增强(如文本改写、合成数据)提升泛化性,这需要领域知识和算法设计。

2025-02-10 12:55:35 523 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除