- 博客(13)
- 收藏
- 关注
原创 不是吧?这么好用的开源标注工具,竟然还有人不知道…
与常见的标注工具不同,LabelU提供了非常灵活、丰富和可自定义组合的标签工具,就像是一套为AI研究员量身打造的“积木”。
2024-08-20 17:21:15
2698
原创 ChemLLM化学大模型再升级,AI助力化学研究
ChemLLM系列模型是由上海人工智能实验室基于InternLM2 开发的首个兼备化学专业能力和对话、推理等通用能力的开源大模型。相比于现有的其他大模型,ChemLLM 对化学空间进行了有效建模,在分子、反应和其他领域相关的化学任务上表现优异。
2024-08-06 14:34:44
2243
原创 面向多样应用需求,书生·浦语2.5开源超轻量、高性能多种参数版本
在 2024 年 7 月 4 日的 WAIC 科学前沿主论坛上,上海人工智能实验室推出了书生·浦语系列模型的全新版本——InternLM2.5。相较于上一代,InternLM2.5 全面增强了在复杂场景下的推理能力,支持 1M 超长上下文,能自主进行互联网搜索并从上百个网页中完成信息整合。
2024-08-06 14:30:35
818
原创 LMDeploy Windows 平台最佳实践
Windows 是全球范围内最流行的操作系统之一,许多企业和个人用户都在使用 Windows 系统。通过在 Windows 系统上支持 LLM 的推理,许多办公软件、聊天应用等都可以受益于 LLM 的技术,为用户提供更智能、更个性化的服务。LMDeploy 支持在 Windows 平台进行部署与使用,本文会从以下几个部分,介绍如何使用 LMDeploy 部署 internlm2-chat-1_8b 模型。成功安装后,打开 Powershell 后,环境变量 CUDA_PATH 不为空。
2024-08-05 16:32:55
879
原创 善用知识图谱,问答助手只“解惑”,不“闲聊”
作为聊天工具,机器人越来越多地被应用于群聊中。但是群聊场景中往往存在信息繁杂、消息泛滥等情况。聊天机器人如何应对?作为一款基于大语言模型的知识问答AI助手,茴香豆(HuixiangDou)可被部署在社交软件群聊中,避免无效的“闲聊”,更高效地帮助用户答疑解惑。开源以来,得益于准确检索、低成本部署等优势,茴香豆受到开发者广泛好评。
2024-08-02 11:53:40
1811
原创 text2vec 如何选择 chunksize 和 splitter?
面对这些 RAG 问题,本文根据 text2vec 模型原理做假设,并用 HuixiangDou 真实数据进行验证,最终给出 chunksize 上下界。本文认为关键是让 tokenize 后的长度和模型输入(如 512)对齐,以发挥出模型完整编码能力。而 chunksize 只是 splitter 的附属选项。
2024-08-02 11:51:30
1148
原创 登顶GitHub Trending,开源工具MinerU助力复杂PDF高效解析提取
在7月4日举行的WAIC 2024科学前沿主论坛上,书生·浦语2.5正式发布,面向大模型研发与应用的全链条工具体系同时迎来升级。在数据处理环节,上海人工智能实验室(上海AI实验室)大模型数据基座OpenDataLab团队开源了全新的智能数据提取工具——MinerU。
2024-07-31 12:25:41
4270
原创 WAIC上官宣!大模型语料提取工具MinerU正式发布,开源免费“敲”好用
对于大模型数据处理环节,开源了全新的智能数据提取工具——MinerU,不仅能将混合了图片、表格、公式等在内的复杂多模态 PDF 文档精准转化为清晰、易于分析的 Markdown 格式,还能从包含广告等各种干扰信息的网页中快速解析、抽取正式内容,极大提高AI语料准备效率。
2024-07-31 12:24:13
1114
原创 让AI成为人类的Intern,书生通用大模型体系迈向通专融合 | WAIC 2024
7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC)正式开幕。在当天下午举行的科学前沿主论坛上,上海人工智能实验室(上海AI实验室)发布通专融合系列成果。
2024-07-30 10:59:22
1237
原创 周伯文:通专融合是通往AGI的战略路径
7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)在上海开幕。上海人工智能实验室主任、首席科学家,清华大学惠妍讲席教授,衔远科技创始人周伯文在WAIC 2024科学前沿主论坛上发表开场报告。以下为报告全文。
2024-07-30 10:49:46
1085
原创 使用 ollama 快速部署 InternLM2.5!
ollama 是一个用于部署和管理 LLMs 的工具,它可以帮助用户轻松地将复杂的模型部署到生产环境中。本文将介绍在 Linux 系统下如何使用 ollama 快速部署 InternLM2.5。
2024-07-29 16:51:46
1184
原创 书生·浦语2.5发布,支持百万长文,推理能力开源领先 | WAIC 2024
在7月4日举行的WAIC 2024科学前沿主论坛上,上海人工智能实验室(上海AI实验室)发布通专融合系列成果。作为书生·浦语系列大语言模型的最新版本,书生·浦语2.5具备一百万词元(Token)的超长文本窗口及开源模型中领先的推理能力,并支持自主规划和在线信息整合,成为助力复杂问题高效解决的得力AI助手。
2024-07-29 15:41:39
940
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人