juzibot-期初报告-信息管理机器人-机器人与部分算法实现

JuziBot是一款基于Wechaty的信息管理机器人,具备信息收集、管理、搜索等功能。现已实现Arxiv论文自动下载及关键词提取、图片OCR识别等功能,方便用户高效整理微信群内的文件和笔记。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

项目信息

简介:juzibot(repo)是基于wechaty的信息管理机器人,包括信息收集、管理、搜索、标签分析全文搜索等功能, 目前已有Arxiv论文收集和下载、图片OCR识别、记录notes等功能,方便在微信群里将各种文件、笔记等收集, 更加方便记录和检索。

Proposal Video

项目详情

  • 阶段列表
    • 熟悉机器人功能开发流程;
    • 开发数个额外功能模块;
    • Image Caption效果优化、提供置信度等;
    • 功能的开关控制,实现可定制的产品;
    • 实现功能的自动化测试。
  • 当前进度
    • 完成中文关键词提取的算法优化和库的开发GitHub - deepdialog/ZhKeyBERT: Minimal keyword extraction with BERT
    • 提供了OCR、keyword extraction、object detection等功能的web api OCRkeyword extractionobject detection
    • 每个具体功作为独立的api后端,分派到各自的容器中,wechaty作为前端解析微信消息的各种属性和意图,再通过前后端的交互实现具体功能,有利于功能扩展、快速相应
    • 为Juzi Bot添加了识别arxiv链接并保存相应pdf文件以及爬取论文题目、摘要等信息的功能,并做了关键词抽取
    • 对含有文本的图片自动做OCR识别,对笔记、文本文件自动做中/英文关键词抽取
  • 计划安排:
    • 阶段一
      • 完成时间:11月21日(已完成)
      • 计划描述:通过OCR、arxiv论文获取等小功能对JuziBot的开发流程有个整体了解,详情见当前进度
    • 阶段二
      • 完成时间:11月28日
      • 计划描述:研究关键词抽取、Image Captioning等NLP算法,将相应功能加入到机器人中
    • 阶段三
      • 完成时间:12月5日
      • 计划描述:做到每种功能的开关控制,群管理员可自行调整,实现可扩展、可定制的产品
    • 阶段三
      • 完成时间:12月12日
      • 计划描述:完成(部分)功能的自动化测试,考虑测试的形式并给出相应的测试代码

联系方式

  • Email:1092702101@qq.com

Author:@AquaIndigo

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值