联想语音开放平台

以下内容来自github。

官网网址:https://voice.lenovomm.com

1. 开发者账号申请

第一步需要在官网注册账号,并在开发者账号页面获取联想密钥AK和安全密钥SK。

2. Python 客户端

使用前需要先申请开发者账号,并确认config.yml文件填入了有效的AK和SK。

用途

转写录音文件、为视频生成字幕等。

命令行参数

usage: offline-asr.py [-h] [--srt] [--lrc] [--debug]

input_filename output_filename

必选参数:

参数描述

input_filename输入语音文件

output_filename输出文本文件

可选参数:

参数描述

-h, --help显示帮助信息并退出

--srt使用SRT格式保存识别结果

--lrc使用LRC格式保存识别结果

--debug在输出文本文件里保存调试信息

3. 平台参数说明

Python客户端源码内已设置。

首部(header):

编码名称描述

channel来源标识用于标识外部来源的用户,值暂固定cloudasr

lenovokey账号公钥需从我们的官网注册账号后,即可得到

secretkey账号私钥需从我们的官网注册账号后,即可得到

请求参数(body):

编码名称描述

scene语音场景长语音是long,短语音是short,默认短语音

language音频语言目前只支持中英文,英文english,中文chinese,默认中文

sample语音通道数目前只对外开放单通道,值为1

audioFormat语音格式pcm_16000_16bit_sample 为 16000,16bit,单声道的pcm格式语音

pcm_8000_16bit_sample 为 8000,16bit,单声道的pcm格式语音

alaw_8000_16bit_sample 为 8000,16bit,单声道的alaw格式语音

ulaw_8000_16bit_sample 为 8000,16bit,单声道的ulaw格式语音

有任何问题,请在官网或GITHUB留言。

数据集介绍:神经元细胞核检测数据集 一、基础信息 数据集名称:神经元细胞核检测数据集 图片数量: - 训练集:16,353张 - 测试集:963张 分类类别: - Neuron(神经元细胞核):中枢神经系统的基本功能单位,检测其形态特征对神经科学研究具有重要意义。 标注格式: - YOLO格式,包含边界框坐标及类别标签,适用于目标检测任务 - 数据来源于显微镜成像,覆盖多种细胞分布形态和成像条件 二、适用场景 神经科学研究: 支持构建神经元定位分析工具,助力脑科学研究和神经系统疾病机理探索 医学影像分析: 适用于开发自动化细胞核检测系统,辅助病理诊断和细胞计数任务 AI辅助诊断工具开发: 可用于训练检测神经元退行性病变的模型,支持阿尔茨海默症等神经疾病的早期筛查 生物教育及研究: 提供标准化的神经元检测数据,适用于高校生物学实验室和科研机构的教学实验 三、数据集优势 大规模训练样本: 包含超1.6万张训练图像,充分覆盖细胞核的多样分布状态,支持模型深度学习 精准定位标注: 所有标注框均严格贴合细胞核边缘,确保目标检测模型的训练精度 任务适配性强: 原生YOLO格式可直接应用于主流检测框架(YOLOv5/v7/v8等),支持快速模型迭代 生物学特性突出: 专注神经元细胞核的形态特征,包含密集分布、重叠细胞等真实生物场景样本 跨领域应用潜力: 检测结果可延伸应用于细胞计数、病理分析、药物研发等多个生物医学领域
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值