自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 问答 (1)
  • 收藏
  • 关注

原创 Sora来了!抓住AI风口,普通人也能搞钱的N种方式!

Sora是可作为世界模拟器的视频生成模型,它可以生成持续时间、纵横比和分辨率各异的视频和图像,目前支持生成长达一分钟的高清视频。sora效果图​Sora的横空出世,为普通人带来了前所未有的搞钱机会!今天就来聊聊,如何利用Sora实现财富增长,一起来看一下吧!sora效果图。

2024-02-22 15:13:21 557

原创 大语言模型LLM领域有哪些值得学术研究的方向(下)

以下内容承接上篇!!!随着ChatGPT等大型语言模型的崛起,大语言模型(LLM)已经在自然语言处理、机器翻译、智能问答等领域展现出了强大的应用潜力。在众多计算机科学的学术研究方向中,LLM无疑是一个备受瞩目的领域,与其相关的学术研究和成果也层出不穷。作为研究人员,面对LLM这一广阔而深邃的研究领域,我们该如何选择适合自己的研究方向呢?

2024-02-07 14:17:32 1375

原创 大语言模型LLM领域有哪些值得学术研究的方向(上)

随着ChatGPT等大型语言模型的崛起,大语言模型(LLM)已经在自然语言处理、机器翻译、智能问答等领域展现出了强大的应用潜力。在众多计算机科学的学术研究方向中,LLM无疑是一个备受瞩目的领域,与其相关的学术研究和成果也层出不穷。作为研究人员,面对LLM这一广阔而深邃的研究领域,我们该如何选择适合自己的研究方向呢?

2024-02-06 18:24:35 1226

原创 开源大语言模型推荐和配置要求

可以看到,现有开源的LLM模型所需显存从几个GB到几百GB不等。对于小型LLM模型,可能仅需2GB显存,适合在个人PC上运行;而大型LLM模型可能需要更高的显存,这时可能需要多卡并行计算才能启动。在选择合适的LLM模型时,请根据您的实际配置情况和需求进行选择,确保所选模型与您的硬件资源相匹配。关注alpha-soso,获取更多人工智能内容!

2024-02-05 10:47:51 5039

原创 使用语音识别+声纹识别实现智能会议记录

在基本功能实现方面,我们已经取得了不错的进展。在准确率方面,我们也进行了一些测试。大部分情况下,声纹识别的准确率是可以接受的。语气词,例如“啊”、“哈哈”等。小孩子说话。说话人非常多的对话场景。为了提高识别准确率,大家可以在Hugging Face上寻找针对中文训练效果更好的模型。这些模型可能对于特定的语音特征有更好的识别能力。结合声纹识别与语音识别,我们可以更准确地分析和记录会议内容,为后续的数据处理和分析提供坚实基础。希望这次的技术分享能对大家有所帮助,也欢迎大家在评论区交流心得和经验。

2024-02-02 18:04:13 4367 1

原创 基于Pyannote的中文声纹识别

以上做的一些目前都只是一些基于声纹识别的小实验,首先模型配置没有限制导致分割的segmentation还是偏多,离真正的实现日常工具化、商业化还需要一些调整,另外官方本身也提供模型微调训练的demo,感兴趣的可以去看一下。下一篇文章,博主计划将语音识别和声纹识别结合,能够实现一个能够独立完成图文转播的完整工具。

2024-01-31 18:08:35 4094

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除