alpha-soso-优快云博客

原创 Sora来了！抓住AI风口，普通人也能搞钱的N种方式！

Sora是可作为世界模拟器的视频生成模型，它可以生成持续时间、纵横比和分辨率各异的视频和图像，目前支持生成长达一分钟的高清视频。sora效果图Sora的横空出世，为普通人带来了前所未有的搞钱机会！今天就来聊聊，如何利用Sora实现财富增长，一起来看一下吧！sora效果图。

2024-02-22 15:13:21 557

原创大语言模型LLM领域有哪些值得学术研究的方向（下）

以下内容承接上篇！！！随着ChatGPT等大型语言模型的崛起，大语言模型（LLM）已经在自然语言处理、机器翻译、智能问答等领域展现出了强大的应用潜力。在众多计算机科学的学术研究方向中，LLM无疑是一个备受瞩目的领域，与其相关的学术研究和成果也层出不穷。作为研究人员，面对LLM这一广阔而深邃的研究领域，我们该如何选择适合自己的研究方向呢？

2024-02-07 14:17:32 1375

原创大语言模型LLM领域有哪些值得学术研究的方向（上）

随着ChatGPT等大型语言模型的崛起，大语言模型（LLM）已经在自然语言处理、机器翻译、智能问答等领域展现出了强大的应用潜力。在众多计算机科学的学术研究方向中，LLM无疑是一个备受瞩目的领域，与其相关的学术研究和成果也层出不穷。作为研究人员，面对LLM这一广阔而深邃的研究领域，我们该如何选择适合自己的研究方向呢？

2024-02-06 18:24:35 1226

原创开源大语言模型推荐和配置要求

可以看到，现有开源的LLM模型所需显存从几个GB到几百GB不等。对于小型LLM模型，可能仅需2GB显存，适合在个人PC上运行；而大型LLM模型可能需要更高的显存，这时可能需要多卡并行计算才能启动。在选择合适的LLM模型时，请根据您的实际配置情况和需求进行选择，确保所选模型与您的硬件资源相匹配。关注alpha-soso，获取更多人工智能内容！

2024-02-05 10:47:51 5039

在基本功能实现方面，我们已经取得了不错的进展。在准确率方面，我们也进行了一些测试。大部分情况下，声纹识别的准确率是可以接受的。语气词，例如“啊”、“哈哈”等。小孩子说话。说话人非常多的对话场景。为了提高识别准确率，大家可以在Hugging Face上寻找针对中文训练效果更好的模型。这些模型可能对于特定的语音特征有更好的识别能力。结合声纹识别与语音识别，我们可以更准确地分析和记录会议内容，为后续的数据处理和分析提供坚实基础。希望这次的技术分享能对大家有所帮助，也欢迎大家在评论区交流心得和经验。

2024-02-02 18:04:13 4367 1

原创基于Pyannote的中文声纹识别

以上做的一些目前都只是一些基于声纹识别的小实验，首先模型配置没有限制导致分割的segmentation还是偏多，离真正的实现日常工具化、商业化还需要一些调整，另外官方本身也提供模型微调训练的demo，感兴趣的可以去看一下。下一篇文章，博主计划将语音识别和声纹识别结合，能够实现一个能够独立完成图文转播的完整工具。

2024-01-31 18:08:35 4094

alpha-soso的博客

原创 Sora来了！抓住AI风口，普通人也能搞钱的N种方式！

原创大语言模型LLM领域有哪些值得学术研究的方向（下）

原创大语言模型LLM领域有哪些值得学术研究的方向（上）

原创开源大语言模型推荐和配置要求

原创使用语音识别+声纹识别实现智能会议记录

原创基于Pyannote的中文声纹识别

空空如也

mysql在shell中导入导出问题

原创 Sora来了！抓住AI风口，普通人也能搞钱的N种方式！

原创 大语言模型LLM领域有哪些值得学术研究的方向（下）

原创 大语言模型LLM领域有哪些值得学术研究的方向（上）

原创 开源大语言模型推荐和配置要求

原创 使用语音识别+声纹识别实现智能会议记录

原创 基于Pyannote的中文声纹识别

空空如也

mysql在shell中导入导出问题

原创大语言模型LLM领域有哪些值得学术研究的方向（下）

原创大语言模型LLM领域有哪些值得学术研究的方向（上）

原创开源大语言模型推荐和配置要求

原创使用语音识别+声纹识别实现智能会议记录

原创基于Pyannote的中文声纹识别