- 博客(347)
- 资源 (7)
- 收藏
- 关注
原创 如何调整vad参数
min_silence_duration_ms和min_speech_duration_ms这两个参数很微妙啊,min_silence_duration_ms如果越小,那么片段就越碎,而min_speech_duration_ms越小,则片段就越长。而这两个参数如果同时变小,就不一定片段是变长还是变小了,因为你不知道min_speech_duration_ms到底会影响多少片段之间的音频连接处会不会把它们连接起来。这是触及到了 VAD(语音活动检测)算法中最“混沌”的博弈区域。
2026-01-08 11:41:33
256
原创 Manus 技术栈与 LangChain 关系
Manus 能够达到如此高的代码执行成功率,很大程度上归功于 Anthropic 的 Claude 3.5 Sonnet。在多个代码评测榜单中,Claude 3.5 展现了超越 GPT-4o 的编程与逻辑推理能力。Manus 的 CodeAct 架构与 Claude 的强项完美契合。如果改用能力较弱的模型,CodeAct 产生错误代码的概率将指数级上升,导致系统瘫痪。
2025-12-30 10:52:40
673
原创 罗计物流为什么会失败
出于对陌生交易的恐惧,司机一般都会本能地抬价,这会造成陌生交易的频率和成功率的降低。现实中,货物运输的交易环节比打车更为复杂,有大量需要人为确认的、非标准化的线下交易活动和环节。在公路货运中,大约90%的车辆是个体车辆,与出租车司机相比,管理难度更大。据一位资深业内人士介绍,根据其公司交易系统统计,在上百万次的已达成货运交易中,大约有60%~70%是“熟关系”交易,完全陌生的交易只是少数。在没有完善的商业信用体系的情况下,“熟人关系”代行了这一职能,因此这种固定的熟人关系看起来牢不可破。
2025-12-07 20:00:49
393
原创 pip安装fasttext报错
报错现象:error: command '/usr/local/bin/gcc' failed with exit code 1 ----------------------------------------ERROR: Command errored out with exit status 1:解决办法:sudo yum install centos-release-sclsudo yum install scl-utils-buildsudo yum install devto
2025-11-12 12:34:01
698
原创 基于VibeVoice搭建语音合成demo
https://github.com/vibevoice-community/VibeVoice.git,该项目的优势是支持微调模型。
2025-11-07 20:24:45
275
原创 如何在DCU上面编译llama.cpp
完成后,再运行:(下面的128可改为你真实的cpu核数)然后再次重新运行上面的编译命令。此处的编译时间很长,需耐心等待。
2025-11-01 15:30:32
384
2
原创 开源的语音识别数据整理
主要由YouTube 和播客(Podcast)通过数据抓取,其中,YouTube 录音采用光学字符识别(OCR)技术标注,播客录音采用自动语音识别(ASR)技术标注。是已知最大的中文语音开源数据集。填写名称、公司等信息后即可获取。
2025-09-18 10:11:21
288
原创 如何用c++调用大模型——关于使用llama.cpp的lib库的简易教程
【代码】如何用c++调用大模型——关于使用llama.cpp的lib库的简易教程。
2025-09-06 11:42:09
350
原创 中文逆文本标准化 (ITN) 标注规范
逆文本标准化(Inverse Text Normalization, ITN),或称“中文转数字”,是指将文本中的口语化、文本化的数字表达(如“一千二百三十”、“百分之五”、“十一点半”)转换为标准化的书面形式(如“1230”、“5%”、“11:30”)。核心目标:使转换后的文本更符合书面阅读习惯,并便于后续的机器处理。示例:今天十一点十一分 -> 今天11:11我国总人口约十三点八六亿 -> 我国总人口约13.86亿标签定义适用场景变化。
2025-09-03 18:19:15
906
原创 语音识别后处理——如何语音断句加上标点、顺滑、纠错、ITN等
摘要: 机器同传(MSI)中的断句技术是影响翻译质量与实时性的关键瓶颈。完整语义单元对神经机器翻译(如Transformer)至关重要,断句不准会导致上下文割裂与翻译错误。当前技术包括基于静音、语言模型预测、韵律特征及端到端混合模型,需权衡实时性与准确性。类似挑战也存在于机器人交互中,错误断句可能导致指令误解与执行风险。研究高效断句算法(如VAD、端点检测)对实现流畅人机交互具有重要意义。文中还对比了大模型在口语化文本翻译中的表现差异,并展示了不同正则引擎的性能对比。
2025-09-01 07:35:51
554
原创 使用linux的mail命令发送html格式的邮件
2、然后修改/etc/mail.rc,在文件末尾增加以下内容,指定邮箱和授权码。1、关闭本机的sendmail服务或者postfix服务。3、然后通过命令来发送邮件。3、授权码的获取方式。
2024-07-10 05:32:12
10358
原创 github的优秀项目
GitHub - keon/awesome-nlp: A curated list of resources dedicated to Natural Language Processing (NLP)GitHub - glample/tagger: Named Entity Recognition Toolhttps://github.com/guoguibing/librec 优秀推荐系统代码https://github.com/ottokart/punc
2024-05-27 13:57:58
854
原创 模型蒸馏笔记
Hinton在NIPS2014提出了知识蒸馏(Knowledge Distillation)的概念,旨在把一个大模型或者多个模型ensemble学到的知识迁移到另一个轻量级单模型上,方便部署。简单的说就是用小模型去学习大模型的预测结果,而不是直接学习训练集中的label。
2024-05-26 20:20:47
989
原创 语料清洗的难点——为什么gbk编码常用抽取正则表达式无法抽取“嘚瑟“的“嘚”字
原因是:“嘚”的二进制编码是874e,而4e的编码正好是大写字母N,经过lower()函数后,就变成n,对应的二进制编码是6e,而876e就是”噉”因此语料预处理时需要非常小心,大小写转换在语料处理流程中的顺序,以及中文字符的抽取的正则都需要多加检验才能保证语料的干净。而我们常用的gbk汉字抽取正则表达式为[\x80-\xff][\x80-\xff]原因是:现在很多年轻人喜欢用兔斯基表情-.-,在语料处理时-被删除了,但是.留下了。其中0a为\n字符,874e即“嘚”字的gbk编码。
2024-05-16 14:24:24
455
原创 streamlit报错:AxiosError: Request failed with status code 403
步骤三:重新启动你的streamlit网页。步骤一:创建config.toml。步骤二:加入以下内容。
2024-05-14 22:44:26
1878
原创 deepspeed笔记
传统的深度学习,模型训练并行,是将模型参数复制多份到多张GPU上,只将数据拆分(如,torch的Dataparallel),这样就会有大量的显存冗余浪费。ZeRO Stage 3: 划分模型参数,或者说,不同的layer. ZeRO-3会在forward和backward的时候,自动将模型参数分配到多个memory。由于ZeRO-1只分配optimizer states(参数量很小),实际使用的时候,我们一般只会考虑ZeRO-2和ZeRO-3。而ZeRO的实现方法,就是把参数占用,逻辑上分成三种类型。
2024-04-18 14:43:03
714
原创 isascii、isdecimal、isdigit、isnumeric、isprintable、islower、isupper、isalpha、isalnum到底有什么异同
在使用python进行文本预处理时,经常会用到以上函数,那么它们到底有什么异同?
2024-04-16 16:48:31
342
原创 linux 的split命令如何确保split出来的多个文件,每个文件都 带上原始文件开头的第一行
split_with_header.sh如下。
2024-04-11 07:15:37
384
原创 hanlp的使用
hanlp最流行的是java的1.*版本(代码支持python和java),但是后来研发了2.0版本(代码仅支持python),2.0的版本是深度学习版本,功能也很多,但是貌似没有1.*那么流行。本文重点介绍1.*版本的使用(以v1.8.4为例)
2024-03-29 17:46:14
574
原创 报错:failed to initialize nvml driver/library version mismatch
【代码】报错:failed to initialize nvml driver/library version mismatch。
2024-03-23 16:27:58
1678
1
hanlp的data-for-1.7.5.zip
2024-03-29
八数码问题(附实验报告文档,java实现)
2010-04-21
EM算法(附实验报告文档,java实现)
2010-04-21
哈米尔顿环问题(c++实现)
2010-05-15
条件随机场(史上最牛条件随机场教程)
2010-03-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅