- 博客(152)
- 资源 (1)
- 收藏
- 关注
原创 人脸识别检测涉及的技术
106点人脸关键点检测:https://github.com/jhb86253817/PIPNet?tab=readme-ov-file
2024-09-04 14:22:38
259
原创 linux环境下重新编译opencv的安卓动态链接库opencv_java4.so文件
如果想要只保留自己需要的模块,那就在opencv-4.10.0/modules删除掉没用的模块。1) 在opencv的根目录下的CMakeLists.txt的java部分添加ANT的参数。2) 通过sdkmanager安装ndk,build-tools,3) 安装完后,可以到/opt/android-sdk目录下查看。5)将JAVA,ANDROID_SDK放到环境变量中。版本可以通过sdkmanager --list查询。4)对安装的sdk做授权。
2024-07-28 22:29:20
1141
原创 大模型知识库
embedding 模型: git clone https://huggingface.co/BAAI/bge-large-zh。思想实现的基于本地知识库的问答应用,目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。1. 下载Langchain-chatchat。创建数据库langchain_chatchat。2. 下载大模型和embedding模型。1)安装postgresql数据库。大模型: git clone。5. 安装相应的向量数据库。查询所有的数据库:\l。
2024-03-18 15:23:07
1037
原创 linux 使用apt 安装gcc之后(sudo apt install gcc-12),gcc --version显示的还是旧版本
问题二、linux 使用apt 安装gcc之后(sudo apt install gcc-12),gcc --version显示的还是旧版本。第三步,重新将新安装的gcc12链接上,sudo ln -s /usr/bin/gcc-12 /usr/bin/gcc。首先,gcc-12 --version, 如果可以显示出来是gcc8的版本证明安装成功了。第二步,删除之前的链接,sudo rm /usr/bin/gcc。第四步,gcc --version显示的就是gcc12了。
2024-02-21 12:58:22
1297
原创 自然语言大模型
GitHub - IDEA-CCNL/Fengshenbang-LM: Fengshenbang-LM(封神榜大模型)是IDEA研究院认知计算与自然语言研究中心主导的大模型开源体系,成为中文AIGC和认知智能的基础设施。
2024-01-03 16:32:30
385
原创 asr,声纹识别,声音分类,情感识别,语音合成微调
GitHub - yeyupiaoling/Whisper-Finetune: Fine-tune the Whisper speech recognition model to support training without timestamp data, training with timestamp data, and training without speech data. Accelerate inference and support Web deployment, Windows desk
2023-12-08 20:04:46
731
1
原创 模型微调技术
这两种方法只微调模型的一小部分(额外的)参数,同时冻结预训练模型的大部分参数,从而大大降低了计算和存储成本。尤其是LoRA,它在Transformer架构的每一层中注入可训练的秩分解矩阵,从而大大减少了下游任务的可训练参数数量。而且,LoRA的表现与完全微调的模型质量相当或更好,尽管它的可训练参数更少,训练吞吐量更高,并且与适配器不同,它没有额外的推理延迟。
2023-11-21 16:51:43
120
原创 tensorflow学习
tensorflow-101: 《TensorFlow 快速入门与实战》和《TensorFlow 2 项目进阶实战》课程代码与课件 - Gitee.com
2023-11-10 09:05:42
141
原创 安装opensips
会新建数据库账号:opensips,密码:opensipsrw。安装完毕后,再选择需要的module继续安装,不需要编译。将以下的配置黏贴到.opensips-cli.cfg里面。打开vim /etc/mysql/my.cnf文件 增加。如果只是用作load balancer,那么只需要安装。保存好脚本后,会看到新的脚本在哪里,编辑脚本。3)执行osipsconfig获取新的脚本。2. 安装opensips-cli。# 选择模块添加数据库表结构。1. 安装opensips。3. 安装mysql。
2023-11-01 16:09:06
583
原创 数据库优化
查询sql每个索引可存储总量:show global status like ‘innodb_page_size’;对于B+TREE,总共三层,若一条数据1KB,那么一个索引里面可以包含1170*1170*16=2000多万数据。每个节点可存储16kb/(8+6)B=1170。
2023-09-21 13:59:53
181
原创 fabricjs
Fabric.js 从入门到________ - 掘金参考以下内容:GitHub - nihaojob/vue-fabric-editor: 基于fabric.js和Vue的图片编辑器,可自定义字体、素材、设计模板。fabric.js and Vue based image editor, can customize fonts, materials, design templates.
2023-09-02 08:43:15
173
1
原创 虚拟人生成
GitHub - zeng-yifei/AvatarBoothGitHub - weihaox/awesome-digital-human: A collection of resources on digital human including clothed people digitalization, virtual try-on, and other related directions.虚拟人交互实时:https://github.com/FACEGOOD/FACEGOOD-Audio2Face
2023-07-29 09:59:27
342
原创 安装docker
Installation Guide — container-toolkit 1.13.1 documentation (nvidia.com)
2023-07-19 15:45:10
84
原创 大模型论文
1. BERT(bilinear encoder representation transformer)是谷歌公司发明的,基于自注意力机制的nlp模型。有预训练好的模型,并且开源的供所有人去做调优。是2018年的时候最优秀的nlp模型。
2023-07-16 23:14:03
744
原创 ffmpeg
链接:https://www.jianshu.com/p/c63a57713945。商业转载请联系作者获得授权,非商业转载请注明出处。
2023-06-27 15:14:19
3282
1
原创 语音情感识别技术
aipersonal/Speech-Emotion-Recognition: Speech emotion recognition using LSTM, SVM and MLP | 语音情感识别 (github.com)
2023-06-07 17:54:08
137
原创 多国语言语音翻译
openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision (github.com)
2023-06-07 15:34:09
154
原创 研究国外现有的ASR
Welcome to DeepSpeech’s documentation! — Mozilla DeepSpeech 0.9.3 documentation
2023-06-03 17:11:21
98
原创 研究音转唇项目
3. 在filelists文件夹下建main文件夹,里面放经过syncnet处理后的video数据,处理成mp4文件。docker 用paddlepaddle的包。loss要收敛到约0.25。loss收敛到约0.2。
2023-05-26 14:51:51
1343
hadoop执行需要的winutils.exe
2014-11-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人