- 博客(27)
- 收藏
- 关注
原创 填坑 3D gaussian splatting里SIBR_viewers的安装
那剩下的就是我把这个链接地址给换掉了,反正就是换成了可以访问的到,并且就是要下载的那个资源。因为3DGS生成的模型要跑起来得用到GPU,所以一开始我就只能用它带的viewer,结果装了半天装不上,上篇文章评论里我看大家也遇到了吧。然后再编译,就成功了,安装完,所有的view软件都装在这个目录的install/bin里了。然后不出意外,就编译报错了,就是因为编译过程需要用个插件是github上的,结果下不下来。报错信息里有要下载的链接的关键词, 于是我复制了一下在代码里全局搜了一下找到了对应代码。
2024-01-13 16:35:17
9984
12
原创 程序员从开始就要养成养生习惯
最近两周,突然耳朵时不时就会响,开始是那种噼里啪啦的声音,我想了很久,才找到一个形容这个声音的事情,就是特别像吃跳跳糖的时候,跳跳糖在舌头上跳的声音。2、饮食,能自己做就尽量自己带饭,早餐一定要吃好,每次吃饭的比例,菜、肉和主食的比例2:1:1,菜的种类每天尽量要多一些。在出现一周后,去医院看了下,做了检测,大夫的诊断是脑供血不足,但是还没严重到需要特别治疗阶段,给我开了些药吃。其中最重要的就是第1个,也是各位程序员,甚至是喜欢玩手机的人,都很难做到的。听到这个声音的时候,不痛不痒,就只是能听到,很烦人。
2023-12-12 13:40:25
272
原创 google突然就发布了Gemini
然后会把Gemini放到Pixel手机上,Pixel 8 pro是第一款搭载Gemini Nano的智能手机,拥有一些强大的特性,比如能总结录音app里的内容,还会在放到GBoard的智能回复里,从Whatsapp开始,明年会放到更多消息类应用。Gemini是原生多模态大模型,是谷歌大模型新时代的第一步,它包括三种量级:能力最强的Gemini Ultra,适用于多任务的Gemini Pro,以及适用于特定任务和端侧的Gemini Nano。Gemini Ultra也快来了,还在做最后的测试。
2023-12-11 12:08:20
510
原创 当初为什么选择计算机这类的行业?
编程能力其实一直都是在工作中锻炼的,因为还是实际项目才能练出来,最终才知道还是解决问题的思想最重要,debug的过程才是磨练身心,稳固基础的重要方式,尤其是有一段时间做嵌入式DSP算法的时候,要了老命了,对平台的操作系统还得使劲挖掘,各种L1 L2 cache机制,EDMA啥的,从一脸懵逼到看各种文档找地址,最终解决问题,再后来做上层的相关东西,各种调库不用管实现可真是太爽了…直到公司出现问题,有大龄码农危机的时候,直到人到中年面临各种压力的时候,才想起,这个专业就是吃饭的家伙啊,是得好好学习掌握了啊。
2023-12-07 12:07:17
533
原创 Linux命令 - screen
有时候程序运行跑在前台,如果关了终端窗口,程序也退出了,很不方便。所以要使用这个命令 screen。它可以新建一个终端窗口,在这里跑了程序,即时关掉终端窗口,程序也还在运行。
2023-12-05 16:52:47
278
原创 我在生活中能用到人工智能吗
人工智能这个词儿已经很早了,太远的不说,就说我十几年前的专业就是人工智能方向的,那时候还没有用到现在深度学习这一套,还是处于逻辑分析应用和优化各种算法到业务的传统方法。然而,现在提起人工智能,直接潜移默化地就变成了CHATGPT、STABLE DIFFUSION、MidJourney等等这些工具了,对,我说的是工具,都不是算法或者技术了。这就是人工智能突然进化一大截的证明,不光停留在专业场景层面,已经发展为每个人可以使用的工具了。
2023-11-27 16:08:46
987
1
原创 数据分析师的学习之路-pandas篇(1)
python的pandas库,可以与excel文件联动,进行各种各样的操作,是数据分析的得力帮手,所以得知道怎么用,一些常见的业务场景都有相应的操作,学习并记录一下。
2023-11-26 13:30:59
163
1
原创 tornado使用中遇到的latin-1字符编码问题
..python路径/lib/python3.6/site-package/tornado/全网搜了个遍,只要有类似的解决方法都试了一遍,最后忘了在哪来搜到的成功解决了该问题。解析参数时字符编码问题,因为参数里有中文。改完以后,重启服务,解决。系统:Centos7.9。
2023-11-25 14:53:40
215
原创 很厉害的语音克隆TTS:coqui-ai TTS的使用过程
我录了几句话,十几秒的音频,然后就能克隆输出了,我用GPU,速度很快,3秒内就输出了,当然这和传的音频还有合成文字的长度有关系。这一串tts_models--multilingual--multi-dataset--xtts_v2 是程序自动创建的目录,如果模型下载失败,这个目录会直接删掉的,注意。coqui-ai开源的TTS,它的特色我总结为:可以上传自己的一段人声音频(哪怕就几句),它就能给你克隆了,并且把你要说的文字给转成语音读出来。如果想自己训练啥的,就下载源码按教程弄吧,这里就不说了。
2023-11-23 15:59:02
14585
17
原创 AI音乐创作飞跃了?Google最新发布新模型Lyria
google deepmind联合YouTube发布了一个AI音乐创作的模型,去官网看了下,演示视频里确实质量一个大NB,现在我整体大概介绍一下google是咋说的哈
2023-11-22 12:38:28
1516
1
原创 Colmap在Linux下的安装
如果有问题那就要么有更基础的没装,或者版本问题,总之仔细看报错的信息,分析一下应该就能找到解决办法。在用Gaussian splatting时,要先装colmap才能做一些预处理。以下是我这的安装过程记录,可能不一定适合其他人,但是仔细查查肯定能解决~进入目录,然后创建build目录,在这里进行编译和安装。结果,我这个编译安装过程异常顺利,有点不敢相信。cuda版本:11.8,显卡是4090。问题1: 有出现这个库出错的 libtiff4.0。解决:可能是依赖连续安装时,有些因为网络原因漏装了。
2023-11-21 15:45:48
2614
12
原创 FFMPEG调用出的这么一个错
这个专栏就是把平时遇到的一些可能不起眼的问题,都记下来,免得以后再碰到又得一通找。可能这些东西看着不是那么高大上,但确实是熟练精通的过程中要一步一个脚印踩过去的坑,所以还是有必要记一下的,当然经常会懒得记。如果有碰上类似的错,可以试试吧,虽然咱们的场景可能不一样。于是, conda update ffmpeg。(都是在conda环境下,用python的)安装过程居然也没出错,顺利的不敢相信。要升级一下ffmpeg。安装完,再运行,就好了。
2023-11-19 15:33:45
564
1
原创 语音识别神器 Whisper 的几个小技巧
综述所述,最后就固定一个prompt的写法,就能解决标点符号和繁体字问题。以下是普通话的句子,这是一段会议记录。如果想输出繁体字,上面内容就全用繁体字写。后半句写语音的内容概括,并且一定要加上句号。祝大家成功!
2023-11-18 11:48:51
10514
8
原创 升级和切换CUDA版本
这里先记录下初学时可能会搞迷糊的问题,就是跑深度学习这些的时候,CUDA版本到底看的是哪个,我开始就搞迷糊了。第2个版本是toolkit的版本,这才是编程要看的那个版本,一般是小于等于第1个显示的版本。在我的环境里这么操作是没问题的,如果大家遇到不一样的问题,就再多搜搜细心分析,肯定能解决的~第1个版本是显卡驱动的版本,这个版本显示了这个显卡最高支持的CUDA版本。1)nvidia-smi 命令出来的,比如当前我的版本显示的是 12.0。所以修改这个文件,把路径指到新版本的目录,就可以了。
2023-11-16 14:00:51
2579
3
原创 web.py 的基本使用方法
最近要快速做一些DEMO,所以直接用了web.py做后台web服务,记录下最基本最简单使用方法,理解一下它的逻辑。web.py的介绍就不说了,一搜就有,直接开始。我的环境是这样的:系统:ubuntu 22.04python: 3.8 (conda环境)如果大家用下来和我经历的不一样,那就再琢磨琢磨,总会解决的~
2023-11-15 19:32:20
712
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人