
人工智能
delphiorang
这个作者很懒,什么都没留下…
展开
-
Python视觉实战项目31讲 图书及源码地址
使用OpenCV预处理神经网络中的面部图像。使用OpenCV对运动员的姿势进行检测。使用OpenCV实现早期火灾检测系统。使用OpenCV为视频中美女添加眼线。使用OpenCV实现社交距离检测器。使用OpenCV实现道路车辆计数。使用OpenCV进行实时面部检测。使用OpenCV实现车道线检测。基于OpenCV的实时面部识别。使用OpenCV实现哈哈镜效果。使用OpenCV实现猜词游戏。使用OpenCV实现图像修复。使用OpenCV实现口罩检测。基于OpenCV 的车牌识别。基于OpenCV的图像卡通化。原创 2024-12-18 15:41:32 · 110 阅读 · 0 评论 -
OpenAI开源的能识别99种语言的语音识别系统——whisper
从whisper的模型可知,其模型开源了5种模型,可以自行选择,然后把我们下载的音频文件直接使用model.transcribe("11.mp4")代码,模型便可以自动识别,并打印出识别出来的txt文本。这里简单提一下pytube库,此库可以下载YouTube的视频与音频文件,当然上面的代码是下载音频文件,下面的代码可以下载视频文件。可以看到,模型识别效果极高,针对本段音频,其识别正确率为100%,当然模型支持99种语言,大家可以使用模型来识别不同语言的语音。Whisper支持5种不同的模型尺寸。转载 2023-07-24 23:21:12 · 2713 阅读 · 0 评论