人工智能
文章平均质量分 79
用算法解决问题,专攻机器视觉、深度学习的落地,采用Tf、keras、caffe等框架嵌入C++、Python、Android中、全程源码开放。细致教学。
优惠券已抵扣
余额抵扣
还需支付
¥19.90
¥99.00
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
南七小僧
C9博士,前百度、联想技术产品总监。深入理解人工智能技术研发与应用。
展开
-
白话科普 | AI如何理解你的问题?万字长文结合案例解析Prompt核心技术!让DeepSeek等大模型更好用
白话科普 | AI如何理解你的问题?万字长文结合案例解析Prompt核心技术!让DeepSeek等大模型更好用原创 2025-02-01 16:16:00 · 248 阅读 · 0 评论 -
DeepSeek太卡?5种方法(含本地部署)快速接入!微软、英伟达、亚马逊等“偷偷”部署R1,真香定律再现!
DeepSeek最近因为全球用户的涌入和流量激增导致服务异常卡顿,甚至出现了“三天流量等于欧洲互联网三天总和”的夸张说法。面对这一情况,微软、英伟达、亚马逊等科技巨头纷纷“偷偷”将DeepSeek-R1模型部署在自家服务器上,为用户提供替代方案。本文详细解析了如何通过5种方式快速接入这些公司的DeepSeek-R1服务,帮助用户绕过官方API的拥堵问题,同时探讨了背后的技术逻辑和行业趋势。原创 2025-02-01 16:15:18 · 1806 阅读 · 0 评论 -
DeepSeek超全使用攻略:颠覆你对AI的认知,这可能是2025年最实用的生产力指南
当硅谷还在教用户如何"驯化AI"时,中国团队打造的DeepSeek正在重新定义人机交互的规则。这款完全免费的国产大模型,正在用颠覆性的"中文思维"改写AI使用范式。经过200+小时实测,我们整理出这份全网最深度使用指南,内含5大核心技巧及3个关键禁区。核心发现:DeepSeek月活用户环比增长380%(数据来源:艾瑞咨询2024Q1报告)效率提升:测试团队平均任务处理时间缩短67%行业影响:已有23家上市公司采购企业版部署场景化理解:准确捕捉"话外之音"中文思维适配:成语俗语理解准确率91.2%原创 2025-01-28 15:22:39 · 7254 阅读 · 0 评论 -
python多张图片生成/合成gif
变量的值为实际包含图片的文件夹路径。运行此脚本后,你会在每个图片文件夹所在的目录下找到相应的GIF文件。函数时传递不同的帧率值来调整生成的GIF的速度。你可以通过调整帧率来提高GIF的流畅度。默认情况下,代码中的帧率为每秒1帧(我们可以增加这个值来加快动画速度。在这个版本中,我添加了一个可选参数。,默认值为5帧每秒。原创 2025-01-05 18:47:01 · 242 阅读 · 0 评论 -
Flask: flask框架是如何实现非阻塞并发的
同样,只要实现了WSGI协议的任何web server都可以作为flask app的服务器,既不适用Flask 框架携带的Werkzeug作为默认的web server,比如uWSGI, Gunicorn,mod_wsgi等等,同样,同一个实现了WSGI协议的server也可以用在其他实现了WSGI协议的web框架上,比如:Django, Bottle ,flask。写在前面:Flask框架是通过多线程/多进程+阻塞的socket实现非阻塞,其本质是基于python的源库socketserver实现的。原创 2024-12-05 03:50:50 · 504 阅读 · 0 评论 -
FlashRAG:可能是最全的、最快搭建RAG的开源框架
尽管已有多种创新算法和模型被提出以提升 RAG 系统的性能,但由于缺乏统一的标准化框架,加之 RAG 过程的复杂性,研究人员在一致环境中比较和评估这些方法面临挑战。为了应对这一挑战,本篇论文作者推出了FlashRAG,这是一个开源库,旨在帮助研究者轻松复现现有的RAG方法,并开发他们自己的RAG算法。该库允许研究者利用构建好的管道复现现有工作,使用提供的RAG组件构建自己的流程,或利用组织好的数据集和语料库加速他们的RAG工作流程。在流程层面,根据RAG发展的现状,实现了8种常见的RAG流程。原创 2024-12-05 01:30:26 · 452 阅读 · 0 评论 -
万字长文 | 如何让你的大模型“开口”说话:从ASR到端到端语音大模型的进化之旅
回顾过去,ASR、NLP和TTS三大技术携手走过了六十年的风雨历程;展望未来,端到端语音大模型正引领我们进入一个人机对话新时代。在这个过程中,每一步都是对未知领域的探索,每一次突破都凝聚着无数科研人员的心血。那么,在您看来,未来的语音技术将会给我们带来哪些意想不到的变化呢?欢迎在评论区留下您的见解!那么,小伙伴们,你们认为未来的语音技术还会带来哪些变革?欢迎在评论区分享看法和想法!原创 2024-12-03 23:31:13 · 575 阅读 · 0 评论 -
ESP32 wifi smartConfig 配网时密码错误导致一直死循环问题解决
烧录程序后,debug打印“smartconfig_example: Scan done”信息后,打开手机app“EspTouch”进行配网,如果密码输入正确,增加计时器,从“EspTouch”app获取wifi名称和密码后,断开wifi连接,重新配置wifi后,启动计时器(1s中断),启动wifi连接。当密码错误程序进入上述循环后,此时用“EspTouch”再次进行配网时也无反应,无任何相关信息打印。任务,因此无法重复配网,需重启开发板。计时器中断时判断是否wifi连接成功,如果连接成功则停止计时器,原创 2024-11-28 15:13:14 · 538 阅读 · 0 评论 -
最全高质量 思维链数据集 ,大模型训练集(不定期更新)
思维链数据集是一种专门设计用于训练和评估人工智能模型在处理包含多种信息模态(如文本、图像、声音等)的复杂问题时的推理能力的数据集。这些数据集通常包含了丰富的多模态信息,以及对应的问题和答案,有时还包括了问题的解决过程或解释,以帮助模型学习如何结合不同模态的信息来解决问题。原创 2024-11-27 20:52:25 · 353 阅读 · 0 评论 -
poetry 更换 pip源 | HTTPSConnectionPool(host=‘files.pythonhosted.org‘, port=443): Read timed out的解决方法
poetry 默认使用官方镜像源下载,特别慢。换成国内源加快速度。原创 2024-09-27 00:33:06 · 1285 阅读 · 0 评论 -
Graph Clustering和Community Detection(附代码) 图谱
关于图聚类,我们有大量的算法可以帮助我们实现。有在度量空间内聚类的,有在图上聚类的;有聚成独立的类的,有聚成overlapping的类的。实际上,在我看来,用哪个都差不多。比如我们推荐的这篇通过聚类进而有针对性发广告的论文,把node建立在Graph上是OK的,建立在度量空间里也是很平凡的;聚类的时候用Markov算法聚成独立的类,推荐的结果是好的,假如聚成有重叠的类,推荐的结果也不会差。原创 2024-09-23 19:38:49 · 353 阅读 · 0 评论 -
3D人体骨架 骨骼关键点 面部关键点检测(mediapipe)代码开源 手把手
【代码】3D人体骨架 骨骼关键点 面部关键点检测(mediapipe)代码开源 手把手。原创 2024-09-23 19:31:50 · 245 阅读 · 0 评论 -
FACS丨面部表情编码系统1
可能大多数新人朋友听到这么个啥FACS编码系统都很陌生,其实对于行业内做动画的朋友应该是老生常谈的东西了,当然也有通过其他途径了解到的比如有通过Human Emoitions了解到的FACS,以及学习心理学专业朋友,或者你是个美剧爱好者同时恰好又看过(别对我撒谎&千谎百计),你一定对主角那流弊的通过面部微表情来施展“读心能力”印象深刻。当然了,相信关注咱公众号的老粉基本都是美术工作者,那么作为美术一样有了解这一块的必要,学习研究之后对创作一定更有帮助。所以我整理一堆资料,今天借此机会全部给到大家。原创 2024-09-22 00:31:18 · 458 阅读 · 0 评论 -
代码开源!人脸微表情 识别 face action unit facs Facial Action Coding System (FACS) – A Visual Guidebook
In this article, we have put together a visual guidebook to better showcase the power of the facial action coding system (FACS). All facial action units are presented with animations to give a first-hand understanding and valuable reference point in the fu原创 2024-09-20 03:28:03 · 444 阅读 · 0 评论 -
从openAI最新模型GPT-o1再谈思维链(Cot)技术,大模型该怎么提升其逻辑推理能力?
最近openAI发布了号称史上最强模型——o1,其具有强大的逻辑推理能力,号称能达到人类的博士生水平。而从o1模型的评测来看,o1模型在数学竞赛,编码,科学问答等方面表现良好,甚至高出了GPT4o一大截。而且,o1在物理,化学,生物,逻辑学等其它领域,相比GPT4o都得到了巨大的提升。而据介绍o1模型之所以具有如此强大的逻辑推理能力,就是因为使用了思维链技术;当然,目前官方并没有公布o1的核心技术理论,因此也不排除o1模型使用了其它更加强大的逻辑推理技术。原创 2024-09-19 22:14:02 · 748 阅读 · 0 评论 -
心理学量表汇总 50多个 附下载
目录一、心理健康与精神病态量表二、行为问题量表三、人格评估量表四、智力测验一、心理健康与精神病态量表1.一般症状自评量表(SCL-90)症状自评量表 (The self-report symptom inventory ,Symptom checklist ,90,简称 SCL90) 有 90 个评定项目 , 每个项目分五级评分 , 包含了比较广泛的精神病症状学内容, 从感觉、 情 感、思维、意识、行为直至生活习惯、人际关系、饮食等均有涉及,能准确刻划被试的自觉 症状,能较好地反映被试的问题及其严重程度和变原创 2024-09-10 14:51:56 · 681 阅读 · 0 评论 -
Android audioRecord 获取实时音频可视化
通过本文的介绍,我们了解到了如何使用Android的类来获取实时音频数据,并将其可视化展示。这不仅有助于我们更好地理解音频信号的特性,也为开发音频相关的应用提供了基础。希望本文的内容对您有所帮助,如果您有任何问题或建议,欢迎在评论区与我们交流。原创 2024-09-10 11:58:50 · 875 阅读 · 0 评论 -
迈向认知共情,华南理工团队全面开源心理咨询师数字孪生大模型SoulChat2.0
要实现特定的心理咨询师的数字孪生,前提是能获取该心理咨询师的大量咨询案例,但是这对于心理咨询师个体而言,难度极大。SoulChat2.0的推出,将为心理健康大模型领域带来新的研究思路:通过少量的真实咨询案例去进行心理咨询师数字孪生建模的方式,可以低成本、快速、高效地构建拥有特定心理咨询师语言风格与疗法技术的心理健康大模型,在谈话技术、状态与态度、情感共情、认知共情方面均有显著的性能提升,能很好地辅助真实世界心理咨询师展开心理咨询工作,例如执行这些咨询师的前置谈话,二十四小时的在线服务等等。原创 2024-09-10 02:17:43 · 356 阅读 · 0 评论 -
Github开源游戏集合
Below is a list of open source games and game-related projects that can be found on GitHub - old school text adventures, educational games, 8-bit platform games, browser-based games, indie games, GameJam projects, add-ons/maps/hacks/plugins for commercial原创 2024-09-09 13:40:31 · 2195 阅读 · 0 评论 -
分享6款文字语音生成驱动虚拟数字人说话的开源项目
对定性和定量结果的大量实验表明,我们的算法实现了高质量的照片真实感对话头部视频,包括根据语音节奏进行的各种面部表情和头部运动,并超过了最先进的水平。我们的系统包含三个阶段。当然,FACEGOOD Audio2face 部分也可根据自己的喜好进行重新训练,比如你想用自己的声音或其它类型的声音,或者不同于 FACEGOOD 使用的模型绑定作为驱动数据,都可以根据下面提到的流程完成自己专属的动画驱动算法模型训练。兼顾生成的韵律和外表的相似,除了面部,考虑到了头部的动作,虑了背景区域的artifact。原创 2024-09-08 19:35:25 · 1037 阅读 · 0 评论 -
史上最全知识图谱建模实践:本体结构与语义解耦
Root节点,代表“常识知识树”的根结点,在这棵概念树上,我们预定义了17种实体的分类体系,如“角色”、“物体与物品”、“组织机构”、“品牌”、“事件”都是一个“概念类型”(即一个分类体系的根结点),每个概念类型作为起点的子树,定义了对该类实体的语义细分,目前蚂蚁知识树上已经有超过2W+的节点。描述实体-实体间的关联。如果你的图谱,涉及对带有时空信息的行为事件的表达,或建模场景下的业务规则、专家经验,需要对所定义“概念”的内涵和外延有计算机可处理可计算的逻辑语义解释,高阶篇中有你所需知道的一切。原创 2024-08-29 20:46:34 · 675 阅读 · 0 评论 -
知识图谱基础(三)-schema的构建
简单来说,一个知识图谱的schema就是相当于一个领域内的数据模型,包含了这个领域里面有意义的概念类型以及这些类型的属性。任何一个域的schema主要由类型(type)和属性(property)来表达。图1是plantdata内的创投schema,主要是为了发掘一级市场的投资和融资构建的schema。该schema主要是去定义需求,哪些数据对创投有用,才往上构建,例如:人物都有身高、体重,但是这些数据对创投来说意义不大,在schema中就不用构建了。原创 2024-08-29 20:27:19 · 665 阅读 · 0 评论 -
Windows怎么让防火墙开放端口
选择网络,点击侦听端口,再防火墙状态中可以查看到端口是否被防火墙开放。先从控制面板,进入到Windows Defender防火墙。点击右边的新建规则,点击端口,点击下一步。点击性能,再点击右下方的打开资源监视器。选择协议类型和端口号点击下一步即可。点击高级设置,点击入站规则。原创 2024-08-29 17:51:59 · 2532 阅读 · 0 评论 -
python读取配置文件&&简单封装 公共配置文件 config
之前有做过把爬虫数据写到数据库中的练习,这次想把数据库信息抽离到一个ini配置文件中,这样做的好处在于可以在配置文件中添加多个数据库,方便切换(另外配置文件也可以添加诸如邮箱、url等信息)原创 2024-08-29 12:56:55 · 646 阅读 · 0 评论 -
Neo4j+Neovis+Vue3:前端连接数据库渲染
参考有些文章对labels的配置里的字段加了双引号“”,配置不需要双引号,而且prettier会报错。MATCH (n) return n返回的只有节点,不显示关系。最终效果图:鼠标滚动放大,节点可拖拽。使用以下语句查询关系。原创 2024-08-28 15:56:19 · 280 阅读 · 0 评论 -
利用api方式部署流式接口到nginx服务器,api无法流式输出,但localhost和ip可以的问题
【代码】利用api方式部署流式接口到nginx服务器,api无法流式输出,但localhost和ip可以的问题。原创 2024-08-26 02:33:51 · 669 阅读 · 0 评论 -
vue3版本中挂载axios(在main.js中配置全局axios)--以助于方便管理
而且如果端口变化,则每个文件的端口都要发生改变,这是我们不希望看到的,并且处理繁琐。如果不在main.js里面配置全局。可以在终端下载vue-axios。原创 2024-08-25 19:04:22 · 743 阅读 · 0 评论 -
Python Sqlite3以字典形式返回查询结果的实现方法
Python中使用sqlite3库操作SQLite数据库时,查询结果默认以元组的形式返回。但是,在实际开发中,我们有时候需要以字典的形式返回查询结果,以方便代码的编写和维护。本攻略将介绍如何使用PythonSqlite3以字典形式返回查询结果。本攻略介绍了如何在PythonSqlite3中以字典形式返回查询结果,涉及了开启row_factory属性、查询数据和处理数据三个方面。通过本攻略,你可以灵活地使用PythonSqlite3操作SQLite数据库,并方便地获取查询结果。原创 2024-08-25 13:28:23 · 613 阅读 · 0 评论 -
python markdown vuejs前端:如何正确处理多行字符串的缩进问题
你上下对比看看,会不会觉得非常疑惑,这明明就是一样的,为什么下面可以上面不行?其实很简单,因为你的Markdown文本有问题。,我发送一个txt文件过去,他首先帮我总结整个文件的内容,然后以问答的形式列出10个要点。这样一来,既兼顾了多行字符串的美观,又不会因为缩进导致Markdown渲染失败。但如果你直接这样写,你会发现Markdown的渲染好像出问题了。这可太丑了,要是被那些不喜欢Python缩进的人看到,又要被调侃了。注意到了吗,在函数里面定义多行字符串时,很容易把缩进带进来,导致。原创 2024-08-25 02:06:02 · 348 阅读 · 0 评论 -
梯子、翻墙、VPN导致接口出错,Nodejs和python 设置 openai 的API正向代理和反向代理入口链接连接方式,用于国内访问openAI接口
网址进行了屏蔽,因此需要科学上网或对API进行反向代理才能使用API接口,那么该怎么使用反向代理的API接口呢?由于国内对openai的。原创 2024-08-24 20:19:38 · 2337 阅读 · 0 评论 -
PowerShell 激活 activate 命令切换Python虚拟环境
但是在日常使用过程中,发现存在一个问题,windows激活虚拟环境的命令在cmd中可以正常使用,但是在。至此结束,重新开一个PowerShell就可以在其中正常使用activate来激活虚拟环境了。中使用就存在一些问题,总之无法正常运行.2.更改PowerShell设置。然后使用如下命令就可以激活。使用如下命令可以创建新的。原创 2024-08-24 02:33:16 · 695 阅读 · 0 评论 -
使用LlamaIndex中的Reli 进行实体链接和关系提取
此外,系统还识别出 “Tomaz ”与 “Diagram ”之间的关系,关系的特征是 “INTERESTED_IN”,表明 Tomaz 对图表感兴趣。如果你使用的是专业版,或将在更强大的本地计算机上使用,则可以测试 relik-ie/relik-cie-small 模型,该模型可执行实体链接和关系提取。通过微调较小的、针对特定任务的模型(如 Relik 框架中的模型),你可以为你的检索增强生成 (RAG) 应用程序实现高性能的信息提取。在本例中,模型识别出 “Tomaz ”和 “He ”指的是同一个实体。原创 2024-08-19 22:57:17 · 172 阅读 · 0 评论 -
Centos7的yum安装报错Error: Nothing to do
后,有时候yum不是最新的,最好安装完系统之后,更新一下yum源。由于安装完操作系统后,没有更新yum源,今天就碰到如下的错误。原创 2024-08-10 17:06:53 · 687 阅读 · 0 评论 -
Python中zip()、zip(*zipped)、*zip()的用法及区别
Python中zip()、zip(*zipped)、*zip()的用法及区别。原创 2024-08-09 19:53:17 · 223 阅读 · 0 评论 -
企业级RAG的数据方案选择 - 向量数据库、图数据库和知识图谱
一个向量数据库以向量格式存储和维护数据。当数据准备存储时,它被分成100到200个字符的块。然后,通过一个嵌入模型,这些块被转换为可以存储在向量数据库中的向量嵌入。向量数据库有很多用例,但从定义上来说,并不是RAG的完整基础。大多数向量数据库并不提供嵌入模型,因此公司通常需要找到并集成一个嵌入模型,才能将向量数据库用作他们的基础。向量数据库的特性也因所使用的算法而异。向量数据库使用KNN(K最近邻)或ANN(近似最近邻)算法,每种算法对任何搜索和检索特性的最终结果都有不同的影响。原创 2024-08-09 09:16:17 · 383 阅读 · 0 评论 -
彻底搞懂LangGraph深入浅出
**Chain(链)**是LangChain中最核心的概念之一(看名字就知道)。简单的说,就是把自然语言输入、关联知识检索、Prompt组装、可用Tools信息、大模型调用等这些LLM 应用中的常见动作,组装成一个可以运行的“链”式过程。链可以直接调用,也可以用来进一步构建更强大的Agen原创 2024-08-09 08:41:36 · 697 阅读 · 0 评论 -
Vector | Graph:蚂蚁首个开源Graph RAG框架设计解读
RAG的目标是通过知识库增强内容生成的质量,通常做法是将检索出来的文档作为提示词的上下文,一并提供给大模型让其生成更可靠的答案。更进一步地,RAG的整体链路还可以与提示词工程(Prompt Engineering)、模型微调(Fine Tuning)、知识图谱(Knowledge Graph)等技术结合,构成更广义的RAG问答链路。增强训练REALM引入了知识检索器增强大模型预训练,以改进大模型的问答质量和可解释性。增强微调RA-DIT实现了对大模型和检索器的双指令微调,RAFT。原创 2024-08-09 08:34:37 · 893 阅读 · 0 评论 -
ECCV 2024 | 数字人也懂惯性定律!上海AI Lab团队提出3D人体姿态序列建模 人体建模 多图3d建模
与现有数据集着装相比,我们为被试者穿上宽松的服装,如连衣裙和轻便外套,并进行复杂的加减速运动,如旋转后的突然停止、摆动和袖子的挥动。在网络设计上,也许输入的 SMPL 单帧姿态相同,但当外表不同时,往往意味着一段时间前的 SMPL 姿态序列不同,因此将姿态序列作为输入更能让网络感知到惯性。事实上,不同的速度和加速度模式下,人体在相同姿态下外表均会有不同程度的惯性表现,这是现有的人体 NeRF 无法理解的。因此,仅依赖单帧 SMPL 模型姿态的建模仍然存在固有的外表歧义,无法充分理解衣料的外表变化。原创 2024-07-31 15:35:22 · 268 阅读 · 0 评论 -
从多张图片重建3D模型(瞎七瞎八写了好多)
其实文章虽然写了很长,但并不能把我这两个多月所有的全部写进去,由于时间很短,我对三维重建这块的原理也是一知半解,所以,有疏漏有错误以及各种各种不好的地方,希望大家指出多多包涵。而且会遇到各式各样的问题。(这是一篇关于opencv3.1+contrib的配置大总结,里面有遇到的各式各样的问题,还有安装教程博客的推荐,以及作者自己编译好的半永久配置文件,特别好,我配置了三天,失败无数次,实属无奈,最后用的还是作者的半配置文件,但不知是我前一个配置的成功还是作者的半配置文件,反正吧,最后成功了,笔芯,强推!原创 2024-07-31 15:13:28 · 397 阅读 · 0 评论 -
fastapi swagger文档无法渲染问题
在app生效之前,将生成swagger文档的方法替换掉.(在fastapi为:fastapi.openapi.docs.get_swagger_ui_html)原创 2024-07-23 03:44:22 · 408 阅读 · 0 评论