- 博客(1037)
- 资源 (1)
- 收藏
- 关注
原创 告诸位技术同胞大佬!!!
近日,发现其他网站大量复制粘贴我这里的博文,既不注明原文链接,也没有注明作者,这样的网站毫无底线,完全是流氓网站。鉴于这种情况的出现,本人今天以后的博文全部只能粉丝可见。下面我要挨个投诉,申诉,直到删除复制的我的博文,不限于起诉维权,反正一无所有,咱就死磕到底!!!For Video Recommendation in Deep learning QQ Group 277356808For Speech, Image, Videoin deep learning ...
2020-06-05 10:12:14
1347
1
原创 MongoDB 是关系型数据库吗?
选择关系型数据库当你的数据结构非常稳定,需要复杂的跨表查询和 JOIN 操作,并且业务对事务一致性要求极高(如银行系统)。选择MongoDB 这类非关系型数据库当你的数据结构多变,需要快速迭代,数据模型是半结构化或无结构化的,并且应用需要大规模水平扩展(如社交网络、日志系统)。
2025-10-17 13:27:55
764
原创 flutter 详细解读
Flutter 是由 Google 开发的一款开源 UI 软件开发工具包,用于构建跨平台的高性能应用程序。它最初发布于 2017 年,现已成为构建 iOS、Android、Web、桌面(Windows、macOS、Linux)甚至嵌入式设备应用的流行选择。
2025-09-28 18:03:53
1570
原创 Installed Build Tools revision 36.1.0 is corrupted. Remove and install again using the SDK Manager.
问题原因从 31.0.0 开始,Google 把构建脚本里调用的换成了,但旧版 Gradle 插件默认仍去找 dx,于是报解决思路要么(最快),要么让它直接用 d8。下面给出 3 套方案,按喜好挑一条即可。
2025-09-28 15:39:50
740
原创 安卓手机能跑的2048App
的 Android 2048 源码(原生 Java,Android Studio 工程)。复制代码 → Run → 手机里就多了一个图标为“2048”的 App,祝你玩得开心!用 Studio 自动生成的即可,只需确认入口 Activity 是。代码全部写在一个文件里,复制即可编译,无任何第三方库依赖。插真机 → 打开 USB 调试 → 选自己的手机 → OK。—— 这就是可任意分发的安装包,发给朋友、上传酷安均可。安装 Android Studio(最新稳定版即可)。,在安卓真机/模拟器都能跑。
2025-09-28 10:19:39
458
原创 某场景检索优化初步探讨
json# 创建索引:指定dense_vector类型,相似度算法为cosine"doc_embedding": { # 文档向量字段"dims": 768, # 向量维度(与模型输出一致,如BERT-base输出768维)"similarity": "cosine" # 语义检索优先用cosine},"doc_content": { # 文档原文(用于后续重排序或结果展示)优化环节核心动作示例场景(医疗文献检索)向量生成优化。
2025-09-26 14:48:09
213
原创 kauditd0 病毒/挖矿程序完全清除方法初试
整个处理过程最好在断网的情况下进行,以防病毒与控制服务器通信。完成所有步骤后,重启服务器并再次使用top命令确认CPU/GPU使用率是否已恢复正常。✅ 紧急必做:SSH密钥登录 + 改端口 + 防火墙白名单。✅ 系统加固:更新系统 + 安装Fail2ban + 权限最小化。✅ 持续监控:定期检查进程/端口 + 查看日志 + 安全扫描。最重要的一点安全是一个持续的过程,而非一劳永逸的设置。养成定期查看日志和系统状态的习惯,是守护服务器安全最关键的一环。
2025-09-26 11:31:45
777
原创 function call 的用法初步
运行后,程序会输出每个查询中提取到信息,如果某个信息不存在则会显示为 None。这种方式相比直接文本提取更加可靠,尤其是在处理复杂句式时。将代码中的 "your_api_key_here" 替换为你的实际 OpenAI API 密钥,或者设置环境变量。通过 OpenAI 的 function call 机制,模型会分析用户查询并自动调用上述函数,返回结构化的结果。代码包含了多个测试案例,展示了不同情况下的信息提取效果。函数,用于结构化存储提取到的信息。
2025-09-19 08:45:00
73
原创 符合openai库要求的大模型请求
请注意保护好你的 API 密钥,不要在公开代码中泄露。如果是在生产环境中使用,建议通过环境变量等方式安全地管理 API 密钥。替换为你实际的 OpenAI API 密钥,你可以在 OpenAI 官网的个人账号中获取。模型,这是 OpenAI 提供的一个高效且成本较低的模型,你也可以根据需要替换为其他模型如。替换为你实际的 OpenAI API 密钥。来存储你的密钥,避免直接在代码中硬编码。在使用前,你需要将代码中的。然后在系统中设置环境变量。
2025-09-19 08:30:00
64
原创 function call进阶使用之多功能函数调用
并替换 API 密钥。代码会根据输入自动选择合适的函数组合,返回清晰的结构化提取结果。运行前请确保安装了 openai 库(
2025-09-18 14:50:05
298
2
原创 网页抓取mcp复盘记录
大模型是 “参数规模大、训练数据多、泛化能力强” 的语言模型的统称。参数规模:通常以 “亿” 或 “千亿” 为单位(如 GPT-3 有 1750 亿参数,入门级模型如 DistilGPT2 约 6 亿参数);数据驱动:通过海量文本数据(如书籍、网页、论文)学习语言规律,无需人工标注特定任务;涌现能力:当规模达到阈值后,会自发具备逻辑推理、多轮对话、代码生成等复杂能力。大模型入门的核心是 “先实践后原理”:通过 Hugging Face 工具栈快速调用预训练模型,感受大模型的能力;
2025-09-17 14:01:50
72
原创 大模型入门实践指南
大模型是 “参数规模大、训练数据多、泛化能力强” 的语言模型的统称。参数规模:通常以 “亿” 或 “千亿” 为单位(如 GPT-3 有 1750 亿参数,入门级模型如 DistilGPT2 约 6 亿参数);数据驱动:通过海量文本数据(如书籍、网页、论文)学习语言规律,无需人工标注特定任务;涌现能力:当规模达到阈值后,会自发具备逻辑推理、多轮对话、代码生成等复杂能力。大模型入门的核心是 “先实践后原理”:通过 Hugging Face 工具栈快速调用预训练模型,感受大模型的能力;
2025-09-14 22:39:19
584
原创 声反馈问题产生的原因及解决方法初探
我依旧记得之前参加一个讲座报告,问那个教授声反馈问题如何解决,他竟然没有听过啥叫声反馈,这么常见问题,在手机端很容易复现这个问题,他竟然不知道。所以我还是觉得实践也是很重要的!仅此。跟进参考2,放手机上打开即可复现声反馈问题(howling),非常明显,回声消除根本去不掉。目前市面上的某某会议都有这种情况,都没去掉,参加会议的主持人还会让你关闭麦克风,只能一个人讲,其他人听,不能很多人一起讲。世界难题。好问题!👏 你已经发现了一个 WebRTC 在真实场景里在里,通常就能很好地抑制播放→录音的回声。
2025-09-12 08:30:00
944
原创 回声消除的产生的原因与实验
是 WebRTC 的经典应用场景之一。场景是:设备既能播放声音(扬声器/喇叭),又能录制声音(麦克风),但我们不想录制到自己刚刚播放的声音,只想保留“真实外部声音”(比如讲话的声音)。WebRTC 内置的 AEC 算法就是用来解决这种“扬声器-麦克风环路”。
2025-09-12 08:15:00
271
原创 回声消除AEC初探
那段保留即可——在播放期间把麦克风关闭(软件层面的 mute),同样能根除回声,只是会失去“一句话期间仍能捕获背景噪声”的能力。如果还有更细节的需求(比如多语言 TTS、实时流式 ASR),欢迎继续交流。的完整示例,可直接拷贝、改造、集成到你现有的 LLM‑TTS 对话系统中。实际效果取决于用户设备的硬件与驱动,若仍有回声,可让用户佩戴。把扬声器信号(把播放音频拷贝给 AEC)从麦克风流中减去。:TTS 播放的声音被同一个麦克风再次捕获,导致声学回声。三种实现示例,帮助你快速落地。,几乎可以消除所有回声。
2025-09-10 22:00:00
301
原创 flashAttention的原理及应用详解
如果你有特定的模型/硬件/序列长度与 batch 配置,我可以给出更针对性的开启方式与预期加速比建议,或者帮你把现有的 MultiheadAttention 模块替换为 SDPA/flash-attn 的落地代码。注:PyTorch 的 SDPA “flash” 后端并不是简单地把 Tri Dao 仓库塞进去,而是以相同思想实现/集成的内核;一图理解内存收益(以 B=1, H=16, L=4096, dtype=fp16 为例)示例(打包 QKV 的形式,形状为 B,L,3,H,D;
2025-09-10 08:15:00
265
原创 deepseed 加速训练的ZeRO 2/3
如果你有特定模型(如 HuggingFace Transformers)需要接入,我可以给你对应的命令行与脚本改造点(例如 activation checkpointing、gradient checkpoint、TP/PP 组合等)。在 rank 1 节点把 NODE_RANK=1 即可。二、准备 DeepSpeed 配置。你可以直接复制到工程目录试跑。三、训练脚本(最小可跑)
2025-09-09 08:45:00
327
原创 Constant-length packing 常长打包
在Transformer Reinforcement Learning(TRL)框架中,是一种优化训练数据处理的策略,主要用于SFT微调阶段。其核心思想是将输入序列固定为特定长度,以减少内存占用并提升训练效率。
2025-09-09 08:30:00
60
原创 MCP(Model Context Protocol)与大模型一起运用
三、端到端示例:自建 MCP 服务器 + 用 OpenAI 工具调用桥接。四、把你的 MCP 服务器接入现成客户端(无需写桥)如果你只想直接跑起来,可以从“端到端示例”开始。一、MCP 是什么(和 LLM 为何要一起用)
2025-09-05 15:06:32
160
原创 图片网页能打开但是程序获取不到?
原理:把 urllib3 的 TLS 指纹伪装成 Chrome114,CDN 一看「哦,是浏览器」,立刻放行。一、问题本质 errno 54 是 TLS/HTTP 指纹被 CDN 拉黑,带再多 header 也无效。三、终极代码(带重试、UA、Referer、Cookie、HTTP/2、浏览器 TLS 指纹)方案 C:临时应急(不想装库) 把链接丢到「免 CDN 代理」再下,例如:【试了没啥球用】方案 A:换「浏览器级」TLS 指纹(零依赖,3 行代码)结论 errno 54 就是「TLS 指纹」被拉黑,
2025-09-05 14:40:12
152
原创 SCRM与SaaS的区别
SCRM 可以是 SaaS 的,也可以是本地部署的;但 SaaS 不一定是 SCRM,它可以是 CRM、ERP、OA、财务系统等等。如果你有具体场景,比如“我想买 SCRM,但不知道是选 SaaS 还是本地部署”,我可以帮你分析利弊。
2025-09-04 17:02:02
355
原创 node.js 安装步骤
在Node.js中安装包通常通过npm(Node Package Manager)来完成,这是Node.js的包管理工具。
2025-08-29 16:51:15
246
2
原创 java IDE安装idea社区版步骤
IntelliJ IDEA 社区版(Community Edition)是一款功能强大且的集成开发环境,非常适合 Java 和 Kotlin 初学者或进行基础开发2。我会为你提供详细的安装步骤。
2025-08-25 09:27:19
1351
原创 logger级别及大小
级别选择生产环境:通常使用INFO或WARN。测试/预发布环境:可以使用DEBUG来排查问题。开发环境:可以使用DEBUG或TRACE。大小管理必须配置滚动策略,绝不能放任日志无限增长。根据应用日志量和磁盘空间,合理设置(如100MB-1GB)和maxHistory(如保留7-30天)。设置作为最后的安全网,防止误算导致磁盘爆满。日志清理推荐使用日志框架自带的maxHistory和机制自动删除旧日志,而不是依赖外部Cron作业,这样管理更清晰、更可靠。
2025-08-21 14:03:13
797
原创 docker-compose启动与重启loki
你的需求应使用的命令简单重启 Loki,应用最新配置快速重启 Loki(配置未改变)停止 Loki停止所有服务并清理启动所有服务查看运行状态重要提醒:请确保你的文件中为 Loki 配置了数据持久化(例如使用了volumes),否则重启或重建容器可能会导致历史日志数据丢失。
2025-08-21 10:28:56
113
1
原创 wrong fs type,bad option, bad superblock on /dev/sdb,I missing codepage or helper program, or other
确认设备,看/dev/sdb是否存在及其文件系统类型。检查挂载点:确认/data2目录已创建且有合适权限。尝试自动挂载。尝试修复:如果自动挂载失败,运行。检查驱动:如果是特殊文件系统(如NTFS),安装对应驱动(如ntfs-3g考虑格式化:如果是新盘,备份数据后用格式化。检查硬件:最后一步,怀疑硬件问题,用smartctl检查或换电脑测试。请根据你的实际情况,谨慎选择上述步骤进行操作。继续排查:这是一个非常重要的步骤,尤其是在进行任何修复或格式化操作之前,确认磁盘内是否有数据可以避免灾难性的数据丢失。
2025-08-20 16:23:57
330
原创 使用 mongosh 设置 MongoDB 账号密码
可以使用mongosh(MongoDB 6.0+ 的现代Shell)来设置账号密码。mongosh是官方推荐的新一代MongoDB Shell工具,替代了传统的mongo命令。【本人博文提到的ip均为随机生成的,不是实际的ip,仅供参考,如有雷同,纯属巧合】
2025-08-20 11:23:26
671
1
原创 [Errno 111] Connection refused (configured timeouts: socketTimeoutMS: 20000.0ms, connectTimeoutMS: 2
这个错误表明你的应用程序无法连接到远程 MongoDB 服务器。
2025-08-20 11:04:14
372
原创 怎么确定mongodb是不是链接上了?
现有mongosh链接了MongoDB,里面能操作,但是想python进行链接,因为代码需要,现在测试下链接成功了没有。
2025-08-20 10:49:12
226
原创 AttributeError: module ‘pkgutil‘ has no attribute ‘ImpImporter‘. Did you mean: ‘zipimporter‘?
这个错误表明您环境中的pip版本与 Python 3.12 不兼容。
2025-08-18 17:26:36
365
原创 Redis 客户端安装方法
sudo yum install redis -y # 包含redis-cli。# 或从源码安装(与服务器安装步骤相同,只需编译redis-cli)注意:生产环境建议使用最新稳定版本,并参考官方安全指南。bind 127.0.0.1 # 只允许本地访问。# 带密码连接(如果设置了密码)下载对应平台的安装包安装。# 连接本地Redis。下载对应平台的安装包。
2025-08-18 14:45:46
257
1
原创 redis客户端安装方法
redis-cli ping # 应返回 PONG。make test # 可选测试。# 下载源码(替换为最新版本号)# 创建redis用户。
2025-08-18 14:20:41
313
2
原创 链接本地redis方法
场景命令示例基础连接redis-cli带密码连接指定端口命令行执行操作检查服务状态⚠️安全提示:生产环境避免使用KEYS *(可能阻塞服务),建议用SCAN替代。
2025-08-18 14:18:16
182
requirements.txt of the stable-diffusion-webui
2023-07-19
stable-diffusion-webui启动文件
2023-07-19
stable-diffusion-webui安装包,亲测有效
2023-07-19
stable-diffusion-webui启动文件launch.py
2023-07-19
diel-data数据集,用来实验与验证GCN模型的,推荐算法中的GCN模型,当然也是最初的分类模型
2023-06-22
Avazu推荐算法必备数据集,无论是召回还是排序都是必备的数据集
2023-06-22
cora-v2数据集,用于推荐算法中的GCN进行测试
2023-06-22
python库peft安装包
2023-05-05
用于NLP预训练模型的微调,应用场景包括language model 和text generation 自然语言处理必备资源
2023-02-14
attention is all you need解读及pytorch代码
2022-12-06
gcn/gat模型中预处理数据用的脚本 如何把数据整成gcn/gat模型需要的数据格式 process
2022-12-06
sample_movielens_ratings.txt
2022-09-17
点击日志数据如何按照两列排序
2022-09-19
spark-sql如何按用户对time排序,序号为新增的一列
2022-09-21
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅