- 博客(7)
- 收藏
- 关注
原创 数据结构学习总结
:数据结构 = “如何组织数据” + “如何高效操作数据”,是编程和算法的基础。逻辑结构 其实就是数据的概念并没有落实到计算机上。存储结构 才是真正记录数据在计算机上如何存储的。
2025-07-24 19:12:00
272
原创 考研数学线性代数行列式的性质
交换行列式中的两行(或两列)会使行列式的符号发生改变,即 \text{det}(A) = -\text{det}(A’),其中 A’是将 A 中的两行(或两列)交换后的矩阵。:如果矩阵的某一行(或某一列)乘以一个标量 k,那么行列式的值会乘以 k,即 \text{det}(kA) = k \cdot \text{det}(A)。我们可以看到,行列式的值变为原来的 3 倍,符合行列式与标量乘积的性质:\text{det}(B) = 3 \cdot \text{det}(A)。
2025-07-22 18:46:01
1047
原创 探索 TF‑IDF:语义搜索与文本分析核心技术详解
TF‑IDF 是一种快速、可解释的文本特征方法,适用于检索、关键词提取与初步分析。将 TF 与 IDF 相乘可得到 TF‑IDF 值:TF‑IDF(t, d, D) = TF(t, d) × IDF(t, D):衡量一个词在语料库中多常见,用来降低那些出现在多数文档中的普通词的权重。公式:TF(t, d) = 词 t 在文档 d 中出现次数 ÷ 文档总词数。公式:IDF(t, D) = log(N ÷ df(t)):衡量一个词在文档中出现的频率,代表文档内该词的重要性。
2025-07-15 00:16:00
716
原创 RAG 初学线路
**学习模块** | **传统ML/DL路径** | **RAG开发高效路径** || **Pinecone** | 云向量数据库 | 部署生产级检索服务 || **FAISS** | 本地向量存储 | 相似度搜索、索引构建 || **RAGAs** | RAG系统评估 | 测试答案相关性、事实准确性 |
2025-07-12 00:51:43
402
原创 深入学习 RAG:从原理到多模态实战全攻略
使用双塔模型(Query Encoder + Document Encoder),对比学习训练,确保相关向量距离更近()。它在回答问题前先“检索”相关知识,再由模型“生成”回答,从而实现对话准确、减少捏造信息(hallucination)。生成质量评测:BLEU、ROUGE、ROUGE-L、人工评估真实性(faithfulness)。基于 Seq2Seq 架构(如 BART、T5、GPT)接收带上下文的 prompt 生成回答。扩展模型支持图文、音频、表格等向量检索。
2025-07-11 18:19:44
1204
原创 ChatGPT 技术核心:模型结构、能力差异与实战价值
GPT‑4o mini:只需输入 $0.15,输出 $0.60 / 1M tokens。GPT‑4o:快两倍、成本大幅下降($2.50/$10 per 1M tokens)GPT‑4:慢、成本高(~ $60+ / 1M tokens)使用 GPT‑4o 协助生成、审查、翻译代码,提高开发效率。GPT‑4o 使用融合结构,支持文字、图像、音频直接输入。GPT‑4o:支持文字、图像、音频、视频输入与语音输出()GPT‑4o:延续 GPT‑4 规模,优化多模态处理。(2023 年末 / 2025 年 2 月)
2025-07-10 14:31:03
1977
原创 装箱拆箱总结
知识点总结装箱值类型转引用类型,涉及堆内存分配拆箱引用类型转值类型,涉及类型检查与拷贝性能影响装箱拆箱大量使用会导致内存和CPU消耗解决方法尽可能使用泛型,避免装箱。
2025-05-06 18:22:11
355
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅