- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 Deepseek-V3如何通过蒸馏技术从R1提取推理能力?
蒸馏技术是一种模型压缩和知识迁移的方法,核心思想是让一个小模型(学生模型)学习一个大模型(教师模型)的能力,从而提升自身的性能。• 传统的训练方法是直接用数据训练模型,而蒸馏技术则是让学生模型模仿教师模型的行为。• 具体来说,教师模型的输出不仅包括最终的预测结果,还包括中间的特征信息、概率分布等,这些信息能帮助学生模型学习更细腻的知识。
2025-02-19 10:22:11
863
原创 OSGI和Maven结合
1、创建项目创建一个maven项目,并在该项目下创建两个maven module,一个为server,令一个为clientserver为发布服务的bundle,client为使用服务的bundle2、代码实现与之前的helloworld一样,写代码server中定义接口,接口的实现类,实现BundleActivator的类(发布服务)client中,实现BundleActivator的类(使用服务)结构如下:server模块IHelloWorld接口..
2020-10-27 14:55:44
1038
原创 SpringMVC发布不到Tomcat、无法访问、无法访问Controller层
第一次在MyEclipse上创建SpringMVC,我的这个过程真的是坎坷啊!接下来,我就说说我遇到的所有问题以及解决方法,希望对初次接触SpringMVC、创建SpringMVC项目出问题的朋友能有帮助首先是创建项目,这个就不说了,如果创建项目都不会,那请你先看看其他文章,但是要注意一点Packaging一定是选择war。项目创建好后,我遇到的第一个问题就是在tomcat,add项目...
2019-07-10 17:49:15
2853
2
原创 Java实现栈、队列
栈:先进后出队列:先进先出栈1.栈的基本概念1.什么是栈栈是限制插入和删除只能在一个位置上进行的表,该位置是表的末端,叫作栈的顶(top)。2.对栈的基本操作进栈:push(相当于插入)出栈:pop(删除最后插入的元素)2.用数据来具体实现栈/** * 栈的结构: * 1.boolean push(E data):入栈 * 2.E pop()...
2019-05-14 10:11:17
129
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人