还不懂Spring Boot启动原理的话,一定要看看!

我们开发任何一个Spring Boot项目,都会用到如下的启动类

@SpringBootApplication
public class Application {
    public static void main(String[] args) {
        SpringApplication.run(Application.class, args);
    }
}

从上面代码可以看出,Annotation定义(@SpringBootApplication)和类定义(SpringApplication.run)最为耀眼,所以要揭开SpringBoot的神秘面纱,我们要从这两位开始就可以了。


一、SpringBootApplication背后的秘密

@SpringBootApplication注解是Spring Boot的核心注解,它其实是一个组合注解:

@Target(ElementType.TYPE)
@Retention(RetentionPolicy.RUNTIME)
@Documented
@Inherited
@SpringBootConfiguration
@EnableAutoConfiguration
@ComponentScan(excludeFilters = {
        @Filter(type = FilterType.CUSTOM, classes = TypeExcludeFilter.class),
        @Filter(type = FilterType.CUSTOM, classes = AutoConfigurationExcludeFilter.class) })
public @interface SpringBootApplication {
...
}

虽然定义使用了多个Annotation进行了原信息标注,但实际上重要的只有三个Annotation:

  • @Configuration@SpringBootConfiguration点开查看发现里面还是应用了@Configuration

  • @EnableAutoConfiguration

  • @ComponentScan

@SpringBootApplication = (默认属性)@Configuration + @EnableAutoConfiguration + @ComponentScan

所以,如果我们使用如下的SpringBoot启动类,整个SpringBoot应用依然可以与之前的启动类功能对等:

@Configuration
@EnableAutoConfiguration
@ComponentScan
public class Application {
    public static void main(String[] args) {
        SpringApplication.run(Application.class, args);
    }
}

每次写这3个比较累,所以写一个@SpringBootApplication方便点。接下来分别介绍这3个Annotation。

1、@Configuration

这里的@Configuration对我们来说不陌生,它就是JavaConfig形式的Spring Ioc容器的配置类使用的那个@Configuration,SpringBoot社区推荐使用基于JavaConfig的配置形式,所以,这里的启动类标注了@Configuration之后,本身其实也是一个IoC容器的配置类。

举几个简单例子回顾下,XML跟config配置方式的区别:

(1)表达形式层面

基于XML配置的方式是这样:

<?xml version="1.0" encoding="UTF-8"?>
<beans xmlns="http://www.springframework.org/schema/beans"
       xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
       xsi:schemaLocation="http://www.springframework.org/schema/beans http://www.springframework.org/schema/beans/spring-beans-3.0.xsd"
       default-lazy-init="true">
    <!--bean定义-->
</beans>

而基于JavaConfig的配置方式是这样:

@Configuration
public class MockConfiguration{
    //bean定义
}

任何一个标注了@Configuration的Java类定义都是一个JavaConfig配置类。

(2)注册bean定义层面

基于XML的配置形式是这样:

<bean id="mockService" class="..MockServiceImpl">
    ...
</bean>

而基于JavaConfig的配置形式是这样的:

@Configuration
public class MockConfiguration{
    @Bean
    public MockService mockService(){
        return new MockServiceImpl();
    }
}

任何一个标注了@Bean的方法,其返回值将作为一个bean定义注册到Spring的IoC容器,方法名将默认成该bean定义的id。

(3)表达依赖注入关系层面

为了表达bean与bean之间的依赖关系,在XML形式中一般是这样:

<bean id="mockService" class="..MockServiceImpl">
   <propery name ="dependencyService" ref="dependencyService" />
</bean>
<bean id="dependencyService" class="DependencyServiceImpl"></bean>

而基于JavaConfig的配置形式是这样的:

@Configuration
public class MockConfiguration{
    @Bean
    public MockService mockService(){
        return new MockServiceImpl(dependencyService());
    }

    @Bean
    public DependencyService dependencyService(){
        return new DependencyServiceImpl();
    }
}

如果一个bean的定义依赖其他bean,则直接调用对应的JavaConfig类中依赖bean的创建方法就可以了。

@Configuration:提到@Configuration就要提到他的搭档@Bean。使用这两个注解就可以创建一个简单的spring配置类,可以用来替代相应的xml配置文件。

<beans> 
    <bean id = "car" class="com.test.Car"> 
        <property name="wheel" ref = "wheel"></property> 
    </bean> 
    <bean id = "wheel" class="com.test.Wheel"></bean> 
</beans>

相当于:

@Configuration 
public class Conf { 
    @Bean 
    public Car car() { 
        Car car = new Car(); 
        car.setWheel(wheel()); 
        return car; 
    }

    @Bean 
    public Wheel wheel() { 
        return new Wheel(); 
    } 
}

@Configuration的注解类标识这个类可以使用Spring IoC容器作为bean定义的来源。

@Bean注解告诉Spring,一个带有@Bean的注解方法将返回一个对象,该对象应该被注册为在Spring应用程序上下文中的bean。

2、@ComponentScan

@ComponentScan这个注解在Spring中很重要,它对应XML配置中的元素,@ComponentScan的功能其实就是自动扫描并加载符合条件的组件(比如@Component@Repository等)或者bean定义,最终将这些bean定义加载到IoC容器中。

我们可以通过basePackages等属性来细粒度的定制@ComponentScan自动扫描的范围,如果不指定,则默认Spring框架实现会从声明@ComponentScan所在类的package进行扫描。

注:所以SpringBoot的启动类最好是放在root package下,因为默认不指定basePackages。

3、@EnableAutoConfiguration

个人感觉@EnableAutoConfiguration这个Annotation最为重要,所以放在最后来解读,大家是否还记得Spring框架提供的各种名字为@Enable开头的Annotation定义?比如@EnableScheduling、@EnableCaching、@EnableMBeanExport等,@EnableAutoConfiguration的理念和做事方式其实一脉相承,简单概括一下就是,借助@Import的支持,收集和注册特定场景相关的bean定义。

@EnableScheduling是通过@Import将Spring调度框架相关的bean定义都加载到IoC容器。
@EnableMBeanExport是通过@Import将JMX相关的bean定义加载到IoC容器。
@EnableAutoConfiguration也是借助@Import的帮助,将所有符合自动配置条件的bean定义加载到IoC容器,仅此而已!

@EnableAutoConfiguration会根据类路径中的jar依赖为项目进行自动配置,如:添加了spring-boot-starter-web依赖,会自动添加Tomcat和Spring MVC的依赖,Spring Boot会对Tomcat和Spring MVC进行自动配置。

@EnableAutoConfiguration作为一个复合Annotation,其自身定义关键信息如下:

@SuppressWarnings("deprecation")
@Target(ElementType.TYPE)
@Retention(RetentionPolicy.RUNTIME)
@Documented
@Inherited
@AutoConfigurationPackage
@Import(EnableAutoConfigurationImportSelector.class)
public @interface EnableAutoConfiguration {
    ...
}

其中,最关键的要属@Import(EnableAutoConfigurationImportSelector.class),借助EnableAutoConfigurationImportSelector,@EnableAutoConfiguration可以帮助SpringBoot应用将所有符合条件的@Configuration配置都加载到当前SpringBoot创建并使用的IoC容器。就像一只“八爪鱼”一样,借助于Spring框架原有的一个工具类:SpringFactoriesLoader的支持,@EnableAutoConfiguration可以智能的自动配置功效才得以大功告成!

自动配置幕后英雄:SpringFactoriesLoader详解

SpringFactoriesLoader属于Spring框架私有的一种扩展方案,其主要功能就是从指定的配置文件META-INF/spring.factories加载配置。

public abstract class SpringFactoriesLoader {
    //...
    public static <T> List<T> loadFactories(Class<T> factoryClass, ClassLoader classLoader) {
        ...
    }


    public static List<String> loadFactoryNames(Class<?> factoryClass, ClassLoader classLoader) {
        ....
    }
}

配合@EnableAutoConfiguration使用的话,它更多是提供一种配置查找的功能支持,即根据@EnableAutoConfiguration的完整类名org.springframework.boot.autoconfigure.EnableAutoConfiguration作为查找的Key,获取对应的一组@Configuration类。

image

上图就是从SpringBoot的autoconfigure依赖包中的META-INF/spring.factories配置文件中摘录的一段内容,可以很好地说明问题。

所以,@EnableAutoConfiguration自动配置的魔法骑士就变成了:从classpath中搜寻所有的META-INF/spring.factories配置文件,并将其中org.springframework.boot.autoconfigure.EnableutoConfiguration对应的配置项通过反射(Java Refletion)实例化为对应的标注了@Configuration的JavaConfig形式的IoC容器配置类,然后汇总为一个并加载到IoC容器。


二、深入探索SpringApplication执行流程

SpringApplication的run方法的实现是我们本次旅程的主要线路,该方法的主要流程大体可以归纳如下:

1) 如果我们使用的是SpringApplication的静态run方法,那么,这个方法里面首先要创建一个SpringApplication对象实例,然后调用这个创建好的SpringApplication的实例方法。在SpringApplication实例初始化的时候,它会提前做几件事情:

  • 根据classpath里面是否存在某个特征类org.springframework.web.context.ConfigurableWebApplicationContext来决定是否应该创建一个为Web应用使用的ApplicationContext类型。

  • 使用SpringFactoriesLoader在应用的classpath中查找并加载所有可用的ApplicationContextInitializer

  • 使用SpringFactoriesLoader在应用的classpath中查找并加载所有可用的ApplicationListener

  • 推断并设置main方法的定义类。

2) SpringApplication实例初始化完成并且完成设置后,就开始执行run方法的逻辑了,方法执行伊始,首先遍历执行所有通过SpringFactoriesLoader可以查找到并加载的SpringApplicationRunListener。调用它们的started()方法,告诉这些SpringApplicationRunListener,“嘿,SpringBoot应用要开始执行咯!”。

3) 创建并配置当前Spring Boot应用将要使用的Environment(包括配置要使用的PropertySource以及Profile)。

4) 遍历调用所有SpringApplicationRunListenerenvironmentPrepared()的方法,告诉他们:“当前SpringBoot应用使用的Environment准备好了咯!”。

5) 如果SpringApplication的showBanner属性被设置为true,则打印banner。

6) 根据用户是否明确设置了applicationContextClass类型以及初始化阶段的推断结果,决定该为当前SpringBoot应用创建什么类型的ApplicationContext并创建完成,然后根据条件决定是否添加ShutdownHook,决定是否使用自定义的BeanNameGenerator,决定是否使用自定义的ResourceLoader,当然,最重要的,将之前准备好的Environment设置给创建好的ApplicationContext使用。

7) ApplicationContext创建好之后,SpringApplication会再次借助Spring-FactoriesLoader,查找并加载classpath中所有可用的ApplicationContext-Initializer,然后遍历调用这些ApplicationContextInitializerinitialize(applicationContext)方法来对已经创建好的ApplicationContext进行进一步的处理。

8) 遍历调用所有SpringApplicationRunListenercontextPrepared()方法。

9) 最核心的一步,将之前通过@EnableAutoConfiguration获取的所有配置以及其他形式的IoC容器配置加载到已经准备完毕的ApplicationContext

10) 遍历调用所有SpringApplicationRunListenercontextLoaded()方法。

11) 调用ApplicationContextrefresh()方法,完成IoC容器可用的最后一道工序。

12) 查找当前ApplicationContext中是否注册有CommandLineRunner,如果有,则遍历执行它们。

13) 正常情况下,遍历执行SpringApplicationRunListenerfinished()方法、(如果整个过程出现异常,则依然调用所有SpringApplicationRunListenerfinished()方法,只不过这种情况下会将异常信息一并传入处理)

去除事件通知点后,整个流程如下:


本文以调试一个实际的SpringBoot启动程序为例,参考流程中主要类类图,来分析其启动逻辑和自动化配置原理。

总览:

上图为SpringBoot启动结构图,我们发现启动流程主要分为三个部分:

  • 第一部分进行SpringApplication的初始化模块,配置一些基本的环境变量、资源、构造器、监听器;

  • 第二部分实现了应用具体的启动方案,包括启动流程的监听模块、加载配置环境模块、及核心的创建上下文环境模块;

  • 第三部分是自动化配置模块,该模块作为springboot自动配置核心,在后面的分析中会详细讨论。在下面的启动程序中我们会串联起结构中的主要功能。

启动:

每个SpringBoot程序都有一个主入口,也就是main方法,main里面调用SpringApplication.run()启动整个spring-boot程序,该方法所在类需要使用@SpringBootApplication注解,以及@ImportResource注解(if need),@SpringBootApplication包括三个注解,功能如下:

  • @EnableAutoConfiguration:SpringBoot根据应用所声明的依赖来对Spring框架进行自动配置。

  • @SpringBootConfiguration(内部为@Configuration):被标注的类等于在spring的XML配置文件中(applicationContext.xml),装配所有bean事务,提供了一个spring的上下文环境。

  • @ComponentScan:组件扫描,可自动发现和装配Bean,默认扫描SpringApplication的run方法里的Booter.class所在的包路径下文件,所以最好将该启动类放到根包路径下。

image

SpringBoot启动类

首先进入run方法

image.gif

run方法中去创建了一个SpringApplication实例,在该构造方法内,我们可以发现其调用了一个初始化的initialize方法

这里主要是为SpringApplication对象赋一些初值。构造函数执行完毕后,我们回到run方法

该方法中实现了如下几个关键步骤:

1.创建了应用的监听器SpringApplicationRunListeners并开始监听

2.加载SpringBoot配置环境(ConfigurableEnvironment),如果是通过web容器发布,会加载StandardEnvironment,其最终也是继承了ConfigurableEnvironment,类图如下

image

可以看出,*Environment最终都实现了PropertyResolver接口,我们平时通过environment对象获取配置文件中指定Key对应的value方法时,就是调用了propertyResolver接口的getProperty方法

3.配置环境(Environment)加入到监听器对象中(SpringApplicationRunListeners)

4.创建run方法的返回对象:ConfigurableApplicationContext(应用配置上下文),我们可以看一下创建方法:

方法会先获取显式设置的应用上下文(applicationContextClass),如果不存在,再加载默认的环境配置(通过是否是web environment判断),默认选择AnnotationConfigApplicationContext注解上下文(通过扫描所有注解类来加载bean),最后通过BeanUtils实例化上下文对象,并返回。

ConfigurableApplicationContext类图如下:

主要看其继承的两个方向:
  • LifeCycle:生命周期类,定义了start启动、stop结束、isRunning是否运行中等生命周期空值方法

  • ApplicationContext:应用上下文类,其主要继承了beanFactory(bean的工厂类)

5.回到run方法内,prepareContext方法将listeners、environment、applicationArguments、banner等重要组件与上下文对象关联

6.接下来的refreshContext(context)方法(初始化方法如下)将是实现spring-boot-starter-*(mybatis、redis等)自动化配置的关键,包括spring.factories的加载,bean的实例化等核心工作。

配置结束后,Springboot做了一些基本的收尾工作,返回了应用环境上下文。回顾整体流程,Springboot的启动,主要创建了配置环境(environment)、事件监听(listeners)、应用上下文(applicationContext),并基于以上条件,在容器中开始实例化我们需要的Bean,至此,通过SpringBoot启动的程序已经构造完成,接下来我们来探讨自动化配置是如何实现。


自动化配置:

之前的启动结构图中,我们注意到无论是应用初始化还是具体的执行过程,都调用了SpringBoot自动配置模块。

SpringBoot自动配置模块

该配置模块的主要使用到了SpringFactoriesLoader,即Spring工厂加载器,该对象提供了loadFactoryNames方法,入参为factoryClass和classLoader,即需要传入上图中的工厂类名称和对应的类加载器,方法会根据指定的classLoader,加载该类加器搜索路径下的指定文件,即spring.factories文件,传入的工厂类为接口,而文件中对应的类则是接口的实现类,或最终作为实现类,所以文件中一般为如下图这种一对多的类名集合,获取到这些实现类的类名后,loadFactoryNames方法返回类名集合,方法调用方得到这些集合后,再通过反射获取这些类的类对象、构造方法,最终生成实例。

工厂接口与其若干实现类接口名称

下图有助于我们形象理解自动配置流程。

SpringBoot自动化配置关键组件关系图

mybatis-spring-boot-starterspring-boot-starter-web等组件的META-INF文件下均含有spring.factories文件,自动配置模块中,SpringFactoriesLoader收集到文件中的类全名并返回一个类全名的数组,返回的类全名通过反射被实例化,就形成了具体的工厂实例,工厂实例来生成组件具体需要的bean。

之前我们提到了EnableAutoConfiguration注解,其类图如下:

可以发现其最终实现了ImportSelector(选择器)和BeanClassLoaderAware(bean类加载器中间件),重点关注一下AutoConfigurationImportSelectorselectImports方法。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Dm6tiUWw-1597051375071)(https://upload-images.jianshu.io/upload_images/18688925-97932faefd1184cf?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)]

该方法在springboot启动流程——bean实例化前被执行,返回要实例化的类信息列表。我们知道,如果获取到类信息,spring自然可以通过类加载器将类加载到jvm中,现在我们已经通过spring-boot的starter依赖方式依赖了我们需要的组件,那么这些组建的类信息在select方法中也是可以被获取到的,不要急我们继续向下分析。

该方法中的getCandidateConfigurations方法,通过方法注释了解到,其返回一个自动配置类的类名列表,方法调用了loadFactoryNames方法,查看该方法

image.gif

在上面的代码可以看到自动配置器会根据传入的factoryClass.getName()到项目系统路径下所有的spring.factories文件中找到相应的key,从而加载里面的类。我们就选取这个mybatis-spring-boot-autoconfigure下的spring.factories文件

image.gif

进入org.mybatis.spring.boot.autoconfigure.MybatisAutoConfiguration中,主要看一下类头:

发现Spring的@Configuration,俨然是一个通过注解标注的springBean,继续向下看,

  • @ConditionalOnClass({ SqlSessionFactory.class, SqlSessionFactoryBean.class}):当存在SqlSessionFactory.class, SqlSessionFactoryBean.class这两个类时才解析MybatisAutoConfiguration配置类,否则不解析这一个配置类,make sence,我们需要mybatis为我们返回会话对象,就必须有会话工厂相关类。

  • @CondtionalOnBean(DataSource.class):只有处理已经被声明为bean的dataSource。

  • @ConditionalOnMissingBean(MapperFactoryBean.class)这个注解的意思是如果容器中不存在name指定的bean则创建bean注入,否则不执行(该类源码较长,篇幅限制不全粘贴)

以上配置可以保证sqlSessionFactory、sqlSessionTemplate、dataSource等mybatis所需的组件均可被自动配置,@Configuration注解已经提供了Spring的上下文环境,所以以上组件的配置方式与Spring启动时通过mybatis.xml文件进行配置起到一个效果。

通过分析我们可以发现,只要一个基于SpringBoot项目的类路径下存在SqlSessionFactory.class, SqlSessionFactoryBean.class,并且容器中已经注册了dataSourceBean,就可以触发自动化配置,意思说我们只要在maven的项目中加入了mybatis所需要的若干依赖,就可以触发自动配置,但引入mybatis原生依赖的话,每集成一个功能都要去修改其自动化配置类,那就得不到开箱即用的效果了。

所以Spring-boot为我们提供了统一的starter可以直接配置好相关的类,触发自动配置所需的依赖(mybatis)如下:

这里是截取的mybatis-spring-boot-starter的源码中pom.xml文件中所有依赖:

因为maven依赖的传递性,我们只要依赖starter就可以依赖到所有需要自动配置的类,实现开箱即用的功能。也体现出Springboot简化了Spring框架带来的大量XML配置以及复杂的依赖管理,让开发人员可以更加关注业务逻辑的开发。

最后

关注公众号:程序员追风。回复 003 领取2020最新Java面试题手册(200多页PDF文档)

<think>好的,我现在要帮用户决定在他的在线题库项目中,协同过滤推荐算法应该用Java还是Python开发,以及数据如何传递。用户已经用Spring Boot做后端,Vue前端,MySQL数据库,MyBatis连接数据库。现在需要快速实现协同过滤,不要求性能,只要求实现。 首先,用户的技术栈已经是Java为主的,Spring Boot后端,所以如果继续用Java的话,可能维护起来更方便,不需要引入新语言的环境和依赖。但用户可能对协同过滤算法不太熟悉,需要找一个容易实现的库或者框架。Java这边有没有简单的推荐算法库呢?比如Apache Mahout,但可能配置起来复杂,或者还有其他更轻量的库?或者用户可能需要自己手动实现简单的协同过滤,比如基于用户的协同过滤,这样虽然代码量大,但可以控制。 另一方面,Python在机器学习领域有丰富的库,比如Surprise、scikit-learn,甚至TensorFlow或者PyTorch,但这些对于协同过滤来说可能有点重。用户只需要快速实现,不要求性能,所以可能用Surprise这样的库更合适。Python的代码量可能更少,因为有现成的算法实现,用户只需要调用即可。但问题是,用户需要将数据从Spring Boot传到Python,这涉及到数据传递的方式,可能需要额外的工作。 接下来是数据传递的问题。用户有两种选择:一种是通过Spring Boot的API将数据传给Python处理,另一种是Python直接访问数据库。如果选择前者,用户需要在Spring Boot中编写接口,将数据序列化成JSON或其他格式,然后Python调用这个API获取数据,处理后再返回推荐结果。这种方式的好处是数据访问层仍然由Spring Boot控制,安全性和维护性更好,但会增加网络开销和延迟,尤其是数据量大的时候。 如果让Python直接访问MySQL数据库,可以减少数据传递的中间步骤,提升效率,但需要处理数据库连接和安全问题。比如,Python需要配置数据库的连接信息,可能需要在Spring Boot和Python之间同步数据库结构的变化,增加了耦合性。此外,直接访问数据库可能带来安全风险,尤其是如果数据库暴露在公网的话,需要做好权限控制。 用户的需求是快速开发,且对协同过滤算法不太熟悉,所以可能需要优先考虑使用Python的现有库来减少开发时间。比如用Surprise库,用户只需要准备好数据格式,调用fit和predict方法,就能生成推荐结果。这样即使不熟悉算法细节,也能快速实现。而如果选择Java,可能需要自己实现算法,或者集成Mahout,但配置和学习成本可能更高,尤其是时间紧迫的情况下。 数据传递方面,如果数据量不大,可能通过API传递更简单,因为不需要处理Python直接连接数据库的配置。比如,当用户需要推荐时,前端请求Spring Boot的API,Spring Boot从数据库获取必要的数据,传给Python服务,Python处理完返回推荐结果,再由Spring Boot返回给前端。虽然增加了网络调用,但实现起来可能更直接,特别是如果用户已经熟悉Spring Boot的API开发的话。 不过,如果数据量较大,比如需要处理大量的用户行为数据,直接让Python访问数据库会更高效,避免多次网络传输。但用户提到不要求性能,只要求实现,所以可能可以接受API传递带来的延迟。另外,Python直接访问数据库需要处理数据格式的解析,比如从MySQL读取数据并转换成适合算法输入的格式,比如用户-试题的评分矩阵,这部分工作可能需要一些数据处理代码。 另外,还要考虑部署的问题。如果使用Python,需要额外部署一个服务,可能会增加运维的复杂性。而如果使用Java,可以直接在现有的Spring Boot项目中集成,减少部署的麻烦。不过用户可能已经习惯Spring Boot的部署流程,新增一个Python服务可能需要使用Docker或者虚拟机,或者直接在服务器上安装Python环境,这要看用户的技术栈是否支持。 总结下来,可能的建议是:如果用户追求快速实现,并且对Python的机器学习库比较熟悉,可以选择Python开发协同过滤算法,利用现成的库减少开发时间。数据传递方面,如果数据量不大,通过API传递更简单安全;如果数据量大,Python直接访问数据库更高效,但需注意安全和耦合问题。如果用户更倾向于保持技术栈统一,并且愿意花时间在Java中实现或集成现有库,可以选择Java,但可能需要更多开发时间。 不过,用户已经用MyBatis,可能对Java比较熟悉,如果时间紧迫,可能更愿意用Python快速实现算法,而数据传递通过API。例如,在Spring Boot中创建一个REST API,返回用户和试题的互动数据,Python服务调用这个API获取数据,处理后生成推荐结果,再通过另一个API将结果传回Spring Boot存储或直接返回给前端。这样可以利用Python的库快速实现算法,同时保持后端的数据访问由Spring Boot管理,减少直接数据库访问的风险。 另外,还可以考虑批处理的方式,比如定期(比如每天)运行Python脚本,生成推荐结果存储到数据库,这样前端请求时,Spring Boot直接从数据库获取预先生成的推荐结果,减少实时计算的延迟。这对于不要求实时推荐的场景可能更合适,同时简化了系统的复杂性。 最后,需要提醒用户注意数据同步和更新的问题,确保推荐算法使用的数据是最新的,以及如何处理新用户或新试题的冷启动问题。不过用户当前可能只需要基本实现,这些进阶问题可以后续优化。</think>### 分步解释与建议 #### 1. **技术选型分析** **选择 Python 的理由**: - **快速实现**:Python 有成熟的协同过滤库(如 `Surprise`、`scikit-learn`),可直接调用现成算法,无需从零实现。 - **代码简洁**:Python 的 Pandas 库能快速处理数据,算法逻辑可能只需 10~20 行代码。 - **学习成本低**:即使不了解算法细节,也能通过文档示例快速上手。 **选择 Java 的理由**: - **技术栈统一**:避免引入新语言环境,降低部署和维护复杂度。 - **实时性**:若需实时推荐(如用户做题后立即更新推荐),Java 内嵌算法可减少跨服务通信延迟。 **结论**:**优先选择 Python**(快速实现目标 > 技术栈统一)。 --- #### 2. **数据传递方案对比** | **方案** | **优点** | **缺点** | **适用场景** | |---------------------------|-----------------------------------|-----------------------------------|---------------------------| | **Spring Boot API 传数据** | - 安全可控(数据权限由 Java 管理)<br>- 无需暴露数据库连接 | - 网络开销大(序列化/反序列化)<br>- 需额外开发接口 | 数据量小、实时性要求低 | | **Python 直连 MySQL** | - 高效(避免中间传输)<br>- 开发简单(直接读写数据库) | - 需配置数据库权限,有安全风险<br>- 耦合数据库表结构 | 数据量大、需频繁读取原始数据 | **结论**: - **若数据量小或需实时推荐**:通过 Spring Boot 开发 API 传递数据(例如 `/api/user-behaviors` 返回用户-题目交互记录)。 - **若数据量大或需离线计算**:让 Python 直接读取 MySQL(需确保数据库 IP 白名单和只读权限)。 --- #### 3. **具体实现步骤** **方案一:Spring Boot API + Python 处理(推荐)** 1. **Spring Boot 侧**: - 新增接口,返回协同过滤所需数据(例如用户 ID、题目 ID、评分/做题次数): ```java @GetMapping("/api/user-questions") public List<UserQuestionDTO> getUserQuestionData() { return mybatisMapper.selectUserBehavior(); } ``` - 提供接收推荐结果的接口(供 Python 回写结果): ```java @PostMapping("/api/recommendations") public void saveRecommendations(@RequestBody List<RecommendationDTO> list) { recommendationService.batchInsert(list); } ``` 2. **Python 侧**: - 调用 Spring Boot API 获取数据,使用 `requests` 库: ```python import requests data = requests.get("http://springboot-server/api/user-questions").json() ``` - 利用 `Surprise` 库实现协同过滤(示例代码): ```python from surprise import Dataset, Reader, KNNBasic import pandas as pd df = pd.DataFrame(data) reader = Reader(rating_scale=(0, 5)) dataset = Dataset.load_from_df(df[["userId", "questionId", "score"]], reader) algo = KNNBasic() algo.fit(dataset.build_full_trainset()) # 为指定用户生成推荐 user_id = 123 recommendations = algo.get_neighbors(user_id, k=5) ``` - 将推荐结果回传 Spring Boot: ```python requests.post("http://springboot-server/api/recommendations", json=recommendations) ``` **方案二:Python 直连 MySQL** 1. **Python 侧**: - 使用 `pymysql` 直接读取数据: ```python import pymysql connection = pymysql.connect(host='mysql-host', user='readonly', password='xxx', db='question_db') df = pd.read_sql("SELECT user_id, question_id, score FROM user_behavior", connection) ``` - 后续算法逻辑与方案一相同。 --- #### 4. **部署与优化建议** - **Python 服务部署**: - 简单场景:直接运行脚本(如每日定时任务生成推荐)。 - 复杂场景:封装为 Flask/FastAPI 微服务,与 Spring Boot 通过 HTTP 交互。 - **性能妥协方案**: - 若协同过滤计算耗时,可改为**离线批量计算**(如每天凌晨跑一次),推荐结果预存到 MySQL,Spring Boot 直接读取。 - **冷启动问题**: - 对新用户/新题目,可退回基于规则推荐(如热门题目),无需强依赖算法。 --- ### 最终建议 1. **技术选型**:用 **Python**(`Surprise` 库)快速实现协同过滤。 2. **数据传递**: - **优先通过 API**(开发快、安全性高,适合学生项目)。 - 仅在数据量极大时让 Python 直连 MySQL(需严格限制数据库权限)。 3. **代码示例**:提供 Spring Boot 接口和 Python 脚本的模板,降低实现门槛。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值