基于大数据spark小说推荐系统 协同过滤推荐算法 数据分析 可视化 Django框架 大数据技术 机器学习(源码+文档)✅

博主介绍:✌全网粉丝50W+,前互联网大厂软件研发、集结硕博英豪成立软件开发工作室,专注于计算机相关专业项目实战6年之久,累计开发项目作品上万套。凭借丰富的经验与专业实力,已帮助成千上万的学生顺利毕业,选择我们,就是选择放心、选择安心毕业✌
> 🍅想要获取完整文章或者源码,或者代做,拉到文章底部即可与我联系了。🍅

点击查看作者主页,了解更多项目!

🍅感兴趣的可以先收藏起来,点赞、关注不迷路,大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,希望帮助同学们顺利毕业 。🍅

1、毕业设计:2026年计算机专业毕业设计选题汇总(建议收藏)✅

2、最全计算机大数据专业毕业设计选题大全(建议收藏)✅

1、项目介绍

小说推荐系统功能模块介绍

本小说推荐系统以Python、Django为技术基石,整合MySQL数据库与Echarts可视化技术,核心依托协同过滤算法,构建起覆盖用户全流程需求的功能体系。

注册登录模块为用户提供安全访问入口,保障账户与操作安全。系统首页作为功能枢纽,聚合小说推荐、可视化分析等核心模块入口,方便用户快速导航。推荐模块是核心亮点,基于用户阅读历史与物品相似性,通过协同过滤算法生成个性化小说推荐,提升阅读匹配度。

小说详情页呈现标题、作者、章节等完整信息,并提供阅读及下载服务。可视化分析模块通过多维度图表,直观展示小说阅读趋势、类型热度、用户行为模式及不同时段阅读量变化,为用户与管理员提供数据参考。个人信息页面支持用户查看阅读记录、收藏列表及修改个人资料。后台数据管理则为管理员提供小说、用户、日志等数据的全流程管控,保障系统稳定与数据安全。

技术栈:
Python、MySQL数据库、Django框架、Echarts可视化、基于用户和基于物品的协同过滤推荐算法、HTML技术

2、项目界面

(1)系统首页

在这里插入图片描述

(2)小说详情页

在这里插入图片描述

(3)可视化分析1

在这里插入图片描述

(2)可视化分析2

在这里插入图片描述

(3)可视化分析3

在这里插入图片描述

(4)可视化分析4
在这里插入图片描述

(5)推荐模块

在这里插入图片描述

(6)个人信息页面

在这里插入图片描述

(7)后台数据管理
在这里插入图片描述

(8)注册登录

在这里插入图片描述

3、项目说明

小说推荐系统功能模块介绍

本小说推荐系统以Python、Django为技术基石,整合MySQL数据库与Echarts可视化技术,核心依托协同过滤算法,构建起覆盖用户全流程需求的功能体系。

注册登录模块为用户提供安全访问入口,保障账户与操作安全。系统首页作为功能枢纽,聚合小说推荐、可视化分析等核心模块入口,方便用户快速导航。推荐模块是核心亮点,基于用户阅读历史与物品相似性,通过协同过滤算法生成个性化小说推荐,提升阅读匹配度。

小说详情页呈现标题、作者、章节等完整信息,并提供阅读及下载服务。可视化分析模块通过多维度图表,直观展示小说阅读趋势、类型热度、用户行为模式及不同时段阅读量变化,为用户与管理员提供数据参考。个人信息页面支持用户查看阅读记录、收藏列表及修改个人资料。后台数据管理则为管理员提供小说、用户、日志等数据的全流程管控,保障系统稳定与数据安全。

一、技术栈
本项目采用了以下技术栈进行开发:

编程语言:Python,一种解释型、互动性和面向对象的高级程序设计语言,具有简洁易读、学习曲线平缓的特点。
数据库:MySQL,一个开源的关系型数据库管理系统,具有高性能、高可靠性和易用性等特点。
框架:Django,一个用Python编写的高级Web框架,它允许快速开发安全和维护性高的网站。
可视化:Echarts,一个使用JavaScript实现的开源可视化库,用于数据的可视化展示。
推荐算法:基于用户和基于物品的协同过滤推荐算法,这两种算法是推荐系统中常用的技术,用于根据用户的历史行为或物品之间的相似性来推荐新的内容。
前端技术:HTML,用于构建网页的基本结构和内容。

二、项目界面与功能模块介绍
系统首页
展示系统的主要功能和导航菜单,包括小说推荐、可视化分析、个人信息等模块的入口。
小说详情页
展示小说的详细信息,包括标题、作者、简介、评分、章节列表等,并提供阅读或下载链接。
可视化分析模块
可视化分析1:展示小说的阅读趋势、用户活跃度等统计数据。
可视化分析2:分析不同小说类型的受欢迎程度,帮助用户了解当前流行的阅读趋势。
可视化分析3:通过图表展示用户的行为模式,如阅读时长、阅读频率等。
可视化分析4:对比不同时间段的小说阅读量,分析阅读量的变化规律。
推荐模块
根据用户的阅读历史和偏好,使用协同过滤推荐算法为用户推荐新的小说。
个人信息页面
展示用户的个人信息,包括用户名、头像、阅读记录、收藏的小说等,并提供修改个人信息的功能。
后台数据管理
为管理员提供管理小说数据、用户数据、日志数据等后台管理功能,确保系统的正常运行和数据的安全性。
注册登录模块
提供用户注册和登录功能,确保用户能够安全地访问和使用系统。
通过以上功能模块,本小说推荐系统为用户提供了丰富的阅读体验,包括个性化的推荐、详细的小说信息、可视化的数据分析等,同时也为管理员提供了便捷的后台管理功能。

4、核心代码

# -*-coding:utf-8-*-
import os

os.environ["DJANGO_SETTINGS_MODULE"] = "recommend.settings"
import django

django.setup()
from item.models import *
from math import sqrt, pow
import operator
from django.db.models import Subquery, Q, Count

# from django.shortcuts import render,render_to_response
class UserCf:
    # 获得初始化数据
    def __init__(self, all_user):
        self.all_user = all_user

    # 通过用户名获得列表,仅调试使用
    def getItems(self, username1, username2):
        return self.all_user[username1], self.all_user[username2]

    # 计算两个用户的皮尔逊相关系数
    def pearson(self, user1, user2):  # 数据格式为:岗位id,浏览此
        sum_xy = 0.0  # user1,user2 每项打分的成绩的累加
        n = 0  # 公共浏览次数
        sum_x = 0.0  # user1 的打分总和
        sum_y = 0.0  # user2 的打分总和
        sumX2 = 0.0  # user1每项打分平方的累加
        sumY2 = 0.0  # user2每项打分平方的累加
        for job1, score1 in user1.items():
            if job1 in user2.keys():  # 计算公共的浏览次数
                n += 1
                sum_xy += score1 * user2[job1]
                sum_x += score1
                sum_y += user2[job1]
                sumX2 += pow(score1, 2)
                sumY2 += pow(user2[job1], 2)
        if n == 0:
            # print("p氏距离为0")
            return 0
        molecule = sum_xy - (sum_x * sum_y) / n  # 分子
        denominator = sqrt((sumX2 - pow(sum_x, 2) / n) * (sumY2 - pow(sum_y, 2) / n))  # 分母
        if denominator == 0:
            return 0
        r = molecule / denominator
        return r

    # 计算与当前用户的距离,获得最临近的用户
    def nearest_user(self, current_user, n=1):
        distances = {}
        # 用户,相似度
        # 遍历整个数据集
        for user, rate_set in self.all_user.items():
            # 非当前的用户
            if user != current_user:
                distance = self.pearson(self.all_user[current_user], self.all_user[user])
                # 计算两个用户的相似度
                distances[user] = distance
        closest_distance = sorted(
            distances.items(), key=operator.itemgetter(1), reverse=True
        )
        # 最相似的N个用户
        print("closest user:", closest_distance[:n])
        return closest_distance[:n]

    # 给用户推荐岗位
    def recommend(self, username, n=3):
        recommend = {}
        nearest_user = self.nearest_user(username, n)
        for user, score in dict(nearest_user).items():  # 最相近的n个用户
            for jobs, scores in self.all_user[user].items():  # 推荐的用户的岗位列表
                if jobs not in self.all_user[username].keys():  # 当前username没有看过
                    if jobs not in recommend.keys():  # 添加到推荐列表中
                        recommend[jobs] = scores*score
        # 对推荐的结果按照岗位
        # 浏览次数排序
        return sorted(recommend.items(), key=operator.itemgetter(1), reverse=True)


# 基于用户的推荐
def recommend_by_user_id(user_id):
    user_prefer = UserTagPrefer.objects.filter(user_id=user_id).order_by('-score').values_list('tag_id', flat=True)
    current_user = User.objects.get(id=user_id)
    # 如果当前用户没有打分 则看是否选择过标签,选过的话,就从标签中找
    # 没有的话,就按照浏览度推荐15个
    if current_user.rate_set.count() == 0:
        if len(user_prefer) != 0:
            job_list = xiangmu.objects.filter(tags__in=user_prefer)[:15]
        else:
            job_list = xiangmu.objects.order_by("-c9")[:15]
        return job_list
    # 选取评分最多的10个用户
    users_rate = Rate.objects.values('user').annotate(mark_num=Count('user')).order_by('-mark_num')
    user_ids = [user_rate['user'] for user_rate in users_rate]
    user_ids.append(user_id)
    users = User.objects.filter(id__in=user_ids)#users 为评分最多的10个用户
    all_user = {}
    for user in users:
        rates = user.rate_set.all()#查出10名用户的数据
        rate = {}
        # 用户有给岗位打分 在rate和all_user中进行设置
        if rates:
            for i in rates:
                rate.setdefault(str(i.job.id), i.mark)#填充岗位数据
            all_user.setdefault(user.username, rate)
        else:
            # 用户没有为岗位打过分,设为0
            all_user.setdefault(user.username, {})

    user_cf = UserCf(all_user=all_user)
    recommend_list = [each[0] for each in user_cf.recommend(current_user.username, 15)]
    job_list = list(xiangmu.objects.filter(id__in=recommend_list).order_by("-c9")[:15])
    other_length = 15 - len(job_list)
    if other_length > 0:
        fix_list = xiangmu.objects.filter(~Q(rate__user_id=user_id)).order_by('-collect')
        for fix in fix_list:
            if fix not in job_list:
                job_list.append(fix)
            if len(job_list) >= 15:
                break
    return job_list


# 计算相似度
def similarity(job1_id, job2_id):
    job1_set = Rate.objects.filter(job_id=job1_id)
    # job1的打分用户数
    job1_sum = job1_set.count()
    # job_2的打分用户数
    job2_sum = Rate.objects.filter(job_id=job2_id).count()
    # 两者的交集
    common = Rate.objects.filter(user_id__in=Subquery(job1_set.values('user_id')), job=job2_id).values('user_id').count()
    # 没有人给当前岗位打分
    if job1_sum == 0 or job2_sum == 0:
        return 0
    similar_value = common / sqrt(job1_sum * job2_sum)#余弦计算相似度
    return similar_value


#基于物品
def recommend_by_item_id(user_id, k=15):
    # 前三的tag,用户评分前三的岗位
    user_prefer = UserTagPrefer.objects.filter(user_id=user_id).order_by('-score').values_list('tag_id', flat=True)
    user_prefer = list(user_prefer)[:3]
    print('user_prefer', user_prefer)
    current_user = User.objects.get(id=user_id)
    # 如果当前用户没有打分 则看是否选择过标签,选过的话,就从标签中找
    # 没有的话,就按照浏览度推荐15个
    if current_user.rate_set.count() == 0:
        if len(user_prefer) != 0:
            job_list = xiangmu.objects.filter(tags__in=user_prefer)[:15]
        else:
            job_list = xiangmu.objects.order_by("-c9")[:15]
        print('from here')
        return job_list
    # most_tags = Tags.objects.annotate(tags_sum=Count('name')).order_by('-tags_sum').filter(job__rate__user_id=user_id).order_by('-tags_sum')
    # 选用户最喜欢的标签中的岗位,用户没看过的30部,对这30部岗位,计算距离最近
    un_watched = xiangmu.objects.filter(~Q(rate__user_id=user_id), tags__in=user_prefer).order_by('?')[:30]  # 看过的岗位
    watched = Rate.objects.filter(user_id=user_id).values_list('job_id', 'mark')
    distances = []
    names = []
    # 在未看过的岗位中找到
    for un_watched_job in un_watched:
        for watched_job in watched:
            if un_watched_job not in names:
                names.append(un_watched_job)
                distances.append((similarity(un_watched_job.id, watched_job[0]) * watched_job[1], un_watched_job))#加入相似的岗位
    distances.sort(key=lambda x: x[0], reverse=True)
    print('this is distances', distances[:15])
    recommend_list = []
    for mark, job in distances:
        if len(recommend_list) >= k:
            break
        if job not in recommend_list:
            recommend_list.append(job)
    # print('this is recommend list', recommend_list)
    # 如果得不到有效数量的推荐 按照未看过的岗位中的热度进行填充
    print('recommend list', recommend_list)
    return recommend_list

if __name__ == '__main__':
    # similarity(2003, 2008)
    print(recommend_by_item_id(1799))




🍅✌感兴趣的可以先收藏起来,点赞关注不迷路,想学习更多项目可以查看主页,大家在毕设选题,项目编程以及论文编写等相关问题都可以给我留言咨询,希望可以帮助同学们顺利毕业!🍅✌

5、源码获取方式

🍅由于篇幅限制,获取完整文章或源码、代做项目的,拉到文章底部即可看到个人联系方式。🍅

点赞、收藏、关注,不迷路,下方查看👇🏻获取联系方式👇🏻

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值