- 博客(27)
- 资源 (1)
- 收藏
- 关注
原创 多模态大模型在教育领域具体如何个性化教学?
伴随式采集实训教学过程中生成的多模态数据,利用人工智能技术,自动提取课堂教与学的相关特征,从不同的维度揭示课堂黑箱,实现常态化的课堂教学智能分析与反馈。例如,EduChat模型通过高质量、多样化的教育语料库,激发学生讨论、辩论、评估和分析等高级思维技巧,培养学生的自主学习和创新能力。:通过对交互过程中的多模态数据采集与分析,形成师范生的教学能力、教学风格、心理特质和生理特质综合画像,实现师范生实践教学能力培养的学习节奏、学习资源和学习场景个性化推荐。
2025-01-15 11:24:59
1116
原创 大模型的训练时间
text{训练时间} = \frac{8 \times 175 \times 10^9 \times 300 \times 10^9}{1024 \times 312 \times 10^{12} \times 0.45} \approx 2921340 \text{秒} \approx 34 \text{天} \][^4^]\frac{\text{总计算量}}{\text{GPU数量} \times \text{每个GPU的峰值FLOPS} \times \text{GPU利用率}}
2025-01-15 11:24:23
751
原创 多模态大模型具体有哪些应用?
例如,在汽车制造中,可以利用多模态大模型对智能驾驶系统进行优化和升级,提高汽车的安全性和舒适性。:通过分析生产线上的图像、视频和传感器数据,多模态大模型可以实时检测产品质量,提高检测效率和准确性。:多模态大模型可以结合文本、语音和图像数据,提供更加智能和人性化的客服服务,提升客户体验。:多模态大模型可以结合患者的病史、基因数据和治疗反应,提供个性化的治疗方案,提高治疗效果。:在游戏开发中,多模态大模型可以生成游戏中的角色、场景和剧情,提升游戏的沉浸感和可玩性。
2025-01-15 11:22:58
1067
原创 2025年大模型热门话题
例如腾讯元宝指出多模态大模型的重要性,文心一言也提到2025年多模态AI将成为企业采用AI的主要驱动力,Kimi认为多模态AI将助力更丰富的交互和广泛的应用场景,豆包表示构建原生多模态大模型是进化的重要方向,同时多模态生成幻觉的消除也将成为新的探索方向。:随着对环境影响的关注增加,越来越多的公司开始关注AI模型的能效优化,通过采用更加高效的算法和硬件,优化数据中心的能源管理,如采用更高效的芯片架构和散热、冷却技术,以及优化训练流程,减少不必要的计算,以在提升模型性能的同时降低能耗,推动绿色AI的发展。
2025-01-15 11:21:26
896
原创 AI面试官如何实现
以近屿智能的“AI得贤招聘官”为例,该系统通过多模态深度学习算法,对候选人的回答内容、宏表情、声音等进行评估,并基于人类设定的权重相加算出总体得分。:使用深度学习算法,如篇章级语义识别算法、表情识别算法、声音识别算法等,对数据进行训练。通过上述步骤和技术,可以构建一个功能完善的AI面试官系统,提高招聘过程的效率和公正性。:通过构建复杂的神经网络模型,提高AI在图像和语音识别上的准确性。:对候选人的回答进行评估,可以包括内容评估、表情评估、声音评估等。:收集大量的面试数据,包括候选人的回答、表情、声音等。
2025-01-15 11:20:48
434
原创 大模型的原理
例如,在机器翻译任务中,模型直接将源语言的文本序列作为输入,学习到如何生成目标语言的文本序列,而不需要先将文本转换为某种中间表示,再进行翻译。以Transformer架构中的自注意力机制为例,当处理一个句子时,模型会计算每个单词与其他所有单词之间的关系权重,权重高的单词之间就会产生更强的关联,从而让模型能够更好地理解句子中各个部分的重要性。例如,在语言模型中,可以采用掩码语言模型(Masked Language Model,MLM)的方式,将输入文本中的一些单词随机掩盖,然后让模型预测这些被掩盖的单词。
2025-01-15 11:20:13
438
原创 如何训练大型语言模型?
数据来源可以是公开可用的网页、新闻文章、社交媒体内容等,也可以利用现有的开源数据集如Common Crawl、Wikipedia、BookCorpus等。训练一个大型语言模型不仅需要强大的计算能力和丰富的数据资源,还需要精细的设计和调优。在一些高级应用中,可能会用到基于人类反馈的强化学习方法,这种方法可以让模型根据人类给出的反馈来优化自己的行为,从而提高输出的质量。监督微调是指在预训练的基础上,使用有标签的数据集对模型进行进一步训练,使其能够更好地适应特定的任务,如问答、摘要生成等。
2025-01-09 15:02:33
799
原创 Transformer模型具体是如何工作的?
Transformer模型是一种基于注意力机制的深度学习模型架构,最初由Google在2017年的论文《Attention Is All You Need》中提出。其核心思想是通过自注意力机制(Self-Attention)来处理序列数据,使得模型能够同时考虑输入序列中的所有位置。
2025-01-09 14:56:11
396
原创 大模型原理?一文详细解释
大模型通常指的是具有数十亿甚至数万亿个参数的深度学习模型。这些模型通过大规模的数据预训练和微调,能够在多种任务上展现出卓越的性能。大模型的“大”不仅体现在参数数量上,还包括其训练数据集的广泛性和模型结构的复杂性。
2025-01-09 14:55:03
456
原创 IDEA <statement> expected, got ‘ID‘ 的报错原因
但是如果我们不去改配置文件呢? sql节点内必须要有一个函数开头,因此将
2023-07-03 16:54:19
2644
原创 RuntimeError: exp_vml_cpu not implemented for ‘Long’
问题描述:执行div_term = torch.exp(torch.arange(0, d_model, 2) * -(math.log(10000.0) / d_model)) pe[:, 0::2] = torch.sin(position * div_term)报错, RuntimeError: exp_vml_cpu not implemented for ‘Long’原因: torch.exp()操作不支持Long类型的张量作为输入解决方法: 将张量转为浮点型即可, 执行div_term
2021-05-17 12:46:59
2686
原创 百度-字符串匹配
题目描述牛牛有两个字符串A和B,其中A串是一个01串,B串中除了可能有0和1,还可能有’?’,B中的’?'可以确定为0或者1。 寻找一个字符串T是否在字符串S中出现的过程,称为字符串匹配。牛牛现在考虑所有可能的字符串B,有多少种可以在字符串A中完成匹配。例如:A = “00010001”, B = “??”字符串B可能的字符串是"00",“01”,“10”,“11”,只有"11"没有出现在字符串A中,所以输出3输入描述:输入包括两行,第一行一个字符串A,字符串A长度length(1 ≤ lengt
2021-03-30 16:51:38
424
原创 百度-蘑菇阵
题目描述现在有两个好友A和B,住在一片长有蘑菇的由n*m个方格组成的草地,A在(1,1),B在(n,m)。现在A想要拜访B,由于她只想去B的家,所以每次她只会走(i,j+1)或(i+1,j)这样的路线,在草地上有k个蘑菇种在格子里(多个蘑菇可能在同一方格),问:A如果每一步随机选择的话(若她在边界上,则只有一种选择),那么她不碰到蘑菇走到B的家的概率是多少?输入描述:第一行N,M,K(1 ≤ N,M ≤ 20, k ≤ 100),N,M为草地大小,接下来K行,每行两个整数x,y,代表(x,y)处有一个
2021-03-30 16:14:33
183
原创 Pytorch标签转化为onehot形式,再转换回去
for j, data in enumerate(test_dataloader, 1): inputs, labels = data print(labels.type()) # torch.cuda.ByteTensor labels = labels.long() # longTensor print(labels) onehot_labels = torch.nn.functional.one_hot(labels, num_classes=256)
2021-03-30 10:07:29
1427
原创 [LC 动态规划]
[LC 动态规划]70、爬楼梯题目描述:有 N 阶楼梯,每次可以上一阶或者两阶,求有多少种上楼梯的方法。定义一个数组dp储存上楼梯的方法数,dp[i]表示走到第i个楼梯的方法数。第i个楼梯可以和从第i-1和i-2个楼梯再走一步到达,走到第i个楼梯的方法数为走到第i-1和第i-2个楼梯的方法数之和。考虑到dp[i]只与dp[i-1]和dp[i-2]有关,因此可以用两个变量来储存,空间复杂度为O(1)class Solution { public int climbStairs(int n)
2021-03-13 23:35:37
131
原创 [LC215]数组中的第K个最大元素、[LC206]反转链表、[LC3]无重复的最长字串
都是基础题1、反转链表最直观的做法就是建立一个stack,倒进去再倒出来,不用想。import java.util.*;/** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode() {} * ListNode(int val) { this.val = val; } * ListNode(i
2021-03-10 02:30:15
201
原创 记录Linux下不同版本Python3的安装、环境变量配置、虚拟环境创建
因为工程需要,在原本的Python的开发环境基础上添加一个Python3.6版本,同时新的Python依赖库要和旧的环境区分开,于是就有了这篇踩坑经历。如有更好的实现方式或者写的不对的地方请不要吝啬你的留言~一、基本情况使用的服务器只有用户权限,已经安装Python3.8.5,并且已有虚拟环境。目的:安装Python3.6.0,建立相关虚拟环境,并在环境中安装tensorflow1.x二、安装过程1、首先下载Pythone3.6.0wget https://www.python.org/ftp/
2021-01-23 11:52:34
1049
1
原创 [leetcode笔记][1.17] 摩尔投票,
1、力扣面试题 17.10. 主要元素题目描述:数组中占比超过一半的元素称之为主要元素。给定一个整数数组,找到它的主要元素。若没有,返回-1。示例 1:输入:[1,2,5,9,5,9,5,5,5]输出:5示例 2:输入:[3,2]输出:-1示例 3:输入:[2,2,1,1,1,2,2]输出:2说明: 你有办法在时间复杂度为 O(N),空间复杂度为 O(1) 内完成吗?思路:摩尔投票法+验证1、两个数不同,同时消去,两个数相同则保留,最后剩下的一个或者多个值,便是众数。但前提的一定
2021-01-17 22:52:12
114
转载 【转载】光通信会议
原地址:http://xutong.info/2014/08/summary_of_optical_conferences_and_jounals/#respond原作者:许通在传输组待了两年,对我们领域主要的会议和期刊也有了一定的了解,所以写篇文章总结一下。我们组主要研究光传输,尤其是相干光通信这一块。可以投的会议一般有OFC、ECOC、CLEO、OECC、ACP等,期刊则有OE、OL、PTL、JLT、PJ、AO、JOSA、小OE、EL、OC和COL。下面我来简单介绍一下。先说会议,OFC、E
2020-12-09 11:18:47
4357
原创 python中view()函数怎么用?
初学者在使用pytorch框架定义神经网络时,经常会在代码中看到:这样的用法。view()的作用相当于numpy中的reshape,重新定义矩阵的形状。例如:import torcha = torch.range(1, 16)
2020-11-19 17:00:09
88628
2
原创 Linux 如何查看硬件信息
常用命令整理如下:查看主板的序列号: dmidecode | grep -i ’serial number’用硬件检测程序kuduz探测新硬件:service kudzu start ( or restart)查看CPU信息:cat /proc/cpuinfo [dmesg | grep -i ‘cpu’][dmidecode -t processor]查看内存信息:cat /proc/meminfo 或 cat /proc/meminfo | grep Mem 或 free -m 或
2020-11-17 14:55:30
804
原创 java异常处理机制
java异常处理机制一、异常概述二、异常处理机制异常类的继承体系访问异常信息java中的异常处理机制可以使程序中的异常处理代码和正常业务代码分离,保证程序的优雅和健壮。java的异常处理机制主要依赖try、catch、finally、throw、throws五个关键字一、异常概述try关键字后面紧跟一个花括号括起来的代码块,简称try块,里面放置可能引发异常的代码。catch后对应异常类型和一个代码块,用于表明该catch块用于处理这类的代码块。多个catch块后还可以跟一个finally
2020-11-16 16:23:43
507
原创 jupyter notebook 中无法 import 问题——使用juputer运行虚拟环境
没有使用conda,而是使用python自带的Virtualenv,使用juypter运行虚拟环境
2020-11-16 16:22:33
1330
偏振解复用使用matlab实现.m
2020-04-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人