自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(41)
  • 问答 (1)
  • 收藏
  • 关注

原创 1007. Maximum Subsequence Sum

滑动窗口求最大连续子序列和。

2024-09-23 14:10:40 107

原创 1135. Is It A Red-Black Tree (30)

【代码】1135. Is It A Red-Black Tree (30)

2024-09-08 17:27:17 163

原创 1074 Reversing Linked List

【代码】1074 Reversing Linked List。

2024-09-08 15:43:28 165

原创 1119 Pre- and Post-order Traversals

给出一棵树的结点个数n,以及它的前序遍历和后序遍历,输出它的中序遍历,如果中序遍历不唯一就输出No,且输出其中一个中序即可,如果中序遍历唯一就输出Yes,并输出它的中序

2024-09-04 21:46:49 232

转载 1098 Insertion or Heap Sort

重点是堆排序怎么实现。

2024-08-31 15:38:29 254

原创 1068 Find More Coins

一开始用这个方法,但是没有想到怎么记录最小的序列,遂放弃了改用深度暴力搜,结果两测试点超时。

2024-08-15 01:37:41 402

原创 1067. Sort with Swap(0,*) (25)-PAT甲级真题

逆向思维,错位可以想象成链表“错位链”,我们就需要寻找类似"a→b,b→c,c→a"这样的结构,因为这样能一次性换对最多的元素。每一个长度为n的链如果不包含0,则需要n+1次交换,包含则需要n-1次,而0最多只会加入一个链中,所以可以最后考虑。

2024-08-13 22:28:01 183

原创 1066. Root of AVL Tree (25)-PAT甲级真题

回去复习了一年前学的数据结构课本的15章,AVL树插入的平衡处理,有四种情况:LL旋转、LR选中、RR旋转、RL旋转。手搓AVL树的插入。

2024-08-13 15:51:36 303

原创 1057. Stack (30)-PAT甲级真题

我按照这个思路尝试实现了下,发现能过,这里如果直接用priority_queue的话,由于priority_queue不能直接删除特定元素,不是很方便,所以这里用multiset来表示大小根堆(minHeap.begin()的元素在minHeap中最小,pre(maxHeap.end())的元素在maxHeap中最大)三个测试点超时不过,做不出来。

2024-08-11 15:35:48 250

原创 1056. Mice and Rice (25)-PAT甲级真题

当时没想到可以用队列来做,就傻傻的模拟了,用cur存当前轮的id,这个id对应的是order的下标,这里有个求rank的技巧就是当前轮没有晋级的rank为(当前轮的组数+1)

2024-08-10 20:42:54 342

原创 1040. Longest Symmetric String (25)-PAT甲级真题

两种做法:双指针和动态规划。

2024-08-09 22:07:01 225

原创 1018 Public Bike Management

【代码】1018 Public Bike Management。

2024-08-09 20:54:51 560

原创 1049. Counting Ones (30)

【代码】1049. Counting Ones (30)

2024-08-09 15:49:38 394

原创 1045. Favorite Color Stripe (30)

【代码】1045. Favorite Color Stripe (30)

2024-08-08 21:06:05 207

原创 1044. Shopping in Mars (25)-PAT甲级真题

这题暴力用前缀和搜会超时,有两种解法,二分查找和滑动窗口。

2024-08-08 18:07:11 252

原创 1043. Is It a Binary Search Tree (25)-PAT甲级真题

利用函数返回值,判断子树是否是BST或者镜像BST,isBST返回是否是BST,isBST2返回是否是镜像BST,函数参数root为前序序列中根的位置,e为前序序列最后位置。

2024-08-08 14:28:04 140

原创 1035. 插入与归并(25)-浙大PAT乙级真题

我用的是傻傻的模拟两种排序的做法,看其他人写的想法会更好更简洁。

2024-08-07 15:46:43 166

原创 1125 子串与子列 – PAT乙级真题

【代码】1125 子串与子列 – PAT乙级真题。

2024-08-07 15:39:01 299

原创 PAT 1089 狼人杀-简单版(20 分)- 乙级

【代码】PAT 1089 狼人杀-简单版(20 分)- 乙级。

2024-08-07 15:36:43 144

原创 1034. Head of a Gang (30)-PAT甲级真题

这道题主要是对边的dfs,与对点的dfs不同,对边的dfs最后需要除以2(其实也可以遍历之后将边权重设为0,这样就不用除以2)

2024-08-07 14:30:42 126

原创 1033. To Fill or Not to Fill (25)-PAT甲级真题

将终点视作price为0的加油站,设加满邮箱能行驶的最大行驶范围为maxdis,对于当前位置,距离maxdis内(含)的加油站中,若有price比当前小的,选择加油到刚好撑到那个加油站;若没有price比当前小的,则目前加满油,走到price最小的加油站。若最大行驶范围内没有一个加油站,则不可能到达。

2024-08-06 21:20:32 197

原创 1020 Tree Traversals (25)-PAT甲级真题

这里有个技巧,就是二叉树中,各节点标号的关系,左子树和其父节点的关系:index=2*index_father,比如下图中1和2,2和4;右子树和其父节点的关系:index=2*index_father+1。

2024-07-31 02:51:14 243

原创 1017 Queueing at Bank (25)-PAT甲级真题

【代码】1017 Queueing at Bank (25)-PAT甲级真题。

2024-07-29 17:34:33 130

原创 1016 Phone Bills (25)-PAT甲级真题

有坑,如果total费用为0的话,不能输出,包括用户名字和月份和总价格都不能输出。

2024-07-29 02:26:40 169

原创 1014 Waiting in Line (25)-PAT甲级真题

这题有坑,即使一个人服务的终止时间超过了17:00,也会算上他(当前仅当他的服务开始时间严格小于17:00),这个点是从一个评论区看到的,也符合常理,在下班之前到柜台肯定不能把你拒了,只能老实加班。原写法(3个测试点不过,因为没有考虑到以上的问题)

2024-07-28 21:28:57 224

原创 1010 Radix (25)-PAT甲级真题

用顺序查找的方式搜第七个测试点过不去,二分查找是一个办法,注意这里low和high的取值,high的取值我是这样想的:当n2长度为1时进制数最多为low,否则长度大于1时进制数最多为res1(若为(res1+1)就必定会有res2>res1了,肯定不满足)

2024-07-27 02:06:19 396

原创 1003. Emergency (25)-PAT甲级真题

【代码】1003. Emergency (25)-PAT甲级真题。

2024-07-25 21:34:19 152

原创 视频增强实现

它能够处理低分辨率、模糊或部分损坏的人脸图像,通过学习大量人脸数据,生成高质量、清晰的人脸图像。利用了GAN的能力,通过竞争学习的方式,生成器(Generator)学习如何产生逼真的人脸图像,而判别器(Discriminator)学习如何区分生成的图像与真实图像。由于SadTalker生成的视频清晰度不是很高,单帧图片像素只有224*224,所以我考虑给实现视频画质增强,使用对抗生成网络是个不错的选择。视频画质增强可以看作视频中的每个帧对应的图像画质增强。这样就得到了增强画质的视频,并存储到了本地。

2024-06-24 00:56:25 1189

原创 TTS模型实现和部署

其中,大模型和其他模型具体的配置和prompt如下,具体包括配置了 Turbomind 引擎,设计了一个详细的提示(prompt),用来引导模型生成自然的对话,以及配置生成视频所需的参数。全球公认最佳的微软语音模型,该模型生成的语音非常流畅,发音标准,注重语气和连贯性,与口语训练助手的定位非常契合。在第二周个人工作的基础上,本次工作在于封装tts,将其与大模型,数字人模型一起,串联成一个完整的步骤,实现英语口语助手的可视化。# 在执行该行的情况下,期望在扬声器上听到合成语音。# 将接收到的文本合成为语音。

2024-06-23 21:34:14 957

原创 语音评分模型实现和部署

我们选择使用微软的发音评估模型来对用户发音进行细致评分,以向用户展示不同方面的发音分数,和对应单词的发音分数,使用户更好的发现自己的发音问题,从而达到精确纠正的目的。发音评估支持不间断的流式处理模式,所以可以通过流式处理语音信息,但是也可以一次性处理,为了与前端沟通方便,前端传回的wav文件,可以一次性进行分析,这里查看源码可以看到用了async来同步结果,实际上就是流式处理的进行缓存,再统一处理的结果,利用异步锁,识别完全部内容后再输入模型:在中,可以指定要学习或练习以改进发音的语言。默认区域设置为。

2024-06-23 21:17:41 1848 1

原创 数字人部署

在之前数字人模型优化,并且封装成模块之后,再进一步集成输入输出,前端输入大模型回答内容,也就是sentence参数,以及前端输入的role,对应需要的角色。

2024-06-23 20:58:27 391

原创 数字人模型优化

之前的源码分析可以发现,preprocess主要是进行图片的裁剪,标准化,然后进行3DMM特征的提取,其中特征提取部分使用的是resnet50,如果是视频输入则每一帧都要过resnet50,图片的话只要一次就行。这可以帮助管理 GPU 资源,避免因内存不足而导致的错误,并且在进行性能敏感的操作时确保正确的执行顺序。英语口语训练助手实际上不需要每次自己传图片,而是可以让用户选则特定的角色来进行对话,对于特定的角色,实际上可以用固定的图片和音频,音频的实现再之后讨论。

2024-06-23 20:28:59 296

原创 山东大学项目实训 第九周个人工作报告

如图B11(d)所示,映射网络包含姿态ρ[t−2:t+2]和表达式β[t−2:t+2]的t帧([t−2:t+2])运动系数,以在帧t中生成人脸视频(偏航、俯仰、滚转、tr和δ)的运动表示。首先是初始化模型,preprocess_model是用来预提取图片特征的模型,主要作用有裁剪图片为指定形状,然后提取3DMM参数。在face render模块其他的代码和face vid2vid这篇文章一样,主要就是用对抗生成网络来对进行参数驱动的视频生成,这是训练阶段,我们需要的推理阶段只需要用到生成器就可以了。

2024-06-23 16:48:35 597

原创 山东大学项目实训 第八周个人工作报告

这周的工作主要是数字人模型原理解读,为了之后部署做准备这个模型是为了对图片和音频进行3D人脸运动数字人生成通过人脸图像生成说话的头部视频,一段语音音频仍然包含许多挑战,即不自然的头部运动、扭曲的表达和身份修改。论文认为这些问题主要是由于从耦合的 2D 运动场中学习。另一方面,明确使用 3D 信息也存在表达僵硬和不连贯视频的问题。

2024-06-22 17:03:27 304

原创 山东大学项目实训 第七周个人工作报告

这周的主要工作是对之前微调好的大模型的模型量化和部署TurboMind是LMDeploy团队开发的一款关于LLM推理的高效推理引擎,它的主要功能包括:LLaMa 结构模型的支持,continuous batch 推理模式和可扩展的 KV 缓存管理器TurboMind推理引擎仅支持推理TurboMind格式的模型。因此,TurboMind在推理HF格式的模型时,会首先自动将HF格式模型转换为TurboMind格式的模型。

2024-05-30 16:07:52 284

原创 山东大学项目实训 第六周个人工作报告

这周主要的工作在于对上周微调结果模型进行转换,以及微调结果测试,以及模型部署。

2024-05-29 20:44:18 296

原创 山东大学项目实训 第五周个人工作报告

这周主要工作在于大模型微调的实现,利用第四周提取的规范jsonl数据作为微调数据集。

2024-05-28 08:26:39 852

原创 山东大学项目实训 第四周个人工作报告

第二周选择DailyDialog数据集是一个高质量的多回合开放域英语对话数据集。它包含13118个对话,分为11118个对话的训练集和1000个对话的验证和测试集。为转化为Xtuner微调框架所需要的规范数据,使用脚本将剧本中关于甄嬛的对话集抽取出来,作为数据集使用。这周工作主要是为微调数据集进行改造,抽取数据集变换格式以适应Xtuner需要的格式。

2024-05-27 09:11:23 380

原创 山东大学项目实训 第三周个人工作报告

其中增加了enhancer选项能以提高生成的视频的质量,这里采用了对抗生成网络GFGAN进行视频清晰度增强,但是会增加推理的时间。在HuggingFace上也有演示,不过资源排的较紧张,在线演示成功率比较低。本周主要实现了英语口语助手数字人模型的实现和优化。

2024-05-07 19:31:42 220

原创 山东大学项目实训 第二周个人工作报告

文本转语音模型选用了全球公然最佳的微软语音模型,该模型生成的语音非常流畅,发音标准,注重语气和连贯性,与口语训练助手的定位非常契合。本周完成了两个任务:寻找并确定了几个英语口语对话的数据集,文本转语言模型的跑通。首先注册Azure账户,申请资源组,申请具体textToSpeech资源。

2024-04-24 00:41:45 266

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除