- 博客(20)
- 收藏
- 关注
原创 基于带货视频评论的用户洞察挑战赛 X Datawhale AI夏令营
本文介绍了科大讯飞AI竞赛的三个任务阶段:商品识别、情感分析和评论聚类。商品识别采用TF-IDF向量化结合SGD分类器进行二分类;情感分析对评论的四个维度独立建模预测;评论聚类则通过K-means算法对情感分类后的评论进行主题词提取。文章指出当前baseline存在的不足:文本向量化方法简单、数据量小、聚类效果欠佳等,并建议通过引入大模型、优化特征提取等方式提升效果。整体呈现了完整的竞赛技术方案及优化思路。
2025-07-10 13:53:57
317
原创 洛谷P1160 队列安排
一个学校里老师要将班上N个同学排成一列,同学被编号为1∼N,他采取如下的方法:先将1号同学安排进队列,这时队列中只有他一个人;2∼N号同学依次入列,编号为i的同学入列方式为:老师指定编号为i的同学站在编号为1∼i−1中某位同学(即之前已经入列的同学)的左边或右边;从队列中去掉M个同学,其他同学位置顺序不变。在所有同学按照上述方法队列排列完毕后,老师想知道从左到右所有同学的编号。
2025-03-06 12:08:31
1206
原创 动态规划1
辰辰是个天资聪颖的孩子,他的梦想是成为世界上最伟大的医师。为此,他想拜附近最有威望的医师为师。医师为了判断他的资质,给他出了一个难题。医师把他带到一个到处都是草药的山洞里对他说:“孩子,这个山洞里有一些不同的草药,采每一株都需要一些时间,每一株也有它自身的价值。我会给你一段时间,在这段时间里,你可以采到一些草药。如果你是一个聪明的孩子,你应该可以让采到的草药的总价值最大。如果你是辰辰,你能完成这个任务吗?
2025-01-26 17:08:45
906
原创 P1138 第 k 小整数
首先第一想到的是排序,想着刚好练练各种排序,然后看到每个数只计算一次,还全是正整数,于是直接读的时候记录读到啥数字,专门拿一个数组(代码中的b)记录,最后要第k个,直接数就可以,不成立的情况中间筛选了。
2024-03-13 21:25:01
265
1
原创 P1028 [NOIP2001 普及组] 数的计算
a[0]用来补上只有一个数这种情况,这个方法主要亮点在奇数带来的数列不会新加,就等于前一个偶数的;把数列分成从1的方案数加到当前数一半的方案数,比较容易想到。
2024-03-13 20:28:51
233
原创 洛谷P2392 kkksc03考前临时抱佛脚
看到数据想着贪心,试了试不对,但是背包问题还没有掌握,只能暴力搜索了,因为最后作业安排确定好了后,一个脑子里的作业顺序可以随意调换而不影响总时间,因此对每道题目递归放在左脑和右脑,把所有分支遍历后选出最小的时间即可。这题极其不错,可以学习搜索,剪枝,01背包.
2023-11-25 09:05:15
447
原创 P1036 [NOIP2002 普及组] 选数
本题难点在于从n个数中取出k个数,通过直观分析,从左到右依次取就可以,仔细想想,发现我们平常的做法其实就是深度优先算法,只不过需要在过程 中维护一个加数和与已经取的数,通过不断递归即可。(一开始没想粗来,还是参考了题解)坚持写代码,痛苦的坚持,变强变强。
2023-11-02 23:41:29
106
1
原创 洛谷P1065 [NOIP2006 提高组]
其中for循环里面的if偷了点懒,判断一个区间是否可用,直接取五个点判断(一开始用头尾两个点,有些情况就不行了,五个点刚好可以。一道简单的模拟题,重点在于看懂题目所说的安排顺序——一个一个放进机器里面做工序即可。不过完美代码应该将if那块的逻辑改一下,严谨些。
2023-10-19 15:43:23
168
1
原创 洛谷P1124 文件压缩
观察题目,可以发现给出的是排序好的字符串的尾部,那么头部我们也是知道的(只要将给出的字符串排序就可以),就可以从给出的首字符着手,这时候就有两种策略了,可以从首字符在的字符串开始,先挑出原字符串第二位的字符,再把它作为末尾,去找第三位的字符。看起来很有道理,但这最后就是20分,因为忽略了重复字符带来的变数,细节就不在这说了。因此得用第二种策略,从首字符在开头的字符串开始,先挑出原字符串末尾的字符,再将它作为首位,挑选原字符串倒数第二位字符,这样就能完美通关了。
2023-09-22 19:55:02
208
原创 2023/9/21
通过练习对传输时延和传播时延有了更深的理解,一个链路上能传很多个分组,路由器传输分组是有时间延迟的,必须分组里的全部数据都到了才能开始传输,与处理时延不一样。而其通常描述在一段链路中也是因为它是从第一个字节开始传输到最后一个字节开始传输来算的,也就是在一段链路的开始处,即传输时延是对一个分组中最后一个字节来说,这时候它才刚刚离开路由器。但对于未分组的数据来说,也存在传输时延,因此这个是由线路决定的,分组传输多加了些限制。
2023-09-21 21:53:44
72
原创 洛谷每日练习P1079
初看比较复杂,似乎没找到什么规律,于是想过直接把表存进数组里面,然后对着找,但是呢?发现给的是密钥和密文,要对应找明文用表似乎不好办,于是就想能不能看出什么规律来,容易注意到,从第一行开始,26个字母依次循环左移,结合行开头在不断加1,想到其实列是用来表示偏移的,于是就很快写出了代码。(注意,C语言负数不能取模,先加个模数即可。
2023-09-06 20:39:16
152
1
原创 洛谷练习P1015
每日一题,今天做的是一道经典题——高精度加法,最开始写的时候着实被恶心到了,字符串读进来要进行处理,同时十六进制又需要特别判断(其实把字符串一个个转化为数组就好了,就可以避免十六进制的单独讨论,没有想到导致极其麻烦!),中途还因为字符串的原因走了很多坑。不过还是有些小收获的,代码尝试进行模块化,出bug时能比较好的发现问题所在,以及写繁琐的题不要着急,埋头写过去就行,目前代码能力还是不强,构思能力较差,往往是这儿一点想法,那儿一点想法,不能把边界条件想清楚。
2023-09-06 16:01:43
196
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅