- 博客(17)
- 收藏
- 关注
原创 详细聊聊中科院自动所客座实习生(LLM方向)——待遇、工作内容、申请难度、申请技巧
中科院自动化所客座实习生经验分享:线上实习可获科研一作成果+补贴,本科生需以成果突围。线上工作以自主科研为主,也能选择做固定有报酬的任务,每周1-2次导师指导,出成果效率是学校2-3倍。录取率不足1%(本科生更少),需具备英文论文、软著等工程能力证明,顶会论文是重要加分项。面试聚焦实际成果和LLM工程经验,包含论文讲解考核。
2025-07-02 19:59:51
633
原创 一个人有一个人的长征,真不是说着玩的啊...
发生了太多太多的事情,搞得我都有点累了,不管是身体还是心理上,后面众所周知到了2024的考研,我身边同学朋友的经历并没有展现出考研有多简单,让我本来就对考研怀疑的情况下更加的怀疑,然后最近我突然意识到,我挺讨厌学专业课的,特别是高数啊概率论看到那些奇形怪状的题目就烦,那我还不如干脆彻彻底底断了考研的念头,坚定就业或者出国。感觉女朋友对我这样也不是很满意,因为确实很忙了感觉给她的情绪价值也不够,她是个挺好的人吧我们经常会因为这种事情闹矛盾但她总是说没事没事,但客观的来说我其实是知道肯定有事的因此这也很心累。
2025-05-05 23:00:18
454
原创 在年末写给自己也写给你们——接受自己的光环,直面自己的恐惧
我想,不是认为老子天下第一,而是理所应当的接受自己的长处与好的结果。我的选择究竟对与错,难以评判。一物换一物,成败的交换最为公正,在这杆黄金的天平上,我究竟在另一端放上了什么,哪怕我害怕去面对,我也不得不说出来:我失去了生活,失去了自由,失去了一切可以被称作是青春的东西,最最恐怖的是光环本身成为了限制我最为牢固的枷锁,我无法承受成果中断的真空期,无法承受超出预期之外的失败,我跟他人深度合作与磨合的机会基本上被掐断,同时我养成了一个非常致命的恶习:凡事我都最为疯狂的去追求结果,凡事我都认为可被预测可被控制。
2024-12-28 20:03:46
529
原创 【顶会精读-复现篇】CVPR-2023:DPE: Disentanglement of Pose and Expression for General Video Portrait Editing
下方这四个驱动代码分别对应不同的功能,pose对应人头的摆动和动作,expression对应嘴巴和面部肌肉的动作,expression and pose是两者合一一次性合成,one-shot是让图片变得像个视频。不同的driving之间其实是互通的,只用更改--face后面的脚本名称就行,s_path代表你的目标视频,也就是你希望更改面部的视频。预训练的权重通常能有不错的效果,但前提建立在数据干净,也就是背景干净的前提下,同时人脸分辨率也不应过低,过低同样会变成一坨稀饭。
2024-11-29 23:35:18
667
1
原创 蓝色废纸印刷机第二期——如何冲破版权局的“二分之一魔咒”
所以,何必舍本逐末呢?这是加载权重文件的代码,torchvision上有很多预训练权重,通常用于做微调和研究,但在你自行构建了resnet50之后,假设你自己收集了一个数据集,你获得了一个迁移效果不错的全新的预训练权重,那么这就可以是一个软著了,你甚至可以把你的预训练权重加载成二进制文件之类的藏在你代码的某个角落,让著作权保护这份权重不被利用。OK,想必你的大脑已经告诉你了,这东西是ai生成的,措辞和结构相当严谨,注释更是一尘不染,但通体却是虎头蛇尾大头儿子,这就是ai,绝对能让各位朋友一眼顶针。
2024-11-21 21:57:05
355
原创 发软著真的很难??——如何像印钞一样生产软件著作?
虚假的基金:今天又亏了两个点真正的基金:打开版权局,哈哈又下证了,又可以拿学校和合伙人的奖金了鸽了很久的软著制造机系列终于来了,话不多说,直接上图:这是本月下的第四件,已经是第23件了,上半年和下半年写的东西估计会以这个为结尾,很可能不会再有产出了。真的很难吗?真的很难吗?我觉得未必,如果看过我之前的文章的朋友可能还记得我曾提到过:“有价值的是前三个软著”。因为软著本身是极容易产出的东西,它或许跟几种专利能五五开,但跟论文啥的绝对差了几十个量级。
2024-11-20 20:18:42
1334
原创 大二4论文5专利17软著——我的一些科研经验与教训
整个做的周期不能拖太长,战线也不能拖太长,而且尽量做到一次差不多或者不要留大问题,如果出那种偏向算法或者创新层面的问题的话返稿补正会拖得很久,出了一次后面就容易越改越面目全非,最后导致这个想法不了了之,投入的资源也打了水漂(亲身经历)
2024-09-19 14:28:38
1578
原创 软著制造机预告:一些经验和启发
大学上了也有一年了,经受过的训练和环境可谓是相当不一样了,经过一年多断断续续的积累和开发,一口气爆了十多份软件,大多数集中在人工智能,计算生物学,以及智能农业学领域,因为我个人的研究兴趣就在这几个方向。从最初的中了一份感觉十分了不起了,到现在也发了论文做了科研项目,感觉软著其实也不是多么困难,更多还是磨洋工花的成本而已,跟科研和发论文比起来天遥地远。最近会根据十多份软著的最终战绩,和两份发明专利以及三篇sci的经验,去做一个总结,把自己遇到的坑分享出来。
2024-08-01 21:16:18
338
原创 RAG检索增强生成:在智能云快捷构建知识库教会ERNIE你要的知识
定义:RAG是一种结合检索和生成技术的模型,通过引用外部知识库的信息来生成答案或内容。具体来说,当模型需要生成文本或回答问题时,它会先从一个庞大的文档集合中检索出相关的信息,然后利用这些检索到的信息来指导文本的生成。起源:2020年,Facebook AI Research(FAIR)团队发表名为《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》的论文,首次提出了RAG概念。
2024-07-29 14:14:12
1111
原创 ResNet50:通过构建ResNet训练自己的数据集
然后就到了最重要的构建resnet50网络的环节,如果要使用预训练的训练权重有完全不同的方法,预训练的权重在torchvision上有传入的代码,imagenet同理也有。先进行设备检查,tensorflow和pytorch的cuda不一样,pytorch上的cuda有效不代表tf上就可以。加载训练集和验证集,由于imagenet上的训练集很大,可以直接从训练集中划分,或者使用自带的验证集。数据集选择imagenet上的100类别,可以直接下载,不用额外传入。
2024-07-29 13:51:54
2712
原创 Python实践:数据处理与挖掘
当前目录下有一个文件名为score1.txt的文本文件,存放着某班学生的计算机课成绩,共有学号、平时成绩、期末成绩三列。请根据平时成绩占30%、期末成绩占70%的比例计算总评成绩(取整数),并分学号、总评成绩两列写入另一个文件score2.txt中。同时,在屏幕上输出学生总人数,按总评成绩计90分以上、80-89分、70-79分、60-69分、60分以下各成绩档的人数和班级总平均分(取整数)。
2024-07-29 13:36:27
223
原创 C++实践:数组、指针和字符串
从键盘输入一个10~1000之间的整数m,把m插入到已排序的数组array中,要求插入后数组中的整数仍然保持有序,使用Print函数显示数组array的内容以验证插入数据的正确性。编写函数void Print(int* p, int k),该函数的功能是显示数组p中的整数,函数的实现过程要求采用指针进行处理,其中k是数组中元素的个数;对数组array进行排序,并使用Print函数显示数组array的内容以验证排序的正确性;不用字符串处理函数将两个字符串连接,即将字符串b连接到字符串a的后面,变成字符串c。
2024-07-29 13:32:39
515
原创 C++实践:类、对象与运算符重载
由于事先不知道学生的人数,所以在程序中须使用动态对象数组来描述每个学生的数据和对学生的数据进行的操作。假设有两个复数a+bi和c+di,则复数的加、减、乘和除法运算规定如下。
2024-07-29 13:30:31
224
原创 Pensim青霉素发酵仿真数据平台superpro版改良安装包
Pensim青霉素发酵仿真数据平台superpro版改良安装包常用的pensim安装包大都有可能出现一些奇奇怪怪的bug,例如无法输出,以及信息录入不正确的问题。这里修复了相关的问题,个人在使用时尚未发现还有明显的bug。输出数据可以用于机器学习,深度学习等等各类支持预测的算法,甚至可以作为大模型数据集上传使用。目前的数据大多用于LSTM。
2024-07-28 16:09:01
637
原创 机器学习入门实践:基于miRNA表达谱数据的癌症分类研究
miRNAs虽然不能够直接编码蛋白质,但是能够通过与靶mRNA的结合影响其表达和翻译,进而影响蛋白质的产量。--------------------------样本表型数据(维度12804*4),如果是01-09之间的数表示该样本数据是来源于癌症组织,如果编码是大于10的数表示该样本是来源于癌旁正常组织。----------------miRNA表达矩阵(维度743*10824),共有10824个样本,每个样本有743个miRNAs特征。仅保留同时存在df_miRNA与df_phenotype中的样本。
2024-07-28 15:31:24
451
原创 C++课设:高校人员管理系统superpromax改进版
其中教师包含了各类职称需要用户进行输入,比如输入教授,讲师等,该职称信息同时也将录入员工的信息中。系统收集用户输入的员工信息并存储到相应的全局向量中。用户可以选择按姓名、编号或姓氏等等信息查询员工信息,在该模块中,系统将读取用户输入的信息,可以是数字或者字符串等,同时系统遍历所有员工信息,找到符合条件的员工并显示其详细信息。系统统计员工总数、按职业分类的人数、按性别分类的人数、按职称分类的人数以及按年龄区间分类的人数。在查询和修改员工信息时,系统使用线性搜索算法遍历全局向量,找到符合条件的员工信息。
2024-07-28 12:19:21
1237
机器学习入门实践:基于miRNA表达谱数据的癌症分类研究疾病统计数据集
2024-07-28
机器学习入门实践:基于miRNA表达谱数据的癌症分类研究疾病数量统计数据集
2024-07-28
Pensim青霉素发酵仿真数据平台superpro版改良安装包
2024-07-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅