大学断代史(一)——浑浑噩噩

本文记录了作者高考失利后进入大学的生活经历,包括对专业的不满、挂科的困扰以及对未来的迷茫。

大学断代史(一)——浑浑噩噩

/周英明


——风平浪静也好狂风暴雨也罢,一回头就是家

    

   高考后的夏天,阳光是那么的和煦、灿烂……整整一个夏天,竟不知道自己的未来将何去何从,高考的失利使得曾经那高高在上的自大盲目的心理犹如崖顶坠入海底深谷,一度觉得自己的人生陷入低谷,前途一片渺茫。也好,至少在那之后让我看清了自己,不再那么盲目去自信做回了真实的自己。看着同学们一个个已拿到自己仪心大学的录取通知书,我却将自己藏了起来,生怕被嘲笑。每当被问及自己的大学是否是211/985时,我总在别人的挑逗与嘲讽中默默离开,说实在,自小生于农村对外面的世界是一无所知。作为全村第一个大学生(是多么的嘲讽),总被同龄人嘲笑:上学有何用,这么多年来的墨水竟然只考了个二本……

  我不想去与人争辩,至少我已看清自己,那是事实又有何可争辩的,只有默默收起冷酷的心,继续着之后的一切。转眼已是开学之际,这是我第一次走出大山,来到了我印象中所谓富丽与繁华的省会——昆明。就这样接触了大学,在这里我才知道:原来计算机不是只可以用来打游戏的,原来计算机不是只可以用来看电影看图片的。第一次接触了C语言,第一次上了大学的课,第一次感觉到大学真的很好,第一次感觉到大学里原来是这么的悠闲与自在,很多的第一次从这里开启,在这这座城市里扎根了四年而如今却要离开她,不知6月后的自己会奔向何方,何去何从。突然觉得有点小伤感……

  大一就这样悄然来临,也带来了我的第一次爱恋,由于大学专业的被调剂,我始终对计算机有着天生的厌恶,总是想着在别的地方找到弥补,我讨厌计算机。我时时想着要不退学算了,重新去上回高四,或许明年我就可以考个211/985学校,就可以不用为自己的专业是否被调剂而感到不满与厌倦。这样的思绪几乎一直持续占据了我大学生涯的2/3时间,也是在这段时间里我几乎学会了逃课、学会了打游戏(虽然到现在为止都不会迷恋游戏),甚至可以每天宅在宿舍看个一周的电影,这样的后果可想而知——我的大一就挂了英语的综合课,虽说没有被辅导员叫去谈话,但我还是我行我素,每当要交实验报告的时候总会去机房恶补自己的作业,不会的总是找来自己认为很牛叉的同学的作业来copy。这段时间我总是浑浑噩噩,天然厌倦计算机的我不得不想着转专业,可是因为大一英语的挂科,使得我转专业的梦想破灭。之后的所有时间总是沉迷于小说和电影中,更加的泛滥自己。只有在虚拟的世界中才能找到自己所为的满足和慰藉,可以熬夜通宵看小说、看电影。总想着成为小说或电影中主人翁,幻想着自己就是主角,可以八面威风,一展宏图(现在想想那时候的自己真的是太天真太幼稚了)。虽然我很讨厌计算机这个专业还经常逃课,但是《高等数学》这门课我始终不会逃,并不是因为我有多么的喜欢数学,或是多么想要要弥补自己的过失。恰恰相反,因为班里有一个我认为很好看的女生(现在想想感觉自己当时是多么的屌丝),就这样我每天都很早的起床,就因为早点去教室一睹TA的芳容。也幻想着在去打卡的路上遇见她,看一眼足矣。这件事情总使我和舍友发生不解,每次都是那么的不合群。也是在后来的岁月里我将太多的时间荒废在了这件事情上,对于自己的专业课,确是从来不看。导致大一结束的时候,我连用C语言来写个“HelloWord!”都不会,跟别说什么杨辉三角,调度算法之类的。那时的我明知自己转专业无望,可还是一无事事。总幻想着“车到山前必有路”、“桥到船头自然直”。也不知道是拿来的毅力,我居然去图书馆借土木学的书来看,还自学AutoCAD、鲁班软件 自学混泥土的算法等等,是多么的热衷于于建筑学、土木学

  就这样,大一在浑浑噩噩中度过了一年,如果说这一年里我所收获的是什么,我只能说一无所获,唯一让我记忆深刻的是英语挂科了,补考没过有重修了,好多成绩都是刚好过了及格分。虽然我并不认为大学里的成绩能用来干嘛,也对所谓的奖学金、优秀生不屑,但是至少不要挂科。大学里就算你成绩考到了90分以上,也不能说明你对这门课的深入理解,或许你是真的为考试而考试,或许你真的是为学习而考试,又或许你是为了拿个奖学金考考试,又或许这个分数是你copy来的……

  所以,我并不认为分数有多重要,顶多说明你是个好学生。

以下是些训练宋朝文献断代模型可能用到的方法和技术: ### 数据收集与预处理 - **数据收集**:收集大量宋朝及其他朝代的文献数据。可以从古籍数据库、图书馆馆藏等渠道获取。例如《全宋文》《全宋诗》等大型文献汇编是很好的数据来源。 - **数据清洗**:去除文献中的噪声,如标点符号、特殊字符等。对于些异体字、通假字进行统转换。 - **标注**:为每篇文献标注所属朝代,作为模型训练的标签。 ### 特征提取 - **词汇特征**:统计文献中特定词汇的出现频率。例如,宋朝有些独特的官职名称、文化术语等,可以将这些词汇作为特征。 - **语法特征**:分析文献的语法结构,如句子长度、句式等。不同朝代的文献在语法上可能存在定差异。 - **语义特征**:使用词向量技术(如Word2Vec、GloVe等)将文献中的词汇转换为向量表示,从而捕捉词汇之间的语义关系。 ### 模型选择与训练 - **机器学习模型** - **朴素贝叶斯分类器**:基于贝叶斯定理,通过计算文献属于不同朝代的概率来进行分类。它的优点是简单、训练速度快。 - **支持向量机(SVM)**:寻找个最优的超平面,将不同朝代的文献分隔开。可以处理高维数据,并且在小数据集上表现较好。 - **随机森林**:由多个决策树组成的集成学习模型,通过对多个决策树的结果进行综合来进行分类。具有较好的泛化能力。 - **深度学习模型** - **卷积神经网络(CNN)**:可以自动提取文献中的局部特征,通过卷积层和池化层对特征进行筛选和压缩。 - **循环神经网络(RNN)及其变体(LSTM、GRU)**:适合处理序列数据,能够捕捉文献中的上下文信息。 - **Transformer模型**:利用自注意力机制,能够更好地捕捉长距离依赖关系,在自然语言处理任务中取得了很好的效果。 ### 模型评估与优化 - **评估指标**:使用准确率、召回率、F1值等指标来评估模型的性能。 - **优化方法**:采用交叉验证、网格搜索等方法来调整模型的超参数,提高模型的性能。 以下是个简单的使用Python和Scikit-learn库实现朴素贝叶斯分类器的示例代码: ```python from sklearn.feature_extraction.text import CountVectorizer from sklearn.naive_bayes import MultinomialNB from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score # 假设documents是文献文本列表,labels是对应的朝代标签列表 documents = ["文献1内容", "文献2内容", ...] labels = ["宋朝", "唐朝", ...] # 数据划分 X_train, X_test, y_train, y_test = train_test_split(documents, labels, test_size=0.2, random_state=42) # 特征提取 vectorizer = CountVectorizer() X_train_vec = vectorizer.fit_transform(X_train) X_test_vec = vectorizer.transform(X_test) # 模型训练 model = MultinomialNB() model.fit(X_train_vec, y_train) # 模型预测 y_pred = model.predict(X_test_vec) # 模型评估 accuracy = accuracy_score(y_test, y_pred) print(f"模型准确率: {accuracy}") ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值