总结一下封校的五月
Published:
上次出校还是 5 月 2 日,到现在整整一个月了。开学前还在期待着,这学期课少,多出去走一走,没想到还是被封了一个月。目前来看期末考完后可能再留校一段时间,不出意外解封有望,希望到时能出去玩。
封校生活
五月初,刚开始上网课(似乎也是大学第一次网课,如果不算我在 B 站大学上的课的话),经历了快半个月几乎完全三点一线的生活,起床后先在宿舍打开电脑上课、或者做一些简单的学习;简单解决午饭后直奔机房;直到晚饭时间去一个稍远的食堂(中区或者东区),当作饭前饭后的散步;再回机房学到大约十点左右回宿舍洗澡,并在宿舍一边学习一边摸鱼到睡觉。
很简单也很单调。一开始几天觉得还行,学习效率也不错,甚至觉得这种简单的生活挺好的,解决生活需求和一些日常事务之外,可以全身心地投入学习。这种想法大概持续了十天左右,突然就有种憋坏了的感觉,特别想出去玩。很明显的一个感受便是,比之前更难专注下来,每天的有效学习时长肉眼可见地减少,例如,下午花上三四个小时读完一篇论文,晚上就很难再做一些需要高度集中注意力的困难的学习。现在想来可能一方面和机房的环境有关,有种闷热、压抑的气氛;另一方面可能是老师同学的交流少了很多,即使我早就习惯了独来独往地去自习,网课环境下一直缺乏直接的交流,还是产生了一定的侧面影响。
很难想象一直持续这种学习节奏会怎么样,但我想我大概是顶不住的,我可以在一段短期时间内专注,但如果时间一长,抱歉,只想摆烂。
于是,当接下来的几天学校允许返乡的时候,我顺理成章地摆了小一周。
从 RUC 完全放开返乡(5.21 晚上)到现在也就短短十天,却感觉像过了半个学期一样。那天晚上看着大家收东西回家,有种高中散学典礼的感觉。于是和 ZL 每次晚上聊天,都无法避免谈一些诸如人生不易、离别之苦等略显悲伤的话题。除此之外,那几天每天还和一些北京友校的同学聊天,最关注的就是疫情发展怎么样、学校政策又发生了什么变化、返乡情况怎么样云云。和 FXR 聊天时,说起为什么要留校,我们的理由很相似,一是相信北京的疫情不难控制下来,二是,我们出奇一致地觉得自己可能“对生活质量的追求不是很高”,除了饮食之外可能没有很难克服的问题,只要不封寝,生活都能过。
不过,除了前几天短暂地禁止堂食之外,留校的生活质量显然比我想象中的要高。
首先学校里人少了很多,就能让生活质量提升一大截。吃饭、洗澡、乃至做核酸都不用排队了;图书馆、自习教室人也少了很多。校园里难得地清静,除了晚上的教二草坪依然极具生命力——仍然有许多同学聚餐打牌聊天,很久没有看到饭点、下课点时校道上、饭堂里熙熙攘攘的人流。开玩笑地说,大规模的离校潮,让本来看起来紧缺的校内资源突然就丰富了起来,甚至学校时不时还能送点好吃的。
其次换了个自习地点,从机房换到了立德楼。不得不说立德的自习环境是真的不错,空调加充足的插座的配置就已经足够了,还有舒适的桌椅、随时可以远望的大窗。加之人少,一个教室往往只有三四个人。敞亮的空间让心情也敞亮了许多。唯一的缺点就是远,于是开了个共享单车卡,幸福指数又提高了一点。
以及,最近又开始喜欢去操场散步了。晚上八九点从立德出来,刚好可以去操场走上两三圈。八点出头的时候人还不是很多,天色差一点才完全暗下来,但温度已经变低,这个时候散步是最舒适的。好几次都让我回想起在华附的时候,周末学校里往往也没什么人,五六点的时候去操场,一边散步,一边总结一下一周的学习并做一些规划。可惜的是高三晚自习下课去散步往往能遇到人一起,现在却没有。如果九点多去操场,人就多起来了,大多数都是在跑步的,或者跳刘耕宏的,像我一样跟个老大爷一样龟速散步的没几个。散步时或者打个电话给家里,或者自己安静地想一些事情,大概是生活里最放松的时间之一吧。
当然,虽然目前感觉生活挺滋润,还是希望北京早日清零、学校早日解封。一个稳定、舒适的环境才能真的好好学习、好好生活。
探索与思考
封校、留校是五月生活的主题,学业上,这个月大概做了更多的一些探索和思考。
五月初的时候,趁着假期阅读了许多经典论文,一轮下来感觉总算是对从 Transformer 开始兴起的 NLP 预训练模型的发展有了一个很模糊的轮廓。但说来惭愧,感觉自己在论文阅读时还是存在很多问题。
主要问题是读不懂——唯一我认为自己掌握地比较好的论文(基本上理解模型和代码、达到复现水平)的是 Transformer 的原论文,但这是在我前后一共读了三遍、仔细阅读源码的基础上的。很多论文其实并没有这么充裕的时间和精力去折腾,由于自身水平的原因,只能停留在一知半解的水平。这其实还可以衍生出几个小问题:读论文抓不住重点,十几页的论文不能快速完成一遍粗读并了解其核心观点,要么就只能靠几个小时硬读才勉强理解论文,要么就快速扫一遍摘要开头结论图表,但并未达到一个比较好的理解;缺少代码阅读和实践,即常说的“复现论文”,停留在纸上谈兵的阶段,事实上一到代码层面还是什么都不会,即使许多工作都代码开源,自己拿来一看还是一脸懵;缺少对整个领域的“大局观”,几篇相似的、或者有明显的承接关系的论文,目前的水平比较难以将其联系或者对比,例如 RoBERTa 和 ALBERT 都是 BERT 的改进,我认为最基本的要求是做到清晰地说出这两个工作在 BERT 存在的什么问题上做出的针对性改进,但我显然连这一点都不一定能轻松达到,更别说进一步的横纵向对比了。
当然,我认为这是作为一个大部分科研入门者开始学习阅读文献的必经之路,只不过大家跨过这个门槛的时间长短不一罢了。所以倒也不着急,慢慢来,自然会有一个水到渠成的突破。而在这段时间读论文的过程中,我感觉自己在大部分时间还是能乐在其中的,虽然没有传说中“看到一个好的 idea 能兴奋得跳起来”这种程度(某种意义上来说,由于积累不够我认为自己是还不具备快速、准确识别一个工作好坏的能力的),但当自己理解一个工作的前因后果、核心方法之后,还是会有很大的成就感。在对某个方向的工作感兴趣时,在文献调研时能得到一些正反馈,在科研入门的道路上大概会是很有帮助的。
除了阅读论文的“输入”之外,这个月还探索了一些可能的“输出”,即第一次尝试在公众号上发表一些学习笔记。
原因很简单,我一直认为,输出能力是做学术、做科研的核心能力之一。闭门造车几年做出突破性工作后一鸣惊人当然也是一种科研方式,但不一定是大多数人的正确选择,尤其是 AI 这种日新月异的领域。发表论文固然是最重要的输出方式,但我认为除此之外还应该培养一些其他能力,例如作报告、写博客、甚至写/录教程等等。在个人水平不足的时候,写博客记录自己的学习自然就成为了一种最合适的方式。
于是,在自学传统信息检索知识的基础上,开始写一些学习笔记。其实发出来还是会有很多顾虑,倒不是担心没人看,而是担心有人看。因为刚起步,自己写的东西其实并没有什么含金量,基本上就是 slides 的翻译和书上知识点的整理,很少加入自己的理解,原创性并不高。因此,反而担心看的人多了,会出现一些觉得内容质量水之类的问题。
后来想通了,CSDN 上那么多直接抄袭、重复性极高的内容都能发出来、B 站上一些我觉得讲的不怎么样的视频都能发出来,并且收获很大的点击量,我一个字一个字自己敲出来的为什么不能理直气壮地发,起码是我自己学习之后总结整理出来的成果。看的人少就自娱自乐,收获的学习动力是自己的,学到的知识也是自己的;也不需要担心出现什么批评,只有人气高了才能出现不同的声音,应该感到开心才对。一步一步地积累、学习、改进,如果能一直坚持,总能有一天能够输出优质的原创内容的。
在这两件事的基础上,就开始思考一些问题:我喜欢做学术吗?
大概目前是很难有比较清晰的答案的。一方面,我并没有真正地开始科研,尤其是开展一项时间较长的研究性的工作,并且取得结果(无论是成功还是失败),那么我其实是没有资格说自己喜欢科研的——没有做过的事情,谈何喜欢?最多只不过停留在兴趣层面罢了。这是从实践的角度出发。另一方面,从个人层面来看,我并不确定自己有没有科研潜力。很多人会说科研潜力其实和智商以及本科的 GPA 不是完全相关,但不可否认有一定的关系。自我感觉并不是一个很聪明的人,当一些厉害的同学能很快举一反三的时候,我还要一段时间才能反应过来;同时一直认为自己的独立思考和钻研能力不是很强。所以在这方面也一直持有一个怀疑态度。
本来还思考了一些读博的问题,但想一想,不一定有书读,还是算了,不写了。
当然,这些问题归根结底还是缺少一个“实践出真知”的过程。考完期末大概会开始做一些有趣的东西,想学的、想尝试的、想探索的,或许很多事情实践一段时间之后会有更明确的答案。