悟已往之不谏,知来者之可追
三年半的时间一晃就过去了,第八学期马上就要开始了。
总结一下前几年的work。踩过很多坑,目前几乎一事无成,一个曾经意气风发的少年现在感觉前途渺茫,哈哈。
写这篇blog的目的:整理一下这几年踩过的坑,轻装前行吧。
第一、二学期
还记得刚进入TJ的时候啥都不懂,按着老师的指示,在第一学年花了数月的时间看小波、区间分析等完全看不懂的东西,还花了很长时间去看CV圈儿的基础知识。第二学期结束的时候知道了水利课题已经立项,老师安排我去打杂。这时突然发现花了几个月看的cv的知识白费了……
这俩学期的课程基本都没有干货,线性系统理论老师基本上一直在念PPT,模式识别以及计算机视觉、人工智能等课也很仓促,可以说完全就不像一门课程嘛,看来老师们都无心教课吧,好气愤,更气愤的是老师们还很有理,给研究生的课当然要以培养研究能力为目的,所以你们研究生就来讲论文吧,好无语啊。一门课程最起码要讲清楚这门学科是啥,咋来的,现状是啥,有啥主流的方法(算法),当然这些东西你甭想在课堂上听说啦。
第三学期
第三学期一开始老师让写一个关于小数据、贫信息处理的综述,当时就感觉怪怪的,对于一个还没有进入科研圈儿,啥都不懂的毛头小子,这东西能实在不好搞,我花了一个月的时间去找对应的论文,发现这东西没法搞啊:首先你得弄懂何为小数据处理,当然更重要的是,这东西是否是一个研究领域?很明显,由于小数据处理散布于很多学科,而且大都是一个处理过程的其中一个empirical的小步骤,如在统计学中很少的数据下如何根据某个应用背景(如航天领域)去估计某个统计量,在土木学(如预测模型、结构辨识)中的一些模型的标定……。对,这东西还没有形成一个研究领域,没有几种common的方法,甚至小数据处理的目的都是很模糊的,遂作罢。对于水利课题,由于项目指标都是一些工程性质的东西,非学术性任务,一看就不是博士生应该干的,因此我也就没有太放在心上,开始思索我到底该干什么,当时不知道咋听说的time series prediction,于是就从这儿着手了,同时开始积累(加固)数学知识(rudin的数学分析原理,泛函分析,模式分类,PRML,拓扑学,统计推断,ps:由于没有养成良好的读书习惯,这些书很多都没有看明白)。
由于处于放养状态,看的文献实在太杂,看了很多水的东西,当然现在来看一眼就能看出来当时那些文章是水文,还有很多是不值得花时间研读的文章(即只需要记住结论,或者只需要知道大概是啥就行了,没必要研读,如AIC,BIC的论文),这一切都源于一个非常critical的现实:我没有研究目标,当然就没法以一个中心开始研究了。很容易理解哈。一开始是一篇time series prediction水文章,再继续看下去有可能找到了一篇偏统计的文章,下一篇又是一篇偏经管的文章,没办法这个time series本来就这样无语,由于不同学科的taste几乎完全不一样,这种situation对于我这个不知道如何research的门外汉来说完全是disastrous的,当时的我好可怜啊。
第四学期
第四学期继续处于这种不知道干啥的状态,看了很多有毒的paper,即一些奇淫巧技的灌水论文,我当时完全脱离了主流学术圈儿,道路完全走偏了……,痛定思痛,决定直面现实,看看水利课题有啥可做的,遂花了将近三个月的时间对水文学这个学科的文章进行调研,主要是各种水文模型,收集了好多博士论文(当然我认真看了好多博士论文的)。在调研的过程中,发现这个学科搞的黑箱模型和ML领域的也很像嘛,各种ANN,FIS都是好熟悉的身影啊,看来我第三学期看的prediction的文章还是有用的?当然,得意的太早了啊,细思恐极之处在于:你现在这么玩儿就是跨了好多学科,而不同学科的思维方式是有很大不同的,特别是对于水文学这个传统学科来说,我一个EE的本科出身的人完全搞不清楚这个学科的high点是啥,当然这个问题我直到六学期才意识到。。。
第四学期调研三个月的水文学之后,我还是不知道要干啥,我发现这么下去不是办法,于是赶紧静下心来看ESL,暑假也是继续看ESL和凸优化,将SVM基本搞懂,天呐,虽然我很早就看了李航的统计学习方法,但我这时候才开始认真积累主流的算法,自此才知道要进入ML圈儿……
第五、六学期
第五学期九月份又温习了小波,继续看ESL,发现没啥好玩儿的了,而且以我的数学功底,想要完全看懂那本《小波十讲》都是几乎不可能的,况且一个令我胆战心惊的问题一直围绕着我:我到底要干什么?难道一直玩儿方法论?
十一月底就要开题了,我决定搞水文预测吧,十月份花了一整个月的时间去搞开题报告。十一月份决定静下心来好好研究一些算法,想到了调研水文模型的时候看到的一篇很水的文章(很大可能是靠关系发出来的paper,当然我当时是看不出来的),就是基于90年代初的一个聚类算法FMM(现在几乎没人搞了),生成模糊规则,然后构建一个FIS,于是我就试着实现这个FMM,实现的过程中发现了这个聚类算法的一个重大缺陷,即产生的cluster数目很多(公正的说一下,FMM其实是一种思想,即用小box逼近一个cluster或class,FMM用于聚类的时候效果不太好,但用于分类效果很不错,所以一直到10年左右还是有好些follow的work,但FMM聚类基本上没人follow了,可惜我当时没有从这个角度看待这个算法)。于是我花了大半个月对其进行改进,这样十一月就过去了,一直到十二月底才开始写paper,过年的时候也在写。
三月初写完,这时候已经是第六学期了,扔给浩哥看,浩哥说理论性不足,于是我又放了两个月,到了六月中旬的时候投到TFS上(十一月底拒稿)。六月中旬到七月底我试图进入证bound的领域,可惜花了将近两个月的时间还是无法入门,决定弃坑。八月份回家后静下心来,决定从零开始,该聚焦了。
第七学期
第七学期一开始我就决定了要focus到聚类领域,九月中旬发现可以在一篇对PCM聚类算法进行改进的算法APCM进行不确定性的阐述,使其更灵活,于是花了一个多月时间写完投到TFS(17.1.18拒稿)。十一月份又打算对此paper写一篇改进版投到FUZZ的会议上,十一月底写完以后,晾到十二月底才投出去,到3.10就会有消息了,目测要悬了。
前七学期总结
三年半的路程说起来轻巧,其实是非常痛苦的。最痛苦之处莫过于我不知道自己要干什么,连研究领域都无法确定,直到第七学期才“狠下心来”决定做聚类,当然这个仍然是方法论,还是没有具体问题,原先想好的做FIS,用模糊聚类来获得FIS的rules,但是你的FIS用来干啥?还是不知道的啊,所以我很羡慕那些做CV、NLP的,问题就摆在那里,方法论是为研究目标服务的,我现在只能本末倒置了。
听闻在科院的华哥发了篇JACS,真是羡慕人家实验学科(搞有机、过柱子……),当然人家有大牛带,我连个研究伙伴都找不到,也不知道自己搞的东西到底能不能算是research,差距啊差距啊。
17年寒假感悟
以下是一些零碎的感悟,记录下来主要是为了防止遗忘,有些东西只需要discover一次就行了,不需要忘了再去discover。
另外,整理好了思绪才能轻装前行,不要非得等着啥事都干妥了再去干下一件事,浩哥说过“没有干不完的事”,所以啊,东西还得收拾,总结还是得做,规划还得有啊。
世俗:展现最美好的一面
即所见非实。如人们外出总是习惯将自己打扮一番,火车上陌生人之间一般都是和和气气的等。
我应该记住这一点,这毕竟是一个生活经验嘛,能够理解你所处的历史进程的各种phenomenon是一种很好的体验。
一个启发就是,要学会去去除各种无用的information,认识事物的本质。
哈哈,生活还是得多思考。
多思考之后就可以将很多东西变成你的技能树,很容易理解各种生活现象,也不再受各种烦心事的困扰。
再举一个例子就是,我以前比较容易陷入思维死胡同,即在一些不值得思考的事情(如很多生活小事)上面花了太多时间,导致心力交瘁哈哈,其实很多东西没必要放心上的,这就是一个技能吧!
默读:还是家乡话好使
我发现在家一两周以后,默读就会习惯使用家乡话,突然意识到普通话的默读很容易错失一些information,即没经过大脑就跑过去了,看来以后还是使用家乡话吧。
由此,我得出一个结论:思维方式一旦养成就很难改变了,要好好利用已有的技能树。
当然了,如何才能获得各种技能呢?当然是要多思考啊,思考的时候还得有技巧,即要慢下来。
慢:急切不可取
做事不可求快。如果求快就说明你已经厌倦了正在做的事,就无法真正地做好这件事了。
上面说的有点抽象,其实就是要搞清楚你要干啥,不要为了做而做,而是要达到做这件事的目的。目的达不到,也就相当于白做了。
一个重要的原因就是,干活的速度快了之后就会忘了初心,沉迷进去出不来了,即“调制”到正在做的事,从而无视了很多值得做的事、应该看的paper、需要坚持的身体锻炼等。
这一点其实就是“魔”吧!
魔都:痴迷即为魔,凡事皆不可痴迷
上海被称为“魔都”,我的最大的感受就是你不要被其各种表象给迷惑到了,不管多么纷杂的现象,不管其多么”魔幻“,多么地难以驾驭,其实都没有那么麻烦,你需要做的就是一步一步来,不要好高骛远。
一方面不要一个劲的被它迷惑住,从而深陷其中,进入“痴迷”状态而不可自拔;另一方面也不要妄自菲薄,要好好“定位”,保持正确的姿态,静下心来找到好方法,然后慢慢来吧。
再啰嗦一下,痴迷的一个表现就是心跳加速,不知道干啥,急切,浮躁等。
所以啊,如果干活干累了就歇着吧,避免进一步的痴迷,凡事要有个度,不要入戏太深。例如要写一篇paper的话,不要一连几天都干这一件事,你看着效率高了,其实不然啊,不能因为这一件优先级特别高的事而耽误其他事,要不然很难返回normal状态,而且会错失很多information:如果你同时干很多事,如一只track各个领域的paper,锻炼身体保持身心健康,效率会高很多。
记住:很多东西都是不能太痴迷的,你痴迷之后就养成了对应的生活方式,准确来说,是调制成对应的生活方式的,这就要求我不能坚持某些坏习惯了。
定位:历史进程与自我奋斗
要想不进入“痴迷“状态,一个必须的途径就是”定位“,知道了自己的位置,知道自己几斤几两,你做的决策也就更wise了。
要意识到,现实没有那么美好,环境连普通配置都算不上哈。
一开始我认为自己很牛逼,认为自己写的paper很牛逼,能发很好的journal,被拒了两篇文章之后发现自己也就那么回事,和别人比差远了。我连个具体的问题都找不到,被放养,啥都是自己凑的,走了很多弯路,基本连个反馈都没有,你有啥跟别人比?所以啊,认识到这一点,心态就平和了。
知道自己平庸的一面之后,很多“决策”也就非常reasonable。我没有必要整体急急忙忙地干完一件事,真没必要,你咋知道你干完这件事,看完这一篇paper能有啥收获?这篇paper也许就是作者拿来玩儿的,你还认为这篇paper很牛逼,那不就很可笑了。
所以啊,要对自己正确定位,也要对所做的事进行定位,及时评估你所看到的事物所在的“历史进程”,正确评估之后才能“闷声发大财”。
定位就像GPS哈哈,知道自己在哪个位置,知道目的地,就可以根据地图的路径选一个,就ok了。我所做的事有点challenging:我没有地图,没有真实位置,没有确切的目的地,所有东西都是estimate出来的……
恩,所以有些时间该浪费浪费,不要痴迷于正在做的事,因为很可能你正在做的事对你的毕业目标没有任何贡献,要合理评估所有事的优先级,进行正确调度,这就牵涉到“规划”了。
规划:不可随波逐流
借鉴了很多知乎牛人的经验,我决定对我的life routine进行重新规划。
首先是一天的时间安排。
-
晚上
我决定不在晚上进行学术活动了,最好的安排就是锻炼身体吧,俯卧撑等囚徒健身的内容要拾起来。
将需要密集思考的东西放到白天去做。也可以收拾东西(各种杂物),进行各种总结等。
最好八点前回到宿舍。一定要早睡。 -
早上
一定要早起,六点左右一定要起来,如果条件允许一定要去跑步。跑完步还有一个小时的时间可以在实验室度过,然后再去吃早餐。 -
中午和下午
我已经坚持将近一年不午休了,还要坚持下去。
早上和下午是主力时间,一定要好好把握。
然后是具体科研内容的约束。
-
知识面积累不能停
对于各个publication 的更新要密切关注,知道别人在干啥,避免陷入死胡同,要给自己多点活路,哈哈。 -
看paper不要太偏执
不要指望着从paper中能得到多少东西,看paper等积累过程或者说是调研或发现的过程一定不要急躁,记住:你的目的只是参考这些paper,需要积累的paper其实并不多,知道有那一回事就行了,一定要聚焦。 -
一天不要只干一件事
生活就是要丰富多彩,不要只在一个进程中运行嘛,这样有助于调节心情。
总结一下
寒假在家闲了一个月,属于真正意义上的休整吧。每顿饭吃的基本上都是撑着的,家里有米汤哈哈,好怀念。老妈嘱咐俺在学校要舍得喝汤,这样才吃得饱,恩。
一个月的放松让我意识到很多问题,也想通了很多问题,读博拿不到学位就算了,咱也不强求了。
如今身体已经垮了,要好好坚持我定的各种计划吧,毕业之前把身体搞好就行了。