# 2021-2022跨年前的遐思

# 0. 那些年度总结

今天是2021年12月31日,其实日期只是时间节点的某种表示,我们人为地给某些时间节点赋予了特别的意义,比如生日——代表自己又长大了一岁,比如中秋——吃月饼赏圆月,提示我们要和家人团圆,比如今天是跨年——代表旧的一年要过去了,包含着这一年经历的、发生的所有事,都随之过去了,我们需要总结、反思这一年的所作所为、成绩和遗憾。

相信大家都在各种日常使用的App中收到了自己的2021年总结,从打响第一枪的网易云音乐,到紧随其后的知乎年度报告、B站视频总结、微信读书阅读报告、各种运动软件的运动总结....

各种App的年度报告

我们试图用这些报告来总结这一年,但不知道大家有没有这种感觉,看了这些报告,最开始感觉很有趣,但回过头来,却有一种空虚感,一种手抓细沙的无力感,仿佛这么整整一年,只留下了这么几条数据,明明经过了漫长的365天,却不知道到底自己做了啥就过去了。

认真的人儿,则会拿起笔或者键盘,好好写下对自己这一年的总结,比如今天逛知乎看到了田渊栋大佬的总结:

田渊栋大佬的总结

才看这一段,吓得我赶紧关闭了知乎,人家太厉害了,什么叫人生赢家?科研大丰收、业余爱好成绩斐然、家庭幸福美满。

然后再看各种公众号,有的是在总结自己今年100+原创文章,感谢读者、大撒红包;有的科技、技术公众号则站在很高的高度来总结今年十大AI趋势......

我只能嘴里喊着佩服、牛逼,然后默默地关上手机。

回想自己这一年,无论学术上,还是业余生活上,似乎都没什么拿得出手的成就可以摆上台面宣传,这个时候,难免会想:“为什么别人的一年,都收获满满,而我,却仿佛原地踏步?”

我是一个不甘平凡的人,但每每这个时候,我都会发现,我其实就是个平凡的人,一个普通人。

# 1. 浮躁的一年

这一年,我感觉挺浮躁的。

一方面是我自身比较浮躁,没有好好沉下心,认真把一件事情做到自己十分满意。在8月份刚刚被拒稿的时候,我曾给自己写过一个反思:

[]

如今过了3,4个月,有所改善,但是总体上依然感觉头脑很乱、生活与科研的平衡依然不够好。例如此时此刻我的屋子又有大概一个月没有拖地了,比方我对科研的方向,依然没有完全的坚定,这一年,我的研究的主要精力放在了data augmentation上,但依然懵懵懂懂,处在自己瞎看论文的阶段,没有内行人指导,没有队友,自己瞎摸索。

不得不说AI这一行发展得太快,上半年各种大规模预训练模型还在卷呢,下半年prompt又宣称自己开启了NLP的第四范式,当时激动的我觉得NLP平民的春天来了,但我发现,当我开始激动时,各大学术机构早已布局,当我们反应过来时,人家已经做出了完整的框架,我们只能捡一些剩骨头吃。除了prompt,再就是自监督、对比学习,成功地激活了所有人的Attention机制,包括我的,所以也蠢蠢欲动地想试试。总之,AI届的东南西北风挂的我团团转,一不小心就迷失了自己,忘了来时的路。

第二方面是感觉AI行业、学术圈的浮躁。

正如我上面所说的,预训练、prompt、自监督、对比学习...一个个概念、一个个热潮,此起彼伏。从学术上讲,这都是正常的学术创新和技术迭代。

然而,各种科技媒体的夸大宣传、过度宣传,赋予了原本单纯的技术创新过大的光环,从而促使整个行业更加浮躁。

一个典型例子,在我看李沐老师讲解MAE的时候,他说他观察到一个奇怪的现象:MAE在国外社交媒体上的讨论并不多,但是在国内却被推上了神坛,各种刷屏。

诚然,这反映了国内AI届的技术敏感度很高、传播快,但其实我们如果翻看媒体的报道,就发现,真正深入到技术原理中的报道很少,多数都是标题党,抓住MAE最吸引眼球的那个图(见下图,你哪怕没看过论文,也一定见到过这个图)一顿吹就完事儿了,“何恺明”就是流量密码,“用几个像素就能重构原图”就是宣传噱头,那些头部的媒体,借助自己庞大的用户群体,瞬间就可以点燃整个学术圈乃至行业的关注,然后各种自媒体也争相报道。(注:我没有说MAE不好,只是在评价媒体的报道)

MAE论文中的图

AI在中国已经太火了,不知不觉间,AI内容的报道就成为了一种生意,脱离了技术本身的单纯。而当一件事成为了一个生意,资本就会为了流量而入局,从而展现给我们的,一定是最能让资本挣钱的,而不一定是对大家最好的。所以,AI的新闻报道,一定是最能吸引流量的,背后的真正技术创新?媒体才不会管呢。

正因此,我在网上看到了网友对一些知名AI媒体的调侃:

机器之心——>重磅之心(经常推送“重磅发布XXX”类新闻,搞得AI圈仿佛隔三差五就要地震一次)

量子位——>颠覆位(经常推送“XXX颠覆XX行业”类似的新闻,搞得好像AI无所不能,要把全行业重新洗牌一样)

我只记得这两个了,其他的大公众号也或多或少有这样的问题。诚然,像机器之心、量子位这样的媒体,对AI的发展,做出了卓越的贡献,但不得不承认,这些媒体早期的文章,更加有质量,更加能刺激AI从业者的思考。

反正我目前已经取关了部分AI媒体,比较,一天到晚被“震惊”、被“颠覆”,人怎么可能淡定?

# 2. AI届的同质化、两极分化

# 同质化

前面刚刚调侃了机器之心,现在又得表扬它,因为它最近的一个推送,让我获得了一些思考:

这篇文章讲了一个发表在PNAS上的论文:

这个文章主要分析了科学界投稿量激增、经典论文的引用量激增的背景下,科学技术的创新受到了什么样的影响。

我这里直接摘抄机器之心对这个论文的总结:

  • 新论文将更有可能引用最高引的论文而不是低引用的论文;
  • 每年最高引的论文列表几乎不会出现变化,导致经典论文始终是那些;
  • 一篇新论文成为经典之作的概率将下降;
  • 进入高引用论文列表的新论文不会通过循序累积的传播方式实现;
  • 新发表论文中发展现有科研想法的比例增加,而颠覆现有想法的比例下降;
  • 一篇新论文成为颠覆性工作的概率降低。

这里的结论,我觉得十分有警示作用——人工智能相关的技术,越来越趋于同质化。

由于AI从业者、学者、研究生现在太多了,各种AI会议、期刊乃至arxiv上发表的论文月到数不胜数,这导致创新性的工作,越来越有可能淹没在历史的长河中,而那些本来引用量就高的作品,就更容易在茫茫论文之海中脱颖而出,被新研究者阅读、被新工作引用,从而来越来经典,如此循环下去,那些在领域大火之前就发表的作品,就占了大便宜,有很高的概率成为经典作品,而之后的作品就可怜了。。。

# 两级分化

除了同质化,还有一个现象在AI届越来越明显——两极分化。

啥意思呢?那些大组、大公司、大机构,可以越来越如鱼得水,发更多的论文、获得更大的影响力、有更高的引用量,形成良形循环,像滚雪球一样越滚越大,而小组、个人研究者、小公司,则越来越难竞争。

首先,那些本身就历史积淀、有名气的组,掌握了丰富的资源和人才,所以对学术届的未来方向更加洞悉、可以更早地入局一些热门领域,甚至他们可以直接引领一些学术方向,从而获得先发优势;再加上这些组织本身的名气大,媒体对他们的成果也会争相报道,从而其学术成果的影响力也会很大,从而更容易脱颖而出。另一方面,大组的合作更加密切、讨论更加深入和前沿,行动力更强,出成果也就更快。最后,由于大组往往能够成为某个细分领域的引领者,所以个大期刊、会议在对应的细分领域上,也会有更多的大组成员担任审稿人,那么大组本身的学术观点、框架、思路,就会影响这些学术评议的客观性和多样性。

相比之下,小组的劣势就不用多说了,一个字就是“难!”。

# -. 我们能怎么做

上面的所有,可以看做是我作为一个AI领域的小科研人员的观察或者吐槽吧。在当下这么浮躁、内卷的社会里,即使待在象牙塔里,即使做大家眼中都很单纯的科研,也不得不感受了浮躁、内卷、两极分化等社会现象在科研届的越来越大的影响。

有的时候特别羡慕那些知名大科研组的同学,他们以及他们背后的组织,是学界和业界的弄潮儿,他们是AI浪潮巨大红利的最大获益者。但如果我们是平凡的大多数呢?

平凡的大多数,没法引领技术的发展,只能跟着热门方向走;没法在大佬的引路下、在好的研究氛围下,每次会议批量地投稿,只能一次做一个工作,投一次改一次;没法大胆地自信地分享自己的工作,害怕自己漏了什么、错了什么,只能怀着“能中就不错了”的心态去写论文。。。

有些事情,我们没法去问“问什么”,就好比我们没法问“为什么我们的父母不是富翁?”一样。难道我们要从高考开始去怀疑自己,为什么不考更好的大学,不考研去更好的学校么?

这就是这个世界的一个基本的、我们必须承认并接受的事实:我们每个人所处的环境、拥有的资源就是不一样的,但我们却不得不在同一个环境下去竞争。

其实,人跟人之间的不理解,很多时候也是源于每个人的立场、处境、经历、际遇的不同。但是我们进行人跟人的比较的时候,很难意识到这一点。而如果我们在评价他人、跟他人争论、跟他们人比较的时候,能够去思考一下“如果ta跟我一样的环境,ta会怎么想/样”或者“如果我跟ta一样的环境,我会怎么想/样”,那我相信人跟人之间的理解就会变得容易地多。

然而,要求别人,甚至这些社会,去用那种更客观地方式去评价自己,其实很难,因为这种事儿是很费劲的。这就导致,一个普通学校的毕业生,即使他十分努力,个人能力十分突出,也可能会在求职中被一个清北的一般同学,单纯地因为学校这种外部因素而比下去。

这种情况是无法避免的,甚至比比皆是。如果吧范围拉得更宽一些,你会发现,很多发达国家的小孩,比我们中国小孩笨多了,但他们就可以很轻松地读世界顶尖大学,根据自己的需求,想读研就读研,为了个人价值而生活,而我们累死累活,为了很普通的大学的读研名额,挤得头破血流。

这些事实,听起来挺让人丧气的,尤其对于普通人来说。

那我们可以做什么呢?

第一,用一个更加客观的视角去看待和评价自己和他人:

当把环境、资源、机遇等额外优势去除掉,我们还剩下什么?

如果去除了这些外部资源,你觉得你已经尽力去争取你想争取的了,那么你就可以问心无愧地说:我已经很不错了。在这个层面去评价自己和他人,可以让我们看到真正的差距,而不是一味地焦虑、怀疑。

第二,在这个浮躁的、内卷的环境下,始终保持哪怕一点点的“为自己而活”的定力:

如果不为了比较、不为了别人,我自己到底想要什么?想做什么?

我相信不同的人,即使所处环境、机遇不同,ta对世界的好奇心、兴趣的程度,应该是大体差不多的。所以,即使我们为了生存不得不进行比较、不得不为了家人、老板、周围人的评价而活,我们也必须时不时问问自己,如果不为了这些,我想做些啥?这些事情,才是能真正给自己带来快乐和成就的事情,而不会被环境、出身、际遇所改变。


以上,作为我个人在2021年末的一点点反思和期望吧,大家共勉!祝大家新年快乐!

真正的英雄主义