今年在深圳过年,比老家要平淡一些,闲下来就想着要不要写一个年终总结(不也是这么正式,就是抒发一下),毕竟大过年的。但其实,过年过节什么的,都是人为规定的,在大维度的时间层面上来看,并不是说你过年过节,生活或者事业就会得到突破性的进展。所以,也不是说因为过年就应该要写一个总结,而是这种反思性的一个应该成为一种习惯。
事实是道理我都懂,我在日历上每周日下午会单独设置两小时来写每周总结,实际情况是每次都是各种理由或是直接无视日历的提醒。毕竟,这种付出不能立即见到反馈收获,或是长期以来,我们可能都感受不到,可能它确实会有一些好处,但我们自己可能意识不到的那种好处。这就难以形成的内在驱动,去驱使了我去执行这件事情。
既然一年都没有什么总结,那就趁着这个时候放假,然后还是过年很闲的时候,就当消遣来做一个反思与总结,总体围绕今年的探索与体验(毕竟是年轻人😁)。一年发生了很多事情,只是很多我不是很记得,如果说体验的话,唯一能想到的事是暑假的时候去实习。我的实习也不是很累,大部分时间还是在完成给定任务的情况下自己去探索,每天早起然后六点准时下班。
那段时间应该是我作息最规律的时候,早上六点起床,六点半坐地铁,然后去吃个早餐九点钟上班。九点上班按理说不应该起这么早,但是当我体验过广州的早高峰地铁,我就知道相比于早起我更怕跟人挤来挤去,何况有时候还挤不上去,甚至被人推着进地铁。到还不如从从容容,早起洗漱,从容坐地铁,从容吃早餐,点一杯咖啡坐在公司楼下自己刷会手机或看会电脑,准时上班。
大概是上了二三十天,我就离开然后自己去旅游了。先是去了大理,在这次之前去大理也是第一次好像还是在高考之后,也是觉得大理比较悠闲。之前的模糊记忆加上这两年看的电视刷的短视频对大理的渲染,想去的冲动更加强烈。当然,体验嘛还是一般般,太晒了,白天出门晒晚上出门人多,而且吃的还不符合我的胃口。出去玩嘛,不就是自己爽,对我来说吃住行是首要,风景啥的倒是口腹之欲上的精神追求。
我住在洱海生态廊道附近,基本上那几天晚上都是在廊道活动。我坐在一个酒馆的二楼大阳台,点了一份晚餐然后一杯果饮,带着耳机吹着晚风,从晚上六点坐到九点。坐在角落,观察下面来来往往的人,大多数都是在拍照的游客,沧海面上飘着的灯就像坠落的星星,与远处的山在蓝色的色调中形成非常棒的拍照背景。很多挂着大相机,戴着遮阳帽并穿着冰丝袖的人,一看就是专门给人拍照的,到处询问游客要不要拍照。有的精明一点的,会先去找好角度给游客先去拍,然后再拿到游客面前,直接把成品展现出来,这确实比口头揽客有用多了。
到了一定时间,会有两三人摆好音响和麦克风,架起手机支架就直接开嗓了。不一会就围了一群人,唱的怎么样是一回事(当然都出来唱了,自然还是有些实力),主要气氛到位了,掌声也是响个没停。演唱者也很忙碌,一方面招呼面前的听众要不要点歌,还要照顾线上直播的听众,比如回应一些弹幕。
坐在高处俯瞰这一片热闹的小地方,看着大家都是洋溢着笑容,再想到世界上此时此刻还有千千万万个这样的地方,很难想到世界上或者生活中竟然还会有那么多的困难苦难,此时此刻好像全世界都是善意与温暖。但是当我看着茫茫人海,想到自己也是其中一员,又不觉会认为自己是如此的渺小与平凡,心里又有些难受。我如果每天都是这样平凡快乐的生活,应该是很难实现的,但是我又试想一下如果我真的过上这样的生活,可能又会觉得很乏味无趣,有点不甘平凡。哈哈,这就有点像我现在放假的状态,之前上学每天很累期盼着放假每天快快乐乐,但是现在过上了这样每天无所事事的日子,又觉得假期什么也没干成,有点浪费光阴。
由于实在是有些无聊了,我觉得出来玩还是要吃些好的,后面我又飞去了成都,虽然成都也很热,但四川美食甚合我心,香锅串串、牛油火锅、川菜小炒…就这样吃吃逛逛大概一周我就回家了,马上也就要开学了。
在上学期间,我所听见并且接触到最多的词是“AI”,不论是新闻隔三差五的就有什么新的 AI 技术的突破,又或是出现了哪些基于大语言模型能力的 app 应用,还是身边的同学夸赞“写代码还得是 Claude”等等。每一次新技术或新应用的诞生,我总会凑到信息第一线去打探消息,说起来这似乎对我来说好像也没什么功利性的好处,只是满足了我对于人工智能技术的新的遐想以及拓展了下相应的认知——原来 llm 还能这么落地、原来 prompt 还能这么写、原来 gpt 不仅仅只能帮我写论文…
用的多了慢慢的对于 ai 的认知也就丰富了,gpt 刚出生的时候,总听说 ai 能够带来教育平权,很多人用 ai 都能不用请家教了,慢慢的我越来越意识到这个说法的错误。首先,你要能接触到 ai,很多人甚至都不曾使用过 ai,比如我妈今天让我帮她下载 deepseek 的应用她都差点没找到,况且这还是 deepseek 这段时间名声大噪,以前那么多 ai 出现的时候他们都不曾深度使用,我每次看到有人问我什么问题之前我都要先问他你有没有用 ai 先查询过。其次,我们都应该要知道,ai 有幻觉,意思就是 ai 会产生错误答案,即使现在有 RAG 这种技术来避免,但我们都无法保证他说的就一定是对的,因此谁能真正放心让 ai 去当老师呢,这就有一个悖论:希望让AI去当老师的人,往往在这个领域欠缺相关知识,缺乏这方面知识的人,无法识别AI所提供信息的正确性,也就是说假如AI给出的信息是错误的,他们无法识别,接收到的也就是错误信息,这样子的教育还有什么意义。
所以说,AI可能会增大教育的差距,能够识别AI错误信息的人,能够更好地去利用AI,而这部分人也是受到很好教育的人。他们会进一步根据AI去赋能,提升教育情况,或者说帮助他们提升效率。但是,不能使用AI的人,他们可能还是原来的教育情况,如果他们没有受到很好的教育,或者欠缺相关的知识,还要去使用AI,这个时候可能会适得其反。
在关于AI的讨论中,联想到的另一个概念就是“prompt”,也就是提示词。提示词是指我们如何与AI进行对话。例如,同一个问题,如果我们以不同的方式提出,可能会引起AI给出不同的回答。
就很简单的一个例子,有时候我直接问他一个问题,和我在问他一个问题之后再加上一句“请你一步一步的回答”,这两个可能大家去试一下。你去用一个问题去问他,然后他可能会给出一个错误答案。但是如果你加上一些话,比如说“请你一步一步的思考”,加了这一段话之后,他可能会给出一个正确答案。所以不同的提问方式或者说不熟的提问方式,也会引起他答案的一个正确与错误。
我觉得一个人对AI的利用程度很大程度上取决于你的提示词。不是说你的提示词要写得多么细致、多么精致,而是说你需要把你的需求提出来,并且需要让AI能够回应你的需求。这一点非常重要,因为它能够帮助我们清楚地知道自己想要什么。
前些天ChatGPT推出的Deep Research功能,以及之前使用过的Gemini的Deep Thinking,在你提出需求之前,它会列出一个清单,帮你把需求更加细化,会询问你有没有什么需要补充的。这样就可以帮助它能够更加了解你想要的是什么。我觉得这是一个非常好的交互方式。未来可能很多产品也会借鉴这样的交互模式,因为如果要自己主动挖掘需求,这种潜意识是比较难的。但是如果有外在的引导去挖掘需求的话,可能就很容易把潜在的认知挖掘出来。
我感觉自己对于需求的具象化本身就是一个元认知的训练。首先就是明确自己的核心诉求,第二就是设定自己的边界条件,补充一些隐藏的需求等等。在AI作为思维延伸的工具的时候,精准的提问能力就是新时代的元技能,不仅仅是prompt技巧,还有自我认知的镜像。越了解自己想要什么,就越能得到有价值的回应。
很多情况下,我看到身边的人,包括我自己也会这样,比如说,我想写一个Python程序,我就直接让AI给我写一个能够实现某种功能的程序。
但是,如果我能够把我的具体功能细分地告诉它,我希望怎么去实验、希望怎么怎么样,后面得到的Python代码就更能符合我们的要求。如果我只是简单地给出一句“我想要写一个什么样的文件,实现什么样的功能”,那么它可能会生成我们意想不到的结果。
如果我们给它的附加条件越多,把我们的需求展示得越详细,它就越能给出符合我们需求的代码。
所以这就促使我们去提高对自己需求的认知,进而将自己的需求表达出来。很多情况下,其实我们心里有一个方向,但在用言语表达出来之后,不仅能够更好地利用AI,自己对目标的理解也会更加清晰。这也会给我们带来一些灵感或启发。
再把这个方面扩大来讲的话,这就是提问的艺术。通过与 AI 的聊天,我也能够发现,和 AI 聊天就是去启发它。你通过你的提示词去启发它,激活它相应领域的知识,然后去回答你。
这与我们与人聊天是一样的,有时候,我们小组作业或者团队合作时,互相之间需要对自己的工作进行交接,以确保大家同步进行。这个时候,就需要把我们做过的事情和需要对方做的事情讲得清楚明白。这样才能保证双方的信息是对称的,也能够确保团队合作的协调性。
提问的艺术,肯定不仅仅是这个方面,还有一些我自己的经验吧。比如说,提问可以让你很委婉地去提醒某个人他的一些粗心大意造成的一些问题。就比如说,有时候可能某个人他有什么事情没有干,那我这个时候不会去直接提醒他。我会说:“哎,这件事情是谁干的?”这样就不会显得太过于直接和强硬。在最好的情况下,当然是这个人他自己就会意识到:“哦,是我干的,我等会去干。”而在其他情况下,可能大部分情况下,另一个朋友就说:“我记得是他,他要干这个事情。”要干这件事情的人就会意识到:“哦,那我去干。”这样从侧面去提醒他,避免了这个直接碰撞的尴尬。
还有一个就是使用场景的问题。一般来说,这种常见的使用场景就是让它帮我们翻译、写一段话,或者说问它一些生活中的问题。我觉得只要你的想象力够大,它能为你做的事情就会越多。特别是一些可以联网的功能,以前我们使用谷歌、百度去问一些问题,它的答案可能不会直接呈现给你,需要你搜索完之后在一些博客文章或者专栏文章、网页里面去搜索那个特定的答案。
但是现在AI是直接通过检索,然后自己帮你消化那个网页,把答案呈现给你。当然了,有时候我们肯定需要double check一下。除了那种计算题,或者说需要深度思考的题目,可能就需要我们double check一下。一般来说,像那种事实性的问题,只要不是太偏门的,你可以去相信它。
它就相当于简化了我们获取信息的路径。以往我们是去搜索,搜索之后再自己去消化,然后最终得到信息;现在是我们直接提问,然后直接获得信息。
现在有人说2025年是AI agent爆发的一年,我觉得会有更多的垂直领域的agent直接被实现出来,然后去赋能到垂直领域的一些效率。AI agent简单来说就是给AI装上一些武器,它能够帮你去调配一些工具,比如说做一些更加需要复杂步骤的工作。
以前原始的AI就是一问一答对话式的,或者说根据你的任务然后输出一段话。AI agent后面可能就会演变成你给它一个命令,它可以帮你去做这个,然后自己再去判断下一步需要怎么做,再去调用相应的工具去执行后续的步骤,最后给你一个结果。相当于它从一个对话工具变成了一个完整的系统来完成特定的复杂任务。
就是我之前自己通过RAG检索,然后再用AI帮忙,它可以帮你做很多重复性的工作。比如说你可以写一个Python程序,通过爬虫以及大语言模型。我之前写过一个每日的爬虫,它帮我从Hacker News、Reddit,以及一些主流媒体上面去获取每日的科技新闻或者前沿新闻。然后再用AI帮你把这些新闻打上标签,做一些注释或者总结以及归类,它可以帮你筛选哪些信息是有用的,哪些是没用的。
利用这种方式进行信息筛选的好处是它比较人性化。以前我们可能就是根据一些深度学习或者机器学习,根据语义去进行一些判断,做一些得分之类的东西,帮你筛选掉一些信息。但是语言这个东西如果单纯从得分上来看,可能误伤的几率会很大。但是如果直接从语义上让语言模型帮你判断,判断会更加人性化一点。
举个例子,之前我们需要去搜一些文献,文献要求必须要使用到ANOVA方法。如果我只是根据关键词去搜索的话,我肯定就是用ANOVA、心理学这几个关键词。但是这样就相当于是根据关键词来匹配,或者说做一些相似性的算法。但是如果用大语言模型的话,它可以在中间再加一个步骤,就是通过ANOVA这些关键词获取之后,它能够帮你再去进行筛选。因为仅根据关键词来匹配,它不能锁定到关键词之间的关系。比如说,如果我仅仅根据关键词匹配的话,它还会给我一些介绍ANOVA方法的心理学文献。所以我在这里还要进行一个区分,就是用大语言模型去将使用ANOVA方法进行分析的文献和介绍ANOVA方法的心理学文献进行区分。
当然,我这里讲的只是一些最简单的应用。大语言模型可以赋能到RPA,更加智能就形成一个系统。它可以模拟一系列步骤,将重复需要用到的人工替代掉。比如说像简单的任务判定,或者说进行分类的时候可以使用到。它也可以作为一个团队,你可以用多个大语言模型AI进行多种职能。比如说,2024 年有人提出过一个学术团队,里面有数据分析师、实验想法提供者,还有文章撰写和润色的,以及学术规范校准的角色。这些角色都可以通过不同的指令、通过不同的AI来进行扮演。然后把他们放到同一个代码系统里去,只要把规则流程制定好,他们就可以自行地去运作。
通过这一年来的了解,我了解了很多AI大语言模型的落地应用。虽然自己没有怎么去实践,或者只是做一些简单的实验,没有进行那么深入复杂系统的设计,但是也确实打开了不少想象力。原来AI还可以这么去使用,还可以这么去落地。
也使用过很多产品,像简单的ChatGPT,更高级点的比如说一些白板,很多都是提升工作效率的工具。用下来的话,感觉有时候会陷入一些工具的陷阱。就是工具太多了也会牵绊到自己的效率,这主要还是我感觉自我的工作流不是很严谨导致的缺点。我在某一个工作节点使用工具的时候没有做出很好的规划,导致在多个工具之间犹豫不定,这不仅会导致效率的下降,也会浪费不必要的钱财。
还有一个就是很多时候都是在尝试,然后我觉得不是说我自己要去做一些落地,希望它赋能给我的效率,可以输出一些有价值的东西。这些价值可能是一些个人的影响力,或者说粗暴点就是名声。这种也可以是对自己的一些提升,比如说眼界的提升,或者说想象力的提升,或者是一些使用场景的扩展。
还有一点可以反思,就是感觉我的目光都集中在互联网的线上。我在想,还是需要去了解一下线下的一些东西,它不光只能存在于线上用手机用网络,它可以存在于线下的某一个实体。比如说前些时间有一个AI玩具,他们就在玩具里面装了一些AI,可以跟玩具对话之类的,这就是一个很好的实践。这或许也可以有一些启发,比如像一些成人玩偶,它也可以纳入一些AI对话的功能,既满足了实际陪伴的需求,也可以通过人声模拟对话进行情感的陪伴。或者说以老人为对象做一些拓展,因为我觉得,虽然说现在这个比较火热,但是我感觉普及率还是很低。我觉得还是可以从那些不了解但可能会有一定需求的人入手,我觉得这部分人是比较庞大的,就是他们不会用但是他们可能又需要使用。
所以总的来说,2025年的展望就是多了解、多学习,然后多去开眼看世界。不仅是从底层的逻辑,还是到高层的落地,或者说是一些推广的策略以及管理方面的东西都需要去学习。我觉得很多东西都是融入一体的,不是分开单独去看的。也希望能有多一点的时间走出去看一看吧,就是去各地看一下。有些东西不是只能从网络上才能看到的,还需要自己去亲身体验、亲眼看到,才知道有的东西并不是靠嘴就能说出来的。还有一个就是多输出多创造价值,因为我觉得这个输出会倒逼输入。你只要逼着自己去不断地输出,从输入到输出之间的过程能够提升你自身的见识,增加你的眼界。
最后就是希望事事顺利,毕业有份好事业🌹。