开篇引用sinan写的一段话。

进入互联网时代后的现代社会是个信息的时代,现代人所追求的大部分东西都可以被看作是一种信息编码。长期来看,获取有效信息的能力和输入信息的质量对个人境遇的影响会越来越大。一是因为时间所带来的复利效应;二是信息时代的信息总量会不停膨胀,但优质信息总是相对稀缺的,所以过滤的难度会变大;三是因为以初级人工智能算法为基础设计的推荐系统是个信息回音壁,算法喂给用户的内容是为了调动原始情绪而非提升思维,所以无法主动搜集获取有效信息的人,可能会在机器学习算法的调教下越来越蠢……

原文引自 如何高效获取信息,非常值得一看的一篇文章,作者非常有见解。原文写作时间比较早,本文为基于sinan文章的框架补充一些我的观点以及一些新的内容。文章主要分享我怎么快速搜索AI相关的前沿知识,可以参考去用于其他方向。(文中非我所写的文字均标注引用)

为什么学会获取信息很重要?

决策基于信息

海量的正确信息 + 正确的思考方式 = 正确的答案;

少量的正确信息 + 正确的思考方式 = 不错误的答案;

海量的正确信息 + 错误的思考方式 = 不错误的答案;

少量的正确信息 + 错误的思考方式 = 错误的答案;

决策离不开高质量的信息支持。信息是做出明智判断的基础。拥有更全面、更准确的信息,我们才能更清晰地评估风险,抓住机遇,从而做出更优的决策。反之,基于不完整或错误的信息做出的决策,往往会带来意想不到的负面后果。决策前搜集全面准确的信息是更理智的决定。你们应该深有体会,选择远远大于努力

关于决策的一些个人想法(与本文无关)

我个人决策喜欢全面系统的尽可能搜集到一切我能搜集到的信息,随后基于当前的信息列举所有可能的决策。依次排除我不喜欢的方向,不愿意做的事情,最后再从剩下的选项中选择一个最优解(推荐阅读:真正的高手,不追逐目标,而是设定边界)。我不会做我不想做的事情,我只做我想做的事情。如果把时间尺度拉长到人生,很多东西都无关紧要了,放轻松吧。

人生有限,所以不要把时间浪费在重复其他人的生活上。不要被教条束缚,那只是根据别人的思维结果而生活,不要让他人的喧嚣纷繁淹没了自己内心的声音。最重要的是,你要有勇气去跟随你的直觉和内心,因为它们在某种程度上已经知道你想要成为什么样子,所有其他的事情都是次要的。

避免回音室效应导致的思维固化

很多很多博主都做过回音室效应/信息茧房之类的视频,文章等。我这里不过多赘述了。

信息回音壁(也称“回声室效应”)是指在网络或社交媒体等相对封闭的环境中,拥有相似观点的人们不断重复、强化彼此的看法。这种现象会让群体成员只听到与自己立场一致的声音,忽略或排斥不同意见,最终导致观点极化和认知偏差。信息回音壁的形成,既有个人选择性接收信息的心理因素,也受到社交圈层、算法推荐等技术因素的影响。在这种环境下,信息或想法会被不断放大,甚至以夸张或扭曲的形式重复传播,使得群体成员误以为这些观点就是全部事实,而外部的多元信息很难进入这个圈子。

日积月累的信息复利

如同投资中的复利效应,高质量信息的积累也会产生惊人的复利效应。当我们持续不断地获取、消化和整合新知识时,这些知识会在大脑中相互连接,形成更庞大、更精密的知识网络。这种日积月累的“信息复利”能让我们对新趋势、新变化保持高度敏感,能够更早地识别潜在的机会和威胁。凭借持续吸取高质量的信息,有助于构建自己非共识的insight,成为所在领域的引领者。

怎么快速搜集信息?

切换搜索引擎为Google

搜集信息(特指AI/计算机技术相关,如果是一些国内特有行业,如国央企的信息,可能百度会更好用)的第一步,切换使用的搜索引擎为google(如果无法使用,请自行探索,下文遇到的所有无法使用的均同此条)。替换掉百度/必应等搜索引擎。google可以显著过滤掉大部分的低质量内容,如CSDN/各类营销号/无任何信息价值的新闻等。

构建目标领域的overview

不知道自己不知道是阻碍信息收集的最大难点。在开始深入搜集之前,花时间去构建对目标领域的宏观认知至关重要。这就像绘制一张地图,让你能看到全貌,理解不同信息点之间的关系。你可以通过以下方式:

  • 阅读综述文章或百科条目:维基百科、专业的科技博客、入门级的教材或白皮书,都能帮你快速了解一个领域的关键概念、发展历程、核心问题和主要流派。(AI领域常用的如,github的awesome,arxiv上的xx领域综述等)
  • 浏览领域内知名机构/公司的官网:了解他们的产品、技术方向、发布的最新研究成果,这能帮你迅速抓住该领域的热点和前沿方向。
  • 观看高质量的入门级课程或讲座:一些知名大学或在线教育平台会提供免费的公开课,这些系统性的知识梳理能帮你快速建立起知识框架。

构建目标领域的overview,能更清楚地知道哪些信息是你需要深入探索的,哪些是次要的,避免盲目搜索。

发散再收敛 Diverge before converg

「Diverge before converge」是设计思维(design thinking)里借用数学概念的一条思考原则,即 在解决问题时,先发散思维把所有能想到的选项都列出来,再进入筛选、优化、决策阶段。这里特别反对的(但大多数人会自动采取的)方法是面对问题时,沿着最小阻力路径,草率采用眼前的第一个选项。

为什么要发散再收敛?

主要是为了防止先入为主的印象,避免出现信息回音壁不断强化观点,导致存在偏见。得出一个正确结果的前提是搜集了海量的信息。不要过早的给出结论。在信息搜集阶段,尽可能地拓宽信息源,搜集不同观点和角度的内容,即使它们看起来相互矛盾。只有当你有足够多的原始信息作为支撑时,才能进行批判性思考,辨别信息的真伪和价值,最终得出全面且深入的结论。

我常用的信息发散方法

(具体可参考上文中sinan的文章) 使用大模型/教程建立一个overview 再寻找当前领域的综述,找到有价值的信息 基于有价值的信息再去BFS的搜索(query改写,中文英文混搜,大模型搜)。 找到新的关键词,基于关键词继续搜。

使用大模型协助搜集和理解

搜集信息,建议使用google的gemini(可以辅佐其他家的一起使用,但我使用体验最好的是gemini)。gemini内置了联网搜索(不确定,但我平时直接问gemini,如论文,会直接给出可以搜索到的正确论文标题。使用大模型辅助时注意判断真假。)。同时gemini有每月十次的deep research,效果拔群。搜集信息时注意初筛,将明显不可靠,不重要的信息筛掉。

利用内容平台的推荐算法

在小红书、B站、知乎、X等内容平台(我没有尝试过抖音,不确定效果如何)快速关注大量与你感兴趣内容相关的博主,同时对主页出现的与你希望阅读相关内容不一致的内容打不感兴趣tag,可以快速调教推荐算法。内容平台可以给出很多新的可以搜集的引子,打破信息茧房,提供新的灵感。

个人见解:小红书、B站、知乎等内容平台中. 小红书主做外网搬运,信息速度快,信息质量低,适合快速获取到一些你不知道的信息作为引子,再自己使用搜索引擎进行搜索该方向。 B站,信息速度较小红书慢,一般等信息传递到B站时已经过了好几天了。 知乎,内容产出质量较高,很久没用了不确定现在的状况。 X,如为AI相关,重中之重的平台,内容质量极高。无论是AI初创、大模型基座厂商等等都会在X上发文,同时也会有很多国人在X上发布高质量的insight。

与人交流像遗传算法的DNA互换

信息搜集并非只靠独立摸索,与人交流是获取高质量信息的捷径。积极与目标方向领域的朋友,同事等等人交流。善于提出问题(推荐阅读:提问的智慧),可能能够快速的破除自己的回音壁,也容易得到更多经过人提炼过的想法,能够得到更多的水下信息和非共识。人是更高效的信息过滤节点。

怎么筛选信息?

以是否有用来判断信息的质量

抛弃低价值信息,搜集潜在价值信息,关注高价值信息。 避免在自己的信息流中引入低价值的信息源。不要搜集错误,偏见,无启发的信息。

  • 低价值信息(鸡汤、大道理、与我无关):这类信息通常是泛泛而谈,缺乏具体指导性,对个人实际行动或目标实现帮助不大,甚至可能终身都用不上。
  • 潜在价值信息(知识积累、系统性教育):这类信息属于基础知识和系统性学习范畴。虽然它们可能不会立即产生效果,但它们是构建认知体系、提升个人能力的基础,具有长期的潜在价值。
  • 高价值信息(与目标相关、能导向结果 - Actionable Information):这是最有用的信息类型。它直接与个人目标挂钩,能够指导具体的行动并立即带来可见的结果。这类信息被称为“可行动信息”,其特点是能够促使决策和执行。

尽可能靠近信息的源头

关注大公司、明星初创、头部vc、优质内容产出者等。人是更高效的信息过滤节点减少信息失真: 信息在传播过程中会不断被解读、裁剪和加工,往往导致最初的含义被扭曲或稀释。从源头获取信息,能最大程度地保留其原始面貌和完整性。 提升洞察力: 源头信息通常包含更深层次的背景、细节和思考。这能帮助你建立更全面、更深刻的理解,从而形成独特的见解和判断。 获取前沿信息: 重要的创新、突破和趋势往往首先在源头被提出。比如,一篇开创性的研究论文、一家顶尖公司的财报分析、或者一位顶级投资人的深度访谈,这些都是行业风向的早期信号。

拿科研领域的一条信息传播链举例:在实验室里通过科学方法验证的一个科研假说,就是处于源头的信息。论文是其载体。往下走,加工一手科研论文信息的包括文献综述、一手行业报告和专业书籍。再把综述和行业报告选择性翻译传播给大众的有大众媒体和通俗图书。再往下游走,社交媒体上传播的往往是对媒体专业记者所写内容的再加工。最后还可能下沉到完全无法回溯信息源的形式,比如”我听村口王大爷说……“。这个信息下沉的过程持续数十年也不少见。

做信息的输出端

做信息的输出端可以。吸引到更多观念一致的人共同讨论,构建社区,建立个人的可信度。 输出的本身也是学习。 推荐阅读 分享你最好的想法实际上会为你赢得更多客户

我的idea 使用AI接管我的信息源

再议

怎么沉淀成自己的知识?

推荐阅读: 排名在前 1% 的高中生是靠天赋还是靠努力? 卡片笔记写作法(使用obsidian构建为多链 图状的知识)

抛砖引玉 我的信息搜集/筛选/管理工作流

下面以快速调研某个方案为例。

google

搜索引擎,query改写,使用中英语种基于关键词搜索。

沉浸式翻译

用于快速阅读英文网页。

gemini(或者别的大模型)

辅助快速理解判断是否可用

notebooklm

基于问答去吸收信息,阅读文献很方便

cubox

剪藏软件,我用作稍后读

obsidian

多链笔记,可以使用git同步。搜集到的信息会被沉淀到这里。

dia

比起gemini更方便的AI浏览器,可以获取浏览页面作为上下文

folo

RSS阅读器

zotero

文献整理器