大模型 3 次给不出答案,跟搜索引擎比?我:……

一些想法不一定对

天下苦 baidu 久矣!

1,惊艳一瞥

年初,被大模型惊艳到,还是那种直接给答案的交互方式。你只要简单给一句话,一小段提示词,大模型不管会不会,巴拉巴拉,像模像样地写出很长的文案。这对经常写文字,写会稿的作者,带来了便利。

尤其是 ChatGPT,训练的数据量尤为巨大,所以,相当于一个大大的搜索引擎。不管什么行业,ta 都懂,说起来头头是道。对于对一个行业不了解的小白、新手,这是进入另一个行业的契机。你用门外汉的话,问出的问题,只要携带了一个半个关键词,大模型都能接下去。像极了相声里的逗哏、捧哏。

2,baidu 给不了的清爽

知识类的问题,大模型一次给答案,这样的交互,是 baidu 这些搜索引擎给不了的清爽。baidu 有许多优质的资源,有先进的算法,有新鲜的数据、文档,但广告的问题,常为人诟病。数年如一日,用户自然心有不爽,选择不用。大模型给的答案,没有 ad,没有排名,直至最终的解答。

发挥类的问题,大模型提供了 temperature,可以灵活调整发散度,要严谨,就一板正经地说;要活泼,就海阔天空地畅享。

大模型的问题

1,“人不能两次踏入同一条河”

古希腊哲学家赫拉克利特的名言。第二次踏入那条河流,外部因素,随着时空的变化,而不相同。水流、河沙、卵石、人等等,都会发生变化。

类似地,同一个提示词,大模型不可能有两次同样的输出。这是由其随机决策的机制决定的。使用者直观的感受,是同一个明确知识的问题,难道就不能作为“最佳实践”,被广泛地使用吗?如果正确的答案,千变万化,飘忽不定,那掌握什么,才是最终的“定理”?

2,数据源不可靠

大模型是使用数据训练出来的。数据来自互联网,或者数字化的纸质数据。

做一个不慎严谨的比喻,好比下图。左边是猪肉,右边是火腿,中间是魔法。左边投入的原材料,对右边的产生有直接影响。不可能左边投入了胡萝卜、土豆,而右边产出了猪肉火腿。这么说吧,“能量守恒” :)

猪肉 - 火腿

3,严重依赖提示词

提示词,其实相当于搜索引擎的搜索。给出几个关键词,给了大模型一个方向,可以前往近似方向,搜寻知识。但是,请记住一句话:“并不是所有人,都像你一样会提问”。人们提问的方式,是他们思考角度、思维方式的体现。我们无法强求所有人,都掌握了所谓的“最佳实践”。那么,一些有问题的提问方式,大模型很难给出相近回答。但又不能出一本“提问的方式”,强制大家学习掌握。

3,信息孤岛

这是引起上一段问题的原因。

互联网上的数据,分散在各个大大小小的孤岛。每个网站,每个 App,都在想办法把用户困在自己的“领土”内,穷尽奇技。美其名曰:“羁绊”。有了用户,就有了源源不断的数据。这些商业数据,与竞争对手,是不可能公开的;对公众,更加不可能。大模型的数据源,这一部分,是获取不到的。

回想人们著书立说,总结经验,传道受业,不就是为了把知识传承下去么?各个行业,成功的经验,应该广泛地让他人有所了解。而不是闭门封户,刻意隔绝。

搜索引擎能拿到的数据,大模型都不一定拿的到。只能说,好比金字塔。底部是公开的知识,其上一层,是搜索引擎,再上一层才可能是大模型。大模型曲高和寡,举例新的知识较远。

搜索引擎

互联网是为了更快地交流,交换知识。提高人们的学习能力,加快知识碰撞的进度。搜索引擎是 web 时代不可或缺的基石。

1,数据新鲜

互联网上遍布着搜索引擎的爬虫,主动的、被动的,源源不断地从各个角落,挖掘有价值的数据。通过一系列算法,提供给用户检索。互联网上优质的文档,得以曝光给普通用户学习。

2,最佳答案

诸如开发人员喜欢的 Stack Overflow。一个答案,经过日积月累用户的投票,基本会稳定地选出最佳答案。那是解决特定问题的方法。

搜索框内只要给出合适的关键词,在搜索结果第一页,你几乎可以直接找到需要的答案。

最后

语义化理解,大模型做得很好,能更好理解用户意图。但是,人们提问的方式、数据源的局限、飘忽不定的对答,都是非常迫切的问题。

反观搜索引擎,新鲜的文档不计其数。如果把输入框引入大模型的理解能力,不但会用搜索引擎的人,可以快速锁定最佳答案;不会用的人,也能办到。

我是@程序员小助手,专注编程知识,圈子动态的IT领域原创作者。