从产品交互层面,还无法取代搜索引擎,从技术角度稍微改造一下,取代传统搜索引擎是可行的。
但目前ChatGPT的交互形态,还不能取代搜索引擎。
比如ChatGPT对于不少知识类型的问题,会给出看似很有道理的答案,但有时这些答案可能是错的,但很多问题他又可以回答的很好,这就会给用户产生困扰,到底该不该相信它的答案呢?
此时这种判断就需要交给用户自己,而搜索引擎会给出好几页的可能的答案,用户在其中选择的成本相较于ChatGPT交互带来的成本就会低很多。
ChatGPT基于GPT模型标注训练得来,对于新知识的吸纳并不友好,新知识总会不断出现,但如果一有新知识就去重新预训练GPT模型是不现实的,无论是金钱还是时间都不可接受。
如果对新知识采用Fine-tune的方式,看起来成本会低一些,但很容易出现新数据引入导致的知识遗忘。
总结来说,如何将新知识融入到大模型体系下是非常有挑战的问题。
谷歌和微软的搜索,也只大模型和搜索结合起来,而不是完全替掉了搜索。
我们都知道,大模型的在线推理成本太高,搜索引擎都是面向数以十一记的用户请求,如果延续目前搜索的免费策略,世界上的任何一家公司都是难以维系的。
要么限制用户使用,要么采取收费策略,不管哪一种方式,对于有规模效应的搜索业务来说,都不是一个最好的选择。
似乎只能寄希望于OpenAI自己将训练成本大幅下降才能解决了。
接下来再说下从技术角度取代搜索引擎的思路。
其实new bing的方案基本上提供了一种思路。
在ChatGPT基础之上,引入搜索引擎,解决新知识引入的问题,做好生成内容可信性验证,吐给用户。
ChatGPT是主要的生成引擎,传统搜索引擎首先会对ChatGPT生成的知识类问题进行回答,进行结果可信性验证和展示。
比如ChatGPT给出了一份答案,同时传统搜索引擎也按照这份答案文字搜索到相关链接,一通展示给用户,让用户判断两份结果是否都是真实可信的。
当然,并不是所有的类型的答案都需要做可信性校验,有些问题可以自由发挥。
因为ChatGPT很多内容不具有时效性,所以通过传统搜索引擎,可以随时将新知识引入到大模型中,这就当ChatGPT发现一些时效性问题回答不了时,就可以转向采用搜索引擎的答案了。
ChatGPT和传统搜索引擎,各有所长,所以整个方案看起来是吸取大家各自技术的所长。
未来的搜索引擎大概率是以人工语音作为入口的,用户通过自然语言的方式和一个AI小助理沟通,小助理的回答可能是大模型生成的,也可能是搜索引擎抓取的。
所以短期看技术上是可行的,产品交互层面长期看也是可行的。