在傳統(tǒng)搜索引擎的時(shí)代,想要找到某個(gè)問題的答案,你會(huì)怎么做?
(資料圖片)
也許你會(huì)打開你的瀏覽器,輸入問題,然后點(diǎn)擊搜索按鈕。然后,你會(huì)看到一大堆的網(wǎng)頁鏈接。
但除了某些十分簡(jiǎn)單、很顯而易見的問題外,只要是稍微復(fù)雜些的,需要提煉的知識(shí),人們往往都難以直接從搜索頁面中獲取答案。
于是,你不得不花費(fèi)時(shí)間和精力去篩選和閱讀這些網(wǎng)頁,并不斷點(diǎn)擊“下一頁”,才能找到你想要的信息。
也正因如此,在生成式AI的浪潮下,如微軟的新必應(yīng)、谷歌的bard、Perplexit AI推出的會(huì)話搜索引擎,都在試圖解決人們的這一痛點(diǎn)。
而最近,這股AI搜索引擎的大戰(zhàn),也席卷到了國(guó)內(nèi)。
幾天前,昆侖萬維推出了基于自身“天工”大模型的AI產(chǎn)品——天工AI搜索??梢哉f,這是目前第一款落地,并投入應(yīng)用的獨(dú)立AI搜索產(chǎn)品了。
該搜索AI一出,即刻在國(guó)內(nèi)掀起了不小波瀾,一些科技媒體紛紛盛贊,稱其會(huì)“革了傳統(tǒng)搜索引擎的命!”
那么,在表面的喧囂之下,天工AI搜索,及其類似的一票AI搜索引擎,真正的現(xiàn)狀究竟如何?
01 實(shí)際表現(xiàn)
鑒于到目前為止,關(guān)于天工AI搜索的測(cè)評(píng),已著實(shí)不少了。因此,本篇文章不打算再重復(fù)測(cè)試某些千篇一律、無關(guān)痛癢的功能,而是打算針對(duì)大部分普通用戶,在實(shí)際使用中最可能遇到的重點(diǎn)問題進(jìn)行測(cè)評(píng)。
在這些重點(diǎn)中,最為人關(guān)切的,首先就是幻覺問題。
為了測(cè)試這點(diǎn),我們分別將天工AI搜索與新必應(yīng)進(jìn)行了對(duì)比。
可以看到,在部分問題上,天工AI搜索與新必應(yīng)都給出了較為準(zhǔn)確的回答,沒有出現(xiàn)幻覺/錯(cuò)誤的情況。
但可以明顯感到的是,天工AI搜索的答案比新必應(yīng)要簡(jiǎn)略了許多。
例如,在“谷歌今年推出了哪些AI產(chǎn)品”這一問題下,天工AI只是籠統(tǒng)地提到了PaLM2這一產(chǎn)品。
而這很可能是天工AI的向量語義檢索導(dǎo)致的。
這種檢索方式的好處,是只需要計(jì)算向量之間的距離或相似度,而不需要對(duì)每個(gè)文本進(jìn)行復(fù)雜的分析和處理。
在新必應(yīng)的精確模式下,AI的回應(yīng)也很簡(jiǎn)略
通過對(duì)問題和潛在相關(guān)文檔進(jìn)行編碼,并計(jì)算它們之間的相似度,天工AI就能有效地過濾掉無關(guān)或低質(zhì)量的信息,只保留最相關(guān)和最有價(jià)值的信息。
但這樣一來,生成的內(nèi)容就會(huì)變得十分簡(jiǎn)略。
可即便采用了向量語義檢索,也難以完全避免幻覺問題。
在這個(gè)回答中,天工AI犯了一個(gè)明顯的錯(cuò)誤。眾所周知,在目前OpenAI的計(jì)劃中,GPT-4是不開源的。
而同樣的,類似的錯(cuò)誤與幻覺也出現(xiàn)在了新必應(yīng)中。
從理論上來說,如果搜索AI能夠從網(wǎng)絡(luò)上爬取到所有的信息,并且能夠完美地理解和處理這些信息,那么它就不會(huì)產(chǎn)生幻覺或錯(cuò)誤。但是,這在實(shí)際中是很難實(shí)現(xiàn)的。
至于具體的原因,暫時(shí)先留到文章第二部分解釋。
在這里,我們先看看另一大使用搜索AI時(shí)的重點(diǎn):理解和分析能力。
從功能上來說,AI搜索這個(gè)新物種,之所以被人們寄予了厚望,是因?yàn)樽詮钠湔Q生的那天起,人們就不單單只想將其作為一個(gè)純粹的搜索工具,而是希望它成為一個(gè)能集知識(shí)的發(fā)現(xiàn)、處理、分析和重新組織為一身的個(gè)人智能助理。
畢竟,在這個(gè)信息密度倍增的時(shí)代,人們已經(jīng)越來越不滿足于接收那些未經(jīng)“咀嚼”和“消化”的原始信息了。
那么在這方面,天工AI搜索表現(xiàn)得怎樣呢?
我們可以用幾個(gè)比較考驗(yàn)分析和理解能力的問題對(duì)其進(jìn)行測(cè)試。
從這個(gè)回答,可以看出天工AI仍然保持了十分嚴(yán)謹(jǐn)?shù)娘L(fēng)格,對(duì)“核污水是否會(huì)變核污“雨”沒有給出一個(gè)輕率的結(jié)論。
然而,這樣的回答,仍然停留在了一個(gè)“知其然”的層面,在對(duì)某些復(fù)雜問題進(jìn)行詢問時(shí),人們更渴望搜索AI展現(xiàn)出更智能、更具主觀能動(dòng)性的一面。
在這個(gè)問題上,新必應(yīng)的回答,則顯得詳細(xì)和深入得多。
而要想實(shí)現(xiàn)這樣的回答,就不能僅僅只對(duì)網(wǎng)頁中的信息、數(shù)據(jù)進(jìn)行簡(jiǎn)單的搜集,而是要依靠AI自身的智能,對(duì)其進(jìn)行提煉、分析和理解。
而這樣的智能,在面對(duì)一些需要選擇和比較的問題時(shí),就顯得尤為重要。
在某種程度上,AI搜索引擎邁向智能助理的第一步,就是對(duì)問題形成自己的“看法”。
只有這樣經(jīng)過深度處理后的信息,才能更有效地幫助人們進(jìn)行思考、決策。
而這樣具有“主動(dòng)性”的特點(diǎn),正是新一代AI搜索引擎區(qū)別于傳統(tǒng)搜索引擎最本質(zhì)的區(qū)別。
02 人工智能VS傳統(tǒng)搜索
有了AI加成的搜索引擎,究竟能否戰(zhàn)勝傳統(tǒng)的搜索方式?
自從今年新必應(yīng)問世以來,這就是一個(gè)備受關(guān)注的話題,然而,最終的數(shù)據(jù)卻無情地表明了:現(xiàn)階段的搜索AI,暫時(shí)還干不掉傳統(tǒng)搜索引擎。
分析公司StatCounter的數(shù)據(jù)顯示,今年7月份,必應(yīng)在全球的市場(chǎng)份額為3%。這一份額與今年1月(新必應(yīng)推出前一個(gè)月)的基本相同。
分析公司Similarweb的另一份報(bào)告顯示,7月份必應(yīng)的月訪問量約為谷歌的1%,也與1月份大致相同。
全球搜索引擎市場(chǎng)份額,來源:StatCounter
盡管這樣的數(shù)據(jù),并沒有對(duì)所有直接訪問必應(yīng)聊天頁面的人進(jìn)行統(tǒng)計(jì),但它仍印證了傳統(tǒng)搜索引擎的地位。
這樣的現(xiàn)實(shí),說明了在新式的搜索AI推出許久之后,人們?nèi)匀徊辉干釛墏鹘y(tǒng)搜索方式。
而這背后的原因,其實(shí)也很簡(jiǎn)單:可靠性。
對(duì)很多人來說,用谷歌、百度搜索,雖然麻煩一點(diǎn),但找到的內(nèi)容足以讓自己的材料有足夠高的可信度。
而如果使用AI搜索,哪怕所有的答案中,只有5%是幻覺和錯(cuò)誤,就足以讓人在進(jìn)行決策和判斷時(shí)翻車。
并且從技術(shù)環(huán)節(jié)上來說,聯(lián)網(wǎng)功能也并非根除幻覺的“靈丹妙藥”。
這主要是因?yàn)?,網(wǎng)絡(luò)上的信息包含了很多噪聲,這些噪聲往往是一些不完整、不一致、不可靠的信息。
而搜索AI在識(shí)別和過濾噪聲方面的限制,是由多個(gè)技術(shù)環(huán)節(jié)共同造成的,這其中包括了網(wǎng)頁抓取、索引構(gòu)建、鏈接分析等。而從這些噪音中,提取出有價(jià)值和意義的信息卻絕非易事。
因?yàn)樵谶@一過程中,鏈接的稀疏性、不均勻性,網(wǎng)頁的多樣化,都有可能影響搜索AI判斷,導(dǎo)致噪聲的干擾。
既然如此,那這是否意味著,搜索AI始終無法撼動(dòng)傳統(tǒng)搜索引擎的地位呢?
其實(shí)不然,因?yàn)橐豁?xiàng)新技術(shù)的前景,有時(shí)不在于其在原有賽道表現(xiàn)如何,而在于其是否能開辟新的賽道。
如上一部分所述,在這個(gè)信息密度倍增的時(shí)代,未經(jīng)處理的原始信息,已經(jīng)很難滿足人們的認(rèn)知需求。
換句話說,在這個(gè)時(shí)代,人們想要的不僅是信息、知識(shí),而是智慧。
在目前新必應(yīng)等搜索AI的應(yīng)用場(chǎng)景中,最有價(jià)值,也最不可或缺的部分,就是其對(duì)某些晦澀、艱深內(nèi)容的解讀。
有時(shí)候,只要使用了正確的提示詞,搜索AI就能將信息中難以理解的部分,轉(zhuǎn)化為簡(jiǎn)明易懂的內(nèi)容,
而這無疑大大地降低了個(gè)人的認(rèn)知和理解成本。
從這個(gè)角度上說,搜索AI有著傳統(tǒng)搜索引擎無法取代的意義。
因?yàn)槠洳粌H僅是簡(jiǎn)單地將信息擺在人們面前,并且還提供了一種見解、思路和策略,而這正是真正的個(gè)人智能助理所必備的特質(zhì)。
正如現(xiàn)在的某些瀏覽器,都會(huì)自帶“翻譯插件”,方便人們?cè)跒g覽外文網(wǎng)站時(shí),能夠高效率地理解其中的內(nèi)容一樣,或許在未來,搜索AI也會(huì)以類似的形式,在人們閱讀網(wǎng)頁時(shí),一邊進(jìn)行總結(jié),一邊提供思路,見解。
到了那時(shí),人們甚至能要求其對(duì)網(wǎng)頁中的具體的某段文字,進(jìn)行分析和總結(jié)。
03 未來的搜索引擎
按照上面的思路,未來的搜索引擎,也許將是結(jié)合了傳統(tǒng)搜索與AI搜索二者優(yōu)勢(shì)的產(chǎn)物。
其最有可能的技術(shù)思路,則很可能類似于當(dāng)下的AI智能體。
具體來說,在獲取信息時(shí),搜索AI可以先借助傳統(tǒng)搜索引擎,爬取大量網(wǎng)頁,之后將這些龐大的,未經(jīng)處理的信息,交由一位智能體專門進(jìn)行篩選、提煉。
之后,這些經(jīng)過提煉后的信息,會(huì)交由一個(gè)負(fù)責(zé)審核和糾錯(cuò)的智能體,以核驗(yàn)信息的準(zhǔn)確性。
當(dāng)確認(rèn)無誤后,這些信息最終將交由負(fù)責(zé)整理和輸出的智能體,并通過其分析、推理能力,為人們提供有價(jià)值的思路、建議。
實(shí)際上,這樣的技術(shù)路線,在現(xiàn)實(shí)中并不遙遠(yuǎn),并且已經(jīng)被某些團(tuán)隊(duì)投入了使用。
例如,最近一個(gè)由哥大研究人員開發(fā),名為GPT Researcher的AI智能體項(xiàng)目,已經(jīng)能獨(dú)立完成各種類型的網(wǎng)絡(luò)科研任務(wù)。
其主要原理是運(yùn)行「規(guī)劃者」和「執(zhí)行者」智能體。
其中規(guī)劃者生成研究問題,并提出針對(duì)該問題的一系列大綱、要領(lǐng)。
之后,執(zhí)行者會(huì)針對(duì)大綱中的每個(gè)子問題,匯總20多個(gè)網(wǎng)絡(luò)來源,形成客觀、真實(shí)的結(jié)論。
這樣的解決方案,避免了以往的AI+聯(lián)網(wǎng)搜索時(shí),因?yàn)楂@取的資源有限,以及內(nèi)容的無規(guī)劃性,可能導(dǎo)致膚淺的結(jié)論或帶有幻覺的答案。
在可以預(yù)見的將來,倘若類似的技術(shù),用在了AI搜索上,那么人們就可以既能借助傳統(tǒng)搜索引擎的準(zhǔn)確性,以及AI搜索的智能分析能力,極大地降低個(gè)人的認(rèn)知成本,并以此將其作為每個(gè)人都能擁有智能個(gè)人助理。