這家由前谷歌AI 研究員 Andy Konwinski、Aravind Srinivas、Denis Yarats 和 Johnny Ho 創立的初創公司,通過結合網絡索引和最新信息與會話式 AI 聊天機器人界面,有望顛覆其前東家谷歌在網絡搜索領域的領先地位。其聊天機器人 Perplexity Copilot,直到最近一直使用 OpenAI 的 GPT-4 和 Anthropic 的 Claude 2 作為后臺「智能」,付費用戶可以在這兩者之間切換。

如今,首選搜索引擎目的地邁出了又一步,發布了自己的大型語言模型(LLMs)——pplx-7b-online 和 pplx-70b-online">Perplexity 公司向成為首選搜索引擎目的地邁出了又一步,發布了自己的大型語言模型(LLMs)——pplx-7b-online 和 pplx-70b-online,分別以它們的參數大小 7 億和 70 億命名。這些模型是基于 Mistral 和 Meta 的開源 mistral-7b 和 llama2-70b 模型進行微調和增強的版本。
AI 中的參數指的是每個模型的人工神經元之間的連接數,通常表明模型的強大和「智能」程度,參數越高通常意味著模型更加知識淵博、智能和高效。
為什么 Perplexity 的新在線 LLMs 很重要,它們與 ChatGPT 和其他 LLMs 有何不同?
Perplexity 的新在線 LLMs 之所以重要,以及它們與 ChatGPT 等的區別,在于它們不僅可供其他組織通過 Perplexity 的 API(應用程序編程接口)使用和構建自己的應用程序,而且還旨在提供「有用的、事實和最新的信息」——這是大多數其他領先 LLMs,包括 OpenAI 的 GPT-3.5 和 GPT-4(為 ChatGPT 提供動力)難以做到的。
Perplexity 首席執行官 Aravind Srinivas 在 X 上發布消息稱,新的 PPX LLMs 是「首個實時 LLM API,它們基于網絡搜索數據,沒有知識截止日期!」
GPT-3.5 和 4 的存儲知識截止日期直到最近一直限于 2021 年 9 月,直到今年早些時候才有所提升。盡管如此,這與內置了當前事件和最新消息的知識相比還有很大差距,盡管通過 OpenAI 合作伙伴微軟必應搜索恢復 ChatGPT 的 Web 瀏覽功能在一定程度上緩解了這一點,該功能于 2023 年 9 月底恢復。
通過 LLM 聊天機器人提供最新知識的競賽也在升溫。埃隆·馬斯克(Elon Musk)夸口他的公司 xAI 的新聊天機器人 Grok 將具備這一能力,這要歸功于它與姐妹公司 X(前推特)的直接整合,以及該平臺用戶發布的所有實時信息。Grok 已經向選定用戶提供了有限的測試版,并將在本周推出供任何人使用,前提是用戶支付 X Premium 訂閱。
其他 LLM 提供商,如加拿大多倫多的企業級 Cohere,旨在通過結合 Web 瀏覽功能和檢索增強生成(RAG),將更多最新知識納入其 LLMs,這使模型能夠借助管理員提供的外部信息來源,如公司文件。
在新的 PPLX 在線 LLMs 的情況下,Perplexity 開發了自己的方法來獲取最新信息。正如公司在其博客文章中所寫:「我們的內部搜索、索引和爬蟲基礎設施使我們能夠用最相關、最新和最有價值的信息來增強 LLMs。我們的搜索索引龐大,定期更新,并使用復雜的排名算法來確保優先考慮高質量、非 SEO 化的網站。我們向 pplx 在線模型提供的網站摘錄,我們稱之為『片段』,使其能夠用最新的信息做出回應。」
在提供最新信息方面,Perplexity 是否優于 OpenAI 和 Meta?
為了證明其新 LLMs 的有效性,Perplexity 聘請了一些人力承包商根據三個標準評估問題的回答:有用性、事實性(Perplexity 也稱之為準確性)和新鮮度(后者指信息的最新程度)。
承包商被要求比較兩個模型的回應,其中一些是 Perplexity 的新 PPLX 在線 LLMs,另一些則是 Meta 的 Llama 2 或 OpenAI 的 GPT-3.5 Turbo,選擇他們更喜歡的兩者之間的回應。
然后,Perplexity 利用稱為 Elo 評分的方法從人力承包商的回應中推斷出,其模型在「新鮮度」和「事實性」方面的表現優于 OpenAI 和 Meta 的原始模型。在「有用性」方面,即咨詢顧問認為 LLM 回應的實用性,GPT-3.5 仍然優于 PPLX 和原始的 Llama 2 模型。
「總的來說,評估結果表明,我們的 PPLX 模型可以與 gpt-3.5 和 llama2-70b 匹敵,甚至在提供準確和最新回應的 Perplexity 相關用例上表現更好,」公司在描述新模型的博客文章中寫道。
如何使用和影響
新的 PPLX 在線 LLMs 現在可供個人和組織通過 Perplexity 的 API 網站使用,并按照那里發布的文檔操作。此外,Perplexity 在其博客文章中指出,API 正從測試版可用性轉向公眾普遍可用性。
然而,這是有成本的:盡管是基于免費的開源模型進行培訓的,Perplexity 還是在這些模型中加入了其搜索和 Web 索引技術并收費。Perplexity 為其專業訂閱級別收取 20 美元/月或 200 美元/年的費用,現在將為用戶提供 5 美元/月的信用額度,他們可以將其用于 Perplexity API 以獲取 PPLX 模型的訪問權限。
除此之外,用戶還需要為額外的 API 調用(使用查詢或提示訪問模型)付費。Perplexity 尚未提供公開的定價信息,而是指示有興趣的各方直接通過電子郵件與其聯系。
雖然個人和企業對新模型的接受程度,無論是直接使用還是在新應用程序中使用,尚待觀察,但 Perplexity 已經贏得了一些熱心粉絲的支持,他們認為這是搜索的未來,包括風投資本家 Jeremiah Owyang of Blitzscaling Ventures,他表示自己與該公司「沒有財務聯系」。
隨著谷歌的 Bard 因一些爭議和差評而陷入困境,以及谷歌的后續 GPT 殺手Gemini據說被推遲,現在是 Perplexity 確立自己作為搜索未來另一種愿景的大好時機——在這種愿景中,AI 助手與您對話并從網絡中提取答案,而不是用戶自己對搜索結果進行排序以找到最佳結果。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。