熱門話題:

【杜蘭說AI】GPT-4.5三大關鍵詞 貴!小強!情商!

2025年03月19日 14:20

GPT-4.5剛發布的時候,
我就覺得得讓子彈再飛一會兒,
結果就過了一個周末,
各種聲音全都出來了。

我個人差不多就三個感覺哈。
第一,
知道你openai貴,
但也不能這麽離譜啊?
輸入價格75刀,
輸出價格150刀,
比DeepSeek貴了快300倍。
如此恐怖的成本提升下,
GPT-4.5的性能怎麽樣呢?

這就是我的第二個感受,
確實變強了,但只有一點點。
官方給出的基準測試里,
GPT-4.5是碾壓GPT-4o的,
在最新的一項編碼測試里,
也超越了DeepSeek-R1、o1、GPT-4o等模型,
但在一些比較困難的學術基準測試上,
就不太夠看了,
在某些偏實用的評估基準上,
甚至是全班墊底。

不過OpenAI官方這次也特意強調,
說GPT-4.5的真正厲害之處,
在於它能夠更好地理解人類的意思,
並以更細致入微的“情商”來解讀微妙的暗示或隱含的期望。
用奧特曼的話來說,
就是你會感覺在和一個“有思想的人”說話。
因為GPT-4.5現在只向Pro用戶開放,
我沒買它的會員,
所以只看了一些用戶PO到網上的圖。
對此我的第三個感覺是,
看起來確實有人情味兒了些,
會先安慰你,
給你情緒價值,
而不是直接給一堆解決方案。
但這就能證明它比別家更強嗎?
很難說。
更何況它收費還那麽貴,
頗有一種要算法有情商、
要推理有情商、
要應用還是只有情商的感覺。

最後再給大家展開一下啊,
這次的GPT-4.5還有一個意義,
它很有可能是OpenAI的最後一代非推理模型。
什麽意思呢?
現在業界大模型架構是“重推理”的,
也就是基於傳統的語言模型,
通過思維鏈、自我驗證等多步中間推理生成答案,
擅長編程、學術寫作以及分析覆雜問題,
典型代表就是DeepSeek-R1和GPT-o1。
與之相對的就是非推理大模型,
主要依賴預訓練階段的高質量參數進行學習,
邏輯推理能力稍弱,
更側重於流暢的語言生成和上下文理解,
代表是GPT-o3-mini。

這幾天推理模型陣營的DeepSeek
剛剛把自己壓箱底的寶貝都拿了出來,
搞得全球的開發者都一片沸騰,
這邊非推理模型GPT-4.5的風評,
大家又都有目共睹,
所以我估計,
以後大部分AI的方向,
可能都將會徹底轉向推理。

相關新聞