亚洲免费成人av电影_乱人伦xxxx国语对白_免费看一级毛片_综合av色偷偷网_欧美日韩免费做爰大片_97超级碰碰人国产在线观看_国产视频在线看_亚洲日韩中文字幕_中文字幕jux大岛优香

首頁 > 知識分享 > 知識分享 > LLM首次達到人類語言專家水平,OpenAI o1拿下拆解句法、識別歧義、推理音律

LLM首次達到人類語言專家水平,OpenAI o1拿下拆解句法、識別歧義、推理音律

發布時間:2025-11-08 18:08:45

LLM再下一城!伯克利研究證明:OpenAI的o1被證明也具有匹敵人類語言學家的元分析能力。

在人類諸多才能之中,哪些才是人類所獨有的?

自古希臘哲人亞里士多德以來,語言便被視為最能彰顯人之本性的標志。他曾言:人類乃「具有語言的動物」。

即使當今的大語言模型如ChatGPT已能在表層上模擬人類的日常言談,學者們依然追問:

在人類語言的深處,是否蘊藏著某些獨特的結構與特質,是任何其他生物的溝通方式,乃至AI的運算體系,皆無法真正企及的?

加州大學伯克利分校語言學家、羅格斯大學的攜手,讓多個大語言模型經受一系列語言學測試——其中包括要求模型歸納虛構語言的規則。

雖然大多數大語言模型未能像人類那樣解析語言學規則,但有一個模型展現出遠超預期的驚人能力。它能像語言學研究生那樣分析語言——劃分句子成分、解析多重歧義,并能運用遞歸等復雜語言學特征。

研究者Gašper Beguš表示,這一發現「挑戰了我們對人工智能能力的認知」。

AI會說話不稀奇,會解釋才稀奇——

如果語言是讓我們成為人類的關鍵,那么如今大語言模型獲得了「元語言」能力,這又意味著什么呢?

LLM構建無窮遞歸

想象一下:你在搭一座一層套一層、像俄羅斯套娃一樣的「句子塔」。

每套進一層,理解難度就指數級上升。

這種結構,在語言學里叫「中心嵌入」(center embedding),曾被知名語言學家喬姆斯基稱為能定義人類語言與思維的決定性特征。

比如這句話:

The worldview that the prose Nietzsche wrote expressed was unprecedented.

(大意為:尼采所寫的那篇散文所表達的世界觀是前所未有的。)

表面上看平平無奇,但如果你拆開它的「語言洋蔥」:

最外層:The worldview [...] was unprecedented(這個「世界觀」前所未有);

套進去一層:that the prose [...] expressed(是「那篇散文所表達的」);

再往里一層:Nietzsche wrote(而這篇散文是「尼采寫的」)。

這就像在一個句子中間,又塞進一個完整的句子,再在那個句子里塞進另一個句子——三層套娃,層層遞歸。

人類能理解這樣的句子,但之前,人們認為這樣的能力大模型不具備。

上述句子在真實對話中幾乎從未出現過——因為大家會覺得它「太繞了!」

所以,任何語言模型如果只是靠「背書」,根本不可能見過,自然也無法識別出這種例子。

語言學家們認為,人類語言從有限詞匯和有限規則中生成無限可能句子,這種能力歸因于無限遞歸。

迄今為止,還沒有令人信服的證據表明其他動物能夠以復雜的方式使用遞歸。

圖1:不同大模型識別多重遞歸,繪制正確語法樹的比例

圖1:不同大模型識別多重遞歸,繪制正確語法樹的比例

然而,該研究指出在眾多大模型中,唯有OpenAI o1模型不僅看懂包含多重遞歸的句子(圖1)。

o1不僅能如同語言學家那樣,以接近100%的正確率畫出正確的樹狀結構,還能將本就復雜的句子變得更多一層。

圖2:該句子對應的正確語法樹

圖2:該句子對應的正確語法樹

當它被問:「能不能再加一層遞歸?」o1回復:

The worldview that the prose that the philosopher Nietzsche admired wrote expressed was unprecedented.

「那位尼采所敬仰的哲學家所撰寫的散文所表達的世界觀是前所未有的?!?/p>

這說明o1不僅能夠使用語言,還能夠思考語言,具備元語言能力(metalinguistic capacity )。

由于語言模型只是在預測句子中的下一個單詞,人對語言的深層理解在質上有所不同。因此,一些語言學家表示,大模型實際上并沒有在處理語言。

這項研究的結論看起來是對上述觀點的否定。

大模型能區分歧義

也能深入理解句子

想象一下,你聽到下面的話:「Eliza wanted her cast out.」

乍一聽,好像就是「Eliza想把她的cast趕出去」?

但「cast」這個詞既可以是動詞(「驅逐」),也可以是名詞(「石膏」)!

于是這句話就有兩種不同的含義,分別是

Eliza想要她的石膏被拿出去,

Eliza想把她趕出去。

這樣識別包含多義性句子的能力,之前同樣被認為大模型不具備。

人類擁有很多常識知識,使我們能夠排除歧義。但大模型很難具有這樣的常識知識水平。

然而該研究表明,o1可正確識別兩種結構,并為每種生成了符合語言學規劃的句法樹。其他模型(如 GPT-4、Llama 3.1)只會生成不合語法的結構,還會對語義產生誤解。

該研究還考察了大模型在音韻學相關任務上的表現——

音韻學是研究聲音模式以及最小的聲音單位,即音素的組織方式。

例如,在英語中,給以「g」結尾的詞加上「s」會發出「z」的音,就像「dogs」一樣。但給以「t」結尾的詞加上「s」聽起來更像標準的「s」音,就像「cats」一樣。

該研究一口氣創建了30種新的迷你語言,以了解大模型是否能夠在面對新生成的虛擬語言時,在沒有任何先驗知識的情況下能不能正確推斷語音規則。

結果出人意料,即使是在這些虛構的語言上,o1在音韻相關的任務上表現依舊出色。

大模型比人類更好地理解語言嗎?

從上述三個例子可以看出,曾經那些被認為僅僅人類能夠擁有的語言理解能力,大模型如今也具備了。

2023 年著名語言學家喬姆斯基在《紐約時報》上寫道:「語言的正確解釋很復雜,不能僅僅通過浸泡在大數據中就能學會?!?/p>

該文認為盡管 AI 模型在運用語言方面可能很擅長,但它們并不具備以復雜方式分析語言的能力。

在此思潮影響下,即使ChatGPT在各方面上復制了自然語言,公眾仍想知道大模型是否有人類語言的特定特征能不能由大模型復現。

這當然很有必要,隨著社會越來越依賴大模型,了解它在哪些方面能成功以及哪些方面會失敗變得越來越重要。

語言分析是評估語言模型推理能力與人類相似程度的理想測試平臺。

而o1能夠以與語言學家相似的方式分析語言,例如繪制句子圖、解決多個歧義含義,并利用遞歸等復雜的語言特征

但我們發現這一現象后,人們不禁會問下面兩個問題:

第一個問題是為何只有o1可行,其它大模型表現都差一大截。

回答是相比其它模型,o1 的優勢很可能源于思維鏈(類似Deepseek的深度思考),使其能像人類語言學家一樣逐步推理、驗證假設、構建抽象規則。

第二個問題是當模型的性能隨著規模變大而變大時,大模型是否有一天會比我們更能準確的理解語言嗎?

對于這個問題的回答,目前還沒有定論。

一方面,任何的大模型在語言學上還沒有提出過原創性的觀點,也沒有教給我們關于語言的新知識。

另一方面,增加計算能力和訓練數據,語言模型最終會在語言技能上超越我們,   看不出有什么理由阻止語言模型展現出比我們更好的語言理解能力。

研究尚不足以宣稱「機器理解語言勝于人類」,但足以改變評價口徑:對模型的考察,應從「任務產出」轉向「結構解釋」。

當可解釋性成為首要指標,AI研究、教育與應用治理將迎來同一套標準——把「為什么對」放在「對不對」之前。

知識分享更多>>

鴻蒙智行2025壓軸車,新款享界S9 24小時小訂破5000臺 LLM首次達到人類語言專家水平,OpenAI o1拿下拆解句法、識別歧義、推理音律 硅谷華人女CEO殺入,全球首家AI影工廠引爆“AI韓流” TikTok Shop第3季度全球狂攬約190億美元,短視頻帶貨大獲成功 消息稱高通驍龍8 Gen5芯片暫定11月底發布 隔著屏幕真能聞到味兒了,“氣味電視”亮相 有幾百種味道 網友質疑淘寶“雙11霸屏廣告” 杭州市監:已收到舉報展開調查 DRAM漲價潮來襲,英偉達熱銷顯卡RTX 5060 Ti被曝供應告急 馬斯克:特斯拉將在一兩個月內開放“邊開車邊發短信”功能 消息稱榮耀第二塊萬級大電池試產,典型值9900mAh± 東方甄選孫東旭也走了!俞敏洪為什么學不了任正非? 豆包兇猛,深度解析字節AI戰略 eSIM手機成新趨勢,華為、vivo們的路徑分野 TikTok東南亞用戶超過4.6億,電商、商業化均數據亮眼 劉強東請京東騎手吃肯德基 犒勞京東雙11開門紅送單 REDMI K90全系沒有2K屏,對比上代退步了?官方回應 英偉達為何值5萬億美元?答案或藏在AI數據中心里 何小鵬:今年科技日關鍵詞為“涌現” 小鵬在物理AI領域涌現出驚喜的能力 豪投AI取得回報 孫正義財富暴漲248%超柳井正成日本首富 投OpenAI損失31億美元利潤 微軟第一財季凈利潤同比增長12% 谷歌母公司第三季度營收首破1000億美元 凈利潤同比增長33% Meta第三季度凈利潤因特朗法案大降83% 股價大跌8% 要解決老頭樂行業野蠻生長的“后遺癥”,需要通過標準的建立、監管的加強和行業的自律 理想汽車:不僅完成了L系列和理想MEGA煥新,還推出了兩款純電SUV車型,加速著開辟純電這一第二增長曲線的腳步 豐田汽車公司表示,8月份其全球銷量達到900,598輛(包括子公司大發汽車和日野汽車) 新能源汽車產業終究成了中國汽車從邊緣走向舞臺中央的最大推手 F5詳解:AI大數據時代,如何保障車輛通信可靠性和低延遲? 特斯拉Model Y L再推配置升級,全新淺灰色高級內飾正式上線,選裝價8000元 SpaceX正悄然組建一支志愿者消防隊,以服務其龐大的星際基地發射與制造綜合體 比亞迪10月智能化OTA推送:5大新增功能 主流音樂軟件全覆蓋
亚洲成人第一网站| 婷婷色一区二区三区| 91麻豆蜜桃一区二区三区| av男人的天堂网| 麻豆中文字幕在线观看| 久久综合色综合88| 国产精品粉嫩av| 日韩精品在线视频| 理论片一区二区在线| 黄色网战入口| 老熟妇一区二区三区啪啪| 日韩av影视| 亚洲国产成人私人影院tom| 舔足天天操天天射| 国产福利一区视频| 色www精品视频在线观看| 动漫一区在线| 国产在视频线精品视频| 日韩中文字幕av| 午夜精品毛片| 国产成人精品18| 99999精品视频| 91福利国产成人精品照片| 久久野战av| 国产小视频在线免费观看| 91国内在线视频| 蜜桃视频一区二区三区| 87福利电影网| 国产精品一区二区小说| 国产亚洲精品高潮| 亚洲专区免费| 黄色在线免费网站| 国产女人18水真多毛片18精品 | 91麻豆精品国产综合久久久| 久久综合成人网| 国产日韩久久| 久久伊人91精品综合网站| 欧美日本免费一区二区三区| 精品高清在线| 成人在线免费视频| 国产精品你懂的在线观看| www.xxx麻豆| 日韩av在线免费| 日韩av专区| 国产在线视精品麻豆| 精品无码一区二区三区在线| 精品久久香蕉国产线看观看gif| 日韩av免费| 成年人免费在线观看网站| 18禁免费无码无遮挡不卡网站| 亚洲欧洲午夜一线一品| 国产制服丝袜一区| 国产精品日本一区二区三区在线| 97电影在线| 独立日3在线观看完整版| 你懂的视频在线观看资源| 91国产丝袜播放在线| 黄色av电影网站| 成人免费视频视频| 欧美精品羞羞答答| 色欧美自拍视频| 国产精品一区二区av日韩在线| 欧美男男gaygay1069| 51精品在线| 777电影在线观看| 欧美一区二不卡视频| 国产美女www爽爽爽| 一级片黄色录像| 俄罗斯黄色录像| 色综合久久久久无码专区| 日本人成精品视频在线| 亚洲精品国产精品久久清纯直播 | 伊人av电影| 中文字幕第7页| 精品国产伦一区二区三| 免费黄色小视频在线观看| 成 人 黄 色 小说网站 s色| 亚洲综合中文字幕在线| 国产成人精品福利一区二区三区| 欧美国产视频日韩| 国产精品普通话| 黄色高清视频网站| 91免费在线视频网站| 亚洲高潮无码久久| 蜜臀视频一区二区三区| 欧美多人猛交狂配| 香蕉久久久久久av成人| 99久久国产宗和精品1上映| 男人的天堂成人| 国产精品12p| 青青草久久网络| 黄色国产精品一区二区三区| 久久久久久久久久久久久9999| 天天人人精品| 欧美亚洲午夜视频在线观看| 欧洲一区二区av| 中文字幕精品综合| 天堂av在线一区| 亚洲精品成人无限看| 999精品视频在这里| 国产精品极品| 日韩电影不卡一区| 中文字幕一区二区av | 日韩亚洲视频| 中文字幕在线观看第三页| 久久免费公开视频| 天堂在线视频播放| 成年视频在线观看| 五月激激激综合网色播| 日韩国产成人精品| 精品日韩中文字幕| 色吊一区二区三区| 亚洲精品91美女久久久久久久| 亚洲精品狠狠操| 亚洲三级黄色在线观看| 国产精品久久久久免费a∨大胸| 日本精品va在线观看| 成人女人免费毛片| 黄色aaa级片| av地址在线观看| 日本成人黄色网| 一级在线免费视频| 中文字幕第一页在线视频| 一区二区在线免费看| 日韩高清第一页| 久草视频福利在线| 男人的天堂久久久| a级片免费观看| 成人3d动漫网站| 香蕉av在线| 不卡精品视频| 日韩一区二区久久| 国产午夜亚洲精品理论片色戒| 在线观看免费一区| 国产精品久久久久久久久免费看| 丁香六月激情婷婷| 中文字幕在线1| 少妇高潮av久久久久久| 国产一区二区小视频| 欧美毛片又粗又长又大| 羞羞网站在线观看入口免费| 情se视频网在线观看| 国精产品一区一区| 天天亚洲美女在线视频| 欧美视频中文在线看| 亚洲日本中文字幕免费在线不卡| 国产精品久久久久久久久久ktv| 欧美精品久久久| 中文乱码人妻一区二区三区视频| 波多野结衣视频观看| 中文字幕网址在线| 亚洲黄色a级片| 一区二区三区视频在线免费观看 | 精品国产1区二区| 911精品产国品一二三产区| 亚洲色图美腿丝袜| 成人情视频高清免费观看电影| 一区二区三区在线视频111| 欧美极品欧美精品欧美| 中文字幕无人区二| 性xxxx视频播放免费| 成人日韩欧美| 91视频综合| 热久久天天拍国产| 国产偷国产偷亚洲高清人白洁| 日韩欧美久久久| 国产精品久久九九| av黄色在线网站| 一区在线电影| 色欲av无码一区二区三区| 国产视频一二三四区| av色资源站| 日韩中文一区二区| 天天做天天摸天天爽国产一区 | 色吧亚洲日本| 韩国av一区二区三区| 欧美乱大交xxxxx| 免费观看美女裸体网站| 美女视频黄免费| 九色视频入口| 秋霞午夜一区二区三区视频| 久久亚洲二区| 日韩电影中文字幕av| 日韩在线导航| yjizz视频| 美女高潮网站| 精品国产亚洲一区二区三区大结局 | 美女视频久久黄| 男人c女人视频| 国产在线观看免费视频软件| 黄色网址网站| 婷婷丁香在线| 欧美日韩一区二区三区在线电影 | 九色蝌蚪国产| 日韩一区二区三区高清在线观看| 亚洲成人精品一区| 日本黄网免费一区二区精品| 91tv国产成人福利| 成人日批视频| 激情视频免费观看在线|