
一名女子與中國香港SenseTime公司開發的AI機器人下圍棋。圖片來源:Joan Cros/NurPhoto
本報訊4月15日,美國斯坦福大學人工智能研究所發布《2024年人工智能指數報告》,描繪了過去10年機器學習系統的飛速發展。
報告顯示,聊天機器人ChatGPT等人工智能(AI)系統在閱讀理解、圖像分類和競賽級數學等任務上的表現,已接近甚至超過人類。AI系統的快速發展意味著,許多用于評估它們的通用基準和測試很快就會過時。
報告特別指出,推出評估AI的新方法越來越有必要,如評估其在抽象和推理等復雜任務上的表現。斯坦福大學社會科學家Nestor Maslej表示,10年前,基準可以為社會服務5至10年,而現在,它們往往在短短幾年內就變得無關緊要了。“增長的速度快得驚人。”
斯坦福大學的年度人工智能指數于2017年首次發布。該指數由學術和行業專家編制,旨在評估AI領域的技術能力、成本、道德等,從而為研究人員、政策制定者和公眾提供信息。今年這份長達400多頁的報告指出,美國對與AI相關的監管正在升級。但是,由于缺乏對負責任地使用AI的標準化評估,因此很難根據系統構成的風險對它們進行比較。
新報告還首次用整個章節專門介紹AI的科學應用,包括谷歌DeepMind的一個旨在幫助化學家發現新材料的圖形網絡材料探索(GNoME)項目,以及DeepMind的另一個工具GraphCast,它可以進行快速天氣預報。
當前的AI熱潮建立在神經網絡和機器學習算法之上,這可以追溯到2010年代早期。此后,這一領域迅速發展壯大。例如,代碼共享平臺GitHub上的AI編碼項目數量從2011年的約800個增加到去年的180萬個。報告稱,在此期間,關于AI的期刊出版物大約增加了兩倍。
AI的大部分前沿工作都在工業領域內進行。去年,該領域產生了51個著名的機器學習系統,其中學術研究人員貢獻了15個。美國得克薩斯大學奧斯汀分校人工智能實驗室主任Raymond Mooney表示:“學術工作正在轉向分析企業推出的模型,深入研究它們的弱點。”
這包括開發更嚴格的測試,以評估大型語言模型(LLM)的視覺、數學甚至道德推理能力,這些能力為聊天機器人提供了動力。最新的測試之一是研究生級谷歌驗證問答基準測試(GPQA),去年由包括美國紐約大學機器學習研究員David Rein在內的團隊開發。
GPQA由400多個選擇題組成,難度很大,博士水平的學者回答其所在領域問題的正確率為65%。而當他們試圖回答其專業領域以外的問題時,盡管在測試期間可以上網,但正確率只有34%。
隨著AI性能的飆升,成本也在飆升。據報道,OpenAI公司2023年3月發布的GPT-4的培訓成本為7800萬美元。谷歌的聊天機器人Gemini Ultra于2023年12月推出,耗資1.91億美元。許多人擔心這些系統的能源使用,以及冷卻運行這些系統的數據中心所需的水量。
報告指出,在美國,監管急劇升級。2016年,美國只有一項法規提到了AI,去年則增加到25項。Maslej表示,2022年之后,政策制定者提出的AI相關法案數量大幅增加。
監管行動越來越側重于促進負責任的AI使用。Maslej說,盡管出現了可以對AI工具的真實性、偏見等指標進行評分的基準,但并不是每個人都在使用相同的模型,這使得交叉比較變得困難。(李木子)
一名女子與中國香港SenseTime公司開發的AI機器人下圍棋。圖片來源:JoanCros/NurPhoto本報訊4月15日,美國斯坦福大學人工智能研究所發布《2024年人工智能指數報告》,描繪了過去......
中新社舊金山4月4日電美國斯坦福大學董事會當地時間4日宣布,任命該校商學院院長、經濟學家喬納森·萊文為新任校長,于8月1日上任。斯坦福大學官網4日發布的消息顯示,萊文生于1972年,本科就讀于斯坦福大......
導讀本周三,Tessier-Lavigne宣布將于下個月辭去斯坦福大學校長的職務。2022年11月29日,TheStanfordDaily發表的一篇頭條新聞,引起了國內外人士的廣泛關注,斯坦福大學校長......
斯坦福大學校長恐怕要栽在《斯坦福日報》手里了。當地時間11月29日,《斯坦福日報》發表報道稱,神經生物學家、斯坦福大學校長MarcTessier-Lavigne在多年前的多篇研究論文涉嫌圖片作假,正接......
北京時間9月2日消息,當地時間周三,埃隆·馬斯克(ElonMusk)的法律團隊向斯坦福大學發出了傳票,以作為他與推特公司就其放棄440億美元收購所進行的法律斗爭的一部分。馬斯克的律師亞歷克斯·斯皮羅(......
水滴能自發產生雙氧水?美國斯坦福大學前化學系系主任RichardN.Zare在最近發表的論文中,證明了這一神奇的現象。Zare的來頭不小。他29歲就當上哥倫比亞大學教授,37歲當選美國科學院院士、美國......
據路透社華盛頓2月19日報道,美國司法部近日擴大1月的一份起訴內容,指控斯坦福大學研究員SongChen(音)簽證欺詐、阻撓司法、毀滅文件和虛假陳述,隱瞞其軍人身份。起訴書稱宋自稱研究腦部疾病的神經科......
在RickyRamon7歲時進行一次例行檢查中,猶豫不決的兒科醫生送他去拍一張胸部X光片,結果顯示在他心臟左上腔里有一個良性腫瘤。對于Ramon來說,這是長達二十年的痛苦而漫長的就醫史的開始——伴隨他......
來自斯坦福大學、猶他大學和清華大學等處的研究人員,發現了一類豐富的非編碼DNA可以防止線蟲生殖細胞中隨機的基因沉默。他們的研究論文發布在6月30日的《細胞》(Cell)雜志上。美國著名遺傳學和分子生物......
近日,美國科學理事會原主席查德.N.查爾(RichardN.Zare)教授造訪湖南大學,以湖南大學校長特別顧問的名義,就現代大學制度建設的若干深層次問題與該校校長趙躍宇教授進行了一番暢談。查爾教授系國......