2025年1月21日AI熱點(diǎn)新聞速覽
-
字節(jié)推出 AI IDE Trae:字節(jié)跳動(dòng)推出全新 AI IDE——Trae,基于 Claude 模型且免費(fèi)使用。支持 Python、JavaScript、Java 等多種編程語言,能根據(jù)自然語言描述自動(dòng)生成代碼,還可對(duì)現(xiàn)有代碼進(jìn)行優(yōu)化并提供改進(jìn)建議,同時(shí)提供多種 IDE 插件,方便在主流開發(fā)環(huán)境中使用。
-
OpenAI 測(cè)試 “Operator” 功能:OpenAI 正在內(nèi)部測(cè)試全新 “Operator” 功能,將深度集成到 ChatGPT 的 macOS 版本中。該功能標(biāo)志著 AI 從被動(dòng)助手向主動(dòng)解決問題的超級(jí)智能體轉(zhuǎn)變,預(yù)計(jì)能獨(dú)立完成軟件開發(fā)、復(fù)雜財(cái)務(wù)分析等任務(wù)。
-
Kimi 發(fā)布 k1.5 多模態(tài)模型:Kimi 發(fā)布 k1.5 多模態(tài)思考模型,性能對(duì)標(biāo) OpenAI 的 o1,還首次提出 short2long 技術(shù),通過 long cot 模型的 “教學(xué)”,讓短鏈思維模式實(shí)現(xiàn)長(zhǎng)鏈性能,在 MMLU、IF-Eval 等多個(gè)基準(zhǔn)測(cè)試中表現(xiàn)出色。
-
Google AI 提出擴(kuò)散模型推理時(shí)間縮放框架:來自紐約大學(xué)、麻省理工學(xué)院和谷歌的研究團(tuán)隊(duì)提出擴(kuò)散模型中推理時(shí)間縮放的基本框架,從利用驗(yàn)證器反饋和實(shí)施算法發(fā)現(xiàn)更優(yōu)噪聲候選兩個(gè)維度展開,以 256×256 分辨率的預(yù)訓(xùn)練 SiT - XL 模型為基礎(chǔ),在 DrawBench 測(cè)試中,能持續(xù)提升樣本質(zhì)量。
-
MIT 等揭示視覺語言模型問題及提出框架:麻省理工學(xué)院、谷歌 DeepMind 和牛津大學(xué)的研究人員提出 NegBench 框架,用于評(píng)估和改進(jìn)視覺語言模型(VLMs)對(duì)否定的理解能力,通過檢索與否定、多項(xiàng)選擇題與否定兩個(gè)基本任務(wù),使用大量合成數(shù)據(jù)集,有效克服了現(xiàn)有模型的限制,提升了模型性能。
-
淘天推出創(chuàng)新對(duì)齊方法:淘天集團(tuán)的未來生活實(shí)驗(yàn)室團(tuán)隊(duì)提出 “令牌偏好優(yōu)化”(TPO)方法,引入自我校準(zhǔn)的視覺錨定獎(jiǎng)勵(lì)機(jī)制,能自動(dòng)識(shí)別偏好數(shù)據(jù)中的視覺錨定令牌,為每個(gè)令牌分配反映其與視覺信息依賴程度的獎(jiǎng)勵(lì),以減輕視覺大模型中的幻覺問題。