港科大推出WorldCraft:重新定義3D虛擬世界創(chuàng)建的未來(lái)
在數(shù)字化浪潮的推動(dòng)下,3D虛擬世界的創(chuàng)建正變得越來(lái)越重要。無(wú)論是建筑設(shè)計(jì)、影視制作,還是教育培訓(xùn),3D場(chǎng)景的生成都扮演著關(guān)鍵角色。然而,傳統(tǒng)的3D建模工具通常需要專業(yè)的技能和大量的時(shí)間投入,這讓許多創(chuàng)意設(shè)計(jì)者望而卻步。如今,香港科技大學(xué)推出了一款革命性的工具——WorldCraft,它通過(guò)自然語(yǔ)言交互的方式,讓用戶輕松創(chuàng)建和定制逼真的3D虛擬世界。本文將帶您深入了解WorldCraft的核心功能、技術(shù)優(yōu)勢(shì)及其應(yīng)用場(chǎng)景。
WorldCraft是什么?
WorldCraft是一款基于大型語(yǔ)言模型(LLM)代理的3D世界創(chuàng)建和定制系統(tǒng),旨在讓用戶無(wú)需專業(yè)技能即可生成復(fù)雜的室內(nèi)外場(chǎng)景。通過(guò)自然語(yǔ)言交互,用戶可以輕松調(diào)整場(chǎng)景中的物體和布局,實(shí)現(xiàn)個(gè)性化的創(chuàng)意設(shè)計(jì)。WorldCraft由三個(gè)核心模塊組成:
-
ForgeIt:專注于單個(gè)物體的定制,支持精確控制幾何形狀、紋理和材質(zhì)。
-
ArrangeIt:負(fù)責(zé)場(chǎng)景布局的生成,通過(guò)分層數(shù)值優(yōu)化實(shí)現(xiàn)功能性和美學(xué)的平衡。
-
軌跡控制模塊:支持用戶用對(duì)話形式控制物體運(yùn)動(dòng)和相機(jī)軌跡,生成動(dòng)畫(huà)和視頻。
此外,WorldCraft還兼容現(xiàn)有的深度3D生成器,如Infinigen,進(jìn)一步豐富場(chǎng)景資產(chǎn),提升視覺(jué)效果。

WorldCraft的核心功能
-
自然語(yǔ)言交互:用戶可以通過(guò)簡(jiǎn)單的文本指令或?qū)υ捫问絼?chuàng)建和定制復(fù)雜的3D場(chǎng)景,無(wú)需專業(yè)的3D建模技能。
-
單個(gè)物體定制:用戶可以精確控制物體的幾何形狀、紋理和材質(zhì),實(shí)現(xiàn)個(gè)性化設(shè)計(jì)。
-
場(chǎng)景布局生成:根據(jù)用戶的設(shè)計(jì)意圖(如功能性和美學(xué)要求),生成合理的物體布局。
-
場(chǎng)景動(dòng)畫(huà)控制:用戶可以通過(guò)自然語(yǔ)言描述物體或相機(jī)的運(yùn)動(dòng)軌跡,生成動(dòng)畫(huà)和視頻。
-
兼容性與擴(kuò)展性:系統(tǒng)支持與現(xiàn)有的深度3D生成器結(jié)合,豐富場(chǎng)景資產(chǎn),提升視覺(jué)效果。
WorldCraft的技術(shù)原理
WorldCraft的技術(shù)優(yōu)勢(shì)在于其基于LLM代理的協(xié)調(diào)機(jī)制和程序化生成技術(shù):
-
協(xié)調(diào)代理(Coordinator Agent):管理整個(gè)3D場(chǎng)景生成流程,將復(fù)雜任務(wù)分解為多個(gè)子任務(wù),并協(xié)調(diào)其他代理模塊完成任務(wù)。支持用戶與系統(tǒng)的多輪交互,實(shí)時(shí)調(diào)整生成結(jié)果。
-
單個(gè)物體生成與定制:基于LLM代理操作程序化生成器(如Infinigen),用自然語(yǔ)言指令生成具有精確幾何形狀和PBR紋理的3D物體。
-
場(chǎng)景布局優(yōu)化:將場(chǎng)景布局問(wèn)題建模為分層數(shù)值優(yōu)化問(wèn)題,基于模擬退火算法求解最優(yōu)布局。
-
軌跡控制模塊:基于ChatCam擴(kuò)展,支持用戶用自然語(yǔ)言描述物體或相機(jī)的運(yùn)動(dòng)軌跡,實(shí)現(xiàn)場(chǎng)景動(dòng)畫(huà)的生成。
-
深度3D生成器集成:系統(tǒng)兼容現(xiàn)有的深度3D生成器,用于引入藝術(shù)化的物體和豐富場(chǎng)景細(xì)節(jié)。
WorldCraft的應(yīng)用場(chǎng)景
WorldCraft的應(yīng)用場(chǎng)景非常廣泛,以下是幾個(gè)典型的應(yīng)用領(lǐng)域:
-
建筑設(shè)計(jì)與室內(nèi)設(shè)計(jì):快速生成建筑概念模型和虛擬樣板間,基于自然語(yǔ)言定制室內(nèi)布局和風(fēng)格,優(yōu)化設(shè)計(jì)流程并提升客戶體驗(yàn)。
-
影視與娛樂(lè):創(chuàng)建虛擬電影場(chǎng)景、游戲關(guān)卡和動(dòng)畫(huà)電影中的復(fù)雜場(chǎng)景,降低實(shí)景搭建成本,為虛擬現(xiàn)實(shí)(VR)和增強(qiáng)現(xiàn)實(shí)(AR)體驗(yàn)提供高度逼真的虛擬環(huán)境。
-
教育與培訓(xùn):設(shè)計(jì)虛擬實(shí)驗(yàn)室、歷史場(chǎng)景、地理環(huán)境和醫(yī)療培訓(xùn)場(chǎng)景,基于沉浸式體驗(yàn)增強(qiáng)學(xué)習(xí)效果,支持遠(yuǎn)程教育和專業(yè)技能培訓(xùn)。
-
產(chǎn)品設(shè)計(jì)與展示:快速生成產(chǎn)品概念模型和虛擬展廳,展示家具、汽車(chē)、電子設(shè)備等產(chǎn)品的設(shè)計(jì),支持個(gè)性化定制和虛擬廣告場(chǎng)景的創(chuàng)建。
-
文化與藝術(shù):創(chuàng)建虛擬博物館、藝術(shù)展覽、歷史建筑和文化節(jié)日?qǐng)鼍?,重現(xiàn)文化遺產(chǎn),為藝術(shù)創(chuàng)作和文化體驗(yàn)提供沉浸式空間。
WorldCraft的項(xiàng)目地址
如果您對(duì)WorldCraft的技術(shù)細(xì)節(jié)感興趣,可以訪問(wèn)其arXiv技術(shù)論文:https://arxiv.org/pdf/2502.15601
結(jié)語(yǔ)
WorldCraft的推出標(biāo)志著3D虛擬世界創(chuàng)建進(jìn)入了一個(gè)新的時(shí)代。通過(guò)自然語(yǔ)言交互和程序化生成技術(shù),它讓創(chuàng)意設(shè)計(jì)變得更加高效和便捷。無(wú)論是設(shè)計(jì)師、開(kāi)發(fā)者,還是教育機(jī)構(gòu)和企業(yè)營(yíng)銷(xiāo)人員,WorldCraft都能滿足您對(duì)3D場(chǎng)景創(chuàng)建的需求。未來(lái),隨著技術(shù)的不斷進(jìn)步,WorldCraft有望在更多領(lǐng)域發(fā)揮其潛力,為用戶提供更豐富的創(chuàng)意工具。