(香港文匯網(wǎng)記者郭若溪)11月22日,由粵港澳大灣區(qū)數(shù)字經(jīng)濟(jì)研究院(簡(jiǎn)稱「IDEA 研究院」)主辦的2024年 IDEA大會(huì)在深圳舉行,首發(fā) IDEA 創(chuàng)新成果,覆蓋低空經(jīng)濟(jì)、金融科技、計(jì)算機(jī)視覺(jué)、基礎(chǔ)軟件等世界前沿研究領(lǐng)域,在全球視野下探討科研發(fā)展新路徑,洞悉產(chǎn)業(yè)落地新機(jī)遇。IDEA研究院創(chuàng)院理事長(zhǎng)、美國(guó)國(guó)家工程院外籍院士沈向洋指出,在技術(shù)大爆發(fā)時(shí)期開(kāi)展創(chuàng)新,對(duì)技術(shù)的深度理解尤為重要。隨著AI的各項(xiàng)能力逼近、甚至超越人類,AI治理已成亟待全球共同面對(duì)的議題。
IDEA 大會(huì)於 2021 年首度亮相,由美國(guó)國(guó)家工程院外籍院士沈向洋發(fā)起,致力在粵港澳大灣區(qū)搭建一個(gè)分享人工智能技術(shù)和凝聚數(shù)字產(chǎn)業(yè)力量的國(guó)際化交流平臺(tái),是粵港澳大灣區(qū)最具影響力的科技盛會(huì)之一。本次大會(huì),IDEA公布一系列前沿研究與產(chǎn)業(yè)落地成果。
從通用視覺(jué)感知到具身智能
自2022年起,IDEA團(tuán)隊(duì)從目標(biāo)檢測(cè)出發(fā),打造精準(zhǔn)度、通用性、泛化能力兼優(yōu)的DINO系列視覺(jué)大模型。大會(huì)發(fā)布了該系列最新的DINO-X通用視覺(jué)大模型,擁有真正的物體級(jí)別理解能力,實(shí)現(xiàn)開(kāi)放世界目標(biāo)檢測(cè)。無(wú)需用戶提示,直接檢測(cè)萬(wàn)物。
與此同時(shí),IDEA團(tuán)隊(duì)還推出行業(yè)平臺(tái)架構(gòu),通過(guò)一個(gè)大模型基座,結(jié)合通用識(shí)別技術(shù)結(jié)合,讓模型不需重新訓(xùn)練,就可邊用邊學(xué),支撐多種多樣的B端應(yīng)用需求。視覺(jué)感知是機(jī)器與物理世界交互的基礎(chǔ)。全場(chǎng)景視覺(jué)感知能力的提升,自然為技術(shù)落地拓寬了空間。
在具身智能領(lǐng)域,IDEA研究院宣布與騰訊合作,在深圳福田區(qū)、河套深港科技創(chuàng)新合作區(qū)落地建設(shè)福田實(shí)驗(yàn)室,聚焦人居環(huán)境具身智能技術(shù);與美團(tuán)合作,探索無(wú)人機(jī)視覺(jué)智能技術(shù);與比亞迪合作,拓展工業(yè)化機(jī)器人智能應(yīng)用。IDEA團(tuán)隊(duì)還分享了正在進(jìn)行的AI助盲應(yīng)用研究。
從合成數(shù)據(jù)到大模型價(jià)值創(chuàng)造
大模型能力的湧現(xiàn),離不開(kāi)互聯(lián)網(wǎng)時(shí)代的海量數(shù)據(jù)養(yǎng)料積累。IDEA團(tuán)隊(duì)自研了語(yǔ)境圖譜技術(shù),解決過(guò)往文本數(shù)據(jù)合成方案的多樣性匱乏等問(wèn)題。該技術(shù)為合成數(shù)據(jù)引入「指導(dǎo)手冊(cè)」,以圖譜為綱,指導(dǎo)用於合成的語(yǔ)境採(cǎi)樣。
實(shí)驗(yàn)結(jié)果顯示,IDEA團(tuán)隊(duì)的方案能持續(xù)為大模型帶來(lái)能力提升,表現(xiàn)超過(guò)目前的最佳實(shí)踐(SOTA);從token消耗來(lái)看,平均節(jié)約成本85.7%。目前,該技術(shù)內(nèi)測(cè)平臺(tái)已開(kāi)放,通過(guò)API提供服務(wù)。
在拓展新前沿的同時(shí),大模型價(jià)值創(chuàng)造也在進(jìn)行時(shí)。大會(huì)上,IDEA秀出多個(gè)垂類行業(yè)應(yīng)用落地進(jìn)展,包括:學(xué)術(shù)大模型和AI科研神器ReadPaper、營(yíng)銷創(chuàng)作大模型,以及面向經(jīng)濟(jì)與金融領(lǐng)域的經(jīng)濟(jì)大模型、運(yùn)籌決策大模型、投資大模型。
評(píng)論