管婆家一肖一码100,澳门看码资料软件,澳门一码一码100准确,2025年正版资料免费大全

    科技動(dòng)態(tài)

    計(jì)算機(jī)學(xué)院王利民教授帶領(lǐng)聯(lián)合團(tuán)隊(duì)發(fā)布視頻理解大模型InternVideo2.5

    發(fā)布時(shí)間:2025-02-26 點(diǎn)擊次數(shù): 作者:計(jì)算機(jī)學(xué)院 來源:科學(xué)技術(shù)研究院

    近日,上海人工智能實(shí)驗(yàn)室、南京大學(xué)、深圳先進(jìn)技術(shù)研究院聯(lián)合發(fā)布了通用視頻理解大模型InternVideo2.5,計(jì)算機(jī)學(xué)院王利民教授為該大模型技術(shù)負(fù)責(zé)人。王利民教授長(zhǎng)期專注視頻分析與理解,已經(jīng)帶領(lǐng)研發(fā)團(tuán)隊(duì)在視頻大模型方向深耕多年。2022年帶領(lǐng)團(tuán)隊(duì)發(fā)布首個(gè)通用視頻理解基礎(chǔ)模型InternVideo1.0,構(gòu)建了可泛化的視頻基礎(chǔ)表征能力,全面覆蓋視頻識(shí)別、開放感知、時(shí)空解析三大核心領(lǐng)域。2024年帶領(lǐng)研究團(tuán)隊(duì)發(fā)布多模態(tài)視頻理解大模型InternVideo2.0,在InternVideo1.0基礎(chǔ)上新增了多模態(tài)視頻理解與對(duì)話能力,在識(shí)別檢索、開放問答、高階推理等復(fù)雜視頻理解任務(wù)取得了國(guó)際領(lǐng)先性能。2025年發(fā)布的全新升級(jí)版本InternVideo2.5,在復(fù)雜視頻理解的時(shí)間跨度與細(xì)粒度取得了雙維提升,“記憶力”較前代模型擴(kuò)容6倍,具備萬幀長(zhǎng)視頻中精準(zhǔn)“大海撈針”能力,AI視頻理解既能“短平快”,亦可“長(zhǎng)深細(xì)”。

    圖1 InternVideo2.5性能展示圖

    圖2 InternVideo大模型在巴黎奧運(yùn)會(huì)直播落地應(yīng)用展示圖

    InternVideo系列大模型是國(guó)產(chǎn)書生大模型譜系的重要組成部分,InternVideo系列大模型已成功應(yīng)用于中央廣播電視總臺(tái)巴黎奧運(yùn)會(huì)直播,能夠精準(zhǔn)定位運(yùn)動(dòng)員的得分瞬間及相關(guān)慢動(dòng)作,極大提升了電視節(jié)目編創(chuàng)效率。InternVideo系列大模型也跟華為技術(shù)公司開展合作,在終端視頻內(nèi)容分析、自動(dòng)駕駛、AIGC內(nèi)容生成等場(chǎng)景進(jìn)行了落地應(yīng)用。InternVideo系列大模型同時(shí)還被Google、Meta、NVIDIA等國(guó)際知名企業(yè)關(guān)注和使用,產(chǎn)生了較大國(guó)際影響力。未來InternVideo2.5憑借其更強(qiáng)大的長(zhǎng)視頻處理能力,將為互聯(lián)網(wǎng)內(nèi)容安全、監(jiān)控安防、智慧體育,影視創(chuàng)作、虛擬現(xiàn)實(shí)等應(yīng)用提供更高效的 AI 技術(shù)支持,助力各行業(yè)實(shí)現(xiàn)智能化升級(jí)。

    開源鏈接:

    https://github.com/OpenGVLab/InternVideo/tree/main/InternVideo2.5

    論文鏈接:

    https://arxiv.org/abs/2501.12386

    Huggingface 鏈接:

    https://huggingface.co/OpenGVLab/InternVideo2_5_Chat_8B