管婆家一肖一码100,澳门看码资料软件,澳门一码一码100准确,2025年正版资料免费大全

    校園動(dòng)態(tài)

    匡亞明學(xué)院本科生在人工智能頂級(jí)會(huì)議AAAI2025發(fā)表論文

    發(fā)布時(shí)間:2025-03-11 點(diǎn)擊次數(shù): 作者:匡亞明學(xué)院 來(lái)源:學(xué)院師生在奮進(jìn)

    近日,匡亞明學(xué)院2021級(jí)本科生洪運(yùn)以共同第一作者身份在人工智能頂級(jí)會(huì)議AAAI會(huì)議發(fā)表學(xué)術(shù)論文“DrugHash: Hashing Based Contrastive Learning for Virtual Screening”。該論文通訊作者為南京大學(xué)計(jì)算機(jī)學(xué)院李武軍教授。AAAI為人工智能領(lǐng)域的頂級(jí)會(huì)議之一,由人工智能促進(jìn)協(xié)會(huì)(The Association for the Advancement of Artificial Intelligence, AAAI)組織,每年舉辦一次。AAAI 2025(Thirty-Ninth AAAI Conference on Artificial Intelligence)于2025年2月25日-3月4日在美國(guó)費(fèi)城舉行。

    藥物發(fā)現(xiàn)是一個(gè)周期長(zhǎng)、開(kāi)銷(xiāo)大的過(guò)程,因?yàn)楹蜻x藥物分子往往具有很高的失敗率。虛擬篩選(Virtual Screening)是計(jì)算機(jī)輔助藥物發(fā)現(xiàn)中的關(guān)鍵步驟之一,它能發(fā)掘更可靠的候選藥物分子,從而減少藥物發(fā)現(xiàn)所需的周期和資源開(kāi)銷(xiāo)。相關(guān)研究表明,有效的藥物虛擬篩選需要具備一個(gè)大規(guī)模分子數(shù)據(jù)庫(kù)和一個(gè)精度較高的藥物虛擬篩選方法?,F(xiàn)有的分子數(shù)據(jù)庫(kù)大小最大已經(jīng)達(dá)到十億級(jí)別,但現(xiàn)有的藥物虛擬篩選方法卻無(wú)法滿(mǎn)足實(shí)際應(yīng)用需求。傳統(tǒng)的虛擬篩選方法如分子對(duì)接過(guò)于耗時(shí),無(wú)法在大規(guī)模數(shù)據(jù)庫(kù)上使用。一些基于深度學(xué)習(xí)的方法大部分通過(guò)預(yù)測(cè)蛋白和分子的交互信息或親和度的方式來(lái)進(jìn)行訓(xùn)練,受限于可用訓(xùn)練數(shù)據(jù)的規(guī)模,它們的精度無(wú)法超過(guò)傳統(tǒng)的方法。另有方法如DrugCLIP將虛擬篩選建模為通過(guò)蛋白質(zhì)的向量表示檢索分子的向量表示的過(guò)程,雖然精度較高,但是預(yù)先存儲(chǔ)大量的實(shí)值向量會(huì)產(chǎn)生巨大的存儲(chǔ)開(kāi)銷(xiāo),并且從磁盤(pán)加載預(yù)存儲(chǔ)的向量以及向量之間的相似度計(jì)算和結(jié)果排序的過(guò)程也會(huì)產(chǎn)生較大的計(jì)算開(kāi)銷(xiāo)。

    論文提出了一種基于哈希學(xué)習(xí)的虛擬篩選方法DrugHash,首次將哈希學(xué)習(xí)的思想應(yīng)用在藥物虛擬篩選領(lǐng)域,以解決虛擬篩選方法應(yīng)用于大規(guī)模分子數(shù)據(jù)庫(kù)中的低效問(wèn)題。DrugHash將虛擬篩選建模為蛋白質(zhì)的二值向量檢索分子二值向量的任務(wù)。DrugHash采用多模態(tài)哈希和對(duì)比學(xué)習(xí)策略,同時(shí)為蛋白質(zhì)和分子學(xué)習(xí)二值向量,最大化可以匹配的蛋白質(zhì)-分子對(duì)的相似度,同時(shí)最小化不能匹配的蛋白質(zhì)-分子對(duì)的相似度。該哈希策略不僅能在模型訓(xùn)練時(shí)起到正則化的作用,從而增強(qiáng)模型魯棒性,提升檢索精度,還能在模型推理時(shí)大幅減少存儲(chǔ)開(kāi)銷(xiāo)、提升檢索速度。

    DrugHash方法流程圖

    論文在兩個(gè)數(shù)據(jù)集上測(cè)試和比較了不同虛擬篩選方法的檢索精度,在大多數(shù)場(chǎng)景下,DrugHash的精度都要好于已有最佳方法。論文還測(cè)試了不同方法在存儲(chǔ)空間和檢索時(shí)間上的開(kāi)銷(xiāo):相比于已有最佳方法,DrugHash節(jié)省30倍以上的存儲(chǔ)空間;相比于用實(shí)值向量檢索,DrugHash采用的二值向量能提升至少4.6倍檢索速度。

    匡亞明學(xué)院系統(tǒng)推進(jìn)研究型教學(xué)范式改革,著力構(gòu)建"本-研貫通式"科研育人新生態(tài)。通過(guò)打造動(dòng)態(tài)雙向匹配的本科生科研導(dǎo)師資源庫(kù),基于學(xué)生學(xué)術(shù)志趣與發(fā)展規(guī)劃,在人工智能、生命健康等戰(zhàn)略領(lǐng)域?qū)崿F(xiàn)科研選題精準(zhǔn)導(dǎo)航。該體系實(shí)施以來(lái)成效顯著,學(xué)院本科生累計(jì)獲批國(guó)家自然科學(xué)基金委優(yōu)秀本科生項(xiàng)目4項(xiàng),以第一作者在Angewandte Chemie International Edition等國(guó)際權(quán)威期刊發(fā)表創(chuàng)新成果,摘得"互聯(lián)網(wǎng)+"大學(xué)生創(chuàng)新創(chuàng)業(yè)大賽全國(guó)總決賽金獎(jiǎng)和國(guó)際基因工程機(jī)器大賽決賽金獎(jiǎng)等標(biāo)志性獎(jiǎng)項(xiàng),展現(xiàn)出卓越的學(xué)術(shù)競(jìng)爭(zhēng)力。