近日,東北財經(jīng)大學金融科技學院劉壯副教授的合作論文“Mitigating Age-Related Bias in Large Language Models: Strategies for Responsible Artificial Intelligence Development”,被國際頂級期刊INFORMS Journal on Computing 正式接收發(fā)表。該論文合作者為多倫多大學錢士堯教授、南京大學曹水榮博士、多倫多大學時天宇教授。
大語言模型(LLMs)廣泛應用于教育、醫(yī)療、金融等多個領域,但其容易學習并放大訓練數(shù)據(jù)中的社會偏見,尤其是年齡相關偏見,這會嚴重影響模型的公平性。該研究聚焦大模型(LLM)的年齡相關偏見問題,提出了一種創(chuàng)新的兩階段偏見緩解方法。該方法融合了LLM的共情能力、強化學習以及人在回路機制(Human-in-the-loop),能夠在不改變模型參數(shù)的前提下,有效識別并糾正年齡相關偏見,為構建更公平、更具責任感的人工智能系統(tǒng)提供了全新思路。研究還創(chuàng)新性地構建了自我偏見緩解和協(xié)作偏見緩解兩種模式,同時引入共情視角交換的強化學習策略,使模型生成的回應更貼合不同年齡段用戶需求。實驗表明,該創(chuàng)新模型在降低年齡偏見方面表現(xiàn)出色,通過減少大模型中的年齡偏見,有助于構建更加包容和公平的數(shù)字環(huán)境,使不同年齡段的用戶都能從AI技術中受益。
INFORMS Journal on Computing 是由美國運籌學和管理學研究協(xié)會(INFORMS)出版的季刊,主要發(fā)表運籌學、統(tǒng)計學與計算科學等交叉學科領域的最新研究成果,屬于UTD24期刊之一,享有極高的學術聲譽和影響力。該論文是學校金融科技學院科研成果國際化和精品化的標志性成果,對于進一步提升學校和金融科技學科在國內(nèi)外的影響力具有重要意義。
撰稿:趙鵬輝 審核:史永東 單位:金融科技學院