
微軟和英偉達(dá)今天宣布了由DeepSpeed和Megatron驅(qū)動(dòng)的Megatron-Turing自然語(yǔ)言生成模型(MT-NLG),這是迄今為止訓(xùn)練的最大和最強(qiáng)大的解碼語(yǔ)言模型。這個(gè)模型包括5300億個(gè)參數(shù),與現(xiàn)有最大的模型GPT-3相比,參數(shù)數(shù)量是其3倍。
訓(xùn)練這樣的大型模型涉及各種挑戰(zhàn),沿著所有的人工智能軸線進(jìn)行了許多創(chuàng)新和突破。例如,通過(guò)緊密合作,英偉達(dá)和微軟將最先進(jìn)的GPU加速訓(xùn)練基礎(chǔ)設(shè)施與尖端的分布式學(xué)習(xí)軟件堆棧相融合,實(shí)現(xiàn)了前所未有的訓(xùn)練效率。
微軟與NVIDIA建立了高質(zhì)量的自然語(yǔ)言訓(xùn)練語(yǔ)料庫(kù),其中包含數(shù)千億個(gè)標(biāo)記,并共同開發(fā)了訓(xùn)練配方,以提高優(yōu)化效率和穩(wěn)定性。
網(wǎng)站首頁(yè) |網(wǎng)站簡(jiǎn)介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
Copyright © 2000-2020 m.hngelin.com All Rights Reserved.
中國(guó)網(wǎng)絡(luò)消費(fèi)網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復(fù)制或建立鏡像
聯(lián)系郵箱:920 891 263@qq.com
利川市| 广德县| 广东省| 景德镇市| 丹东市| 阜阳市| 汉川市| 滁州市| 吴忠市| 莒南县| 阿尔山市| 新宾| 黄陵县| 通城县| 吴川市| 江津市| 蓬溪县| 锡林浩特市| 石泉县| 军事| 雷山县| 绿春县| 浦江县| 北海市| 广昌县| 五寨县| 瓮安县| 宜城市| 定兴县| 茂名市| 镇沅| 高安市| 隆昌县| 澄江县| 临沂市| 开江县| 遵义县| 洞头县| 南通市| 万山特区| 鹤峰县|