<sup id="iwcyi"><tbody id="iwcyi"></tbody></sup>
  • <button id="iwcyi"><input id="iwcyi"></input></button>
    <strike id="iwcyi"><acronym id="iwcyi"></acronym></strike>
    <sup id="iwcyi"><tbody id="iwcyi"></tbody></sup>
    <rt id="iwcyi"></rt>
    您現在的位置:海峽網>新聞中心>IT科技>科技前沿
    分享

    DeepSeek“開源周”第二日,DeepSeek宣布開源DeepEP,第一個用于MoE模型訓練和推理的開源EP通信庫。

    昨天,DeepSeek則開源了代碼庫Flash MLA,這是針對Hopper GPU優化的高效MLA解碼內核,針對可變長度序列作了優化。

    MoE(混合專家架構)和MLA(多頭潛在注意力機制)被認為是DeepSeek以低成本實現杰出表現的核心原因。

    簡單理解,MoE架構是由多個專注于垂直技能的專家模型分工協作來實現最終輸出結果,訓練成本和推理成本更低。有消息稱,GPT-4就使用了MoE架構,由8個220B模型組成。但MoE架構的缺點之一是會增加通信成本。

    DeepEP通信庫就是針對通信環節的優化,其特點包括:高效、優化的全員溝通;節點內和節點間均支持 NVLink 和 RDMA;用于訓練和推理預填充的高吞吐量內核;用于推理解碼的低延遲內核;原生 FP8 調度支持;靈活的 GPU 資源控制,實現計算-通信重疊。

    MLA則是讓模型預測更遠位置的token,從而增強語義理解能力。DeepSeek的Flash MLA專為英偉達Hopper GPU打造了高效MLA解碼內核,特別針對變長序列進行了優化。

    責任編輯:黃學焚

           特別聲明:本網登載內容出于更直觀傳遞信息之目的。該內容版權歸原作者所有,并不代表本網贊同其觀點和對其真實性負責。如該內容涉及任何第三方合法權利,請及時與ts@hxnews.com聯系或者請點擊右側投訴按鈕,我們會及時反饋并處理完畢。

    最新科技前沿 頻道推薦
    進入新聞頻道新聞推薦
    AI畫筆勾勒戲曲新美學
    進入圖片頻道最新圖文
    進入視頻頻道最新視頻
    一周熱點新聞
    下載海湃客戶端
    關注海峽網微信
    ?

    職業道德監督、違法和不良信息舉報電話:0591-87095414 舉報郵箱:service@hxnews.com

    本站游戲頻道作品版權歸作者所有,如果侵犯了您的版權,請聯系我們,本站將在3個工作日內刪除。

    溫馨提示:抵制不良游戲,拒絕盜版游戲,注意自我保護,謹防受騙上當,適度游戲益腦,沉迷游戲傷身,合理安排時間,享受健康生活。

    CopyRight ?2016 海峽網(福建日報主管主辦) 版權所有 閩ICP備15008128號-2 閩互聯網新聞信息服務備案編號:20070802號

    福建日報報業集團擁有海峽都市報(海峽網)采編人員所創作作品之版權,未經報業集團書面授權,不得轉載、摘編或以其他方式使用和傳播。

    版權說明| 海峽網全媒體廣告價| 聯系我們| 法律顧問| 舉報投訴| 海峽網跟帖評論自律管理承諾書

    友情鏈接:新聞頻道?| 福建頻道?| 新聞聚合
    主站蜘蛛池模板: 梓潼县| 拜泉县| 嘉禾县| 沁源县| 瓮安县| 青浦区| 文山县| 庄河市| 曲沃县| 博罗县| 安乡县| 兴业县| 会同县| 佛教| 两当县| 隆德县| 岱山县| 吐鲁番市| 邓州市| 自贡市| 通山县| 雅安市| 寻乌县| 龙井市| 曲松县| 永川市| 长顺县| 泽普县| 隆昌县| 十堰市| 抚松县| 富蕴县| 秭归县| 梁山县| 义乌市| 南平市| 东光县| 错那县| 东光县| 隆德县| 广丰县|