華夏經緯網8月23日訊:據香港“中通社”報道:中國人工智能(AI)公司深度求索(DeepSeek)21日宣布,其最新大語言模型DeepSeek-V3.1正式發(fā)布。
據DeepSeek介紹,新升級版本變化體現在三方面:混合推理架構、更高的思考效率、更強的Agent(智能體)能力。通過“深度思考”按鈕切換,DeepSeek-V3.1實現一個模型同時支持兩種模式:面對簡單問題時,能以“非思考模式”快速回答。處理復雜問題時,可切換到“思考模式”,給出更具深度和邏輯的解答。此外,DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數精度。DeepSeek官方公眾號在其文章置頂留言里說,UE8M0 FP8是針對即將發(fā)布的下一代中國產芯片設計。
官方數據顯示,與今年5月發(fā)布的旗艦推理模型DeepSeek R1升級版本“R1-0528”相比,DeepSeek-V3.1在思考模式下效率大幅提升,能在更短時間給出答案,token(大模型文本處理的最小單位)消耗量可減少20%至50%,各項任務平均表現與R1-0528持平。
主辦:華夏經緯信息科技有限公司 版權所有 華夏經緯網
Copyright 2001-2024 By 977696.cn