Photo Credit: Shutterstock / 達志影像

第一款程式能力超越 GPT-4 Turbo 開源模型?中國 AI 新創釋出「DeepSeek Coder V2」

深度求索於 2023 年成立,由量化基金「幻方」所獨立出來的 LLM 組織, 今年發布的 DeepSeek V2 以 GPT 百分之一的價格吸引到目光。

來自中國的 AI 新創「DeepSeek」 (深度求索)最近釋出新開源程市語言模型「DeepSeek Coder V2」,支援 300 多種程式語言,可執行程式碼編寫和數學任務,號稱表現優於大部分的封閉和開源模型,包括 GPT-4 Turbo、Gemini 1.5 Pro 等。

在評估 LLM 程式碼編寫和問題解決能力的 MBPP+、HumanEval、Aider 基準測試中,DeepSeek Coder V2 分別拿到  76.2、90.2 和 73.7,分數超過 GPT-4 Turbo、Gemini 1.5 Pro、Claude 3 Opus、Llama-3 70B (如下圖)。

Photo Credit: DeepSeek 的 X

不過,GPT-4o 表現仍優於 DeepSeek Coder V2,GPT-4o在 HumanEval、LiveCode Bench、MATH 和 GSM8K 等測試中,都獲得較高的分數。

至於 DeepSeek Coder V2 數學和程式碼之外的表現,模型在評估語言理解能力的 MMLU 基準測試中拿到 79.2,��近 Llama-3 70B 的 80.2,但 GPT-4o 和 Claude 3 Opus 仍以 88 分領先。

DeepSeek Coder V2 是基於該公司上個月推出的 MoE 模型 DeepSeek V2 所構建而成,V2 模型是藉由 6 兆個token 預訓練,資料來源包含來自 GitHub 和 CommonCrawl 的��式碼及數學資料。

MoE 架構讓 16B 參數的 DeepSeek V2 Lite 只用到 2.4B參數,而236B 的 DeepSeek V2 則僅用 21B,同時也針對不同的運算需求進行了最佳化。

DeepSeek Coder V2 是採 MIT 授權條款,可供研究和商業用,DeepSeek 有提供模型付費 API,也能藉官網上的聊天機器人體驗模型。

深度求索於 2023 年成立,由量化基金「幻方」所獨立出來的 LLM 組織,目標是研究和揭秘 AGI。去年底發布了以中英訓練的開源模型 DeepSeek LLM,表現接近Llama 2-70B。

今年釋出的 DeepSeek V2 模型,更是以 GPT 百分之一的價格吸引到目光,DeepSeek V2 人民幣 2 元 / 百萬输出 Tokens,GPT-4- turbo  則是 30 美元 / 百萬输出 Tokens。

責任編輯:Jocelyn
核稿編輯:Chris

本文初稿為 INSIDE 使用 AI 編撰;快加入 INSIDE Google News 按下追蹤,給你最新、最 IN 的科技新聞!

延伸閱讀:

 

最新發展:

Photo Credit:Microsoft

AI 創新浪潮席捲全球:微軟 DevDays Asia 2024 技術盛會強勢登場

「DevDays Asia 2024 亞太技術年會」將於 8 月 12 至 14 日於台北、8 月 16 日於高雄盛大登場,聚焦生成式 AI、Copilot 和 AI PC 等前沿技術,帶來四軌並進的豐富議程與實作課程,為與會者提供全場域沉浸式學習和跨界合作機會。

隨著 AI 技術的爆炸性成長,越來越多企業導入 AI 技術來優化服務、搶佔市場,身處時代更迭的科技浪潮中,如何移植寶貴的轉型經驗、跟上瞬息萬變的市場,就成為當代企業決策者、開發技術人員不可不答的關鍵課題。

今年 8 月中旬,微軟即將分別於臺北、高雄盛大舉辦一年一度的「DevDays Asia - 亞太技術年會」,邀請來自亞洲各地的技術人才,打造國際級的知識與技術地共享交��平台。

Photo Credit:Microsoft


立即報名 DevDays Asia - 亞太技術年會,了解最新 AI 技術解決方案!


啟航 AI 新紀元,全新規劃隆重登場

今年年會以「啟.AI 跨躍時代  動.共拓創新佈局」為主題,帶來一日四軌並進的豐富議程,內容包括趨勢論壇、技術專家對談、技術工作坊、開發社群活動、解決方案攤位展示等。

活動號召頂尖的國際專家與開發者,獨家分享最新的雲端科技實戰經驗,並邀請產業客戶與合作夥伴展示應用成果,加速企業數位轉型。

Photo Credit:Microsoft

永續與創新技術齊飛:「DevDays Asia 2024」五大亮點搶先看

  1. 前沿技術與創新應用
    掌握生成式 AI、Copilot 的最新開發趨勢與框架,了解如何結合資安、維運與數據治理技術提升企業生產力,在商業應用中發揮最大化的關鍵力量。
  2. 精英交流與生態圈合作
    集結美國微軟總部頂尖專家、國內社群大神與各行業開發者,分享技術靈感與應用實例。
  3. 全場域沉浸式學習
    規劃「開發者聚落」活動,與台灣重要開發者社群合作,邀請專家、社群講師蒞臨,現場對談解答開發者疑問;並與臺灣電腦書專賣店「天瓏書坊」合作,提供開發者最實用開發工具。
  4. 硬派實作與 GitHub Copilot Workshop
    安排 GitHub Copilot 百人 Workshop,讓開發者體驗 AI 如何幫助我們開發一個真實且可執行的應用程式。
  5. 企業合作與應用
    本次年會在台北和高雄兩地盛大舉行,無論南北場次,皆有多間技術廠商與合作夥伴的應用實例分享展出,讓與會者親身體驗 AI 技術的無限可能。
     

Photo Credit:Microsoft

作為技術開發者、企業領航者的創新舞台,DevDays Asia 2024 不只匯聚技術精英,跨界探索者齊聚一堂,更是激發創新火花、掌握前沿動態、驗證商業策略的盛會。期待你一起加入,共同開啓亞太技術新篇章!

DevDays Asia 2024 活動詳細資訊

-台北場-
活動時間:8 月 12 日(一)~8 月 14 日(三)
活動地點:華南國際會議中心

-高雄場-
活動時間:8 月 16 日(五)
活動地點:高雄萬豪酒店


立即報名 DevDays Asia - 亞太技術年會,了解最新 AI 技術解決方案!