人工智慧

第一款程式能力超越 GPT-4 Turbo 開源模型？中國 AI 新創釋出「DeepSeek Coder V2」

INSIDE 硬塞的網路趨勢觀察

2024/06/20
中國、 AI 、程式碼、 GPT-4 、 LLM 、開源模型

深度求索於 2023 年成立，由量化基金「幻方」所獨立出來的 LLM 組織，今年發布的 DeepSeek V2 以 GPT 百分之一的價格吸引到目光。

來自中國的 AI 新創「DeepSeek」（深度求索）最近釋出新開源程市語言模型「DeepSeek Coder V2」，支援 300 多種程式語言，可執行程式碼編寫和數學任務，號稱表現優於大部分的封閉和開源模型，包括 GPT-4 Turbo、Gemini 1.5 Pro 等。

在評估 LLM 程式碼編寫和問題解決能力的 MBPP+、HumanEval、Aider 基準測試中，DeepSeek Coder V2 分別拿到 76.2、90.2 和 73.7，分數超過 GPT-4 Turbo、Gemini 1.5 Pro、Claude 3 Opus、Llama-3 70B （如下圖）。

不過，GPT-4o 表現仍優於 DeepSeek Coder V2，GPT-4o在 HumanEval、LiveCode Bench、MATH 和 GSM8K 等測試中，都獲得較高的分數。

至於 DeepSeek Coder V2 數學和程式碼之外的表現，模型在評估語言理解能力的 MMLU 基準測試中拿到 79.2，��近 Llama-3 70B 的 80.2，但 GPT-4o 和 Claude 3 Opus 仍以 88 分領先。

DeepSeek Coder V2 是基於該公司上個月推出的 MoE 模型 DeepSeek V2 所構建而成，V2 模型是藉由 6 兆個token 預訓練，資料來源包含來自 GitHub 和 CommonCrawl 的��式碼及數學資料。

MoE 架構讓 16B 參數的 DeepSeek V2 Lite 只用到 2.4B參數，而236B 的 DeepSeek V2 則僅用 21B，同時也針對不同的運算需求進行了最佳化。

DeepSeek Coder V2 是採 MIT 授權條款，可供研究和商業用，DeepSeek 有提供模型付費 API，也能藉官網上的聊天機器人體驗模型。

深度求索於 2023 年成立，由量化基金「幻方」所獨立出來的 LLM 組織，目標是研究和揭秘 AGI。去年底發布了以中英訓練的開源模型 DeepSeek LLM，表現接近Llama 2-70B。

今年釋出的 DeepSeek V2 模型，更是以 GPT 百分之一的價格吸引到目光，DeepSeek V2 人民幣 2 元 / 百萬输出 Tokens，GPT-4- turbo 則是 30 美元 / 百萬输出 Tokens。

責任編輯：Jocelyn
核稿編輯：Chris

本文初稿為 INSIDE 使用 AI 編撰；快加入 INSIDE Google News 按下追蹤，給你最新、最 IN 的科技新聞！

延伸閱讀：

最新發展：

AI ��程式碼��人��？研究：太「新」的問題 ChatGPT 就不會了

Microsoft

AI 創新浪潮席捲全球：微軟 DevDays Asia 2024 技術盛會強勢登場

廣編企劃

2024/07/12
AI 、創新、亞太技術年會、數位發展部、生成式 AI 、 AI PC 、 DevDays Asia 2024

「DevDays Asia 2024 亞太技術年會」將於 8 月 12 至 14 日於台北、8 月 16 日於高雄盛大登場，聚焦生成式 AI、Copilot 和 AI PC 等前沿技術，帶來四軌並進的豐富議程與實作課程，為與會者提供全場域沉浸式學習和跨界合作機會。

隨著 AI 技術的爆炸性成長，越來越多企業導入 AI 技術來優化服務、搶佔市場，身處時代更迭的科技浪潮中，如何移植寶貴的轉型經驗、跟上瞬息萬變的市場，就成為當代企業決策者、開發技術人員不可不答的關鍵課題。

今年 8 月中旬，微軟即將分別於臺北、高雄盛大舉辦一年一度的「DevDays Asia - 亞太技術年會」，邀請來自亞洲各地的技術人才，打造國際級的知識與技術地共享交��平台。

立即報名 DevDays Asia - 亞太技術年會，了解最新 AI 技術解決方案！

啟航 AI 新紀元，全新規劃隆重登場

今年年會以「啟．AI 跨躍時代動．共拓創新佈局」為主題，帶來一日四軌並進的豐富議程，內容包括趨勢論壇、技術專家對談、技術工作坊、開發社群活動、解決方案攤位展示等。

活動號召頂尖的國際專家與開發者，獨家分享最新的雲端科技實戰經驗，並邀請產業客戶與合作夥伴展示應用成果，加速企業數位轉型。

永續與創新技術齊飛：「DevDays Asia 2024」五大亮點搶先看

前沿技術與創新應用
掌握生成式 AI、Copilot 的最新開發趨勢與框架，了解如何結合資安、維運與數據治理技術提升企業生產力，在商業應用中發揮最大化的關鍵力量。
精英交流與生態圈合作
集結美國微軟總部頂尖專家、國內社群大神與各行業開發者，分享技術靈感與應用實例。
全場域沉浸式學習
規劃「開發者聚落」活動，與台灣重要開發者社群合作，邀請專家、社群講師蒞臨，現場對談解答開發者疑問；並與臺灣電腦書專賣店「天瓏書坊」合作，提供開發者最實用開發工具。
硬派實作與 GitHub Copilot Workshop
安排 GitHub Copilot 百人 Workshop，讓開發者體驗 AI 如何幫助我們開發一個真實且可執行的應用程式。
企業合作與應用
本次年會在台北和高雄兩地盛大舉行，無論南北場次，皆有多間技術廠商與合作夥伴的應用實例分享展出，讓與會者親身體驗 AI 技術的無限可能。

作為技術開發者、企業領航者的創新舞台，DevDays Asia 2024 不只匯聚技術精英，跨界探索者齊聚一堂，更是激發創新火花、掌握前沿動態、驗證商業策略的盛會。期待你一起加入，共同開啓亞太技術新篇章！

DevDays Asia 2024 活動詳細資訊

－台北場－
活動時間：8 月 12 日（一）～8 月 14 日（三）
活動地點：華南國際會議中心

－高雄場－
活動時間：8 月 16 日（五）
活動地點：高雄萬豪酒店

立即報名 DevDays Asia - 亞太技術年會，了解最新 AI 技術解決方案！

第一款程式能力超越 GPT-4 Turbo 開源模型？中國 AI 新創釋出「DeepSeek Coder V2」

AI 創新浪潮席捲全球：微軟 DevDays Asia 2024 技術盛會強勢登場

啟航 AI 新紀元，全新規劃隆重登場

永續與創新技術齊飛：「DevDays Asia 2024」五大亮點搶先看

DevDays Asia 2024 活動詳細資訊

【Web3 元觀察】穩定幣的機會與挑戰：為何在 2024 年仍是焦點？

【Web3 元觀察】日本穩定幣法案周年回顧與展望

【Web3 元觀察】加密貨幣的牛市真的來了嗎？價格 v.s. 價值

【Web3 元觀察】探索 2024 年：加密消費者應用的未來發展

【Web3 元觀察】2024 年，「AI + Web3」值得關注的四大領域

最新科學發現：南北極冰層融化會使地球自轉變慢，導致白天變長

聯合國估計：2080 年代全球人口將增長至 103 億，數量在 21 世紀達頂峰

波音 6 月僅售出 3 架客機，上半年總銷售量滑降 70%

不只人工智慧之父，你知道圖靈還是世界首位電腦演奏家嗎？

亞馬遜終止 Astro 機器人商用版發展規劃，��來��中在家用版本

中指通：百萬 YouTuber 暨成人內容推廣師 | 競爭激烈、政策緊縮下的求生之道【塞掐 Side Chat】E251

專訪 Neuchips 創鑫：台灣新創怎緊抓生成式 AI 大浪？

黃明志破億神曲《東京盆踊》背後的男人，專訪 Cool Japan TV 共同創辦人林良升

奇軒 Tricking 登台灣 No.1 千萬級 YouTuber！他如何發揮自我、走向世界？

黃仁勳：計算機時代已逝下一個黃金賽道是生命科學

Threads 一週年：一個文字友好的社交場所，找到了它的受眾

馬斯克為何悄悄撤告 Open AI，背後可能有哪些考量？

AI for the rest of us：蘋果打出的漂亮一仗，並沒有違背賈伯斯的理想

Google I/O 2024：「Google」的意義，或許已不再是搜尋了

9 種你無論如何都不該對主管說的話