百度 CEO 李彦宏:中國 AI 模型太多、實際應用卻太少

李彦宏:「中國太多人把焦點放在模型的跑分和排行榜了!但這太浪費資源。」

最強 LLM 現身?Anthropic 推出「Claude 3.5 Sonnet」和新「Artifacts」功能

這代表 Claude 3.5 Sonnet 在編寫和翻譯程式碼、處理多步驟工作流程、解釋圖表,以及從圖像中轉錄文字等任務將表現得更好,且速度為前一代的兩倍。

第一款程式能力超越 GPT-4 Turbo 開源模型?中國 AI 新創釋出「DeepSeek Coder V2」

深度求索於 2023 年成立,由量化基金「幻方」所獨立出來的 LLM 組織, 今年發布的 DeepSeek V2 以 GPT 百分之一的價格吸引到目光。

這是台灣 LLM 發展之路:跟聯發科資深研究員陳宜昌對談,揭開 AI 的黑盒

聯發創新基地的資深機器學習研究員陳宜昌分享了大型語言模型的發展與應用方向,探討了聯發科投入大型語言模型研究的原因和方向,以及中文大型語言模型的發展現況。

專訪 Neuchips 創鑫:台灣新創怎緊抓生成式 AI 大浪?

2023 年 MLCommons 公布最新 AI 晶片評測,Neuchips 一戰成名,每瓦可處理次數上超越 NVIDIA 的 H100 晶片,能效更是 NVIDIA 的 1.7 倍。

AI 能隨機挑數字嗎?研究:AI 有偏好!Claude 3 特別喜歡 42

當要求 LLM 從 0 到 100 隨機選個數字時,GPT-3.5 Turbo 非常喜歡 47、 Claude 3 Haiku 選擇了 42,Gemini 則喜歡 72。

「ChatXiPT」出爐!中國推出:由習近平思想訓練的 AI 聊天機器人

該 AI 聊天機器人訓練資料中提及習近平的次數超過 86,000 次,並使用「敦促公民在思想、政治、行動上始終與黨中央保持高度一致」等字眼。

完全脫離網路!微軟為美國情報機構打造專用 AI 模型

微軟花了 18 個月的時間來打造這套系統,該系統只有約 1 萬人可以存取。

讓 LLM 一次預測多個 token,Meta 研究員:模型推論速度會快 3 倍

這項研究最有用的地方在於,有機會讓 AI 用很低的額外成本,來進行更高準確性的生成任務,同時也能有效加快推論速度。

OpenAI 和 Stack Overflow 宣布合作!要提升 AI 模型程式碼能力

與 OpenAI 的合作象徵 Stack Overflow 態度的轉變,2022 年平台以 ChatGPT 錯誤率過高為由,曾暫時禁止使用者分享 AI 生成之程式碼。