过去4小时全球AI动态回顾 (截至2026年1月2日08:00) 根据收集到的X/Twitter数据显示,在过去一段时间内(最近的更新集中在2026年1月2日00:00+08:00),全球AI领域涌现出多项引人注目的进展和讨论。 DeepSeek Transformer架构迎来基础性改进,并发布40B参数模型-clem 🤗 DeepSeek宣布其Transformer架构取得了根本性的改进。DeepSeek首席执行官Wenfeng Liang参与了此次作者团队的工作,并对这一突破进行了详细阐述。此外,DeepSeek还发布了一款令人印象深刻的40B参数模型,预示着大型语言模型(LLM)领域可能迎来新的性能飞跃和应用潜力。 …
阅读更多