2025.12.03.20 过去4小时全球AI发生了什么?


  1. Mistral AI 发布 Mistral 3 系列多模态模型,性能超越 Kim 2-小互

    Mistral AI 重磅发布了其最新的 Mistral 3 系列模型,包括大型稀疏专家混合(MoE)模型 Mistral Large 3(41B活跃参数/675B总参数)以及面向端侧运行的 Ministral 3 系列(3B, 8B, 14B稠密模型)。Mistral Large 3 支持图像输入与分析,原生支持十余种主要语言,对系统指令遵循度高,并具备原生函数调用和结构化JSON输出能力,其 256K tokens的超长上下文窗口在开源模型中名列前茅。在LMArena榜单中,Mistral Large 3 位列开源非推理模型第二,开源总体模型第六。端侧模型显存需求分别为 24 GB (14B), 12 GB (8B), 8 GB (3B)。

  2. Anthropic 红队利用AI攻击区块链,成功盗取460万美金-小互

    Anthropic 红队与 MATS Fellows 合作进行了一项研究,首次以经济价值量化了AI的进攻性网络能力。研究团队让AI攻击区块链上的智能合约,结果AI成功攻破了测试集中约一半(207个)的真实漏洞,模拟盗取金额达5.5亿美元。在针对2025年3月后出现的新漏洞测试中,AI仍成功利用了19个合约(55.8%),盗走 460万美元虚拟货币,其中 Claude Opus 4.5 模型贡献了约450万美元。更进一步,GPT 5 和 Claude Sonnet 4.5 甚至在2849个全新合约中发现了四个此前未知的“零日漏洞”,带来约3694美元利润,而GPT-5的扫描成本约为3476美元,表明AI已接近具备自主盈利攻击的技术可行性。

  3. OpenAI面临Google Gemini的激烈竞争及内部“红色警报”-Orange AI

    近期,OpenAI 正面临来自 Google Gemini 的巨大竞争压力,甚至有消息称 Sam Altman 已在内部发布“红色警报”,要求优先应对当前挑战。Salesforce CEO 公开表示,使用 ChatGPT 三年后,仅两小时便上手 Gemini 3,感觉“回不去了”。尽管 OpenAI 拥有8亿周活跃用户和5000亿美元的估值,但其未来8年需要投入1.4万亿美元用于算力和机房建设,面临巨大的现金流压力。相较之下,Google 拥有搜索业务带来的稳定现金流和已实现盈利的Google Cloud,发展节奏明显不同。此外,OpenAI首席研究负责人Mark Chen在播客中透露,内部已有Gemini 3水平的模型,并有信心很快发布更强的型号。

  4. Kling AI 2.6 今日发布,支持原生音频及10秒1080P视频生成-小互

    Kling AI 宣布将于今日发布其2.6版本,新版本将支持原生音频功能,包括说话、唱歌和音乐,并能生成10秒1080P的视频。这一进展标志着视频生成技术在推理能力、世界知识和编辑能力方面迈向了产品化和C端落地的关键一步。从图片编辑模型在短短半年内的发展来看,视频生成领域的快速迭代也值得期待。

  5. AI翻译文章的高效策略:分步重写、校对与润色-宝玉

    AI翻译文章的最佳实践是**“重写”而非直译**,并且应将翻译过程分解为多个独立步骤以获得高质量结果。对于普通翻译需求,一次性重写即可满足,尤其像 Gemini 3 Pro 这样的大语言模型已能提供出色质量。但若追求专业级别,则需在初次重写后,独立进行校对和润色。关键在于避免将所有步骤挤压在一个提示词中,因为大模型在处理过长输出时易出现“偷工减料”和“幻觉”现象。建议在翻译时明确文章风格、术语对照表和目标读者;校对阶段检查遗漏和错误(可省略精度要求不高的场景);润色阶段仅对译文进行语句通顺和表达习惯的检查。对于长文章,应分块处理,并通过将上一块原文和译文加入上下文来确保连贯性。

  6. 利用AI生成创新视觉内容:赛博名片、场景玻璃罐与个人插画-宝玉

    通过详细的提示词,AI可以生成高度创意和精美的视觉内容。例如,用户可以生成逼真的赛博美学未来名片,卡片呈现亚克力无边框设计,带有霓虹灯光渐变,背景模糊以突出主体,文字细节如雕刻般。另一个应用是通过“Nano Banana Pro”提示词将地点或游戏场景“封存”在精致透明的玻璃罐子中,营造梦工厂动画风格的3D微缩景观,强调玻璃的真实感和光影效果。此外,AI还能根据用户描述生成3D等距视角的个性化家庭办公插画,包含多显示器、宠物等细节,风格圆润、精致、趣味盎然。这些案例展示了AI在个性化设计和创意表达方面的强大潜力。

  7. Tesla Optimus 机器人跑步姿态与速度显著提升-小互

    Tesla Optimus “擎天柱”机器人发布了最新视频,展示了其在跑步姿势和速度方面的大幅改进。视频中 Optimus 的运动表现更加接近真人,预示着人形机器人在移动能力和仿真度方面取得了重要进展。

  8. Google Gemini 增强记忆功能,NotebookLM PPT生成对免费用户开放-歸藏(guizang.ai)

    Google Gemini 已上线记忆能力,用户可以在左下角“个人使用场景”中查看并主动添加永久的自定义指令,增强其个性化交互体验。此外,NotebookLM 的PPT生成功能现已对免费用户开放,降低了AI辅助演示文稿制作的门槛,用户可以更便捷地利用AI工具进行内容创作。

  9. 新工具可根据网址自动生成品牌衍生设计-小互

    一款基于 Firecrawl 技术的新工具发布,用户只需输入任何网址,它就能自动识别网站的品牌风格、提取Logo,并分析颜色、字体、图片风格等元素,进而生成与该品牌相匹配的各种周边视觉衍生设计。这一工具极大地简化了品牌视觉扩展和内容创作流程,为设计师和营销人员提供了高效的AI辅助。

  10. Anthropic 收购 Bun 以强化其开发生态系统-宝玉

    Anthropic 宣布收购了 JavaScript 运行时 Bun。这一举动表明 Anthropic 正致力于加强其内部开发工具和效率。此前,Anthropic 的代码中就频繁使用 Bun,此次收购进一步整合了其技术栈,可能有助于提升其AI模型的开发和部署效率。

  11. Apple 发布 CLaRa-7B-Instruct 模型-clem 🤗

    Apple 发布了 CLaRa-7B-Instruct 模型。虽然具体细节未完全披露,但作为 Apple 在AI模型领域的最新动作,预计将为研究人员和开发者提供新的工具,并可能暗示 Apple 在AI指令遵循和特定任务处理能力上的进展。

  12. AI撰写公众号排版CSS代码,提供开源样式-向阳乔木

    有用户分享了利用AI(特别是CSS代码生成能力)撰写的公众号排版样式,这些样式在字体、间距和加粗等方面符合预期。该用户表示可在AI生成的CSS代码基础上进行优化以适应个人风格,并提供了开源地址,展示了AI在辅助前端开发和内容排版方面的实用性。

  13. AI Engineer’s Advent Calendar 提供大型AI平台免费积分/会员资格-merve

    AI Engineer’s Advent Calendar 活动正在进行,为参与者提供免费积分和大型AI平台的会员资格。这为AI工程师和爱好者提供了探索和使用顶尖AI资源的机会,旨在促进社区内的学习和创新。

  14. AI辅助3D模型摆姿工具发布-向阳乔木

    一款新的AI工具发布,允许用户自己摆放3D模型的姿势。该工具的出现,可能大幅提升3D内容创作的灵活性和效率,使得艺术家和设计师能够更便捷地调整和定制角色姿态,加速动画和游戏开发流程。