以下是过去一段时间全球AI领域的重要动态,根据提供的X/Twitter数据整理。请注意,虽然标题提及“过去4小时”,但部分内容的时间戳显示其发布时间早于此。 DeepSeek-Math-V2 开源:超越GPT-5与Gemini,实现IMO金牌水平 - 小互 DeepSeek 开源了数学推理大模型 DeepSeek-Math-V2,其在答案准确率和推理严谨性方面表现出色,超越了GPT-5-Thinking和Gemini 2.5 Pro。该模型核心创新在于“生成+验证+复审”的自我验证系统,能自动生成数学证明并自行检查和修正错误。在IMO 2025、CMO 2024和Putnam 2024等高难度数学竞赛 …
阅读更多AI 评论家 Gary Marcus 重申对 LLM 及 OpenAI 的长期警告 AI 评论家 Gary Marcus 再次强调了他对大型语言模型(LLMs)的长期批判观点,指出它们无法导向通用人工智能(AGI),并将面临经济困境,甚至可能需要救助。他同时表达了对 Sam Altman 的不信任,并预测 OpenAI 将失去其主导地位,GPT-5 也无法实现 AGI 承诺,幻觉及泛化能力不足等问题将持续存在。 Gary Marcus 炮轰 Yann LeCun 剽窃其对 LLM 限制的预测 AI 评论家 Gary Marcus 严厉指责 Yann LeCun 盗用他 2022 年 3 月提出的观点,即 LLM 的扩展将遇到瓶颈, …
阅读更多以下是过去一段时间全球AI领域的重要动态: AI驱动的研究效率提升500倍-Peter H. Diamandis, MD Peter H. Diamandis博士指出,AI驱动的研究方法现在比传统方法快500倍。这一显著的效率提升预示着科学发现和技术进步将迎来前所未有的加速,有望在各领域带来颠覆性影响。 FLUX.2图像生成与编辑模型发布及测试反馈-merve / 歸藏(guizang.ai) / clem 🤗 FLUX.2,一个全新的先进图像生成与编辑模型,现已发布。该模型采用单文本编码器(Mistral Small 3.1)和DiT架构,并支持多种量化方案(如QLoRA,以减少对超过80GB显存的需求),同时提 …
阅读更多FLUX.2图像生成与编辑模型发布 - merve FLUX.2是一款功能强大的图像生成与编辑模型,现已发布。该模型采用单一文本编码器(Mistral Small 3.1)和DiT架构,并支持不同的量化方案,适用于推理和训练(QLoRA),在需要80GB以上显存的场景下尤其有用。FLUX.2还提供了对Diffusers的即日支持,并支持使用SAM3掩码进行图像修复和视频修复。有用户测试发现其2K分辨率版本一致性较好,甚至优于Banana模型,但在中文和提示词遵循上仍存在问题。它对设计师友好,能精准控制色值,但LLM部分在世界知识和多模态推理上不如Banana。 AI在研究领域的应用速度提升显著 - Peter H. …
阅读更多ChatGPT 上线群聊功能 - 小互 ChatGPT 已正式上线群聊功能,支持最多20人共同与AI互动。该功能具备智能判断发言时机、被 @ 提及时强制响应、支持 emoji 表情以及在图片生成中引用用户头像加入个性化元素等特性。目前,该功能正在日本、新西兰、韩国和台湾地区进行试点。群聊还提供了丰富的管理选项,包括自定义群名、成员管理、静音通知,以及为群聊单独设置自定义指令(Custom Instructions),允许用户定义ChatGPT在群聊中的语气、角色或参与方式,例如使其扮演“会议记录助理”或“语气更轻松幽默”的角色。 免费语音转文字工具“代体”改名为“闪电说” - 向阳乔木 免费语音转文字工具“代体”已更名为“闪电 …
阅读更多AI热潮降温:甲骨文股价回吐所有LLM相关涨幅,CoreWeave估值下跌超50%-Gary Marcus AI市场泡沫的迹象显现,投资者对大型语言模型(LLM)的狂热情绪正在消退。据Gary Marcus观察,甲骨文公司此前因LLM热潮获得的巨大股价涨幅已全部回吐,甚至有所下跌。同时,AI基础设施提供商CoreWeave的估值也从高峰期下跌了超过50%。这表明市场正在重新评估AI相关公司的真实价值和增长潜力,LLM领域的投资可能正在经历调整期。 中国AI自媒体探索新商业模式:ListenHub启动品牌合伙人计划,旨在破局商单困境-Orange AI 针对中国自媒体行业普遍存在的“有毒”商业模式,Orange AI观察到国内用户对 …
阅读更多纽约时报起诉OpenAI并索要用户聊天记录,OpenAI发文控诉回应-小互 纽约时报已对OpenAI提起诉讼,并提出惊人要求,希望OpenAI交出2000万条ChatGPT用户的私人聊天记录,理由是检查用户是否利用AI绕过其付费墙。此前,纽约时报曾要求OpenAI提供14亿条对话记录并禁止用户删除聊天记录。OpenAI正通过法律程序反对这一交付要求,并曾提出替代方案(如只检索与纽约时报内容相关的对话),但均被纽约时报拒绝。OpenAI也发布了文章控诉纽约时报,指出其诉讼缺乏依据。 Google Gemini Live推出重磅语音更新,提升对话自然度和趣味性-小互 Google为Gemini Live推出了重大语音更新,旨在使其对话 …
阅读更多以下是过去4小时内全球AI领域的重要动态梳理: Fei-Fei Li on World Labs’ Marble & 3D World Generation-Fei-Fei Li AI领军人物李飞飞参与的World Labs正式发布其3D世界生成模型Marble,现已面向所有用户开放。该模型被定位为“空间智能未来”的基石,旨在通过其强大的生成能力激发用户的创造力和想象力。此项发布获得了业界广泛关注,知名投资人Garry Tan称之为一项“重要发布”,强调了AI在构建沉浸式数字环境方面的潜力,预示着空间计算领域的进一步发展。 Emad讨论用于大型语言模型的硬件需求-Emad Emad就名为“Gabecube”的AI硬件规格进行了讨论, …
阅读更多FII峰会探讨超级智能的未来与经济影响-Peter H. Diamandis, MD 在未来投资倡议(FII)峰会的一次对话中,Eric Schmidt和李飞飞深入探讨了超级智能的到来及其影响。他们预测“口袋里的爱因斯坦”将使数十亿人拥有IQ-148的智能,AI有望使医疗、教育和交通服务几乎免费。对话还强调了人类最后的优势在于尊严、自主性和想象力。展望未来,预计到2030年,AI将带来高达 15万亿美元 的经济增益。 OpenAI迎来新成员,加强计算基础设施建设-Sam Altman OpenAI首席执行官Sam Altman宣布,@sk7037已加入OpenAI团队,将负责设计和构建公司的计算基础设施。这一举措表明OpenAI正 …
阅读更多世界上最快的 AI 聊天客户端 ChatWise 现已支持 ListenHub 朗读回答了。-Orange AI 号称“世界上最快”的AI聊天客户端 ChatWise 近日宣布集成 ListenHub 功能,为用户提供了全新的交互体验。现在,用户不仅可以利用ListenHub朗读AI的回答,更可以通过ListenHub MCP实现将AI回答一键转换为播客的功能。此举旨在提升用户在使用AI聊天客户端时的便捷性与沉浸感,简化内容创作流程,并可通过官方提供的视频教程快速完成配置。 对阿里巴巴通义千问和月之暗面 Kimi 的看好-merve 一位社交媒体用户表达了对阿里巴巴通义千问(Alibaba Qwen)大模型的喜爱, …
阅读更多