以下是过去4小时全球AI领域的最新动态: 阿里发布最强模型Qwen 3-MAX推理版,基准测试表现出色 - 歸藏(guizang.ai) 阿里巴巴近日发布了其最强模型 Qwen 3-MAX 的推理版本。该模型在包括 AIME 2025 和 HMMT 在内的挑战性推理基准测试中取得了 100% 的得分,展现了卓越的推理能力。此外,Qwen 3 Max 的“Thinking”版本也进行了更新,在测试中显示出更像 Claude 的对话风格,并且能够就阅读习惯等非宇宙或科技主题展开讨论,表明其在更广泛的领域具备出色的对话和理解能力。 深度分析:AI为何疯狂使用破折号?—— 19世纪旧书的“语法DNA” - 向阳乔木 一篇深入分析探讨了大 …
阅读更多AI模型真实加密货币交易表现揭示:DeepSeek稳健领先,GPT-5与Gemini表现不佳-歸藏(guizang.ai) 一项N of 1项目通过让六个顶级AI模型(DeepSeek Chat V3.1、Grok 4、Claude Sonnet 4.5、Qwen3 Max、GPT-5、Gemini 2.5 Pro)在真实加密货币市场进行自主交易,每个模型初始资金1万美元,揭示了它们在不确定性下的决策风格和交易能力。结果显示,DeepSeek Chat V3.1以+37.29%的收益率领跑,Grok 4紧随其后。DeepSeek采用数据驱动的技术派策略,保持稳健现金储备;Grok则通过分散投资降低风险。Qwen3 Max以20倍杠 …
阅读更多ChatGPT将放宽内容限制,支持个性化及成人内容-Sam Altman OpenAI首席执行官Sam Altman宣布,ChatGPT计划在未来几周内放宽内容限制,以提供更具人情味的个性化体验,使其更接近用户喜爱的4o版本。Altman表示,在成功缓解了严重的心理健康问题风险并开发出新工具后,公司认为可以安全地放松此前的严格限制。此外,到今年12月,随着年龄验证功能的全面上线,ChatGPT将对通过验证的成年用户进一步放宽限制,允许提供如情色内容(erotica)等。这一举措旨在“将成年用户视为成年人对待”,并满足用户对更具表达力、甚至使用表情包或朋友般交互方式的需求,前提是用户主动选择。 阿里云发布Qwen3-VL 4B和8B …
阅读更多以下是过去4小时全球AI领域的主要动态: Qwen 3 VL旗舰模型发布,性能爆表并支持百万级上下文长度 - orange.ai 阿里云近期发布了其新一代旗舰模型 Qwen 3 VL (Vision Language Model)。多位观察者指出,该模型在基准测试中表现出色,分数“爆表”,被形容为“怪物”。Qwen 3 VL采用Apache 2.0许可,并支持高达 100万 上下文长度,预示着其在多模态理解和长文本处理方面具备强大潜力。 OpenAI发布GPT-5-Codex,专为AI智能体和交互式编程优化 - 宝玉 OpenAI推出了 GPT-5-Codex,这是GPT-5的一个全新版本,专门针对AI智能体和交互式编程任务进行了深 …
阅读更多以下是过去四小时全球AI领域的一些值得关注的动态: GPT-5 Codex 在实际应用中仍有不足-Ben Tossell 有评论指出,尽管人们对GPT-5 Codex抱有很高的期望,但在实际应用中,它仍然会表现出一些**“愚蠢”的行为**。例如,它有时会尝试使用不恰当的编程语言(如Python/Ruby)来读取文件,这表明其在某些方面的逻辑推理和环境理解能力仍需改进,提醒开发者和用户在看待其性能时应保持现实和批判的态度。 AI模型生成秋季落叶艺术作品-歸藏(guizang.ai) AI模型在生成创意图像方面展现了令人印象深刻的能力,尤其是在模拟秋季落叶艺术方面。用户可以通过简单的提示词,让模型将落叶、树枝、银杏叶和桂花等元素组合成有 …
阅读更多文心开源ERNIE-4.5-21B-A3B-Thinking模型登顶HuggingFace趋势榜-向阳乔木 百度文心团队新开源的 ERNIE-4.5-21B-A3B-Thinking 模型在HuggingFace全球模型总趋势榜上取得了第一名。这款模型是一款轻量级的MoE(Mixture-of-Experts)模型,总参数量为21B,但激活参数仅3B,具备128K的上下文窗口,专为提升推理能力而设计。该模型基于百度自研的飞桨深度学习框架构建,而非主流的PyTorch。HuggingFace的CEO Clem也转发推荐了此模型。分析指出,其强大的推理和工具调用能力对于开发Agent产品具有重要意义,有助于打破现有市场垄断。
阅读更多Lovart & Seedream 4.0:自媒体图文生成的终极方案与自定义风格新玩法 - 歸藏(guizang.ai) 歸藏(guizang.ai) 分享了利用 Lovart 与 Seedream 4.0 结合的强大提示词,实现了将任意文案转换为高度可控的成套图文内容,尤其适用于小红书等平台。该方案允许用户通过“垫图”或详细提示词自定义图片风格,例如将Anthropic的文档转化为其品牌设计风格的卡片,或将中国古文转化为水墨风格的传统主题卡片,甚至能以中国仙侠风格讲述科学家事迹。这种方法提供了极高的内容、风格、文案和主题混搭灵活性,被认为是自媒体图文生成的“终极方案”,并提及未来可能实现低成本的完整视频(结合TTS)生成。 深入 …
阅读更多