Mistral AI发布Mistral 3系列多模态模型 Mistral AI正式发布了其最新一代多模态模型Mistral 3系列。该系列包含三款领先的密集模型,参数量分别为3B、8B等。此举标志着Mistral AI在多模态AI领域取得了新的突破,有望在未来为开发者和企业提供更强大的AI能力。 Anthropic收购Bun,强化技术栈 知名AI公司Anthropic宣布收购Bun。据了解,Anthropic在开发过程中已多次使用Bun技术。此次收购预计将进一步整合Bun的优势到Anthropic的产品和开发流程中,可能对其未来的AI基础设施和应用开发产生积极影响。 Google搜索集成更深度的AI模式 Google正在测试一项新 …
阅读更多字节跳动发布“豆包手机助手”技术预览版-小互 字节跳动推出了“豆包手机助手”技术预览版,该产品具备强大的多模态识别与交互能力,支持跨应用操作手机,并通过语音、AI键或耳机唤醒。豆包助手还拥有个性化记忆功能,能够从历史对话和屏幕信息中提取关键数据,提供生活琐事回忆和喜好记忆,并强调数据本地处理以保护隐私。其核心亮点是App Agent能力,能模拟用户操作,自动执行全网比价、生活服务自动化及办公审批等任务。此外,豆包助手还支持系统原生的多模态生成与编辑,例如智能修图,并提供了针对复杂任务的“Pro模式”,能进行多步骤的复杂任务规划和执行,例如跨平台预订旅行。该版本通过与手机厂商的系统集成,获得了更深层的操作权限。 ChatGPT 发布 …
阅读更多过去4小时全球AI要闻回顾 中国在开放AI模型市场超越美国,Z-Image Turbo登顶HF榜单 根据MIT和Hugging Face的一项研究显示,中国已在全球开放AI模型市场中超越美国。与此同时,Ali_TongyiLab的Z-Image Turbo模型在Hugging Face模型榜单上表现出色,荣登榜首。这表明中国在AI开源领域的影响力正快速增长,并在特定模型性能上取得显著成就,预示着全球AI格局的转变。 Nvidia低调发布ToolOrchestrator-8B,Step-Audio-R1音频LLM亮相 Nvidia悄然发布了ToolOrchestrator-8B模型,该模型在“人类最终考试”(HLE)基准测试中取得了令 …
阅读更多Peter Diamandis:10吉瓦计算能力的无限可能 Peter H. Diamandis博士指出,许多人尚未意识到仅凭10吉瓦的计算能力所能实现的巨大可能性。这一观点强调了AI技术在未来几年内可能带来的变革性影响,预示着计算能力提升将解锁前所未有的创新领域,并可能颠覆现有行业格局。 Orange AI:Labnana超越Gemini实现流畅视频内容创作 Orange AI转发推文称赞Labnana在视频内容生成方面的出色表现,能够实现剧本、故事、画面反转的行云流水。与此形成对比的是,Gemini App在处理涉及公众人物的内容时会受到限制,无法出图或编辑,这凸显了Labnana在规避内容审查和提供更自由创作空间方面的优势。 …
阅读更多以下是过去一段时间全球AI领域的重要动态,根据提供的X/Twitter数据整理。请注意,虽然标题提及“过去4小时”,但部分内容的时间戳显示其发布时间早于此。 DeepSeek-Math-V2 开源:超越GPT-5与Gemini,实现IMO金牌水平 - 小互 DeepSeek 开源了数学推理大模型 DeepSeek-Math-V2,其在答案准确率和推理严谨性方面表现出色,超越了GPT-5-Thinking和Gemini 2.5 Pro。该模型核心创新在于“生成+验证+复审”的自我验证系统,能自动生成数学证明并自行检查和修正错误。在IMO 2025、CMO 2024和Putnam 2024等高难度数学竞赛 …
阅读更多AI 评论家 Gary Marcus 重申对 LLM 及 OpenAI 的长期警告 AI 评论家 Gary Marcus 再次强调了他对大型语言模型(LLMs)的长期批判观点,指出它们无法导向通用人工智能(AGI),并将面临经济困境,甚至可能需要救助。他同时表达了对 Sam Altman 的不信任,并预测 OpenAI 将失去其主导地位,GPT-5 也无法实现 AGI 承诺,幻觉及泛化能力不足等问题将持续存在。 Gary Marcus 炮轰 Yann LeCun 剽窃其对 LLM 限制的预测 AI 评论家 Gary Marcus 严厉指责 Yann LeCun 盗用他 2022 年 3 月提出的观点,即 LLM 的扩展将遇到瓶颈, …
阅读更多以下是过去一段时间全球AI领域的重要动态: AI驱动的研究效率提升500倍-Peter H. Diamandis, MD Peter H. Diamandis博士指出,AI驱动的研究方法现在比传统方法快500倍。这一显著的效率提升预示着科学发现和技术进步将迎来前所未有的加速,有望在各领域带来颠覆性影响。 FLUX.2图像生成与编辑模型发布及测试反馈-merve / 歸藏(guizang.ai) / clem 🤗 FLUX.2,一个全新的先进图像生成与编辑模型,现已发布。该模型采用单文本编码器(Mistral Small 3.1)和DiT架构,并支持多种量化方案(如QLoRA,以减少对超过80GB显存的需求),同时提 …
阅读更多FLUX.2图像生成与编辑模型发布 - merve FLUX.2是一款功能强大的图像生成与编辑模型,现已发布。该模型采用单一文本编码器(Mistral Small 3.1)和DiT架构,并支持不同的量化方案,适用于推理和训练(QLoRA),在需要80GB以上显存的场景下尤其有用。FLUX.2还提供了对Diffusers的即日支持,并支持使用SAM3掩码进行图像修复和视频修复。有用户测试发现其2K分辨率版本一致性较好,甚至优于Banana模型,但在中文和提示词遵循上仍存在问题。它对设计师友好,能精准控制色值,但LLM部分在世界知识和多模态推理上不如Banana。 AI在研究领域的应用速度提升显著 - Peter H. …
阅读更多ChatGPT 上线群聊功能 - 小互 ChatGPT 已正式上线群聊功能,支持最多20人共同与AI互动。该功能具备智能判断发言时机、被 @ 提及时强制响应、支持 emoji 表情以及在图片生成中引用用户头像加入个性化元素等特性。目前,该功能正在日本、新西兰、韩国和台湾地区进行试点。群聊还提供了丰富的管理选项,包括自定义群名、成员管理、静音通知,以及为群聊单独设置自定义指令(Custom Instructions),允许用户定义ChatGPT在群聊中的语气、角色或参与方式,例如使其扮演“会议记录助理”或“语气更轻松幽默”的角色。 免费语音转文字工具“代体”改名为“闪电说” - 向阳乔木 免费语音转文字工具“代体”已更名为“闪电 …
阅读更多AI热潮降温:甲骨文股价回吐所有LLM相关涨幅,CoreWeave估值下跌超50%-Gary Marcus AI市场泡沫的迹象显现,投资者对大型语言模型(LLM)的狂热情绪正在消退。据Gary Marcus观察,甲骨文公司此前因LLM热潮获得的巨大股价涨幅已全部回吐,甚至有所下跌。同时,AI基础设施提供商CoreWeave的估值也从高峰期下跌了超过50%。这表明市场正在重新评估AI相关公司的真实价值和增长潜力,LLM领域的投资可能正在经历调整期。 中国AI自媒体探索新商业模式:ListenHub启动品牌合伙人计划,旨在破局商单困境-Orange AI 针对中国自媒体行业普遍存在的“有毒”商业模式,Orange AI观察到国内用户对 …
阅读更多