以下是过去4小时全球AI领域的重要动态: AI对放射科医生工作影响的深度分析-Andrej Karpathy Andrej Karpathy分享了一篇关于“AI不会取代放射科医生”的文章,指出对AI在就业市场影响的许多预测都过于天真。文章以放射科为例,详细阐述了AI不简单替代工作的复杂原因,包括基准测试不足以反映实际场景、工作本身的多面性、部署面临的监管、保险和责任问题,以及耶冯斯悖论(AI提升效率反而可能增加需求)。他建议,AI短期内更可能改变那些重复性高、任务独立、上下文需求少、错误成本低的例行性工作,且通常作为工具使工作性质发生重构。 Moondream3模型部署:实现物体检测、跟踪、提问和图像字幕-merve Merve宣 …
阅读更多哈佛/斯坦福研究揭示生成式AI低投资回报率原因:“工作烂泥”-Gary Marcus 一项来自哈佛和斯坦福大学的新研究深入分析了生成式AI(GenAI)投资回报率(ROI)低迷的原因,指出员工正利用AI工具创建“低努力、表面过得去”的工作成果,却反而给同事制造更多后续工作。研究将这种现象称为**“工作烂泥”(workslop)**,即AI生成的内容看似良好,但实质上缺乏有效推动任务进展的深度和价值,导致了效率的实际降低。 预测:中国机器人产业未来将停止出口,转向国内市场-Emad Emad预测,未来几年中国将停止出口机器人,转而将所有机器人用于国内市场。这一战略旨在解决人口结构问题,使本土AI技术普及化,并通过将机器人用于国内以实 …
阅读更多Flowith 发布 Context Playground 交互更新 - 歸藏(guizang.ai) Flowith 近期发布了名为 Context Playground 的重大交互更新,允许用户自由拖动和复制内容,并将画布中的任何节点或元素选作上下文。此外,用户现在可以直接在侧边栏编辑节点内容以修正AI输出结果,此功能同时适用于图片和文本。此更新旨在提升用户在处理AI生成内容时的灵活性和编辑效率,并继续保持其一贯的良好界面审美。 Qwen 模型发布:创业者的黄金时代 - 宝玉 针对 Qwen 系列模型发布,有观点指出,当前是AI创业者的最佳时代。相较于五年前将基础技术视为“传家宝”的封闭态度, …
阅读更多以下是过去4小时全球AI领域的一些重要动态: 阿里云发布Wan 2.5 Preview模型,AI视频质量达网剧级别-歸藏(guizang.ai) 阿里云近日发布了 Wan 2.5 Preview 模型,该模型支持生成10秒1080P的音画同步视频,并具备图像生成和编辑功能。有评论指出,当前AI视频的质量虽可能尚未达到电影级别,但已足以满足网剧、短剧和电视剧等制作需求,显示出AI视频生成技术在内容创作领域的巨大潜力。 阿里巴巴通义实验室开源Qwen3-VL视觉语言模型-clem 🤗 阿里巴巴通义实验室宣布 开源 Qwen3-VL,这是一款功能强大的视觉语言模型。该模型能够操作图形用户界面(GUIs)并进行代码编写,进一步推动了多模 …
阅读更多以下是过去4小时全球AI领域的主要动态: Qwen 3 VL旗舰模型发布,性能爆表并支持百万级上下文长度 - orange.ai 阿里云近期发布了其新一代旗舰模型 Qwen 3 VL (Vision Language Model)。多位观察者指出,该模型在基准测试中表现出色,分数“爆表”,被形容为“怪物”。Qwen 3 VL采用Apache 2.0许可,并支持高达 100万 上下文长度,预示着其在多模态理解和长文本处理方面具备强大潜力。 OpenAI发布GPT-5-Codex,专为AI智能体和交互式编程优化 - 宝玉 OpenAI推出了 GPT-5-Codex,这是GPT-5的一个全新版本,专门针对AI智能体和交互式编程任务进行了深 …
阅读更多Claude Code 榜一大哥分享AI产品盈利与Agent工具策略 - orange.ai 刘小排(Claude Code全球榜一大哥)在播客中分享了关于AI产品盈利和Agent工具的独到见解。他指出,许多人认为AI不赚钱,但这主要是指头部产品,实际上AI产品只要控制营销和人力成本,从第一天起就能盈利。他强调Claude Code并非仅限于编程,而是一个通用的Agent工具,能处理从调研到代码的多种任务,且其可控性和无限扩展性是其核心价值。刘小排还提到,避免生成“屎山代码”的关键在于清晰的需求文档和与AI的充分沟通,并借鉴猎豹移动的**“简单”产品方法论**,通过预测、单点击穿、All-in实现产品成功。 量子位访谈揭示AI产品 …
阅读更多以下是过去4小时内全球AI领域的重要动态: Coding Agents:能力、局限与最佳实践-宝玉 资深开发者宝玉分享了对当前编码代理(coding agent)的深入见解。他指出,不应盲目期待编码代理能独立完成复杂任务,但也不应低估其在分解任务、清晰描述后展现出的强大能力。一流的编码代理(如结合Codex与GPT-5-Codex High或Claude Code与Opus 4.1/Sonnet 4)在处理小型任务上已达到甚至超越中级软件工程师水平。它们能高效处理百万行代码库,并建议开发者积极拥抱这些先进工具,以期将开发效率提升一倍以上,并推荐使用worktree工具来管理和运行多个编码代理。 AI招聘工具缺陷:建议求职者学 …
阅读更多腾讯发布Hunyuan3D 3.0,提升3D模型生成能力 - Emad (retweeting TencentHunyuan) 腾讯正式推出其全新的Hunyuan3D 3.0模型,该版本在性能上实现了显著飞跃。新模型拥有3倍更高的精度、1536³的几何分辨率以及36亿参数。这一升级标志着腾讯在3D内容生成技术方面取得了重要进展,有望为游戏开发、虚拟现实、元宇宙内容创作及工业设计等领域带来更高效、更逼真的3D资产生成能力,进一步降低高质量3D内容的制作门槛。 \n\n 歸藏(guizang.ai) 推出苹果同款Logo/文字动画工具 - 歸藏(guizang.ai) 歸藏(guizang.ai)发布了一款实用工具,用户可以通过该工具 …
阅读更多XAI 发布 Grok 4 fast 模型 - 歸藏(guizang.ai) 埃隆·马斯克的XAI公司推出了Grok 4 fast模型,该模型采用推理与非推理混合架构,提供高达200万上下文,并支持网页和推特搜索功能。新模型在基准测试中展现出与Grok 4相当的性能,但平均使用的思考token减少了40%,同时在前沿基准上达到相同性能的费用降低了98%。其定价极具竞争力,输入每百万Token仅需$0.2,输出$0.5,命中缓存更低至$0.05,旨在大幅降低AI模型的使用成本和提高效率。 Notion AI Agents 发现漏洞,可被恶意 Prompt 窃取数据 - 宝玉 Notion的AI Agents刚发布便被发现存在潜在漏 …
阅读更多Ben Tossell 正式加入 FactoryAI 并推动 CLI 测试 - Ben Tossell 知名人工智能社区建设者 Ben Tossell 已正式加入 FactoryAI,他此前作为早期投资者支持该公司,现在将以团队成员的身份贡献力量。Ben Tossell 鼓励用户测试 FactoryAI 的命令行界面 (CLI),预示着 FactoryAI 在简化 AI 开发流程方面可能有所新进展。此举显示了其在 AI 工具生态系统中加速用户采纳和产品迭代的决心。 Replit 推出面向教育用户的特别优惠 - Amjad Masad AI 驱动的在线编程平台 Replit 宣布为教育用户提供特别优惠。Replit 的 CEO …
阅读更多