Kimi K2 Thinking模型发布及性能表现 月之暗面(Kimi)发布了其开源思考代理模型Kimi K2 Thinking,并在HLE(44.9%)和IMO(76.8%)两个高难度测试集上取得了全球SOTA(State-Of-The-Art)的成绩。该模型的训练成本估计为560万美元,使用了280万H800小时和14.8万亿tokens。初步测试显示,Kimi K2 Thinking的推理能力优于Xai、Anthropic和Google等公司的现有模型,并展示了识别、修复代码问题及添加性能监控组件的能力。尽管开发公司体量相对较小,其在全球基准测试中取得的突出表现引发了广泛关注。 OpenAI“政变”的最新证词揭秘 在“马斯克 …
阅读更多HeyGen 推出新一代视频翻译引擎,实现更自然逼真的AI翻译 - 小互 HeyGen发布了其新一代视频翻译引擎,显著提升了AI翻译视频的真实感和自然度。该引擎具备上下文感知翻译、超逼真唇形同步、多说话人和性别识别、以及增强音频质量等功能,并支持10种语言的自动翻译。其升级后,无论是正脸、侧脸或嘴巴被部分遮挡,唇形同步都更为精准;翻译能通过画面理解场景上下文,选择更合适的语气和词汇;同时,音频质量得到优化,即使原始视频音质不佳也能输出干净清晰的声音。目前iOS版已上线,API与网页版将在未来几天逐步开放。 TinyFish 获4700万美金A轮融资,推出颠覆性AI Agent平台变革Web操作 - 小互 AI初创公 …
阅读更多以下是过去4小时全球AI领域发生的一些重要事件和动态: Ling Flash 论文在 Hugging Face Papers 上线 - clem 🤗 Ling Flash 论文现已在 Hugging Face Papers 平台发布。用户可以通过该平台查阅论文详情,并有机会与作者进行在线交流,深入了解这项新的AI研究成果。 QeRL:量化增强强化学习项目开源,支持32B LLM训练 - clem 🤗 QeRL(Quantization-enhanced Reinforcement Learning,量化增强强化学习)项目已正式开源。该技术支持4-bit量化强化学习训练,显著降低了硬件要求,例如,能够仅使用两块A6000 GPU就训练 …
阅读更多Huggingface 出品 LLM 训练手册-歸藏(guizang.ai) Huggingface发布了一本详细的LLM训练手册,涵盖了完整的训练流程,包括预训练、后训练和基础设施。该手册以他们自己训练的3B模型SmolLM3为案例,深入分享了在模型训练过程中做出的决策、发现和遇到的挑战,提供了宝贵的实践经验。这对于希望深入了解或参与大型语言模型训练的开发者和研究人员而言,是一份必读的参考资料。 FactoryAI Droid 更新 MCP 实现并支持交互式应用-Ben Tossell FactoryAI的Droid工具近期推出了重要更新,简化了MCP(Master Control Program)服务器的集成过程,使其更容易添 …
阅读更多以下是过去4小时全球AI领域的动态摘要: AI 生成未来主义手表全息投影界面概念-宝玉 有创作者分享了如何利用 Sora 或 ChatGPT 生成逼真的、极具未来感和赛博美学风格的手表全息投影界面照片。该提示词详细描述了如何从表盘投射出一个半透明、晶莹剔透的未来社交媒体个人资料界面,并散发着霓虹光晕,展现高级科幻氛围和8K级别的超逼真细节。内容也提及该生成方式在中文支持方面仍有不稳定性,需要多次尝试。 AI 编程工具:打造最佳 AI 写作助手-向阳乔木 一篇分享指出,AI 编程工具也可以作为优秀的 AI 写作工具。核心方法是结合 AI 编程 CLI 工具(如 Warp、Claude Code Cli 或 Augment …
阅读更多Hugging Face发布LLM端到端训练指南及推理服务优化 - clem 🤗 Hugging Face近期推出了备受关注的“LLM端到端训练”博客(或称“书籍”),全面覆盖了大型语言模型从预训练到后训练的完整流程,旨在使相关主题更易于理解和深入。此外,Hugging Face推理提供商(Hugging Face Inference Providers)现在支持根据速度或成本将每个请求路由到最合适的提供商,进一步优化了AI模型的部署和访问效率。这些举措体现了Hugging Face在推动AI普及和优化开发体验方面的持续努力。 FactoryAI推出Droid:统一终端AI代理开发工具 - Ben Tossell …
阅读更多AI内容质量与中国AI行业认知泡泡的讨论-Orange AI Orange AI指出,如果AI生成的内容轻易被识别出来,这反映了用户尚未掌握正确的AI使用技巧。他同时评论称,中国的AI行业似乎被AI厂商、自媒体和算法分发平台共同构建的“认知泡泡”所困,导致其与真实的体验和用户需求脱节。这强调了AI应用中内容质量和行业自我认知的重要性,呼吁从业者关注真实的用户反馈和体验,避免陷入片面或误导性的宣传。 Sora 重磅更新与对好莱坞的颠覆影响-Orange AI Sora近期推出三项重大更新,显著增强了其视频生成能力:一是角色客串功能,允许用户上传短视频创建可重复使用的角色,并在不同视频中保持一致性;二是短片缝合,支持将多个片段组合成复 …
阅读更多NVIDIA发布8M样本开放数据集并支持开源AI-merve NVIDIA在Hugging Face上发布了一个包含800万样本的开放数据集和OCR工具,该数据集的规模比两个月前的v1版本大了三倍。同时,NVIDIA CEO Jensen Huang也公开表达了对开源AI和Hugging Face的认可,强调开源是AI发展的基础。 警惕OpenAI Atlas等代理浏览器存在的提示注入攻击风险-Gary Marcus 有警告指出,不应安装诸如OpenAI Atlas这类新发布的代理浏览器,因为它们可能容易受到提示注入攻击(Prompt injection attacks)的威胁,即恶意隐藏的指令可能导致不可预测的行为或数据泄露。 …
阅读更多Grokipedia上线并引发讨论-向阳乔木/Gary Marcus 马斯克旗下的Grokipedia已正式上线v0.1版本,目前包含超过80万篇文章。此举兑现了马斯克此前的承诺。然而,这一新平台立即引发了关于其信息准确性和潜在偏见的讨论。Gary Marcus质疑Grokipedia的“更好”标准,指出其可能在重要信息(如事件死亡人数)上存在遗漏,并暗示它可能像“1984”中的百科全书一样,掌控叙事并掩盖科学局限性。 Grimes团队将发布AI音乐视频制作教程-歸藏(guizang.ai) 音乐人兼艺术家Grimes的团队正筹备推出AI音乐视频制作教程。该教程将详细介绍如何使用各种AI工具及其协作流程,以帮助用户完成AI音乐内容 …
阅读更多