Sonnet 4.5 架构分析-Ben Tossell Ben Tossell分享了由Sonnet 4.5模型进行的一项架构分析的有趣表格。该分析在充分的上下文支持下生成,体现了Sonnet 4.5在复杂数据分析和架构理解方面的强大能力。这表明AI模型在辅助专业领域决策和深入洞察方面正发挥越来越重要的作用,尤其是在需要大量背景信息进行推理的工作中,能够提供高效且精准的辅助。 将学术论文转化为科普文章的提示词-宝玉 宝玉分享了一个精心设计的“学术论文科普”提示词,旨在利用AI将晦涩难懂的学术论文转译成通俗易懂、引人入胜的科普文章。该提示词详细定义了AI作为科普作家的角色、工作流程(包括挖掘研究动机、消化论文核心要素、定位行业坐标 …
阅读更多以下是过去4小时内全球AI领域的重要动态: 百度飞桨发布PaddleOCR-VL:0.9B参数模型超越DeepSeek-OCR,登顶Huggingface趋势榜-小互 百度飞桨团队近日发布了 PaddleOCR-VL 模型,该 0.9B 参数的OCR模型在性能上超越了现有所有OCR模型,并在 Huggingface 全球模型趋势榜上持续登顶。用户实测显示,其在处理中日英多语种混排、复杂公式等复杂场景下表现卓越,甚至优于同期发布的 DeepSeek-OCR。PaddleOCR-VL不仅能够识别文字,更具备对复杂文档进行结构化理解与语义重建的能力,支持109种语言,能精确解析文本、表格、公式与图表,并自动识别版面布局以恢复阅读顺序,可直 …
阅读更多GenAI市场份额与ChatGPT普及率报告-clem 🤗 / Peter H. Diamandis, MD Similarweb的最新报告显示,ChatGPT 的市场份额持续下滑,而 Perplexity 的流量份额已突破2.0%。与此同时,据观察,全球约有10%的成年人口正在使用 ChatGPT,这表明其对日常生活的影响日益扩大。专家预测,一旦AI工具的普及率达到社交媒体的规模,其潜在影响将是巨大的,预示着AI技术在更广泛社会层面的深远变革。 开放AI模型领导者地位转移:非美国模型崛起-clem 🤗 《华盛顿邮报》的一项分析指出,在过去的一年里,开放AI模型 的格局发生了显著变化。去年,最优秀的开放AI模型主要来自美国。然而, …
阅读更多今日全球AI领域动态纷呈,巨头间的生态战愈演愈烈。谷歌凭借其视频生成模型Veo 3.1直接对标OpenAI的Sora 2,将AI影视制作推向新高度。微软与苹果则继续将AI深度整合至底层系统与开发工具链,前者计划用AI聊天机器人取代Win11任务栏搜索框,后者则推出三项AI技术赋能开发者自动化测试与修复。在应用层面,淘宝为双11落地6款AI导购,而Spotify则联合三大音乐巨头,探索合规的AI音乐创作模式。同时,硬件的协同创新与供应链的战略布局也成为焦点,鸿海高层密集会晤OpenAI与英伟达CEO,预示着AI硬件生态的深度整合即将到来。 Google的Veo 3.1让AI电影制作的真实感达到新高度 谷歌发布了其生成式视频模型Veo …
阅读更多在过去4小时内,AI领域主要关注Sora 2 Pro的视频生成能力升级、AI图像/视频生成的技术实践与Veo-3.1模型的正式发布。 Sora 2 Pro支持25秒视频生成与故事板功能-歸藏(guizang.ai) Sora 2 Pro现已支持生成最长达25秒的视频内容,并引入了故事板功能,允许用户对视频进行更精细的控制。一位用户详细分享了通过分镜提示词(如场景、镜头和情感描述)生成连贯情节视频的测试经验。该功能通过点击输入框的“故事板”按钮,并在右下角切换时间来实现,极大地增强了文生视频的叙事能力和用户自定义度。 AI图像与视频生成实践技巧分享-宝玉 AI图像和视频生成领域涌现了多项实用技巧。有用户分享了使用Grok …
阅读更多以下是过去4小时全球AI领域的动态汇总: GAGA-1模型:AI视频语音与表演的新突破-歸藏(guizang.ai) Send AI发布了专注于人物对话表演的GAGA-1模型,被认为是目前在人物细微表演对话方面表现最强的模型,甚至可能超越Sora2。该模型在语音和表演表现上达到了极高水平,目前提供免费试用。使用技巧包括:在提示词中优先说明情绪变化,然后是语气和内容;双人对话表现出色,能理解左右、男女或A/B指定角色;图生时建议避免复杂肢体或全身动作;短文本可选择5秒生成时长,长对话选择10秒;目前支持16:9横屏比例,未来将支持9:16竖屏。测试显示,GAGA-1能够精准捕捉并配合剧烈情绪,即使在极限人脸角度下也能维持面部表情和嘴 …
阅读更多新闻列表 腾讯混元图像3.0登顶LMArena文生图榜首,成为全球第一-orange.ai 腾讯混元图像3.0在国际权威AI模型竞技场LMArena的用户投票榜单中登顶第一,成为全球领先的文生图模型。该模型通过完全匿名的盲测机制,击败了包括Google的Nano Banana和OpenAI的GPT-4o生图在内的众多国际知名模型,是LMArena所有单项榜单中唯一一个获得第一的中国模型。用户反馈其最大的特色在于对用户意图的深刻理解,显著降低了提示词编写的复杂性。此外,它在画面精度、色彩还原和风格多样性方面表现出色,并具备优秀的中文文字生成能力(长文本仍有改进空间)。目前,腾讯混元图像3.0已完全免费开放体验。
阅读更多7款可在笔记本上运行的本地AI模型推荐-clem 🤗 itsPaulAi分享了7款可在笔记本电脑上运行的顶级本地AI模型。其中包括Qwen3 Coder 30B 3A,被推荐为最适合编写各类代码的模型。列表还提到了Gemma 3n E4B等,强调了这些模型在本地设备上提供强大AI能力的潜力,尤其对开发者和研究人员具有吸引力,因为它允许在没有云服务依赖的情况下进行高效开发和实验。 Kimi K2模型在Opencode Zen平台降价40%-clem 🤗 据thdxr消息,Kimi K2模型在Opencode Zen平台上实现了40%的降价,成为目前市场上价格最低的选择。此次降价旨在吸引更多用户,特别是针对编码工作负载,该模型显示出高 …
阅读更多智谱AI发布GLM-4.6,国产最强Coding模型比肩Claude Sonnet 4-orange.ai 智谱AI于国庆前夕发布了其最新一代通用AI模型 GLM-4.6,被誉为目前国内最强的Coding模型。该模型在七个权威基准测试中,整体性能表现与 Claude Sonnet 4 基本持平,并超越了前一天发布的 DeepSeek-V3.2-Exp。GLM-4.6的代码能力提升了 27%,上下文窗口扩展至 200K,推理和写作能力也有所增强,并全面适配国产芯片。尤其在前端美学方面,GLM-4.6表现出色,甚至在绘制宝可梦SVG方面超越了Claude 4。此外,Anthropic也发布了地表最强的编码模型 Claude 4.5。作 …
阅读更多今日全球AI领域风起云涌,竞争焦点已从单纯的模型参数竞赛转向生态系统与应用场景的深度整合。Anthropic发布号称“最强编程模型”的Claude Sonnet 4.5,直指开发者与企业级自动化;而OpenAI则双线出击,不仅计划推出全AI生成内容的“AI版TikTok”,更将ChatGPT打造为电商支付一体机,意图构建从内容到交易的闭环。微软紧随其后,将Agent理念深度植入Office套件。国内方面,DeepSeek新模型发布即获硬件生态支持,华为盘古模型持续精进,展现出快速追赶与生态协同的决心。 Anthropic 发布 Claude Sonnet 4.5,号称“全球最佳编程AI模型” Anthropic公司发布了其最新AI模 …
阅读更多