2025.11.27.08 过去4小时全球AI发生了什么?
全新的FLUX.2图像生成模型已发布,采用Mistral Small 3.1作为文本编码器和DiT架构,并支持推理与训练的量化方案。该模型对设计师友好,提供精准的色彩控制。在测试中,FLUX.2的2K分辨率版本在一致性方面表现优异,甚至在某些方面超越了Banana模型。然而,其在世界知识和多模态推理方面仍不如Banana,并且在中文理解和提示词遵循上存在一些问题,这表明其在多语言VLM(视觉语言模型)方面的潜力有待进一步挖掘。
Labnana Pro AI 会员黑五促销及功能亮点-Orange AI
ListenHub与Labnana联合推出Black Friday促销,每月仅需9.5美元即可获得Pro年卡,服务内容包括Banana Pro生图模型(每月数百张)、AI解说视频生成、AI PPT生成、中文AI播客以及智能TTS配音(支持音色克隆和API)。Labnana Pro被宣传为全球首个也是最佳的Nano Banana Pro生图网站,其优势在于使用原生Agent系统,实现最佳模型理解和表现;支持真4K超清输出;提供8种官方原生图片比例选择;采用独立GPU部署确保服务稳定性;并承诺生成失败全额退还积分。此外,还为学生党提供了通过邀请好友和每日签到获取积分,从而“无限白嫖”Pro会员待遇的方案。
分享了两款基于Nano Banana Pro模型的图像生成提示词。一款用于动态生成城市天气卡片,通过精确的45度俯视视角,呈现垂直(9:16)的3D Q版微缩城市场景,将天气元素创意性地融入建筑,营造沉浸式氛围,并根据城市语言显示信息。另一款提示词旨在生成可爱时尚的竖版日历插画,强调清新明快的手绘风格,人物形象灵动,服饰配饰结合季节、节假日或地域特色,并包含日期、宜事项及励志句子。
“LLM Council”项目:多模型协同与匿名评估-向阳乔木
一个名为“LLM Council”的GitHub项目迅速获得了超过5000个星标,该项目由AK开发,旨在通过一次性调用多个不同的大语言模型,实现匿名互评与排名,从而消除偏见。其工作流程包括并行收集各模型的回答,基于准确性和洞见进行匿名评分,最终由一个“主席模型”综合评选并输出高质量的答案,以提升生成内容的可靠性和客观性。
全新文本到视频模型Whisper Thunder崭露头角-Amjad Masad
Amjad Masad透露,一款名为Whisper Thunder的文本到视频模型被认为是全球顶尖。尽管目前关于该模型的具体细节和技术实现披露有限,但其被誉为“世界第一”的地位暗示了其在文本到视频生成领域的显著突破和领先能力,预示着该领域可能迎来新的重要进展。
Hugging Face LeRobot 仿真学习平台重大升级-clem 🤗
Hugging Face的LeRobot团队宣布,其**模仿学习仿真操场(imitation-learning-in-simulation playground)**已进行了重大升级。此次升级旨在提升平台的功能性和用户体验,为开发者和研究人员提供更强大、更高效的工具,以进行机器人领域的模仿学习研究和开发。该平台持续致力于推动开放机器人AI生态系统的发展。
Gary Marcus 对AI发展态势的批判性观点-Gary Marcus
知名AI评论家Gary Marcus再次强调了他对当前大语言模型(LLMs)发展路径的长期担忧。他指出,LLMs及其类似方法不会导向通用人工智能(AGI),并批评了一些同行在这一问题上的立场转变。Marcus重申了他此前关于Sam Altman不可信、OpenAI将失去主导地位、GPT-5无法实现AGI、LLMs缺乏世界模型、幻觉问题无法消除以及LLMs经济模式不可行等预测。他认为,2025年本应是“AI代理年”,却成了“清理烂摊子年”,并对将生成式AI“强行塞入”各种应用场景的现象表示担忧。
AI 极大加速科研进程与创新潜力-Peter H. Diamandis, MD
彼得·戴曼迪斯博士强调,AI驱动的科研速度已达到传统方法的500倍,例如Edison’s Kosmos能将专家数月的任务压缩至12小时完成。他认为,当下最昂贵的指标是**“认知到行动之间的滞后性”**,呼吁加速将洞察转化为实际应用。他指出,未来将由那些过去未曾有机会参与创造的人来构建,AI正在为更广泛的人群带来突破和创新的可能性。
AI时代企业员工技能提升的必要性与商机-Peter H. Diamandis, MD
彼得·戴曼迪斯博士指出,面对普遍存在的AI导致失业的担忧,未来所有中小型企业和大型公司都将需要**“技能提升伙伴”**,即结合人类与AI的混合解决方案,负责提升公司员工的技能基础。他认为,这对于有远见的创业者而言,是一个极佳的服务型商业机会,能够解决企业在AI时代面临的员工技能转型挑战。
Hugging Face 倡导开放合作以加速AI科学发展-clem 🤗
Hugging Face首席执行官Clement Delangue对“Genesis使命”表示祝贺,并强调开放性与合作是美国AI领导力的关键。他指出,正是2017-2021年间的开放精神(例如Google发布Transformer促成OpenAI开发ChatGPT)才带来了当前的AI繁荣。他呼吁将这种开放合作精神应用于科学、能源、机器人等领域的AI发展,并期望Hugging Face平台上能看到更多来自联邦机构的开放科学模型和数据集。
利用Claude Code 进行GitHub项目安装指导-向阳乔木
分享了一个实用的开发者技巧:对于不熟悉如何安装开源GitHub项目的用户,可以利用Claude Code作为**“一步步安装部署指南”**。用户只需将GitHub项目链接输入Claude Code,AI便能提供详细的操作步骤和指引,帮助完成项目的安装和部署,大大降低了非技术背景用户的使用门槛。
一项观点指出,编程语言仍然是人类与AI之间最高效的沟通方式。在“vibe coding”的实践中,开发者更多地倾向于编写伪代码,而无需细化到具体的数据结构,这种方式已被证明足够有效。这表明,在与AI进行复杂任务协作时,结构化和逻辑化的编程语言依然能提供无与伦比的清晰度和效率。