字节跳动发布“豆包手机助手”技术预览版-小互 字节跳动推出了“豆包手机助手”技术预览版,该产品具备强大的多模态识别与交互能力,支持跨应用操作手机,并通过语音、AI键或耳机唤醒。豆包助手还拥有个性化记忆功能,能够从历史对话和屏幕信息中提取关键数据,提供生活琐事回忆和喜好记忆,并强调数据本地处理以保护隐私。其核心亮点是App Agent能力,能模拟用户操作,自动执行全网比价、生活服务自动化及办公审批等任务。此外,豆包助手还支持系统原生的多模态生成与编辑,例如智能修图,并提供了针对复杂任务的“Pro模式”,能进行多步骤的复杂任务规划和执行,例如跨平台预订旅行。该版本通过与手机厂商的系统集成,获得了更深层的操作权限。 ChatGPT 发布 …
阅读更多今日全球AI动态呈现出基础设施与顶层应用的双重加速。硬件层面,三星即将发布HBM4内存,光互联技术也因AI算力需求而备受瞩目,显示出底层算力竞赛的持续白热化。应用层面,AI正渗透金融、办公等传统领域,但也面临用户在游戏等创意领域的抵制与开发者对“去技能化”的担忧。尤为引人注目的是,全球首个具身智能本科专业的设立,标志着AI人才培养正从纯软件向软硬件结合的下一阶段演进,预示着物理世界的智能化将是未来的核心战场。 上海交大设立全球首个具身智能本科专业,联合华为培养 上海交通大学宣布拟增设全球首个“具身智能”本科专业,隶属于人工智能学院,计划招生30人。该专业旨在培养能融合人工智能、机械、计算机等多学科知识的复合型人才,专业带头人卢策吾教 …
阅读更多English Version (Upbeat Intro Music) Host: News Discovery Time! Today we are exploring… Bang! Pop! Wow! A rocket’s powerful journey into space and a super-train’s epic trip across continents!
Hello everyone, and welcome back to our weekly news express for young explorers! I’m your host, Alex. We have seen some …
阅读更多重新定义机器人与人类工作关系-Peter H. Diamandis, MD Peter H. Diamandis博士提出,关于“人形机器人将取代人类工作”的说法是错误的。他认为,机器人的真正作用是承担人类不擅长或具有风险的任务,从而使人类能够专注于发挥自己的长处和优势。这一观点强调了AI与人类协作的未来,而非简单的替代关系。 AI在灾区、诊所及冲突区域的自主配送应用-Peter H. Diamandis, MD Peter H. Diamandis博士指出,尽管自主配送系统可能从家用场景开始普及,但它们在灾区、诊所和冲突区域将发挥至关重要的作用。这些系统能够以快速且安全的方式向最需要帮助的人提供援助,展示了AI技术在人道主义和紧急 …
阅读更多过去4小时全球AI动态一览 中国在开放AI模型市场超越美国,AI代理工具面临可靠性挑战 根据麻省理工学院和Hugging Face的一项研究显示,中国已在开放AI模型全球市场中超越美国。与此同时,AI代理(Agent)工具虽能赋能非技术人员自动化服务,但在实际生产环境中仍表现出脆弱性,有专家建议确定性部分仍需手动实现。此外,有预测指出,未来将出现专门提供**微调即服务(fine-tuning-as-a-service)**的公司,以应对定制验证码及提升浏览器基准测试表现。 AI工具助力内容创作:从旅行手账到神话插画 AI在内容创作领域展现出强大潜力。宝玉分享了如何将特定提示词转化为通用提示词模板,例如用于生成个性化的手绘风格旅行手账 …
阅读更多中国在开放AI模型市场超越美国-clem 🤗 一项由麻省理工学院和Hugging Face联合发布的研究指出,中国在开放AI模型的全球市场中已超越美国。这一突破性的进展标志着全球AI格局的重大变化,中国在开源AI生态系统中的影响力显著增强。 Z-Image Turbo模型登顶Hugging Face排行榜-clem 🤗 由Ali_TongyiLab开发的Z-Image Turbo模型在Hugging Face的模型排行榜上表现出色,位居榜首。这表明该模型在性能和社区关注度方面取得了显著成就,进一步推动了图像生成领域的发展。 Hugging Face指令数据集的再生与优化-clem 🤗 有专家提出,可以从Hugging Face中挑 …
阅读更多AI模型提示词优化与图像生成新进展 多个作者分享了AI在提示词工程和图像生成方面的最新实践。其中,有讨论如何将特定场景的提示词转化为通用模板,使AI能够根据动态输入(如地名和天数)生成个性化的旅游手账插画。此外,Gemini的Nano Banana Pro模型被提及,它通过在绘图前搜索资料来显著提升图片质量和准确性,尤其在生成写实照片和头像方面表现突出。还有用户展示了如何利用Gemini优化提示词,以创作更具真实感的教育科普漫画和视频讲解,甚至可以生成高度逼真的名人视频内容。 AI代理发展与挑战 AI代理技术正在不断进步,一个可自我改进的“Droid Bot”在Telegram上被开发出来,并能自主修复和优化自身功能。与此同时,行 …
阅读更多AI提示词模板化实践与旅行手账生成-宝玉 “宝玉”分享了将特定AI提示词转化为通用模板的方法,从而实现内容动态生成。例如,通过输入城市名和天数,AI可自动生成手绘风格的旅行手账插画,包括详细的旅行路线、景点、美食和趣味元素。这一技术利用大语言模型擅长的推理能力,先根据用户需求生成绘图提示词,再进行图像创作,极大地提升了内容生成的灵活性和效率。 Nano Banana Pro:图像生成新范式与应用案例-宝玉 & 向阳乔木 Gemini的Nano Banana Pro在图像生成领域展现出强大实力。“向阳乔木”指出,该工具支持先搜索资料再进行绘图,显著提升了图片质量和准确性。“宝玉”则提供了详细的Prompt示例,如生成中国神话角色(二 …
阅读更多以下是过去4小时全球AI领域的精选动态: 中国在全球开放AI模型市场超越美国-clem 🤗 根据麻省理工学院(MIT)和Hugging Face的一项研究显示,中国已在全球开放AI模型市场中超越美国,这标志着全球AI发展格局正在发生显著变化,凸显了中国在开源AI领域的快速崛起及其日益增长的影响力。 Google的TPU挑战NVIDIA在AI硬件领域的主导地位-Peter H. Diamandis, MD Google的Ironwood TPU正在NVIDIA占据主导地位的AI硬件市场中取得进展,其日益增长的势头正变得越来越难以忽视。这表明AI芯片领域的竞争日益激烈,Google正积极寻求在高性能计算硬件领域扩大其影响力。 Nano …
阅读更多今日全球AI领域呈现出供需两端的极致张力。一方面,市场需求空前旺盛,不仅体现在算力缺口预计将持续至2026年,也直接导致了OpenAI与谷歌等头部厂商开始对旗下热门模型进行“限流”,并积极探索广告等商业化路径。另一方面,产业应用正加速落地,北京AI产业规模预计突破4500亿元,人形机器人公司宇树科技完成IPO辅导。然而,在高速发展之下,应用层面的挑战与安全隐患也愈发凸显,韩国AI教材试点失败与Sora模型的监管漏洞都为行业敲响了警钟。 北京AI产业规模今年将超4500亿元 根据北京市科学技术委员会发布的《北京人工智能产业白皮书(2025)》,北京的人工智能产业正经历高速增长。数据显示,2025年上半年,北京全市AI核心产业规模已 …
阅读更多