G³周报(16) | Guowei Lu

Abseil 性能优化指南

重视性能优化的意义：
- 反驳“过早优化”：引用 Knuth 的完整名言指出，虽然不应在 97% 的非关键路径上纠结微小效率，但绝不能放弃那 关键的 3%。
- 工程视角：在成熟的工程学科中，12% 的性能提升是巨大的，不应被忽视。
- 避免“性能债务”：如果在开发大型系统时完全不考虑性能，最终会导致系统呈现“扁平化”的性能分布（Flat Profile），即没有明显的瓶颈，性能损耗分散在各处，导致后续优化极其困难。
性能估算 (Estimation)：
- 建立直觉：区分代码类型（测试代码、应用热点代码、底层库代码），对底层库代码尤为重要，应尽可能选择高效实现（如使用 absl::InlinedVector 代替 std::vector）。
- 封底计算 (Back-of-the-envelope)：建议通过计算基础操作（如内存读取、网络传输、磁盘寻道等）的粗略成本来评估不同设计方案的可行性。文章更新了经典的延迟数据表（例如 L1 缓存引用 0.5ns vs SSD 读取 1MB 1ms）。
测量与分析 (Measurement)：
- 测量先行：在动手优化前，必须先进行测量。
- 工具使用：推荐使用 pprof 获取高层级概览，使用 perf 深入细节。
- 微基准测试 (Microbenchmarks)：编写微基准测试有助于快速迭代和防止回退，但需注意其局限性。
应对“扁平化”性能图谱 (Flat Profiles)：
- 积少成多：当没有单一瓶颈时，通过在子系统中进行多次 1% 的微小优化，累积起来也能产生显著效果。
- 结构化调整：尝试在调用栈更高层进行重构（例如将循环处理改为批量处理），或者减少内存分配次数（分配器往往是主要开销）。
API 设计考量：
- 批量接口 (Bulk APIs)：提供批量操作接口（如 LookupMany、DeleteRefs）以减少跨边界调用的开销或利用算法优势。
- 信息传递：允许调用者传递已有的信息（如时间戳 WallTime），避免在底层函数中重复获取或计算。
- 线程安全策略：通常首选线程兼容 (Thread-compatible)（由外部同步）而非线程安全 (Thread-safe)（内部同步），除非内部同步能带来特定的性能优势（如分片锁）。
算法改进：
- 强调从算法复杂度层面解决问题（如从 O(N²) 优化至 O(N)），这是提升性能最关键的手段。
https://abseil.io/fast/hints.html

meshoptimizer v1.0

里程碑式发布：
- 经过九年开发，meshoptimizer 终于迎来了 v1.0 版本。
- 该库是一个在业界广泛使用的网格优化库（基于 MIT 许可），旨在让 3D 网格更小、渲染更快。
- v1.0 标志着大多数功能的稳定，未来版本将保持 API 和 ABI 的兼容性。
核心功能与改进：
- 聚类 (Clusterization)：
  - 算法更快速，空间聚类质量更高（特别是针对顶点受限的 meshlets）。
  - 移除了对齐限制，简化了内存管理。
  - 提供 meshopt_partitionClusters 以优化分层聚类的 DAG 结构。
- 简化 (Simplification)：
  - 引入了属性感知（attribute-aware）的简化算法，大幅提升视觉质量。
  - 新增“宽松模式”（Permissive mode，目前仍实验性），允许在一定程度打破原有拓扑限制以获得更好的简化效果。
  - 支持针对子集（subsets）的锁定与稀疏简化，优化处理大量小部件的性能。
- 压缩 (Compression)：
  - 默认启用 v1 版本的顶点编解码器（Vertex Codec v1），相比 v0 版本压缩率提升约 10%，解压速度更快（在 Apple M4 上提升 30%）。
  - 支持新的 KHR_meshopt_compression 扩展，相比旧版扩展提供更好的压缩效果。
配套工具与库：
- clusterlod.h：随 v1.0 新增的一个单头文件库，用于实现类似 Nanite 的连续层次细节（LOD）系统，生成分层聚类结构。
- gltfpack：配套的 glTF 优化命令行工具，支持全场景优化（去重、简化、压缩），新增对 KHR_meshopt_compression 的支持（需通过 -cz 开启）。
未来展望：
- 开发将持续进行（v1.1, v1.2…），目前没有计划推出破坏兼容性的 v2.0。
- 将继续改进简化质量、聚类算法以及对新硬件/扩展的支持。
致谢：
- 核心库的主要开发工作得到了 Valve 的赞助，同时也受益于与 NVIDIA 工程师的交流。
https://meshoptimizer.org/v1.html

ReSTIR PG

核心理念：
- 提出了一种名为 ReSTIR-PG 的实时渲染方法，旨在解决 ReSTIR（Reservoir Spatiotemporal Importance Resampling）技术中初始候选样本质量受限的问题。
- 利用 ReSTIR 产生的重采样路径（Resampled Paths）来提取引导分布（Guiding Distributions），进而为下一帧生成更高质量的初始候选样本。
解决的问题：
- 虽然 ReSTIR 通过时空重采样显著降低了方差，但其最终效果受限于初始候选样本的质量（通常分布不佳且容易引入相关性伪影）。
- 传统路径引导方法依赖于原始路径追踪样本，而 ReSTIR-PG 则形成了一个闭环：利用重采样后的高质量路径反哺引导采样。
关键观察与方法：
- ReSTIR 接受的路径在本质上已经近似于目标路径贡献密度。
- 这些路径的弹射方向自然遵循局部路径引导的理想分布（即入射辐射率与余弦加权 BSDF 的乘积）。
- 利用这一特性，通过密度估计（Density Estimation）利用每一帧的重采样路径来拟合轻量级的引导分布。
性能与优势：
- 降低方差：相比传统方法，生成的图像噪点更少。
- 快速响应：对场景变化的响应速度更快。
- 减少伪影：有效减少了由于样本相关性引入的视觉伪影。
- 实时性能：在保持上述优势的同时，依然能够维持实时的渲染帧率。
https://research.nvidia.com/labs/rtr/publication/zeng2025restirpg/

MapAnything

统一前馈模型：MapAnything 是一个简单、端到端训练的 Transformer 模型。它不同于针对特定任务训练的独立模型，而是一个单一模型，能够通过单次前馈处理解决超过 12 种不同的 3D 重建任务（如未标定的 Structure-from-Motion、标定的多视图立体视觉、单目深度估计、相机定位、深度补全等）。
灵活的输入模态：该模型支持高度灵活的输入组合。除了接收图像外，还可以选择性地接收几何信息，如相机内参（intrinsics）、外参/姿态（poses）、深度图（depth）或部分重建结果。
分解式场景表示：MapAnything 利用了一种“分解式”的多视图场景几何表示法。它不是直接回归点云，而是预测一系列深度图、局部射线图、相机姿态以及一个度量比例因子（metric scale factor）。这种表示法能有效地将局部重建升级为全局一致的度量框架。
高性能与高效训练：实验表明，MapAnything 的性能匹配甚至超越了针对特定任务优化的专家级前馈模型，同时具备更高效的联合训练特性，为构建通用的 3D 重建骨干网络铺平了道路。
开源与应用：该项目已开源代码（基于 Apache-2.0 协议）及预训练模型，并提供了多种交互式 Demo（包括 Hugging Face 在线 Demo、本地 Gradio 和 Rerun 可视化），支持与 COLMAP 和 Gaussian Splatting 等工具的集成。
https://github.com/facebookresearch/map-anything

OpenAI 发布 GPT-5.2 迎战 Gemini 3，迪士尼十亿美元入股 OpenAI

OpenAI 发布 GPT-5.2 系列回应 Gemini 3
- 为应对 Google Gemini 3 带来的竞争压力，OpenAI 推出了 GPT-5.2 模型家族（包含 Pro、Thinking 和 Instant 版本）。
- 新功能允许用户在 5 个级别（最高至 x-high）调整推理能力。
- GPT-5.2 Pro 在 ARC-AGI 等基准测试中创下新高，且在同等推理能力下成本大幅降低（相比一年前降低约 390 倍）。
迪士尼与 OpenAI 达成重磅战略结盟
- 双方签署了为期 3 年的独家协议，允许 OpenAI 使用迪士尼旗下（包括漫威、皮克斯、卢卡斯影业等）的角色（如米老鼠、达斯·维达）来训练 Sora 生成 30 秒短视频。
- 作为交换，迪士尼获得了 OpenAI 价值 10 亿美元的股份，并计划在 Disney+ 上展示部分用户生成的 AI 视频内容。
Runway 推出通用世界模型 GWM-1
- Runway 发布了 GWM-1 系列模型，包含 Worlds（环境模拟）、Robotics（机器人训练数据生成）和 Avatars（交互式角色生成）。
- 与传统视频生成不同，这些模型旨在构建具有物理一致性和实时交互能力的“世界模型”，支持从不同视角和动作实时生成连贯场景。
低样本多模态适应技术 (SEMI)
- 研究板块介绍了一种名为“样本高效模态集成 (SEMI)”的新技术。
- 该技术利用 LoRA 适配器，仅需极少量样本（如 32 个例子），就能让预训练的 LLM 理解并处理全新的非文本数据类型（如医疗 X 光片、传感器数据或分子结构图），解决了专业领域数据稀缺的难题。
吴恩达 (Andrew Ng) 的观点
- 吴恩达在信中指出，虽然 LLM 具有通用性，但目前要提升其在特定领域的知识和表现，仍需依赖繁琐、“零碎”的数据工程（Piecemeal Process）。
- 他强调不要过度炒作 AI 短期内实现 AGI，也不要低估其潜力，通往更高级智能的道路仍需长期的艰苦努力。
https://www.deeplearning.ai/the-batch/issue-332/

NASA GIS

活动背景：2025 年 11 月 19 日是第 26 个 GIS 日，今年的全球主题是“地理通才时代：空间与万物的交汇”（Geo-Generalist Era: Where Spatial Meets Everything），旨在强调 GIS 技术在各行各业中的广泛应用。
核心展示：NASA 发布了一个交互式的 StoryMap（故事地图），其中包含一个由 39 张卫星图像组成的拼贴画。这些图像由 NASA 的地球观测卫星群拍摄，展示了地球景观的多样性、人类活动的影响以及各种科学现象。
GIS 的应用价值：文章通过具体案例重点介绍了 GIS 技术如何帮助科学家监测长期天气趋势、追踪环境灾害（如野火烟羽、飓风路径）以及编目自然资源。
学习资源：为了配合庆祝活动，NASA Earthdata 推出并推广了一系列新的 GIS 学习资源，包括：
如何将下载的 NASA 数据加载到常用的 GIS 软件（如 QGIS 和 ArcGIS Pro）中。
创建 NetCDF 镶嵌数据集和使用网络/图像服务的高级教程。
目标与意义：该活动旨在提升公众对地理信息系统的认识，展示空间数据如何帮助解决复杂的现实世界挑战，并鼓励更多跨学科的专业人士（“地理通才”）利用空间洞察力进行工作。
https://www.earthdata.nasa.gov/learn/gis/storymaps/nasa-earth-science-celebrates-gis-day-2025

Google Research 2025

生成式模型的全面进化：
- Gemini 3：推出了迄今为止最强、最真实的LLM（大型语言模型），在SimpleQA Verified和FACTS等事实性基准测试中达到了最先进的水平。
- 多模态事实性：将事实性研究扩展到图像、音频、视频和3D环境，提升了Veo、Imagen等模型的质量。
- 多语言与文化适应：Gemma模型现支持超过140种语言，通过TUNA分类法和社区数据收集，增强了模型的文化感知能力。
生成式UI (Generative UI)：
- 在Gemini 3中引入了生成式UI，能够根据提示动态创建沉浸式视觉体验和交互界面（如网页、游戏、应用），并已应用于Google搜索的AI模式和Gemini应用中。
量子计算的新里程碑：
- 发布了Willow芯片，实现了可验证的量子优势。
- 提出了“量子回声”(Quantum Echoes)算法，在Willow芯片上的运行速度比传统超级计算机快13,000倍，推动了药物设计和聚变能源等领域的应用。
加速科学发现：
- AI辅助科学家 (AI co-scientist)：发布了多智能体AI系统，帮助科学家生成、评估和迭代假设，已在药物重用和抗微生物耐药性研究中取得成果。
- 基因组学与神经科学：推出了DeepSomatic工具用于癌症基因变异识别，发布了C2S-Scale单细胞分析基础模型，以及LICONN方法用于绘制脑组织神经元连接图谱。
地球智能与危机应对 (Earth AI)：
- FireSat卫星：发射了首颗FireSat卫星，利用AI实时检测小型野火，被《时代》杂志评为2025年最佳发明之一。
- 洪水与气象预测：洪水预报模型覆盖全球20亿人口，NeuralGCM模型为印度3800万农民提供季风预报，WeatherNext 2提供更精准的中期天气预报。
基础设施与效率：
- 开发了LAVA调度算法，优化云数据中心的资源效率。
- 持续投入推测性解码（如块验证）等新技术，提升模型运行的成本和能源效率。
全球合作与生态系统：
- 计划于2026年在新加坡设立新的Google Research中心。
- 继续通过开源项目、学术合作和奖学金计划支持全球研究社区。

Abseil 性能优化指南

meshoptimizer v1.0

ReSTIR PG

MapAnything

OpenAI 发布 GPT-5.2 迎战 Gemini 3，迪士尼十亿美元入股 OpenAI

**NASA GIS **

Google Research 2025

Enjoy Reading This Article?

NASA GIS