教程
2025年 12月 17日
借助 NVIDIA Isaac Sim 与 World Labs Marble 加速机器人仿真环境构建
一直以来,为机器人仿真构建逼真的 3D 环境是一项非常耗费人力的工作,往往需要数周的手动建模与配置。如今,借助生成式世界模型,
2 MIN READ
2025年 12月 17日
使用 NVIDIA cuDSS 解决大规模线性稀疏问题
随着芯片设计、制造和多物理场仿真复杂性的持续提升,在电子设计自动化(EDA)、
5 MIN READ
2025年 12月 17日
利用 Aether 项目将 Apache Spark 工作负载在 Amazon EMR 上大规模迁移至 GPU
数据是现代业务的燃料,但依赖基于 CPU 的 Apache Spark 管道 会带来高昂的成本。这些系统天生速度较慢,需要庞大的基础设施,
3 MIN READ
2025年 12月 17日
NVIDIA CUDA-Q QEC 中的实时解码、算法 GPU 解码器和 AI 推理增强功能
实时解码对于容错量子计算机至关重要。通过使解码器与量子处理器(QPU)同时以低延迟运行,我们能在相干时间内对设备施加校正,从而防止错误累积,
2 MIN READ
2025年 12月 16日
使用 NVIDIA CUDA MPS 无需修改代码即可提升 GPU 显存性能
NVIDIA CUDA 开发者可以利用多种工具和库来简化开发与部署,使用户能够专注于应用程序的“内容”和“方式”。 多进程服务 (MPS)…
5 MIN READ
2025年 12月 16日
cuQuantum SDK v25.11 中的先进大规模量子模拟技术
随着量子处理器 (QPU) 性能的提升,模拟大规模量子计算机变得愈发困难。验证结果是确保在设备规模超出经典可模拟范围后,
4 MIN READ
2025年 12月 16日
使用 Skip Softmax 加速 NVIDIA TensorRT-LLM 中的长上下文推理
对于大规模部署 LLM 的机器学习工程师来说,这个等式既熟悉又无情:随着上下文长度的增加,注意力计算成本呈爆炸式增长。
4 MIN READ
2025年 12月 16日
利用生成式 AI 和视觉基础模型优化半导体缺陷分类
每个现代电子设备的核心都是一块硅芯片,它通过极为精密的制造工艺构建而成,微小的缺陷也可能决定其成败。随着半导体器件日益复杂,
3 MIN READ
2025年 12月 15日
如何使用强化学习训练科学智能体
科学过程可能重复且繁琐,研究人员往往需要花费数小时深入研读论文、管理实验流程或整理庞大的多模态数据集。科学 AI 智能体能够承担大量繁重任务,
3 MIN READ
2025年 12月 15日
减小 CUDA 二进制大小以在 PyPI 上分发 cuML
从 25.10 版本开始,现在可以直接从 PyPI 下载用于 pip 安装的 cuML wheels。
3 MIN READ
2025年 12月 12日
如何使用合成数据构建隐私保护评估基准
验证 AI 系统需要基准测试(模拟现实世界条件的数据集和评估工作流程),以便在部署前衡量其准确性、可靠性和安全性。缺少这些测试,
4 MIN READ
2025年 12月 12日
R²D²:结合仿真与语言模型提升机器人操作能力
机器人操控系统在进入动态现实环境时,难以应对持续变化的物体、光照条件及接触动力学。此外,仿真与现实之间的差距,以及未经过优化的抓手或工具,
2 MIN READ
2025年 12月 12日
在 Kubernetes 上实现企业级 RAG 组件的横向自动扩展
当今出色的 AI 智能体 依靠 检索增强生成 (RAG) 来实现更准确的结果。一个 RAG 系统通过利用知识库,为 大语言模型 (LLM)…
11 MIN READ
2025年 12月 11日
基于 NVIDIA Jetson 的边缘 AI 入门指南:面向机器人的大语言模型、视觉语言模型和基础模型
在小型、低功耗的边缘设备上运行先进的 AI 和计算机视觉工作流正变得越来越具有挑战性。机器人、智能摄像头和自主设备需要实时智能来感知、
2 MIN READ
2025年 12月 10日
更高效的漏洞检测:Compute Sanitizer 编译时插桩如何增强内存安全性
CUDA C++ 是一种带有扩展功能的标准 C++,支持函数在 GPU 的多个并行线程上执行。它在推动广泛应用的同时,
3 MIN READ
2025年 12月 10日
借助 NCCL Inspector 增强 AI 工作负载的通信可观测性
使用 NVIDIA 集合通信库 (NCCL) 运行包含集合运算(例如 AllReduce、
3 MIN READ