Image
logo
publist
写文章
Image

简介

该用户还未填写简介

擅长的技术栈

JavaPython技术架构大模型AIGC

可提供的服务

技术咨询

使用 Claude Code 生产可持久化内容:HarmonyOS Snapshot 内存泄漏分析实践(THS)

本文记录了一次使用 Claude Code Opus 辅助分析 HarmonyOS Snapshot 内存泄漏的工程实践。与单次问答式分析不同,本文关注的是如何把分析过程中形成的资料、脚本、方法论和报告模板沉淀为可复用资产,使后续同类问题可以从已有知识和工具链继续推进。文章以分时页内存上涨问题为背景,介绍从资料准备、Skill 固化、脚本工具链建设,到自动化分析、人工复核和交叉验证的完整流程,并通

文章图片
#harmonyos#pytorch#人工智能
Transformer原理大白话讲解

《图解Transformer:AI黄金时代的核心引擎》 这篇文章用生活化比喻解析了Transformer的工作原理。Transformer由编码器和解码器组成,编码器像语文老师逐层理解句子,解码器像作家根据理解生成翻译。其核心是自注意力机制,让模型在处理每个词时都能关注句子其他部分,通过Q/K/V矩阵计算词间关系。文章还解释了位置编码、残差连接等关键技术,以及Transformer并行计算的优越性

文章图片
#transformer#深度学习#人工智能
Transformer原理大白话讲解

《图解Transformer:AI黄金时代的核心引擎》 这篇文章用生活化比喻解析了Transformer的工作原理。Transformer由编码器和解码器组成,编码器像语文老师逐层理解句子,解码器像作家根据理解生成翻译。其核心是自注意力机制,让模型在处理每个词时都能关注句子其他部分,通过Q/K/V矩阵计算词间关系。文章还解释了位置编码、残差连接等关键技术,以及Transformer并行计算的优越性

文章图片
#transformer#深度学习#人工智能
Transformer原理大白话讲解

《图解Transformer:AI黄金时代的核心引擎》 这篇文章用生活化比喻解析了Transformer的工作原理。Transformer由编码器和解码器组成,编码器像语文老师逐层理解句子,解码器像作家根据理解生成翻译。其核心是自注意力机制,让模型在处理每个词时都能关注句子其他部分,通过Q/K/V矩阵计算词间关系。文章还解释了位置编码、残差连接等关键技术,以及Transformer并行计算的优越性

文章图片
#transformer#深度学习#人工智能
钉钉基于通义千问大模型推出AI客服助理

钉钉基于通义千问大模型推出的AI客服助理,展现了大模型技术在赋能企业客服场景方面的潜力。它通过降低使用门槛(免费开放、三步部署、无需深厚技术背景)和提升实用效果(精准理解、多轮对话、多模态交互),希望能帮助企业,特别是那些大量依赖专业知识和客户咨询的企业,实现客服流程的智能化升级,提升效率与客户体验。

文章图片
#人工智能
从 Demo 到生产:NVIDIA RAG 部署课程学习与 Mirror 实践启发(THS)

本文基于 NVIDIA Deep Learning Institute 的《在生产环境大规模部署 RAG 工作流》课程,围绕 NIM、RAG、K8s/Helm/Operator、监控弹性、多模态与 Agentic AI 等主线,从工程实践角度总结课程内容,并结合 Mirror 平台的实际场景提供启发。

文章图片
#学习#GPU#RAG
从 CUDA 到 ROCm:AMD 云端 AI 开发的全栈迁移与性能优化实践

摘要: AMD ROCm平台作为开源GPU计算解决方案,在AI训练与推理领域快速发展。本文系统解析ROCm的分层架构(驱动层、运行时层、编译器与框架层),重点介绍HIP编程模型与CUDA的差异及迁移策略。针对PyTorch、vLLM等主流框架,探讨ROCm适配现状与优化方案,包括性能调优技巧和常见问题排查。通过实测数据展示AMD Instinct MI300X在云端AI任务中的优势,为开发者提供从

文章图片
#人工智能#性能优化
vLLM 硬核四连发

vLLM在2026年3月推出四大核心更新:1)SemanticRouter v0.2 Athena升级为多模型编排系统;2)Nemotron3 Super MoE模型优化多智能体协作;3)P-EAGLE实现并行推测解码突破性能瓶颈;4)ModelRunner V2重构底层引擎提升56%吞吐量。这些更新从推理加速、多模型调度到智能体操作系统全面升级,推动vLLM从单一推理引擎向AI推理平台转型。其中

文章图片
vLLM 硬核四连发

vLLM在2026年3月推出四大核心更新:1)SemanticRouter v0.2 Athena升级为多模型编排系统;2)Nemotron3 Super MoE模型优化多智能体协作;3)P-EAGLE实现并行推测解码突破性能瓶颈;4)ModelRunner V2重构底层引擎提升56%吞吐量。这些更新从推理加速、多模型调度到智能体操作系统全面升级,推动vLLM从单一推理引擎向AI推理平台转型。其中

文章图片
vLLM 硬核四连发

vLLM在2026年3月推出四大核心更新:1)SemanticRouter v0.2 Athena升级为多模型编排系统;2)Nemotron3 Super MoE模型优化多智能体协作;3)P-EAGLE实现并行推测解码突破性能瓶颈;4)ModelRunner V2重构底层引擎提升56%吞吐量。这些更新从推理加速、多模型调度到智能体操作系统全面升级,推动vLLM从单一推理引擎向AI推理平台转型。其中

文章图片
    共 282 条
  • 1
  • 2
  • 3
  • 29
  • 请选择