DK_Allen 个人主页

@DK_Allen

DK_Allen

技术引领业务创新

浙江杭州

2023-03-23 15:34:00 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

JavaPython技术架构大模型AIGC

可提供的服务

技术咨询

使用 Claude Code 生产可持久化内容：HarmonyOS Snapshot 内存泄漏分析实践（THS）

本文记录了一次使用 Claude Code Opus 辅助分析 HarmonyOS Snapshot 内存泄漏的工程实践。与单次问答式分析不同，本文关注的是如何把分析过程中形成的资料、脚本、方法论和报告模板沉淀为可复用资产，使后续同类问题可以从已有知识和工具链继续推进。文章以分时页内存上涨问题为背景，介绍从资料准备、Skill 固化、脚本工具链建设，到自动化分析、人工复核和交叉验证的完整流程，并通

#harmonyos #pytorch #人工智能

Transformer原理大白话讲解

《图解Transformer：AI黄金时代的核心引擎》这篇文章用生活化比喻解析了Transformer的工作原理。Transformer由编码器和解码器组成，编码器像语文老师逐层理解句子，解码器像作家根据理解生成翻译。其核心是自注意力机制，让模型在处理每个词时都能关注句子其他部分，通过Q/K/V矩阵计算词间关系。文章还解释了位置编码、残差连接等关键技术，以及Transformer并行计算的优越性

#transformer #深度学习 #人工智能

Transformer原理大白话讲解

#transformer #深度学习 #人工智能

Transformer原理大白话讲解

#transformer #深度学习 #人工智能

钉钉基于通义千问大模型推出AI客服助理

钉钉基于通义千问大模型推出的AI客服助理，展现了大模型技术在赋能企业客服场景方面的潜力。它通过降低使用门槛（免费开放、三步部署、无需深厚技术背景）和提升实用效果（精准理解、多轮对话、多模态交互），希望能帮助企业，特别是那些大量依赖专业知识和客户咨询的企业，实现客服流程的智能化升级，提升效率与客户体验。

#人工智能

从 Demo 到生产：NVIDIA RAG 部署课程学习与 Mirror 实践启发（THS）

本文基于 NVIDIA Deep Learning Institute 的《在生产环境大规模部署 RAG 工作流》课程，围绕 NIM、RAG、K8s/Helm/Operator、监控弹性、多模态与 Agentic AI 等主线，从工程实践角度总结课程内容，并结合 Mirror 平台的实际场景提供启发。

#学习 #GPU #RAG

从 CUDA 到 ROCm：AMD 云端 AI 开发的全栈迁移与性能优化实践

摘要： AMD ROCm平台作为开源GPU计算解决方案，在AI训练与推理领域快速发展。本文系统解析ROCm的分层架构（驱动层、运行时层、编译器与框架层），重点介绍HIP编程模型与CUDA的差异及迁移策略。针对PyTorch、vLLM等主流框架，探讨ROCm适配现状与优化方案，包括性能调优技巧和常见问题排查。通过实测数据展示AMD Instinct MI300X在云端AI任务中的优势，为开发者提供从

#人工智能 #性能优化

vLLM 硬核四连发

vLLM在2026年3月推出四大核心更新：1）SemanticRouter v0.2 Athena升级为多模型编排系统；2）Nemotron3 Super MoE模型优化多智能体协作；3）P-EAGLE实现并行推测解码突破性能瓶颈；4）ModelRunner V2重构底层引擎提升56%吞吐量。这些更新从推理加速、多模型调度到智能体操作系统全面升级，推动vLLM从单一推理引擎向AI推理平台转型。其中

vLLM 硬核四连发

共 282 条

请选择