
Python语义关键词异构图谱TF-IDF、GCN-GAE图卷积自编码器、PCA、t-SNE及KL散度分析中国发明专利数据
本专题正是基于该项目的技术沉淀打造,以2009-2023年中国发明专利数据为基础,围绕人工智能、高端芯片等七大数字技术领域,通过TF-IDF提取领域核心关键词,构建GCN-GAE专利-关键词异构图模型生成特征向量,结合PCA、t-SNE降维可视化与KL散度量化新颖性,实现了数字技术创新突破专利的精准识别与领域特征分析,该框架已在实际业务中得到校验,具备较强的落地性。区块链和工业互联网领域的散点区域较小且分布分散,说明这两个领域仍处于技术探索阶段,专利数量相对较少,但技术发展的差异性大,存在较大的创新潜力;





