知识图谱商业化落地,制约因素主要在于标准化
重要技术进展
知识图谱技术在过去这一年取得的重要技术进展有:
知识抽取方面,多模态信息抽取在同时处理文本和视频方面取得了进展;知识表示方面,自注意力机制的知识表示方法越来越走向实用;知识应用方面,很多行业开始构建行业知识库,用于各类下游任务。
明略科技资深科学家张杰在接受 InfoQ 采访时指出,现阶段,在知识图谱方面,业界普遍面临的研发难点主要体现在两个方面:算法方面,针对非结构化数据的信息抽取和实体对齐的准确度难以保障直接商用,需人工校验;工程方面,行业图谱构建成本高,需要大量的人工标注,另外构建进度也不是一蹴而就,需要业务专家不断运维。
张杰预测,2022 年,领域预训练语言模型和 Prompt 在知识图谱中的应用,有望使得信息抽取环节得到进一步提升。针对技能性知识的抽取技术和多模态抽取技术,商用前景广阔。
应用落地进展
2021 年,知识图谱技术的应用落地,在 ToC 场景中仍主要用于搜索、推荐的提升,在 ToB 场景中集中在可视化上。
张杰认为,现阶段,制约知识图谱商业化落地的主要因素在于标准化,行业图谱的 schema 很难在企业内部大范围内达成认知的一致性,影响了后续的标注、抽取、应用。
2022 年,知识图谱技术的大规模化应用可能会在制造业出现突破,制造业的知识密度高、重视标准化,头部企业重视数字化建设,积累了大量原始数据。
2022 年,值得关注的重要技术趋势
人工智能工程化
近两年,人工智能工程化(AI Engineering)格外受关注。在 Gartner 发布的 2021 年和 2022 年重要战略技术趋势中,人工智能工程化都被列入其中。人工智能工程化是一种实现人工智能模型操作化的综合方法。
不久前,Gartner 高级研究总监高挺曾在接受 InfoQ 采访时表示,AI 工程化本质上是 AI 在企业中大规模、全流程的落地过程,尽管目前大家现在对 AI 期待很高,但实际上 AI 目前的应用仍然是被低估的。因为,很多 AI 项目的价值只能体现在一些“点对点”的一次性的方案中。将 AI 大规模落地的工程化方法(包含 DataOps、ModelOps 和 DevOps)总和起来,便是“AI 的工程化”的一整套体系。