知识图谱是近年来人工智能技术蓬勃发展的核心驱动力之一,已广泛应用在金融、电商、医疗、政务等众多领域,经过短短几年的发展,热度依旧不减,未来,知识图谱又将解决哪些其他技术无法解决的问题呢?它又面临着哪些新的挑战?
知识图谱的发展脉络
作为人工智能的一个重要研究领域,其研究和发展可以追溯到第一个人工智能浪潮。1968年图灵奖获得者Edward Feigenbaum研发出世界首个专家系统DENDRAL,并随后在第五届国际人工智能会议上正式提出知识工程的概念,目标是将知识融入计算机系统用以解决只有领域专家才能解决的复杂问题。1999年互联网发明人、图灵奖获得者Tim Berners-Lee爵士提出语义网的概念,核心理念是用知识表示互联网,建立常识知识,但一直苦于规模小、应用场景不清楚而发展缓慢,因此,2012年以前,学术界和工业界普遍认为知识图谱技术处于初级发展阶段。
直到2012年,这一状况才有了改变。这一年,谷歌发布了570亿实体的大规模知识图谱,其宣传语是“Things, not Strings”给出了知识图谱的精髓,即,不要无意义的字符串,而是获取字符串背后隐含的对象或事物,多组研究者也曾独立地提出过相似的理论。“Things, not Strings”理论脱胎于众多著名认知心理学家提出的Semantic Networks理论,最为著名的有Sowa等人在1984年提出的ConceptNet。 在符号主义的思潮中,许多早期知识图谱将关系局限为几种特殊的基本关系,如“拥有属性”、“导致”、“属于”等,并定义一系列在图谱上推理的规则,期望通过逻辑推理实现智能。
然而,早期知识图谱的思路遇到了许多实际的困难,比如结构化知识信息的大量缺失,推理规则的无法穷举问题等。当然,这些问题也并非来自知识图谱,而是符号主义本身的特性。知识图谱的缺点本质上都是“二元一阶谓词逻辑”作为知识表示的本身缺陷带来的。知识表示是长久以来研究者孜孜不倦追寻探索的话题,完全依靠(头实体、关系、尾实体)这样的命题,尽管能表示大部分简单事件或实体属性,对于复杂知识却束手无策。
2012年发布的谷歌知识图谱将常识知识图谱构建应用于实际系统(Freebase是谷歌知识图谱的前身,它整合了包括许多私人维基在内的大量网络资源,后来被谷歌收购)。自谷歌第一版知识图谱推出以来,它在学术界和工业界掀起了一股热潮,随之而来的是各类知识图谱如雨后春笋般涌现。
Comments