Link

Cognitive Graph for Multi-Hop Reading Comprehension at Scale

GitHub

本文试图模仿人类对文本的阅读理解来解决认知图谱的问题，提出了CogQA框架。人类的阅读理解（Dual process theory）可以分为两个部分：

无意识部分
有意识部分

其中在第一个部分中，通过无意识地抽取关键词，根据关键词在脑中检索信息。在第二个部分中，人们有意识地采用上下文来进行逻辑推理。

在采用机器进行这种阅读理解时，需要解决三个问题：

推理，前人的工作已经对单一文本中的推理得到了很好的结果，但是对于多个文本联合起来的推理没有很好地解决。
可解释性，作为人类推理的一部分，逻辑链条很重要，因此机器想要解决这个问题，就需要解决这个逻辑链条的问题。
可扩展性，对于巨大的知+识库中，如何在巨量的数据中推理也是一个需要解决的问题。

本文的CogQA框架基于BERT和GNN，对多跳阅读理解给出了可解释，可推理的结果，这个结果对之前的工作取得了巨大的提升。

CogQA 框架

这个框架包括两个系统，分别采用BERT和GNN实现，第一个系统和人类的情况类似，维护一个不断扩展的图，图中每个节点是词，这些可能是候选回答或者新跳转词，收集一些关于这些节点和图的证据（系统2），这些证据可能由一些句子组成，这个系统的输出是关于问题，节点以及证据的语义信息，它同时也会不断扩展图，具体地，不断获取关于节点的文本，将新节点和新边加入图中。第二个系统，利用深度学习的算法，根据语义信息，来计算这个图中的各个节点的隐表示，同时为新节点准备新的证据。针对上面的后两个问题，这个系统作出了一定的解答：

可解释性：对于系统一的输入，即网络的节点，每次迭代，收集关于这个网络的证据信息，这在一定程度上，和人类的认识途径类似，同时对于新引入的边集合，这些节点也会重复访问。
可扩展性：传统方案是基于检索/提取的，因此很可能跳转的文本和问题的语义关系不强，从而大量的信息是无效的，在本框架中，对关键节点的扩展，从而一步一步地提高信息量，因此本身就是可扩展的。

实验

实验：Redis6.0.5, torch1.5.1

代码主函数采用’bert-base-uncased‘作为预训练的模型并转换问题为词向量。

系统1的输入：[CLS] Question [SEP] clues[x, G] [SEP] Para[x]，对于回答节点，最后一项可以不存在，1-hop节点，第二项也可能不存在，系统1的输出是LxH维度的矩阵，其中L是输入的长度，H是隐表示的长度，包括语义向量，下一跳的节点和回答节点范围。

作为问题的预测，最终，采用一个两层的神经网络，其输入是所有回答节点的隐表示，输出为具体的答案。

代码的训练分为两个任务，其中任务1用于节点扩展，任务2用于回答节点的预测。

任务1：

新的扩展数据来源于基于莱文斯坦距离的模糊匹配。匹配出来新的节点范围后，对回答节点和下一跳节点的起点和终点采用交叉熵损失进行训练。

实验非常耗时。由于单卡训练，所以降低了学习率，降低了batchsize，提高了accumulate-gradient，即使是这样，显存依然不够，因此训练失败，最后的model第一次运行的在dev数据集合上的是结果是：

{'em': 0.07792032410533424, 'f1': 0.11589995731587953, 'prec': 0.12096540304170288, 'recall': 0.11914047476048512, 'sp_em': 0.017555705604321403, 'sp_f1': 0.17510096211867643, 'sp_prec': 0.20333782336652031, 'sp_recall': 0.20638227066653758, 'joint_em': 0.00675219446320054, 'joint_f1': 0.05201124642132065, 'joint_prec': 0.057943727484409326, 'joint_recall': 0.06562598799059655}

这个结果很低，远低于文章中的结果。下面尝试1.在aws服务器上运行2.改一下代码，把部分负载放到cpu上。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Note.md

Note.md

Link

CogQA 框架

实验

Files

Note.md

Latest commit

History

Note.md

File metadata and controls

Link

CogQA 框架

实验