电脑写作吧 关注:31贴子:241
  • 0回复贴,共1

今天早上想到两种情形,不能依靠相邻词的概率排除歧义义项。第一

只看楼主收藏回复

今天早上想到两种情形,不能依靠相邻词的概率排除歧义义项。第一种是“我花了8000元买了个苹果”,第二种是“小李很喜欢他的苹果”。这两种都比较难确定“苹果”是水果还是手机?特别是第二种,需要依靠上下文前面的“小李拥有两个手机”来判断,两句话的距离可能比较远,而且要在小李的拥有物之内,把苹果与手机关联起来,人虽然容易做到,电脑想依靠数学或算法来做可真是头痛。还好灵感发现,我五分钟之后就想到了办法。
第一种情形,只要写两个语义正则表达式,“Q:* 苹果 * num 元 * A:num:TP@TOTOAL”,“Q:* num 元 * 苹果 * A:num:TP@TOTOAL”,再用这个模板上语料库搜到八句num数值最接近的句子,再计算所得到的八个整句(TP@TOTOAL)里面所有的名词动词与水果和手机的关联度,可以排除歧义义项了。
第二种情形更复杂一点,就用以下语句训练出一个语义模板:
“Q:小明拥有两个手机 A:小明 手机”,
“Q:小明买了一个手机 A:小明 手机”,
“Q:*送给小明一个手机 A:小明 手机”,
“Q:小明手上有两个手机 A:小明 手机”,
“Q:*小明的手机* A:小明 手机”,
“Q:小朱拥有两个玩具 A:小朱 玩具”,
“Q:小朱买了一个玩具 A:小朱 玩具”,
“Q:*送给小朱一个玩具 A:小朱 玩具”,
“Q:小朱手上有两个玩具 A:小朱 玩具”,
“Q:*小朱的玩具* A:小朱 玩具”,
有了这个语义模板以后,遇到可以确定拥有物的语句,就可以输出所有者与拥有物这两个词。用它来处理上下文,就能找到小李的所有拥有物,计算这些拥有物与水果和手机的关联度,可以排除歧义义项了。


IP属地:广东来自Android客户端1楼2020-06-06 09:05回复