内积公式【相识度计算】文档d1:abcafbafh文档d2:-查字典问答网
分类选择

来自田军伟的问题

  内积公式【相识度计算】文档d1:abcafbafh文档d2:ac查询q:aca索引项集合={abcdefgh}查询和文档根据索引项集合建立的向量空间模型可以表示如下二值向量:abcdefghabcdefgha

  内积公式【相识度计算】

  文档d1:abcafbafh

  文档d2:ac

  查询q:aca

  索引项集合={abcdefgh}

  查询和文档根据索引项集合建立的向量空间模型可以表示如下二值向量:

  abcdefghabcdefghabcdefgh

  d1=(1,1,1,0,0,1,0,1)d2=(1,0,1,0,0,0,0,0)q=(1,0,1,0,0,0,0,0)

  n

  求sim(d1,q)=∑(Wk,q*Wk,j)

  k=1

  wk,q是查询q的第K个索引项权重,Wk,j是文档j的第k个索引项权重.

  知道的人呢帮我解答下吧.

  求求你们了.最好能写下步骤.

1回答
2020-04-3023:30
我要回答
提示:回答问题需要登录哦!
李艳红

  这种相似度貌似已经是极大简化的了.直接拿文档向量和查询向量作内积即可.sim(d1,q)=(1,1,1,0,0,1,0,1)(1,0,1,0,0,0,0,0)=2.sim(d2,q)=(1,0,1,0,0,0,0,0)(1,0,1,0,0,0,0,0)=2.实际上,文档d2明显更接近于查询q...

2020-04-30 23:34:50
大家都在问
最新问答