A SIMPLE BUT TOUGH-TO-BEAT BASELINE FOR SENTENCE EMBEDDINGS

本文是阅读 ICLR 会议论文 "A SIMPLE BUT TOUGH-TO-BEAT BASELINE FOR SENTENCE EMBEDDINGS" 所作笔记。

论文 GitHub:https://github.com/PrincetonML/SIF

Abstract

本文提出了一种基于无监督学习的 Sentence Embedding 方法,其效果超过了目前(截止论文发表)主流的 Sentence Embedding 方法。流程如下:

  1. 计算 Word Embedding ,通过对无标签的语料库;
  2. 用加权词向量来表征一个句子;
  3. 用 PCA/SVD 来改善它们
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×