什么是N-gram?

N-gram是自然语言处理中一种基础的序列建模方法,指一个序列中连续n个元素的子序列。例如,在文本分析中,bigram(2-gram)表示两个连续词语的组合,trigram(3-gram)则涉及三个词语。该模型通过统计历史序列的频率来预测下 […]