什么是词汇表(Vocabulary)?

词汇表(Vocabulary)在人工智能领域,特别是自然语言处理(NLP)中,指的是一个预定义的单词、子词或符号集合,用于将文本数据数字化。它包含了系统能够识别和处理的所有语言单元,每个单元被映射到一个唯一的数字索引,便于机器学习模型进行计 […]