AI产品术语2025年6月26日2025年6月28日 什么是Out-of-Vocabulary (OOV)? Out-of-Vocabulary (OOV) 是指那些未被包含在自然语言处理模型训练词汇表中的词语或符号。词汇表是模型预定义的一组单词集合;当模型在处理文本时遇到词汇表之外的词语时,这些词语就被称为OOV词语。由于模型没有学习过这些词语的 […]
AI产品术语2025年6月26日2025年6月28日 什么是词汇表(Vocabulary)? 词汇表(Vocabulary)在人工智能领域,特别是自然语言处理(NLP)中,指的是一个预定义的单词、子词或符号集合,用于将文本数据数字化。它包含了系统能够识别和处理的所有语言单元,每个单元被映射到一个唯一的数字索引,便于机器学习模型进行计 […]