AI产品术语2025年6月26日2025年6月28日 什么是可解释性(Interpretability)? 可解释性(Interpretability)在人工智能领域指的是模型决策过程能够被人类用户清晰理解和解释的程度,它强调模型输出的透明性、可追溯性及可理解性,使人类能够洞察推理逻辑,从而增强信任、促进错误调试、确保公平性并满足合规要求。 在A […]
AI产品术语2025年6月26日2025年6月28日 什么是公平性(Fairness)? 公平性(Fairness)在人工智能领域中,是指算法或系统在处理决策任务时,能够确保对所有个体或群体实现无偏见、公正的结果,避免基于敏感属性(如种族、性别、年龄)产生歧视性影响。这一概念强调在模型训练和预测中维护平等性,是构建可信赖和负责任 […]
AI产品术语2025年6月26日2025年6月28日 什么是偏见(Bias)? 偏见(Bias)在人工智能领域指数据、算法或系统决策中存在的系统性偏差,这种偏差可能导致对特定群体或类别的歧视性结果,根源常在于训练数据的代表性不足、历史偏见的嵌入或模型设计的不均衡,从而削弱AI模型的公平性和泛化能力。 在AI产品开发的实 […]
AI产品术语2025年6月26日2025年6月28日 什么是幻觉(Hallucination)? 幻觉(Hallucination)在人工智能领域,特指生成式模型(如大语言模型)在输出中产生看似合理但事实上错误或完全虚构的信息的现象。这种现象源于模型基于训练数据的统计模式进行预测,当面对知识缺口或模糊查询时,可能生成不真实的内容,例如编 […]
AI产品术语2025年6月26日2025年6月28日 什么是Out-of-Vocabulary (OOV)? Out-of-Vocabulary (OOV) 是指那些未被包含在自然语言处理模型训练词汇表中的词语或符号。词汇表是模型预定义的一组单词集合;当模型在处理文本时遇到词汇表之外的词语时,这些词语就被称为OOV词语。由于模型没有学习过这些词语的 […]
AI产品术语2025年6月26日2025年6月28日 什么是词汇表(Vocabulary)? 词汇表(Vocabulary)在人工智能领域,特别是自然语言处理(NLP)中,指的是一个预定义的单词、子词或符号集合,用于将文本数据数字化。它包含了系统能够识别和处理的所有语言单元,每个单元被映射到一个唯一的数字索引,便于机器学习模型进行计 […]
AI产品术语2025年6月26日2025年6月28日 什么是SentencePiece? SentencePiece 是一种开源的自然语言处理工具,专门用于将文本分割成子词单元(subword units),如字节对编码(BPE)或Unigram语言模型。它直接从原始文本数据训练分词模型,无需预定义词汇表,能高效处理任意语言和未 […]
AI产品术语2025年6月26日2025年6月28日 什么是WordPiece? WordPiece是一种在自然语言处理(NLP)中广泛使用的分词算法,它基于字节对编码(BPE)原理,通过迭代合并高频出现的字符对来构建子词单元(subword units),从而将文本分解为更细粒度的部分,有效处理稀有词和未登录词(OOV […]
AI产品术语2025年6月26日2025年6月28日 什么是BPE(Byte Pair Encoding)? 字节对编码(BPE,Byte Pair Encoding)是一种基于统计的子词切分算法,它通过迭代合并训练文本中出现频率最高的字节对来构建词汇表,从而将稀有词或未知词分解为更小的可处理单元,有效提升自然语言处理模型的泛化能力和效率。 在AI […]
AI产品术语2025年6月26日2025年6月28日 什么是分词器(Tokenizer)? 分词器(Tokenizer)是自然语言处理(NLP)中的一个核心工具,用于将连续的文本序列拆分成离散的单元,例如单词、子词或字符,这些单元称为tokens,便于机器学习模型理解和处理输入数据。分词器的设计直接影响模型的性能和效率,因为它决定 […]