AI产品术语2025年6月28日2025年6月28日 什么是决策树? 决策树是一种监督学习算法,用于解决分类或回归问题,它通过构建树状结构来模拟决策过程。每个内部节点代表一个特征测试,每个分支对应测试结果,而叶节点则输出最终预测值;算法递归地分割数据以最小化不纯度(如基尼指数或熵),生成直观、可解释的模型,便 […]
AI产品术语2025年6月28日2025年6月28日 什么是随机森林? 随机森林(Random Forest)是一种高效的机器学习集成算法,通过构建多个决策树并综合其预测结果来提升模型的准确性和鲁棒性。具体而言,它采用bootstrap抽样方法从训练数据中随机抽取多个样本集,每个样本集用于训练一个独立的决策树; […]
AI产品术语2025年6月28日2025年6月28日 什么是梯度提升树(Gradient Boosting Decision Tree, GBDT)? 梯度提升树(Gradient Boosting Decision Tree, GBDT)是一种先进的集成学习算法,它通过迭代地训练多个决策树来构建强预测模型,每个新树都专注于纠正前一棵树的残差误差,使用梯度下降方法最小化损失函数。GBDT的 […]
AI产品术语2025年6月28日2025年6月28日 什么是LightGBM? LightGBM(Light Gradient Boosting Machine)是一种高效的开源梯度提升框架,由微软开发,专为处理大规模数据和高维特征而优化。它基于决策树算法,通过直方图近似、梯度单侧采样(GOSS)和互斥特征捆绑(EFB […]
AI产品术语2025年6月28日2025年6月28日 什么是支持向量机(Support Vector Machine, SVM)? 支持向量机(Support Vector Machine, SVM)是一种监督学习算法,主要用于分类任务,也可应用于回归问题。其核心思想是通过寻找一个最优超平面来分隔不同类别的数据点,并最大化类间的间隔(margin),支持向量则是距离该超 […]
AI产品术语2025年6月28日2025年6月28日 什么是线性回归? 线性回归是一种基础的统计学习方法,用于建立因变量(目标变量)与一个或多个自变量(特征)之间的线性关系模型。它通过最小化预测值与实际值之间的平方误差来估计系数,从而预测连续型目标变量。模型的核心表达式为 y = β₀ + β₁x₁ + β₂x […]
AI产品术语2025年6月28日2025年6月28日 什么是XGBoost? XGBoost(Extreme Gradient Boosting)是一种高效的梯度提升决策树算法,由陈天奇等人提出,它通过迭代地添加弱学习器(通常是决策树)并优化正则化目标函数来提升模型性能,特别擅长处理分类、回归和排序任务。该算法结合了 […]
AI产品术语2025年6月28日2025年6月28日 什么是CatBoost? CatBoost是一种基于梯度提升框架的开源机器学习算法,由俄罗斯科技公司Yandex开发,专为高效处理分类特征(categorical features)而设计。它通过创新的有序目标编码(Ordered Target Encoding)技 […]
AI产品术语2025年6月28日2025年6月28日 什么是隐马尔可夫模型(Hidden Markov Model, HMM)? 隐马尔可夫模型(Hidden Markov Model, HMM)是一种基于概率的序列建模方法,用于描述一个系统在隐藏状态下的演变过程,其中隐藏状态不可直接观测,但会生成可观测的输出序列。该模型的核心在于马尔可夫性质,即当前隐藏状态仅依赖于 […]
AI产品术语2025年6月28日2025年6月28日 什么是CRF层? CRF(条件随机场)层是一种用于序列标记任务的概率图模型组件,它通过建模序列中相邻元素标签之间的条件依赖关系,显著提升预测准确性,广泛应用于自然语言处理领域如命名实体识别、词性标注等任务。 在AI产品开发中,CRF层的实际应用体现在提升序列 […]