AI产品术语2025年6月28日2025年6月28日 什么是梯度爆炸? 梯度爆炸(Gradient Explosion)是指在训练深度神经网络时,通过反向传播算法计算梯度时出现的现象:当网络层数过深、激活函数选择不当或权重初始化不合理时,梯度值会指数级增长,导致权重更新过大,模型参数剧烈震荡,训练过程不稳定甚至 […]
AI产品术语2025年6月28日2025年6月28日 什么是模拟人脑? 模拟人脑是指通过计算模型来仿照人类大脑的生物结构和功能,包括神经元、突触和神经网络的运作机制,旨在复制大脑的认知能力如学习、记忆和决策。这一概念源于神经科学与人工智能的交叉研究,核心是构建人工神经网络以模拟大脑的信息处理过程,从而在特定任务 […]
AI产品术语2025年6月28日2025年6月28日 什么是批归一化(Batch Normalization)? 批归一化(Batch Normalization)是一种深度学习中用于优化神经网络训练的技术,通过对每个小批量的输入数据进行标准化处理,使其均值为0、方差为1,从而减少内部协变量偏移,加速模型收敛速度,允许使用更高的学习率,并提升泛化能力。 […]
AI产品术语2025年6月28日2025年6月28日 什么是梯度消失? 梯度消失(Vanishing Gradient)是指在深度神经网络的反向传播训练过程中,梯度值随着网络层数的增加而逐层减小至接近零的现象。这主要源于某些激活函数(如sigmoid或tanh)在饱和区域输出变化微小,导致梯度在链式法则中指数级 […]
AI产品术语2025年6月28日2025年6月28日 什么是算子融合(Operator Fusion)? 算子融合(Operator Fusion)是一种在深度学习框架中广泛应用的优化技术,它通过将多个独立的计算操作(算子)合并为一个复合操作,以减少内存访问开销和计算延迟。这种融合避免了中间结果的频繁读写,提升了模型推理效率,例如在神经网络中将 […]
AI产品术语2025年6月28日2025年6月28日 什么是显著性映射(Saliency Maps)? 显著性映射(Saliency Maps)是一种深度学习的可视化工具,用于揭示输入数据(如图像)中对模型预测结果贡献最大的区域。它通过计算输入特征相对于模型输出的梯度或其他显著性度量,生成热力图,其中高亮区域表示模型决策的关键部分,从而帮助理 […]
AI产品术语2025年6月28日2025年6月28日 什么是BFloat16? BFloat16(Brain Floating Point 16-bit)是一种由Google开发的16位浮点数格式,专为深度学习优化设计。它保留了32位浮点数(FP32)的动态范围,同时将位宽减半,从而在训练和推理过程中减少内存占用和计算 […]
AI产品术语2025年6月28日2025年6月28日 什么是梯度检查点(Gradient Checkpointing)? 梯度检查点(Gradient Checkpointing)是一种在深度学习训练中用于优化内存使用的关键技术,它通过选择性地保存和重新计算神经网络中的激活值(activations),在反向传播过程中显著减少内存消耗。具体而言,该方法仅存储部 […]
AI产品术语2025年6月28日2025年6月28日 什么是混合并行(Hybrid Parallelism)? 混合并行(Hybrid Parallelism)是指在深度学习模型训练中,通过结合多种并行策略如数据并行(Data Parallelism)、模型并行(Model Parallelism)和流水线并行(Pipeline Parallelis […]
AI产品术语2025年6月27日2025年6月28日 什么是视觉基础模型? 视觉基础模型(Visual Foundation Models)是指在计算机视觉领域中,通过大规模图像数据集预训练的深度学习模型,它们能够学习通用的视觉特征表示,作为基础架构用于各种下游任务的迁移学习。这些模型通常基于先进的架构如Visio […]