什么是模型量化格式?

模型量化格式是指深度学习模型经过量化处理后所采用的标准化表示方式,量化过程通过降低模型权重和激活值的数值精度(如从32位浮点数缩减到8位整数),以显著减小模型体积、加速推理速度并降低计算功耗,同时力求在可接受的精度损失范围内维持模型性能。 […]

什么是数据共享协议?

数据共享协议(Data Sharing Agreement)是指两个或多个实体之间就数据的共享、使用和管理所达成的正式约定,它明确规定了数据的提供方、接收方、共享范围、使用目的、安全措施、隐私保护、知识产权归属以及法律责任等条款,旨在确保数 […]

什么是BFloat16?

BFloat16(Brain Floating Point 16-bit)是一种由Google开发的16位浮点数格式,专为深度学习优化设计。它保留了32位浮点数(FP32)的动态范围,同时将位宽减半,从而在训练和推理过程中减少内存占用和计算 […]

什么是INT8量化?

INT8量化是一种深度学习模型优化技术,通过将神经网络的权重和激活值从高精度浮点数(如32位浮点FP32)转换为8位整数(INT8)表示,从而显著减小模型体积、降低内存占用并加速推理计算。这种转换通常在模型训练后实施,采用量化感知训练或后训 […]

什么是联邦蒸馏?

联邦蒸馏(Federated Distillation)是一种融合联邦学习和知识蒸馏技术的分布式机器学习方法,旨在保护数据隐私并优化模型性能。在联邦蒸馏框架中,多个客户端设备(如手机或物联网设备)在本地训练模型,而无需共享原始数据;然后,通 […]