什么是模型泛化能力?

模型泛化能力(Model Generalization Ability)是指机器学习模型在训练数据集之外的新数据上保持高性能的能力,它衡量了模型对未知样本的预测准确性和适应性。一个具备良好泛化能力的模型能够避免过拟合训练数据的陷阱,从而在实 […]

什么是通用模型?

通用模型是指能够跨多个不同任务或领域执行功能的智能系统模型,展现出广泛的适应性和泛化能力。这类模型通过大规模数据和算法训练,在未经特定训练的情境中也能高效工作,例如大型语言模型(LLM)可处理文本生成、翻译和问答等多样化任务,其核心优势在于 […]

什么是开放模型?

开放模型(Open Models)是指在人工智能领域,其模型架构、训练代码、权重参数等核心资源被公开发布,允许公众自由访问、使用、修改和分发的AI模型。这类模型强调透明度、可复现性和社区协作,与封闭模型形成鲜明对比,后者通常由企业专有且不公 […]

什么是具身智能体?

具身智能体(Embodied AI)是指拥有物理或虚拟身体的人工智能系统,通过感知环境、执行身体行动来学习和适应世界,强调智能行为源于身体与环境的直接交互。这种智能体突破了传统AI的局限性,能够通过实时行动收集数据、进行实验,从而发展出更复 […]

什么是共情AI?

共情AI(Empathetic AI)是指一种能够理解、识别和响应人类情感状态的人工智能系统,它通过情感计算、自然语言处理和机器学习等技术,模拟人类的共情能力,以在交互中提供更人性化、个性化的体验。这类AI的核心在于感知用户的情感线索(如语 […]

什么是QLoRA训练?

QLoRA(Quantized Low-Rank Adaptation)是一种高效的大型语言模型微调技术,它结合了权重量化和低秩适应方法,通过在量化后的低精度模型参数上应用低秩矩阵分解,显著减少了训练过程中的内存占用和计算资源需求,同时保持 […]