gm.nn.QuantizationAwareWrapper

gm.nn.QuantizationAwareWrapper#

class gemma.gm.nn.QuantizationAwareWrapper( *, method: gemma.peft._quantization_utils.QuantizationMethod = QuantizationMethod.NONE, model: flax.linen.module.Module, parent: flax.linen.module.Module | flax.core.scope.Scope | flax.linen.module._Sentinel | None = <flax.linen.module._Sentinel object>, name: str | None = None, )[source]

基类：flax.linen.module.Module

围绕 Gemma 模型进行封装，以启用量化感知训练。

封装的模型将使其所有 nn.Dense、nn.Einsum 等层替换为其量化感知训练版本。有关更多详细信息，请参阅 gemma.peft 文档。

method

要使用的量化方法。

类型:: gemma.peft._quantization_utils.QuantizationMethod

model

要封装的模型。

类型:: flax.linen.module.Module

method: gemma.peft._quantization_utils.QuantizationMethod = 'none'

model: flax.linen.module.Module

name: str | None = None

parent: flax.linen.module.Module | flax.core.scope.Scope | flax.linen.module._Sentinel | None = None

scope: Scope | None = None