gm#

[[源代码]]

from gemma import gm

Gemma 的 Kauldron API。

所有符号#

模块#

gm

Gemma 的 Kauldron API。

gm.ckpts

检查点 API。

gm.data

数据管道操作。

gm.evals

Gemma 的评估器。

gm.losses

损失函数。

gm.nn

Gemma 模型。

gm.nn.config

构建新的 TransformerConfig 所需的符号。

gm.sharding

分片工具。

gm.text

文本处理工具。

#

gm.ckpts.AnchoredPolicyLoader

gm.nn.AnchoredPolicy 模型的加载器。

gm.ckpts.CheckpointPath

Gemma 检查点的硬编码路径。

gm.ckpts.LoadCheckpoint

从 Gemma 检查点加载权重。

gm.ckpts.SkipLoRA

包装一个部分加载器,以不恢复 LoRA 权重。

gm.data.AddSeq2SeqFields

添加模型 inputtargetloss_mask

gm.data.ContrastiveTask

为类 DPO 损失创建对比模型输入。

gm.data.DecodeBytes

bytes 解码为 str

gm.data.FormatText

等同于 template.format(text=my_string)

gm.data.MapInts

将每个整数替换为一个新值。

gm.data.Pad

在序列末尾添加零以达到最大长度。

gm.data.Parquet

Parquet(*, _fake_refs: ‘type[_FakeRefsUnset]

gm.data.Seq2SeqTask

序列到序列任务。

gm.data.Tokenize

将字符串分词为 ID。

gm.evals.SamplerEvaluator

采样评估器。

gm.losses.DpoLoss

DPO 损失函数。

gm.nn.AnchoredPolicy

围绕模型的一个包装器,用于计算策略和锚点输出。

gm.nn.AnchoredPolicyOutput

gm.nn.AnchoredPolicy 的输出。

gm.nn.Gemma2_27B

Gemma2 transformer 架构。

gm.nn.Gemma2_2B

Gemma2 transformer 架构。

gm.nn.Gemma2_9B

Gemma2 transformer 架构。

gm.nn.Gemma3_12B

Gemma3 transformer 架构。

gm.nn.Gemma3_1B

Gemma3 transformer 架构。

gm.nn.Gemma3_27B

Gemma3 transformer 架构。

gm.nn.Gemma3_4B

Gemma3 transformer 架构。

gm.nn.IntWrapper

围绕 Gemma 模型的一个包装器,用于启用 int4 推理。

gm.nn.LoRA

围绕 Gemma 模型的一个包装器,用于启用 LoRA。

gm.nn.Output

Gemma 模型的输出。

gm.nn.QuantizationAwareWrapper

围绕 Gemma 模型的一个包装器,用于启用量化感知训练。

gm.nn.Transformer

基础 transformer 类。

gm.text.ChatSampler

聊天采样器。

gm.text.Gemma2Tokenizer

Gemma 2 的分词器。

gm.text.Gemma3Tokenizer

Gemma 3 的分词器。

gm.text.Greedy

贪婪采样。

gm.text.RandomSampling

简单随机采样。

gm.text.Sampler

采样器。

gm.text.SamplingMethod

采样方法的基础类。

gm.text.SpecialTokens

特殊 token ID。

gm.text.Tokenizer

分词器的基础类。

函数#

gm.ckpts.load_params

从检查点恢复参数。

gm.ckpts.save_params

将参数保存到检查点。

gm.data.make_seq2seq_fields

创建模型 inputtargetloss_mask

gm.data.pad

在序列末尾添加零以达到最大长度。