Gemma#

Unittests PyPI version Documentation Status

Gemma 是 Google DeepMind 基于 Gemini 研究和技术而开发的开源权重大型语言模型 (LLM) 系列。

此仓库包含 gemma PyPI 包的实现。一个用于使用和微调 Gemma 的 JAX 库。

有关示例和用例,请参阅我们的文档。请在我们的 GitHub 中报告问题和反馈。

安装#

  1. 为 CPU、GPU 或 TPU 安装 JAX。请按照 JAX 网站上的说明进行操作。

  2. 运行

    pip install gemma
    

示例#

这是一个使用 Gemma 进行多轮、多模态对话的最小示例

from gemma import gm

# Model and parameters
model = gm.nn.Gemma3_4B()
params = gm.ckpts.load_params(gm.ckpts.CheckpointPath.GEMMA3_4B_IT)

# Example of multi-turn conversation
sampler = gm.text.ChatSampler(
    model=model,
    params=params,
    multi_turn=True,
)

prompt = """Which of the two images do you prefer?

Image 1: <start_of_image>
Image 2: <start_of_image>

Write your answer as a poem."""
out0 = sampler.chat(prompt, images=[image1, image2])

out1 = sampler.chat('What about the other image ?')

我们的文档包含各种 Colabs 和教程,包括:

此外,我们的 examples/ 文件夹包含使用 Gemma 进行微调和采样的其他脚本。

了解更多关于 Gemma 的信息#

下载模型#

要下载模型权重。请参阅我们的文档

系统要求#

Gemma 可以在 CPU、GPU 和 TPU 上运行。对于 GPU,我们建议 2B 检查点使用 8GB+ GPU 内存,7B 检查点使用 24GB+ GPU 内存。

这不是 Google 的官方产品。