Gemma#
Gemma 是 Google DeepMind 基于 Gemini 研究和技术而开发的开源权重大型语言模型 (LLM) 系列。
此仓库包含 gemma
PyPI 包的实现。一个用于使用和微调 Gemma 的 JAX 库。
有关示例和用例,请参阅我们的文档。请在我们的 GitHub 中报告问题和反馈。
安装#
为 CPU、GPU 或 TPU 安装 JAX。请按照 JAX 网站上的说明进行操作。
运行
pip install gemma
示例#
这是一个使用 Gemma 进行多轮、多模态对话的最小示例
from gemma import gm
# Model and parameters
model = gm.nn.Gemma3_4B()
params = gm.ckpts.load_params(gm.ckpts.CheckpointPath.GEMMA3_4B_IT)
# Example of multi-turn conversation
sampler = gm.text.ChatSampler(
model=model,
params=params,
multi_turn=True,
)
prompt = """Which of the two images do you prefer?
Image 1: <start_of_image>
Image 2: <start_of_image>
Write your answer as a poem."""
out0 = sampler.chat(prompt, images=[image1, image2])
out1 = sampler.chat('What about the other image ?')
我们的文档包含各种 Colabs 和教程,包括:
此外,我们的 examples/ 文件夹包含使用 Gemma 进行微调和采样的其他脚本。
了解更多关于 Gemma 的信息#
要使用此库:Gemma 文档
关于指标和模型能力的技术报告
关于 Gemma 生态系统的其他 Gemma 实现和文档
下载模型#
要下载模型权重。请参阅我们的文档。
系统要求#
Gemma 可以在 CPU、GPU 和 TPU 上运行。对于 GPU,我们建议 2B 检查点使用 8GB+ GPU 内存,7B 检查点使用 24GB+ GPU 内存。
这不是 Google 的官方产品。