集成测试
本文档提供了有关本项目中使用的集成测试框架的信息。
概述
集成测试旨在验证 Gemini CLI 的端到端功能。它们在受控环境中执行已构建的二进制文件,并验证其在与文件系统交互时的行为是否符合预期。
这些测试位于 integration-tests 目录中,并使用自定义测试运行器进行运行。
运行测试
集成测试不作为默认 npm run test 命令的一部分运行。必须使用 npm run test:integration:all 脚本显式运行它们。
也可以使用以下快捷方式运行集成测试:
npm run test:e2e运行特定测试集
要运行测试文件子集,可以使用 npm run <integration test command> <file_name1> ....,其中 <integration test command> 是 test:e2e 或 test:integration*,而 <file_name> 是 integration-tests/ 目录中的任何 .test.js 文件。例如,以下命令运行 list_directory.test.js 和 write_file.test.js:
npm run test:e2e list_directory write_file按名称运行单个测试
要按名称运行单个测试,请使用 --test-name-pattern 标志:
npm run test:e2e -- --test-name-pattern "reads a file"消除测试的抖动
在添加新集成测试之前,您应该使用 deflake 脚本至少运行它 5 次,以确保它不会抖动。
npm run deflake -- --runs=5 --command="npm run test:e2e -- --test-name-pattern '<your-new-test-name>'"运行所有测试
要运行整个集成测试套件,请使用以下命令:
npm run test:integration:all沙盒矩阵
all 命令将运行 no sandboxing、docker 和 podman 的测试。 可以使用以下命令运行每种单独的类型:
npm run test:integration:sandbox:nonenpm run test:integration:sandbox:dockernpm run test:integration:sandbox:podman诊断
集成测试运行器提供了多种诊断选项,以帮助跟踪测试失败。
保留测试输出
您可以保留测试运行期间创建的临时文件以供检查。这对于调试文件系统操作问题非常有用。
要保留测试输出,请将 KEEP_OUTPUT 环境变量设置为 true。
KEEP_OUTPUT=true npm run test:integration:sandbox:none当保留输出时,测试运行器将打印测试运行的唯一目录的路径。
详细输出
为了进行更详细的调试,请将 VERBOSE 环境变量设置为 true。
VERBOSE=true npm run test:integration:sandbox:none当在同一命令中使用 VERBOSE=true 和 KEEP_OUTPUT=true 时,输出将被流式传输到控制台,并保存在测试的临时目录中的日志文件中。
详细输出的格式化方式可以清晰地识别日志来源:
--- TEST: <log dir>:<test-name> ---
... output from the gemini command ...
--- END TEST: <log dir>:<test-name> ---检查和格式化
为确保代码质量和一致性,集成测试文件作为主构建过程的一部分进行检查。您也可以手动运行检查器和自动修复程序。
运行检查器
要检查检查错误,请运行以下命令:
npm run lint您可以在命令中包含 :fix 标志,以自动修复任何可修复的检查错误:
npm run lint:fix目录结构
集成测试在 .integration-tests 目录内为每次测试运行创建一个唯一的目录。在此目录内,为每个测试文件创建一个子目录,然后在其中为每个单独的测试用例创建一个子目录。
这种结构使得查找特定测试运行、文件或用例的工件变得容易。
.integration-tests/
└── <run-id>/
└── <test-file-name>.test.js/
└── <test-case-name>/
├── output.log
└── ...other test artifacts...持续集成
为确保集成测试始终运行,在 .github/workflows/e2e.yml 中定义了一个 GitHub Actions 工作流。此工作流会自动为针对 main 分支的拉取请求运行集成测试,或者在将拉取请求添加到合并队列时运行。
该工作流在不同的沙盒环境中运行测试,以确保 Gemini CLI 在每个环境中都得到测试:
sandbox:none: 在没有任何沙盒的情况下运行测试。sandbox:docker: 在 Docker 容器中运行测试。sandbox:podman: 在 Podman 容器中运行测试。