跳到主要内容

项目复现体验

更新时间:2025-08-17 10:50:25

大模型实验室提供“项目复现”功能模块,支持用户便捷地复现来自GitHub等开源社区的高星项目。平台集成高性能弹性算力资源,帮助用户快速构建开发环境,提升科研与开发效率。

前提条件

  • 您已经获取大模型实验室账户和密码,如果需要帮助或尚未注册,可参考注册账户完成注册。
  • 当前账号的余额充裕,可满足项目复现的需要。

概览

项目复现界面主要由筛选区和项目列表两部分组成。

项目复现

序号模块名称说明
项目筛选您可通过设置所属领域、关键词、复现状态等条件,对项目进行筛选。
项目列表您可以查看项目详情、原文内容以及 GitHub 代码仓库链接,也可点击“立即体验”按钮,快速复现项目。

操作步骤

  1. 登录大模型实验室,系统默认进入平台首页,点击[项目复现]菜单,跳转至项目复现列表页面,例如上图所示。以下操作以复现“DISC-MedLLM”项目为例进行说明。

  2. 找到“DISC-MedLLM”项目,点击“立即体验”按钮,选择JupyterLab、VSCode或LLaMA Factory Online实例。以JupyterLab为例,点击“JupyterLab”图标,进入资源配置页面,根据需求选择合适的资源规格和显卡数量,确认后点击“启动”,即可进入 JupyterLab 环境。

    项目复现

    提示

    LLaMA Factory Online类型的实例需要在管理后台配置,配置之后您可启动LLaMA Factory的WebUI实例,您可在实例内进行对应的模型训练、评估、对话、或者导出等操作。

  3. 进入codelab/DISC-MedLLM/code目录,点击“Terminal”进入终端。您可选择使用系统预置的默认环境或自定义环境进行论文复现。该项目下的文件目录包括:code、dataset、model,具体说明如下表所示。

    项目复现

    文件名称说明
    code存储代码文件,可读取,可写入。
    dataset存储项目数据集,只可读。
    model存储项目模型,只可读。
  1. 如果您使用默认环境进行项目复现,且为首次操作,请运行以下命令配置环境。

    1. 运行如下所示的命令激活系统内置的项目环境。
    conda activate doodle
    1. 运行如下所示的命令,在已经激活的Python环境中安装ipykernel包。
     pip install ipykernel -i https://pypi.tuna.tsinghua.edu.cn/simple
    1. 运行如下所示的命令,将当前Python环境注册为Jupyter内核。
     kernel_install --name doodle  --display-name "python(doodle)"
    提示

    您需在对应的Conda环境中运行上述命令,否则内核(kernel)将无法正确注册。

  2. 刷新页面,单击论文复现图标返回Launcher页面,单击选择Notebook板块下已注册的环境,本例选择上步已激活的 "python(doodle)" 内核,例如下图所示。

    论文复现

  3. 切换至run.ipynb,如下图高亮①所示;点击右上角(如下图高亮②所示),选择“python(doodle)”环境,如下图高亮③所示;点击 论文复现图标执行文件,例如下图高亮④所示。

    论文复现

  1. 脚本运行过程中可打开codelab/DISC-MedLLM/code/output_dirs目录查看输出文件,该目录下有“DISC_MedLLM”和“logs”两个目录。

    论文复现

DISC_MedLLM目录存储项目的实验结果,例如下图所示。

论文复现

查看结果

  1. 根据日志提示,在模型微调完成后,返回至codelab/DISC-MedLLM/code/run.ipynb文件,单击运行按钮,如下图高亮①所示,加载已微调完成的模型checkpoint(检查点),如下图高亮②所示。

    论文复现

  2. 检查点加载完成后,系统将基于训练后的模型生成推理结果,如下图所示。

    论文复现

总结

上述流程完整呈现了项目的复现路径。用户可依据本方案的步骤与方法,在项目列表中选择感兴趣的内容,参照对应项目的README文件完成环境搭建、根据.ipynb可运行文件完成模型微调及推理等环节。该方法显著降低了环境配置的复杂度,有助于将精力聚焦于算法理解、实验验证与创新优化,具备较强的实用性与可推广性。