跳到主要内容

论文复现体验

更新时间:2025-08-17 14:50:25

前提条件

  • 您已经获取大模型实验室账户和密码,如果需要帮助或尚未注册,可参考注册账户完成注册。
  • 当前账号的余额充裕,可满足论文复现的需要。

概览

论文复现界面主要由筛选区和论文列表两部分组成。

论文复现

序号模块名称说明
论文筛选可通过设置所属期刊、领域,关键词,年份等对论文进行筛选。
论文列表展示论文信息,原文及代码链接。

操作步骤

  1. 选择您想要复现的论文,点击“立即体验”,选择JupyterLab、VSCode或者LLaMA Factory Online实例,以下示例以《Attention is All You Need》为例。

    论文复现

    提示

    LLaMA Factory Online类型的实例需要在管理后台配置,配置之后您可启动LLaMA Factory的WebUI实例,您可在实例内进行对应的模型训练、评估、对话、或者导出等操作。

  2. 配置合适的资源及卡数,点击“启动”进入JupyterLab。

    项目复现

  3. 进入codelab/attention-is-all-you-need/code目录,“attention-is-all-you-need”项目下的文件目录包括:code、dataset、model,具体说明如下表所示。

    目录
    文件名称说明
    code存储代码文件,可读取,可写入。
    dataset存储项目数据集,只可读。
    model存储项目模型,只可读。

点击“Terminal”进入终端。您可选择使用系统预置的默认环境或自定义环境进行论文复现。

  1. 如果您使用默认环境进行论文复现,且为首次操作,请运行以下命令配置环境。

    1. 运行如下所示的命令激活系统内置的论文环境。
    conda activate attention
    1. 运行如下所示的命令,在已经激活的Python环境中安装ipykernel包。
     pip install ipykernel -i https://pypi.tuna.tsinghua.edu.cn/simple
    1. 运行如下所示的命令,将当前Python环境注册为Jupyter内核。
     kernel_install --name attention  --display-name "python(attention)"
    提示

    您需在对应的Conda环境中运行上述命令,否则内核(kernel)将无法正确注册。

  2. 刷新页面,单击论文复现图标返回Launcher页面,单击选择Notebook板块下已注册的环境,本例选择上步已激活的 "python(attention)" 内核,例如下图所示。

    论文复现

  3. 切换至paper_reproduce.ipynb,如下图高亮①所示;点击右上角(如下图高亮②所示),选择“python(attention)”环境,如下图高亮③所示;点击 论文复现图标执行文件,例如下图高亮④所示。

    论文复现

    提示

    该论文训练时长:epoch为400,训练时长应为60 min左右。

  1. 查看论文复现结果。打开codelab/attention-is-all-you-need/code/work_dirs目录,该目录下有“result”和“logs”两个目录。

    ① “result”目录。训练好的模型权重位于 ../work_dirs/results/,为 model.chkpt,同时可在该目录下查看训练和评估得分记录 train.log val.log,结果如下图所示。

    论文复现

    论文复现

    ② “logs”目录,存储项目复现过程中的日志。日志文件如下图所示。

    目录