训练一整天效果只能停留在简单对话的状态

采用的这个项目

GitHub - jingyaogong/minimind: 🚀🚀 「大模型」2小时完全从0训练26M的小参数GPT!🌏 Train a 26M-parameter GPT from scratch in just 2h!

看来只能进行微调,不能从零开始

但我已力不从心了,以后再说吧