训练一整天效果只能停留在简单对话的状态
采用的这个项目
GitHub - jingyaogong/minimind: 🚀🚀 「大模型」2小时完全从0训练26M的小参数GPT!🌏 Train a 26M-parameter GPT from scratch in just 2h!
看来只能进行微调,不能从零开始
但我已力不从心了,以后再说吧