继续分享一个某马拉雅的数据,关于问答类型的,可以进行分段进行回答,数据量比较大,上百万。效果也比较好。有需要的朋友可以进行下载进行参考学习。
规则特色:
数据量200w+(因为我也没采完,根据id直接循环的)
过滤了一些无用的词和违规词
重新数据进行排版优化
规则使用版本为火车头9.8以上版本
注意:
只用于合法用途和ai训练使用,切勿做违法!
继续分享一个某马拉雅的数据,关于问答类型的,可以进行分段进行回答,数据量比较大,上百万。效果也比较好。有需要的朋友可以进行下载进行参考学习。
规则特色:
数据量200w+(因为我也没采完,根据id直接循环的)
过滤了一些无用的词和违规词
重新数据进行排版优化
规则使用版本为火车头9.8以上版本
注意:
只用于合法用途和ai训练使用,切勿做违法!