TorchGeo是一个类似于torchvision的PyTorch领域库,专注于地理空间数据相关的数据集、采样器、转换和预训练模型。它能处理多光谱、不同坐标系统和分辨率的地理空间数据集,有多种采样器方便采样,支持特定传感器预训练的模型权重,还与Lightning框架良好集成用于不同任务的训练,包括在多种数据集上的操作示例。这个库为机器学习专家处理地理空间数据以及遥感专家探索机器学习方案提供了极大的便利。
Promptimizer是一个实验性的提示优化库。它能自动化针对特定任务优化提示的过程。使用者提供初始提示、数据集和自定义评估器等,它就能运行优化循环生成优化提示。比如在简单的推文生成任务中,可按安装、创建任务、定义评估器、训练等步骤操作。在训练时先加载数据和提示,评估基线指标,然后循环优化,还能添加人工标签参与优化。整个项目功能丰富,有很多值得探索之处。
InsaneLife/ChineseNLPCorpus是一个综合性的中文自然语言处理数据集项目。它包含多种类型的数据集,像阅读理解数据集有DuReader等不同种类;任务型对话数据集包括MedicalDS等;文本分类、情感分析、实体识别等方面也有诸多相关数据集。这些数据为做相关实验提供了丰富的材料,并且项目欢迎补充提交合并。任何人对这个项目有想法或者有使用经验都可以参与讨论。