训练
此文件夹包含各种示例,用于为特定任务微调 SentenceTransformers
。
首先,我建议您查看语义文本相似度(STS)或自然语言推断(NLI)的示例。
有关如何训练您自己的模型的文档,请参阅训练概述。
训练示例
adaptive_layer - 训练模型的示例,其层可以动态移除以加快推理速度。
avg_word_embeddings - 此文件夹包含基于经典词嵌入(如 GloVe)训练模型的示例。这些模型速度极快,但准确性低于基于 Transformer 的模型。
clip - 训练 CLIP 图像模型的示例。
cross-encoder - 训练 CrossEncoder 模型的示例。
data_augmentation - 如何应用数据增强策略来改进嵌入模型的示例。
distillation - 使模型更小、更快、更轻量的示例。
hpo - 使用超参数搜索为您的任务找到最佳超参数的示例。
matryoshka - 训练嵌入模型的示例,其嵌入可以被截断(允许更快的搜索)而性能损失最小。
ms_marco - 在 MS MARCO 信息检索数据集上进行训练的示例训练脚本。
multilingual - 现有的单语模型可以扩展到多种语言(论文)。此文件夹包含将现有模型扩展到新语言的分步指南。
nli - 自然语言推断(NLI)数据对于预训练和微调模型以创建有意义的句子嵌入非常有帮助。
other - 用于展示特定训练案例的各种微小示例。
paraphrases - 训练能够识别意译的模型的示例,即理解文本在用词不同时具有相同含义。
quora_duplicate_questions - Quora 重复问题是一个大型语料库,包含来自 Quora 社区的重复问题。该文件夹包含如何训练模型进行重复问题挖掘和语义搜索的示例。
sts - 训练模型最基本的方法是使用语义文本相似度 (STS) 数据。在这里,我们有一个句子对和一个表示语义相似度的分数。