中文词向量

站内搜索

站内搜索

Embedding/Chinese-Word-Vectors：提供100 +预训练中文词向量

Embedding/Chinese - Word - Vectors项目提供100多种预训练中文词向量，这些向量通过不同表示形式、上下文特征和语料库训练。项目提供CA8数据集和评估工具包，向量文件为文本格式，有多种特征及技术支撑，包括不同表示方法、上下文特征的运用、多领域语料库收集、特定工具包训练等内容，对于中文词向量相关研究和应用有很大价值。

327 0