Embedding/Chinese - Word - Vectors项目提供100多种预训练中文词向量,这些向量通过不同表示形式、上下文特征和语料库训练。项目提供CA8数据集和评估工具包,向量文件为文本格式,有多种特征及技术支撑,包括不同表示方法、上下文特征的运用、多领域语料库收集、特定工具包训练等内容,对于中文词向量相关研究和应用有很大价值。