【Github】项目名:mathAI – 拍照做题程序识别数学计算式及结果
项目简介
mathAI是一个半开源项目,它是一个拍照做题程序。用户输入包含数学计算题的图片,程序能输出识别出的数学计算式和计算结果。目前上传版本只能处理简单的一维加减乘除算术表达式,想要处理更复杂表达式可参考相关论文。
核心技术
整个程序用Python实现,处理流程涵盖图像预处理、字符识别、数学公式识别、数学公式语义理解和结果输出。用OpenCV对输入图像预处理,将字符裁剪并归一化为固定大小矩阵。在TensorFlow上实现lenet5卷积神经网络识别数学字符(训练使用CHROME数据集),采用编译原理的算符优先法和递归下降法将识别出的字符组织成数学公式,根据属性文法的值传递思想计算公式的值,最后用python的matlibplot库打印计算过程和答案。
项目总结
mathAI是一整套拍照做题的算法框架,能处理多种计算题,这在目前市面上比较少见。但它也存在一些不足,如字符空间关系判断仅用人类启发式规则、图像预处理不够鲁棒、数学公式结构识别算法不够完美等。欢迎大家留言讨论这个项目的改进或者分享自己的使用体验等。
项目地址
数据统计
数据评估
本站链氪巴士提供的mathAI:拍照做题程序识别数学计算式及结果都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由链氪巴士实际控制,在2024年12月6日 上午12:00收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,链氪巴士不承担任何责任。
相关导航
brightmart/albert_zh是一个基于TensorFlow实现的ALiteBertForSelf - SupervisedLearningLanguageRepresentations项目。提供多种版本的中文ALBERT预训练模型,包括不同参数规模和性能特点的模型。项目涵盖预训练、下游任务微调的代码示例,还有如转换为TensorflowLite格式进行移动端部署的操作及性能测试等内容。详细展示了ALBERT模型对BERT的改进之处,如词嵌入向量参数因式分解、跨层参数共享、段落连续性任务等改进方式。这对于自然语言处理研究和应用开发有很大的参考价值。