Llama-ocr-基于Llama 3.2视觉的文档转Markdown OCR库
LlamaOCR是一个Node.js库,旨在利用TogetherAI的Llama 3.2端点进行图像解析并转换为Markdown内容。它可通过npm安装,目前支持图像文件(即将支持PDF),提供线上演示。其使用方式是导入ocr函数并传入图像路径和API密钥等参数获取Markdown结果。项目规划包括对本地图像、远程图像、单页PDF、多页PDF以及JSON输出等多方面的支持完善。它的出现为文档转换提供了新的途径,对于有此类需求的开发者或用户来说是一个值得关注的项目。