OCR + 大模型识别。上传 PDF 或图片后,系统会自动提取图纸内容并生成结构化 BOM 结果,适合常规图纸的快速识别与核对。
多模态大模型识别。上传 PDF 或图片后,系统自动完成图纸理解与结构化 BOM 提取,适合复杂图纸的快速识别与核对。
纯多模态工序识别。上传机械零件图(支持 PDF / PNG / JPG / JPEG),系统**仅靠多模态大模型**理解图纸的几何形状、关键尺寸、材料与热处理要求,自动推断完整工艺路线(下料 → 粗加工 → 热处理 → 精加工 → 钳工 → 检验)并估算单件工时定额。
OCR + 多模态联合工序识别。先用 PaddleOCR 把图纸上的工序号、温度、HRC、Ø/SR/R 尺寸、角度、单件工时等数字精确读出来,再与图像一起送多模态模型联合判读:数字以 OCR 为准、文字语义以图像为准,可显著降低多模态对近形数字(3/8、6/8、0/Ø)的混淆。与方案三返回字段一致,便于横向对比识别质量。