目前我这边的方案是:人脸检测用 OpenCV DNN 跑 YuNet;车牌检测用 PyTorch 跑 YOLOv8,不过模型好像没用中文车牌数据集训练。两个都是各自领域的专用模型。 问题是,一帧图像得分别跑两次模型,效率偏低。在没有 GPU 的情况下,我的笔记本每秒大概只能处理 3~5 帧,体验还是比较差。如果能有一个面向图像脱敏场景(人脸 + 车牌 + 文字)的多任务检测模型,而且是基于国内数据集训练的,应该会大大提升效率和准确性。 我问了 GPT,开源界好像还没人做这类专门用于脱敏的一体化模型。如果有人做了,感觉在国内还是挺有市场的。 回复
目前我这边的方案是:人脸检测用 OpenCV DNN 跑 YuNet;车牌检测用 PyTorch 跑 YOLOv8,不过模型好像没用中文车牌数据集训练。两个都是各自领域的专用模型。
问题是,一帧图像得分别跑两次模型,效率偏低。在没有 GPU 的情况下,我的笔记本每秒大概只能处理 3~5 帧,体验还是比较差。如果能有一个面向图像脱敏场景(人脸 + 车牌 + 文字)的多任务检测模型,而且是基于国内数据集训练的,应该会大大提升效率和准确性。
我问了 GPT,开源界好像还没人做这类专门用于脱敏的一体化模型。如果有人做了,感觉在国内还是挺有市场的。