1.概述
今天老同事发了一张图片,
结果后面有几个家伙回了“中毒了。。。”“这是挖墙脚的节奏么”(对了,这个老同事也离职了)。
本来也想说上几句的,发现激情难在。
不过,最近了解到DIP、DM、ML、NPL方面的知识。让大脑跑一遍吧。
主题:如何过滤图片?
首先,要做基础的技术点了解。
2.DIP
Dip,Digital Image Processing,数字图像处理。
其能够做什么?
图像灰度处理,二值化,反色,分割,投影,识别。
典型应用:验证码识别,车牌号码识别,借助ML可以实现人脸识别库。
3.DM
DM,Data Mining,数据挖掘。
其提供了对数据分析处理的一种科学的方法。
典型的例子:啤酒与尿布。
包括聚类分析,决策树等理论。
4.ML
ML,Machine Learning,机器学习。
其能够做什么?
简要地说,就是能够学以致用。包括有监督的学习和无监督的学习。
包括一堆的分类器算法,如SVM。
5.NLP
NLP,Natural Language Processing,自然语言处理。
人工智能的一个分支,先通过分词,语义分析,再用ML或DM做后续步骤。
典型应用:垃圾短信过滤,自动邮件回复等。
6.重点:识别广告图片的过程构想
Steps:
1) 训练;
2) 入训练库;
3) 输入测试集;
4) 输出识别字符;
5) 调用中文分词;
6) 通过分词结果到关键字库匹配,成功,则表明需要过滤。
后续怎样,听天由命吧~~