写给设计师的人工智能指南:图像
“在未来30年,
人工智能将取代目前世界上50%的工作。”
——莱斯大学 计算机科学教授 Moshe Vardi
不管未来怎么样,我觉得提高设计师的效率是眼前最容易做到的事情。
设计师打交道最多是图像,各种图案、照片、视觉设计稿,都离不开图像。而图像识别正是人工智能的典型应用之一。
所以本期选择了这一主题。
我们先看最简单的例子。
验证码的识别,属于比较简单的图像识别技术:简单的图像分类器。
大致的识别过程:
1)待测试的图片灰度化并二值化
2)预先装载特征库
3)物体轮廓检测
4)扫描待测图片,并进行特征码比对,匹配优先
其实关键在于特征库。
如果我们的特征库足够强大,那随便啥验证码都可以完美识别啦。
是不是这么说?
再看难一点的图像识别类型:
人脸识别。
我们可以打开支付宝,体验下人脸识别;
我是觉得还可以,不知各位体验如何?
那么,人脸识别是什么技术呢?
1、采用的是深度学习,要了解深度学习就得去了解机器学习;
Machine Learning是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
随着这几年硬件设备的发展,机器学习的研究进展也提速了,网上也有许多的开源机器学习库,这里推荐谷歌的tensorflow。
2、机器学习的算法很多,部分如下所列:
决策树
随机森林算法
逻辑回归
SVM
朴素贝叶斯
K最近邻算法
K均值算法
Adaboost 算法
神经网络
马尔可夫
选一种合适的算法很重要,为什么?
复杂的算法并不一定解决问题,得看具体的应用场景。
比如前段时间,我用了K-means聚类,对照片的颜色进行的提取,完成了我的一款app:
「 采色灵感」。有兴趣可以下载体验下ios版。
这个算法其实非常简单,把数据投射到一个坐标空间中,通过不断地取离种子点最近均值的算法。
最后,我通过它提取到了图像颜色的分类。我把它限制到了4个以内。
太多其实没多大用处,还不如打开ps用取色器,一个个像素取,对吧?
基于图像,提取特征值,我这里仅仅是进行了颜色这一特征的提取,还算比较简单。
回过头来看人脸识别,需要提取的特征值就复杂多了,主流的方法有EigenFace、FisherFace、LBPHFace三种,加上还有其他各种各样的变种方法,在opencv都有提供。
眼睛、鼻子、嘴巴。。不是这么好识别的,不过,作为设计师我们可以了解图像识别的基本技术路线:
结合大量公开和独有的训练数据集,在超级计算机上学习并提取照片特征,实现高效准确的标定和识别。
记住,一定要大量,只有保证训练数据的大量,才有可能得出相对准确的模型。
这里,如果有兴趣,我们可以用开源的技术框架,进行图像识别的实验。
OpenCV ,包含从底层的图像颜色空间转换到高层的机器学习工具。
可以尝试的项目:
1、做特征匹配,当下最常用和前沿的“以图搜图”的实现方法
2、做人脸对齐,人脸识别和人脸中的五官识别
3、实现监控视频的行人识别与跟踪
关于人脸识别这块,还可以试试科大讯飞的开放平台提供的服务,提供一张图像,科大讯飞返回一张坐标。至于可以有哪些具体应用,设计师们可以创作下~
这里我找到了相关的图像识别的应用案例:
深绘。机器够识别图片中的人物主题和服装,读懂图片中的模特框架、动作、姿态甚至是着装的效果,然后根据不同的需求来裁剪图片以配合不同模板、屏幕的需求。同时帮助商家完成设计、排版、上架等一系列的工作,而且最快只需要几分钟就可以全部搞定。
深绘的技术类似于人脸识别相关技术,只是应用在服装模特照片上。深绘,采用的应该是大量的服装训练集,把模特的动作、姿态、着装效果等进行标记,进行机器学习。期间要用到图像识别、机器学习等相关技术。
tensorflow的相关开源项目
源代码开源哦,想怎么改都行,而且可以跟着作者的思路实现下。
图像描述,即看图说话。image caption:im2txt
基于MNIST数据集的手写数字识别,tensorflow其中最广为人知的example。
这一期就这样吧。
下一期我有可能会更新的主题:
1、聊天机器人的技术;
2、人工智能助理;
3、用人工智能来完成艺术创作,如写作、作诗、谱曲、画画等。
人工智能相关文章: