写给设计师的人工智能指南:图像

“在未来30年,

人工智能将取代目前世界上50%的工作。”

——莱斯大学 计算机科学教授 Moshe Vardi

不管未来怎么样,我觉得提高设计师的效率是眼前最容易做到的事情。

设计师打交道最多是图像,各种图案、照片、视觉设计稿,都离不开图像。而图像识别正是人工智能的典型应用之一。

所以本期选择了这一主题。

我们先看最简单的例子。

验证码的识别,属于比较简单的图像识别技术:简单的图像分类器

大致的识别过程:

1)待测试的图片灰度化并二值化

2)预先装载特征库

3)物体轮廓检测

4)扫描待测图片,并进行特征码比对,匹配优先

其实关键在于特征库

如果我们的特征库足够强大,那随便啥验证码都可以完美识别啦。

是不是这么说?

再看难一点的图像识别类型:

人脸识别

我们可以打开支付宝,体验下人脸识别;

我是觉得还可以,不知各位体验如何?

那么,人脸识别是什么技术呢?

1、采用的是深度学习,要了解深度学习就得去了解机器学习;

Machine Learning是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

随着这几年硬件设备的发展,机器学习的研究进展也提速了,网上也有许多的开源机器学习库,这里推荐谷歌的tensorflow

2、机器学习的算法很多,部分如下所列:

决策树

随机森林算法

逻辑回归

SVM

朴素贝叶斯

K最近邻算法

K均值算法

Adaboost 算法

神经网络

马尔可夫

选一种合适的算法很重要,为什么?

复杂的算法并不一定解决问题,得看具体的应用场景。

比如前段时间,我用了K-means聚类,对照片的颜色进行的提取,完成了我的一款app:

「 采色灵感」。有兴趣可以下载体验下ios版。

这个算法其实非常简单,把数据投射到一个坐标空间中,通过不断地取离种子点最近均值的算法。

最后,我通过它提取到了图像颜色的分类。我把它限制到了4个以内。

太多其实没多大用处,还不如打开ps用取色器,一个个像素取,对吧?

基于图像,提取特征值,我这里仅仅是进行了颜色这一特征的提取,还算比较简单。

回过头来看人脸识别,需要提取的特征值就复杂多了,主流的方法有EigenFace、FisherFace、LBPHFace三种,加上还有其他各种各样的变种方法,在opencv都有提供。

眼睛、鼻子、嘴巴。。不是这么好识别的,不过,作为设计师我们可以了解图像识别的基本技术路线:

结合大量公开和独有的训练数据集,在超级计算机上学习并提取照片特征,实现高效准确的标定和识别。

记住,一定要大量,只有保证训练数据的大量,才有可能得出相对准确的模型。

这里,如果有兴趣,我们可以用开源的技术框架,进行图像识别的实验。

OpenCV ,包含从底层的图像颜色空间转换到高层的机器学习工具。

可以尝试的项目:

1、做特征匹配,当下最常用和前沿的“以图搜图”的实现方法

2、做人脸对齐,人脸识别和人脸中的五官识别

3、实现监控视频的行人识别与跟踪

关于人脸识别这块,还可以试试科大讯飞的开放平台提供的服务,提供一张图像,科大讯飞返回一张坐标。至于可以有哪些具体应用,设计师们可以创作下~

这里我找到了相关的图像识别的应用案例

深绘。机器够识别图片中的人物主题和服装,读懂图片中的模特框架、动作、姿态甚至是着装的效果,然后根据不同的需求来裁剪图片以配合不同模板、屏幕的需求。同时帮助商家完成设计、排版、上架等一系列的工作,而且最快只需要几分钟就可以全部搞定。

深绘的技术类似于人脸识别相关技术,只是应用在服装模特照片上。深绘,采用的应该是大量的服装训练集,把模特的动作、姿态、着装效果等进行标记,进行机器学习。期间要用到图像识别、机器学习等相关技术。

tensorflow的相关开源项目

源代码开源哦,想怎么改都行,而且可以跟着作者的思路实现下。

图像描述,即看图说话。image caption:im2txt

基于MNIST数据集的手写数字识别,tensorflow其中最广为人知的example。

这一期就这样吧。

下一期我有可能会更新的主题:

1、聊天机器人的技术;

2、人工智能助理;

3、用人工智能来完成艺术创作,如写作、作诗、谱曲、画画等。

人工智能相关文章:

Javascript也可以玩机器学习

《机器学习》入门的26个概念。笔记1


(0)

相关推荐

  • AI的发展(一)

    人工智能是集合了计算机科学逻辑学生物学心理学和哲学等众多学科,在语音识别图像处理自然语言处理自动定理证明及智能机器人等应用领域取得了显著成果人工智能在社会发展中扮演着不可或缺的角色人工智能在提升劳动效 ...

  • 什么是模式识别?

    在 5 岁时,大多数孩子可以识别数字和字母--小字符.大字符.手写.机器打印或旋转--所有这些都很容易被年轻人识别. 在大多数情况下,最好的模式识别器是人类,但我们不了解人类如何识别模式. 模式识别是 ...

  • 《最强大脑》人机大战最大价值:小度们从此走到各行各业中去

    在Master全胜人类围棋选手之后,另一场人机大战正在进入尾声:百度小度机器人已在<最强大脑>完成三期挑战,分别取得3:2.1:1.2:0的成绩,两胜一平,直接晋级<脑王决赛> ...

  • 写给设计师的人工智能指南:推荐系统

    这个系列的文章已经写了5篇了. 指南:图像 指南:虚拟私人助理 指南:Tensorflow快速入门 指南:   JS框架Synaptic 指南:如何找出相似的文章 点击可以查看往期. 本期更新第6篇文 ...

  • 写给设计师的人工智能指南:如何找出相似的文章

    这个系列的文章已经写了5篇了. 指南:图像 指南:虚拟私人助理 指南:Tensorflow快速入门 指南:   JS框架Synaptic 点击可以查看往期. 本期更新第5篇文章, 聊聊文本挖掘中的 & ...

  • 写给设计师的人工智能指南:JS框架Synaptic

    上一篇写了tensorflow,发现tf对于设计师来说,其实门槛有点高.要折腾各种配置,还要gpu...其实是不利于快速入门的. 今天更新一篇,选择了一个js框架,非常容易使用. 本系列其他文章可点击 ...

  • 写给设计师的人工智能指南:Tensorflow快速入门

    本篇是<写给设计师的人工智能指南>系列的第3篇,本期主要想帮助大家最快速度地上手tensorflow. 前2期的文章可以点击以下链接,快速回顾: 给设计师的人工智能指南:图像 给设计师的人 ...

  • 写给设计师的人工智能指南:虚拟私人助理

    本期谈谈 <虚拟私人助理>相关的内容. 我们先大致看下人工智能10大细分行业的典型应用: 1.深度学习/机器学习: 预测数据模型与分析数据的软件平台: 垃圾邮件检测: 金融诈骗检测: 2. ...

  • 写题两个月了,框架是真会了,论述是真瞎写 | 你的十一月提升指南

    ⏳ 已经十一月了呀. 今天这篇推送的灵感来源于昨晚后台的一条留言,她是这么说的:最佳发现自己写题的时候,知其然而不知其所以然怎么办--题目的框架和搭的特别快,知识点也能很快的找到,但是论述就毫无生命力 ...

  • 从0开始写小说,这本指南最容易上手!

    书海泛舟,人间清欢 这是书语人间为你解读的第656本书 <从零开始写小说> 大家好呀~ 今天,灵遥将为你带来一本新书,名字叫做<从0开始写小说>. 收到这本书已经有一阵子了,一 ...

  • 帮助指南 | 图像失真。/画面闪烁。

    图像失真./画面闪烁. 检查连接以及天线和外围设备的位置 检查天线/有线连接. 使天线/有线远离其他连接电缆. 当安装选购设备时,在设备和电视机之间留出一些空间. 务必使用高质量75欧姆同轴电缆连接天 ...

  • 帮助指南 | 图像正常,但没有声音。

    图像正常,但没有声音. 检查天线/有线连接. 将电视机连接到交流电源线,然后按电视机或遥控器上的电源按钮. 检查音量控制. 按静音/ (静音)或音量/ (音量) + 按钮取消静音. 按 (快速设置)按 ...