未来已来(四)——Python学习进阶图谱

如下,是我们学习Python编程的路径选择:A1-A2是必修,A3系列是个人根据自己的方向进行选择,A4及其之后则是人工智能线的深度学习路径。

(A1-A2)必修

等级 课程 内容 项目 目标
A1 初识AI 1. 人工智能科普:本质、应用、起源、学习路径
2. Python基础语法知识:输入、输出、变量、条件判断
1. 本地编程环境配置
2. 编写简易人机对话小游戏
3. 体验人工智能代码
1. 了解人工智能本质和应用,制定自己的学习路径
2. 掌握基本数据类型及转换关系
3. 会写输入和输出
4. 掌握条件判断的用法
A2 基础语法 1. 数据类型:布尔值、列表、字典
2. 控制流:for循环和while循环
3. 函数的用法和写法,使用open()函数完成文件读写
4.Python面向对象的编程思想
1. 文字冒险游戏
2. 学会给代码做debug
3. 封装、使用函数及模块
4. 将python代码制作为可执行文件,双击执行
5. 乘法表
6. 小乌龟画国旗
7. bad_apple字符画视频
8. 打印星阵图
通关基础语法,为后续的人工智能应用做铺垫

(A3)自选

等级 课程 内容 项目 目标
A3-1 人工智能应用 1. 调用模块的通用方法
2. 自学新模块的通用方法
3. 利用requests、json调用人工智能接口
4. 简单人工智能库的调用:如jieba
待填充 1. 学会调用已有人工智能技术:语言识别、图像识别、自然语言处理、人脸识别、图像处理、计算机视觉……
2. 能够自学简单的模块,实现一些简单的功能:打开浏览器/制作二维码/发邮件/定时执行任务
A3-2 网络爬虫 1. HTML基础
2. Xpath/BeautifulSoup/PyQuery/selenium爬虫常用模块的使用
3. Scrapy框架使用和数据存储
4. 常见应对反爬虫技巧
1.新浪财经股票信息爬虫 1. 能够从网络上自动抓取自己需要的信息:商业分析、舆情监测、生活助手
2. 胜任初级爬虫工程师(需额外学习A3-4)的工作
A3-3 Git与项目实现 1. 掌握git语法管理自己的代码
2. 加入开源协作社区github
3. 小型项目的实现步骤
4. 图形化界面Tkinter模块
5.实战练习
待填充 1. 学会使用git对自己的代码进行版本管理
2.学会借助github上的开源代码提高工作效率,使日常重复、繁琐的工作自动化完成
3. 掌握项目实现的完整思路,开发出自己的独立小程序
4. 能够完成图形化界面程序,开发桌面应用
A3-4 数据科学 1.SQL语法,使用Python接入数据库
2. 数据分析模块:Pandas、NumPy、SciPy…
3. 数据可视化模块:matplotlib、Seaborn、ggplot…
1. 量化交易(需要通关A3-3和新浪财经爬虫项目,推荐有金融理财相关背景的学员) 1. 掌握数据库管理、数据分析、数据可视化的技能
能够制作数据看板,实现数据指标监控
3. 能够胜任数据运营、初级爬虫工程师(需额外学习A3-3)、量化交易、初级BI商业分析师等工作
A3-5 自动化办公 1. 文档管理:shutil和zipfile,自动完成复制/移动/改名/删除/读取/解压/压缩
2. 数据处理:openpyxl和csv,自动处理excel和csv数据
3. 文字处理:docx和pyPDF2,处理word和pdf文档
4. 信息传输:使用Python发送邮件/微信/短信
待填充 借助Python处理日常办公文档,使繁琐、重复性的工作自动化
A3-6 多媒体处理 1. 图像编辑:Pillow库处理图片,实现拷贝/粘贴/合并图片、放大缩小、分离和合并通道、几何转变、模式转换、图像增强、模糊特效、添加文字/数字、转变字符画…… 2. 通过openCV可实现计算机图像、视频的编辑。应用图像识别、运动跟踪、机器视觉等 视频编辑与音频编辑 学会使用Python自动化处理多媒体文件,提高设计师工作效率
A3-7 web开发 1. 前端:HTML5、CSS、Javascript、JQuery库
2. 后台:Django框架技术
3. 项目实战练习
待填充 利用Python胜任web开发工作,实现:新闻、购物、导航、博客、论坛等网站的搭建
A3-8 自动化测试 1. 软件测试的分类与环境搭建
2. 元素定位与浏览器控制
3. 自动化测试模型介绍
4. Selenium深度应用
5. 自动化测试实战
待填充 帮助测试人员提高综合的技术高度与宽度,从而摆脱简单的手工测试,向高级测试工程师的道路迈进。
A3-9 自动化运维 1. Linux基础
2. 服务器软件安装与管理
3. 高并发下的Web架构
4. Python自动化运维
5. Python自动化监控/报警/安装配置/部署
6. Docker 容器实战
9. 自动化运维管理实战
待填充 IT运维自动化是一组将静态的设备结构转化为根据IT服务需求动态弹性响应的策略,实现减少人工干预、降低人员成本以及出错概率,实现:堡垒机、CMDB、全网监控、主机管理等。

备注:

  1. A3内容呈并列关系,在完成A1-A2的学习之后,可根据需要进行选择学习

  2. 如果希望去做金融理财的量化分析,至少需要修A3-2和A3-4,并且完成项目《新浪财经股票信息爬虫》和《量化交易》

  3. 如果希望去学习更加深度的A4、A6知识,至少需要完成:A3-1、A3-2、A3-3、A3-4的学习

  4. A3-7至A3-9明显偏技术向,推荐有相关工作需求的学员选择

(A4)自选

等级 课程 内容 项目 目标
A4 多元统计分析和机器学习 1. 高等数学、概率论与数理统计…
2. 机器学习十大算法:有监督算法、无监督算法
3. 集成算法
4. Scikit-Learn框架
待填充 1. 掌握机器学习常用算法思想,如最近邻算法、聚类算法、决策树、随机森林等
2. 能够利用python建立机器学习模型,对一些应用场景进行智能化,比如用户聚类、用户流失预测、用户付费预测、垃圾邮件识别、产品等级划分、智能推荐等
3.可转向数据分析工程师、机器学习算法工程师、搜索算法工程师、推荐算法工程师

(A5-A6)自选

等级 课程 内容 项目 目标
A5 深度学习(一) 1. 神经网络算法入门:RNN/CNN…
2. 深度学习框架学习:TensorFlow、Keras
待填充 1. 掌握深度学习常用框架:Tensorflow、Keras的基本语法
2. 可自行搭建图像相关算法,实现图像分类、人脸识别、目标检测等
3. 可自行搭建NLP常见算法,实现文本分类、文本自动生成、问答系统等
4.人工智能工程师(初阶)
A6 深度学习(二) 1. GAN网络(生成对抗网络)
2. 强化学习算法
3. 项目实战、大型赛事
待填充 1. 掌握GAN网络相关算法,实现图像、文本等生成任务,如风格迁移、图像自动上色、图像美化、图像超分辨率、对话系统等
2. 掌握强化学习相关算法,利用强化学习完成最优策略生成任务,如AlpahGO、推荐算法、文本生成等
3. 人工智能工程师(进阶)

未来已来(三)——同九义何汝秀

其实,这篇文章还有一个正常版的标题是:学了编程之后,同是新手的他们做了什么?

如果让我来讲给你,学编程这事多有意思,事情会变得很不得体:我写了太多程序,我对这事有太多的喜欢,以至于很难对你讲述得清楚。

当你习惯了编程给工作生活带来的快乐和高效,你就再也回不到过往的那种节奏去。

比如,现在你正读的这篇文章,是我用Markdown(一个特别高效的文档书写工具,需要借助编码)的语法在VS Code(写代码用的编辑器)上写的,我用git做版本管理,最后它以gitbook的形式发布。而word,是再也回不去了。

或许你还看不明白我上一段在说什么,没关系,再往前走一点点,你也可以感受到这种便利和快乐。

下面,我要讲给你四个编程初学者的故事,他们利用编程,做出了好些有趣、有用的事情。它们,都发生在我的身边。

(一)一个大学生,在用Python预言P2P暴雷

A君以前是我们这里的一个数据分析实习生,他在广州的华南理工大学念金融。因为父母早年做生意,家境会比较优渥。

近几年P2P很火,高收益率吸引了许多人。去年底的时候,父母想买一些,但是又常听说机构卷钱跑路的新闻,自己不懂,所以来问问自己家的大学生。

A君懂得P2P运作原理,一部分人通过中间机构把钱借出去赚利息,一部分人通过中间机构借到钱解燃眉之急。他也懂收益越高,风险越高的道理。

但这些,都是大道理,不能解决问题。告诉自己父母也没什么用。

他决定做点定量的分析。

首先,他用Python写了一个爬虫,把众多P2P机构的评论、利率、交易的历史数据全都抓取了下来。

接着,他利用别人已经做好的一个人工智能模型,总结出那些破产跑路的平台,具有哪些数据特征。

把现在的机构和历史跑路的机构做了对比,这一比麻烦了:有问题,即将跑路的机构一大把。

P2P整个行业都要地震。

他告诉父母:别买了,这个铁定会出事。把钱先正常存着吧。要真想买,可以买点外币。

后来的事情大家都知道了,2018年P2P大面积暴雷,机构跑路,多少人血本无归。

2018-09-21-16-58-44

这是当时正常,但是他预言会暴雷跑路的名单节选:

潮人贷、他项车贷、Aoao贷、酷宝盒、月月贷、首库金融、绿谷贷融资、五岳贷、国泰财富、吉盟财富、千店贷、华众时贷、富轩投资、升值贷、互贷网……

此外,他还做出一份避雷指南给家人:

  1. 已上线时长越长、获得ICP许可证、加入监管协会、平台背景为国资系、上市系、银行系和风投系的P2P平台,其风险要相对低一点。

  2. 对于平台的运营模式,参考投资期限越长,每天展示交易数据的P2P平台,其风险越低。

  3. P2P平台的投标保障这种东西基本没用。

  4. 对于网友评论信息,网友印象评价的前七个关键词中,出现“老板牛”、“提现快”的P2P平台,其风险相对较低,而出现“坑爹”关键词的P2P平台,则风险较高。

  5. 对于平台交易信息,平均参考收益率大于8.4%时,P2P平台的风险急剧上升。对于用户评价信息,平均提现分大于3.5分的P2P平台,风险越低。

(二)我的同事,在用Python做社群运营

作为一家做在线教育的公司,我们会有非常多的微信群聊。

在一期课程结束之后,为了防止群聊里长出小广告来,打扰到用户,通常我们会把群聊解散。

如果量少还好,但如果数量多了,就会让人头痛:这一个个可得点多久啊!

在这样的情况下,负责这事的酱酱就跑来问我:“吴枫呀,有没有什么办法,把这个群聊给自动解散掉。”

那时,我正忙于研发Python课程,正好缺人来试学。我就讲:“办法当然是有的,不过你得自己学。我教你Python,学会了你自己写。”

……

我们在学习两周之后,开始着手写的这个程序。当时有两个方案,一个是直接调用微信相关的模块来操作,但是坏处是微信对此监管很严格,滥用这个模块很容易导致封号。而我们,有很多群聊,的确是要滥用的……

酱酱自己想到了第二个方案:Python里有一个模块,能够用代码来模拟电脑的键盘鼠标,自动进行操作。这样只要登录微信网页版,再执行这个程序,电脑就可以自动点点点,把群聊给清理干净。

最后,执行的效果就像这样:

2018-09-21-22-05-18

从那天开始,公司再也没有运营同事会用手点击来解散群聊。把需要解散的群聊名字一键导入进去,点击执行,稍等一会就全部搞定。

事实上,这样一个程序,只需要改一改,可以替代我们所有重复性的键鼠操作。

后来正因为这件事,我们公司进入了全民学编程的时代。

(三)我的朋友,在用Python做商业提案拿offer

如果你对广告行业有所了解,会知道近几年这个行业不大景气,客户很多适合倾向于自己持有一个品牌传播团队,或者是绕过广告公司,直接和渠道进行合作推广。

广告公司的收入,好几年过去不见上涨。优秀的人才在流失向其他的行业。

我认识一位小朋友,本科是念广告,毕业后凭借优秀的创意才能和学习能力,去了一家全球顶尖的4A广告公司,在里面一直都过得还不错。

2016年末的时候,他找我说决定离开:我再也不想留在这个行业了。你知道吗,这都2016年了,我身边还有同事不知道大疆是什么,Surface电脑是什么。这可是号称见多识广的一线广告人呐。

我问他想去做什么,他说想去做甲方,做旅游业,但是自己之前没做过旅游相关的项目,可能不大容易,有什么办法吗?

我告诉他没关系,这都2016年,每个行业都缺懂数据的人才。懂数据的人,他哪个行业都能懂,因为经验会欺骗,但数据不会。你学点编程,加上你才华,不管哪儿的市场部面试横竖都能过。

他去报名了一个线下班,花了几万块,去学了编程和数据分析。

后面他在面试的时候,还专门写了一个ppt,是将目标企业,在网络上的所有评论数据,都给抓取了下来。然后用一个自然语言处理的库,提取出高频的关键词,分析游客情绪数据,他们究竟在关注什么,吐槽什么。

然后用这个东西,去做推广方案,去做改良方案。

这offer自然是稳的,薪资比之前翻了两倍还多。

现在我已经找不到那份ppt,但代码是可以还原的,我用深圳欢乐谷为例,简单演示一下当时的效果:

2018-09-21-22-34-48

(四)一个高中生,在用Python写小游戏

Z君,是我在玩王者荣耀的时候认识的朋友,他技术特别老练:最强王者三十多个星。

所以每次玩,都是他带我。

后来我们加了微信好友,我才知道:Z君还在念高二,在西安一所蛮厉害的中学。

或许是因为我一直没问过他:为什么念中学,还有那么多时间打游戏。我们的关系一直都还挺融洽,颇有种忘年交的感觉。毕竟我念中学时候,也会溜到网吧打游戏。道理都懂,谁还没个年轻时候呢?

后来,我开始做Python的项目,在朋友圈里发了内测邀请的消息。

他在下面回复:“我想试试。”

这一试不得了。打游戏好的人,仿佛做什么都有天赋,他是那一轮内测用户里,学习最快的那一个,动不动就学到晚上一两点——而从前,这是属于打游戏的时间。

他在学完第12关之后,已经不满足课程里的内容,就自己写了一个文字冒险的游戏。大概长这样:

2018-09-21-22-54-11

这是一个正儿八经的文字冒险游戏,剧情会根据用户的选择来变化。甚至,还有游戏记录存档的功能。

因为这是第一个用户,主动写出的游戏程序。所以现在,我把这个游戏作为了Python小课中的一个项目(《文字冒险》),让所有学习Python小课的用户,都可以体验它。

在写这篇稿件的时候,Z君已经用Python写出来《2048》、《Flapy Bird》、《炸弹人》等多个小游戏。

目前,Z君已经开始读高三,每天很忙碌,已经在游戏里或者是Python课里见不到他。但是,他上次告诉我:编程这事有意思,他想大学时候去学计算机。到时候,希望来我们这里实习。

我说,行,加油,欢迎你。


(五)你也可以

以上,就是我今天要分享的四个全部故事。

其实真正想说的就一句:编程是一件非常自由而高效的事情,学会它你可以用来实现任何你想实现的项目:人工智能、解放工作、数据分析、自制游戏……都能成。

也欢迎你来学习它。

未来已来(二)——拥抱AI

我想讲一个现象,它每时每刻在你身边发生着,但却很少被你所注意,这个现象叫做“无人化”。

“无人化”和一个选择

就像我在《未来已来(一)——技术变革》中说的一样:深圳华侨城的沃尔玛里,人没了。我平时会喜欢下厨,下厨要买菜,买菜要称重,称重从前需要人。但是,现在却是我自己在做这件事。更甚至,买单也是我在机器的帮助下自己完成。

2018-12-18-10-31-00

我翻过超市的发展史。它是一个存在了上百年的那么个东西。在最开始,我们在一个大商超买买买,再推到买单的地方付钱结账;后来,我们在一个大商超买买买,再推到买单的地方刷卡结账;再后来,我们用手机支付……但这一切,都没离开“人”的存在。

今天,事情却发生了变化。

超市里没人了并不怎么可怕,可怕的是我们对类似的事情习以为常,以至于很少在这件事上投入更多的思考。

我大学时,有念物流工程的朋友,总开玩笑说自己要不要考一个叉车证,去仓库里扒拉货。但是今天,亚马逊、优衣库这些对仓库有高度依赖的企业,它们的仓库早已换副光景:

![2](https://res.pandateacher.com/2.gif

机器人来来去去,没有人的踪影。

如果说我们刚才的举例,它们本身就是一些比较简单可重复的工作。那么,坐在办公室里的白领就与之无关?

我们最先看到的岗位是“编辑”,这是一个有着悠久历史的白领岗位,许多新闻门户网站都有这样的岗位设立。他们工作内容,有很重要的一部分是【编辑推荐】:我觉得这部分用户会对这部分内容感兴趣,我把内容推荐给这些用户让他们看到。

但是,后来有了今日头条、抖音这样的产品出现。它们本身不生产内容,它们做平台。用算法而非人工,去做兴趣推荐:机器推算出这个用户喜欢这个,所以推送给这个用户这个。这种产品,活得反而比传统的新闻、视频产品更好。

无人驾驶,无人货架、无人旅馆、无人港口……如是种种。

我们身边的所有一切,都在向“无人化”的方向推演。这是此时此刻,正在发生的,你我都有目睹却又熟视无睹的,“消失的人”。

这一切的发生,并非无规律可循。接下来的篇幅里,我会为你讲述:为什么会在短短几年里,事情变成这样,在未来,它还会变成怎样。

在听完这些内容之后,你会明白这个世界在发生些什么。但更重要的是,你会面临一个选择:像过去一样,普普通通地生活下去,成为那个“消失的人”;还是成为一个被技术赋能的“超人”,创造更多、更大的价值。这个选择,它会影响你未来至少十年的人生路径。

什么是人工智能?

是什么在让人消失?

答:是人工智能。

在这几年你在许多不同的地方都听过“人工智能”这四个字:阿尔法狗,它能下围棋;谷歌的语音助理,能打电话订餐了;微软的小冰,能写诗能猜谜,能成语接龙……

2018-12-18-10-38-34

但其实挺少有人站出来解释清楚,人工智能究竟是什么?

一个精简的答案是这样:人工智能,就是用机器去做,在过去只有人能做的事。科学家们把这些事进行了分类:推理、规划、学习、交流、感知、运动。

用机器去做,在过去只有人能做的事。这句话听起来简单,但如果你看一看历史,就不会这样想。

从人类文明诞生以来,我们大约经历了:石器时代、铁器时代、机器时代、电器时代……今天来看,最关键的里程碑应该是“机器时代”,也就是我们常在历史课本里见到的“工业革命”。

为什么这么讲?一直以来,我们人作为价值的创造者,一直以来有两种创造价值的方式:一个是体力劳动,一个是脑力劳动。当工业革命来临,我们进入机器时代,体力劳动就没那么重要,脑力劳动者的收入得到提升。大家开始进工厂,进办公室。

我还记得小学课本里有这样一句童谣,叫:“人有两件宝,双手和大脑。”当我们进入机器时代,我们就已经把手上的老茧逐渐放下。“机器去做,在过去只有人能做的事”,人工只能打起了脑力劳动的算盘。人何以为人,成为一件我们需要花更多时间思考的事。

2018-12-18-10-39-04

你有没有试图追溯过:人工智能技术,是如何一夜之间恰如千树万树梨花开?

我追溯过。在上世纪四十年代,差不多和计算机被发明的同时,就已经有人开始着手研究这个领域。此后,一直一直一直默默无闻。

技术发展有一个规律:上一个月还是默默无闻,可是一旦它突破了某个临界点,下一个月你就能在生活中看到它的身影。

事情是在十多年前开始发生巨变的。2006年,深度学习算法出现,它推动着人工智能往前走了一大步。因为这一大步,人工智能如井喷一般飞速发展,就仿佛一夜之间,就走进了千家万户。我们前面所举的全部案例,全都来源于此。

其实自2006年后,再也没具有这样巨大影响力的底层技术出现。但是,我们却在最近几年越来越高频地听到“人工智能”相关的信息。这就是因为,技术被应用到了生活当中。

在未来,还会有更多的应用出现。这里面,它蕴藏着巨大的机遇。

2018-12-18-10-39-32

我们来举一个例子:前面我们说,人工智能要让机器去做,从前只有人能做的事。其中里边有一个部分叫“感知”。在“感知”里,有一个非常重要的部分是“图像识别”,通俗来说,就是让计算机能像人一样,去“感知”图像,它能看懂图片。

从前的相机,它看不懂图片,在它的眼里:玫瑰花不过是一堆图像和形状的组合,和月亮没有区别,和狗熊没有区别。

2018-12-18-10-39-51

你可能会好奇,算法是个什么东西?做个比方:我们人类学习东西,需要“学习方法”。计算机也是如此,我们可以把“深度学习算法”理解为计算机的“学习方法”。从前它一直没有一个好的学习方法,现在有了,我们就可以拿东西给它学。

我们去拿一万张玫瑰的照片给计算机去看,告诉它:记住了,这是玫瑰。计算机在算法的帮助下,计算这一万张玫瑰,有什么共性的规律。它学习,记住这个规律。当我们去拿第一万零一张照片给计算机看。它做出判断:这张图基本符合之前我记住的那个规律,它有99%的概率是玫瑰。

于是,它说:这是玫瑰。

让计算机说出来一句:这是玫瑰。这看上去像是一件微不足道的小事,但它是一个开端。

我们喂给它更多的数据:玫瑰、月季、牡丹、梯子、人脸、面包……让它计算,学习,记忆。图像识别,就这么成了:从此以后,计算机能读懂图。

2018-12-18-10-40-19

单是让计算机能读懂图片不成,我们还要想办法把技术应用到生活场景里面去,这样它才能创造价值。

就像我们前面说的,无人购物,要用到图像识别技术:负责识别顾客取走的货物,识别顾客的人脸用于安防,负责扫码完成付费……下面,我要为你举几个案例:单是一个图像识别技术,还可以用在哪些领域。

它可以拿来打农药。

在传统的农田里,我们常看到一个农民老伯,背一只药筒,手持喷头,从田里走过去,地毯式喷洒农药。

2018-12-18-10-40-53

但是,有了图像识别技术。你可以改用装载了摄像头的无人机来喷洒农药。

2018-12-18-10-41-06

在我们眼里,农田是长这个样子:

2018-12-18-10-41-21

但是在无人机眼里,事情是这个样子:

2018-12-18-10-41-35

谁是杂草,谁是庄稼,一目了然。农药只打在该打的地方。这样做,一个是效率的提升,两架无人机完成一块100亩左右的农田农药喷洒,大概只需要2个小时左右。一个是降低农药残留,相比从前大水漫灌式的方案,它可以节省农药90%以上。

还有一个场景是医疗。随着我们生活水平变更好,人均寿命被延长,癌症的发病率也随之上升。常规,我们去检查身体,是去拍个片,然后医生拿着看,告诉你:这怕不是肿瘤吧。

2018-12-18-10-41-54

但是现在,我们可以让计算机去做看片这件事。在事实上,目前人工智能在识别早期癌症上,已经比人类更厉害。腾讯,已经就有一个团队在做这件事。

这里面我们要思考件事:一个医生要成长到能诊断癌症,他要读好多年的书,积累好多年的临床经验。但是机器,这个成本太低。

如果机器做事成本更低这件事成立,要么是医生们的工作量减少,要么是医生的数量减少。以目前来看,情况尚且乐观,事情可能在向前者的方向发展。但其它工作,却不见得。

这个案例,可能你很难想象。这也是我前几天看到的,是在一个做地板的厂子。

他们厂子有一项拳头业务是做高端木质地板,有个很重要的工作是筛选木板。这得雇一个熟练的老工人,工作流程是:有虫眼的放左边,好的放右边;有裂痕的放左边,好的放右边;有毛面的放右边,好的放左边……诶?错了,掉过来。好的放右边,有毛面的放左边。

但是现在不了,他们引入一条流水线,这条流水线没什么特别,只是比平常的多加了个摄像头。摄像头会自动识别毛面/裂纹/结疤/虫眼……的问题木板,去左边,好的放右边。

2018-12-18-10-42-21

这让生产效率直接翻倍。成本……几乎没有成本,一点点的电费和网费罢了,比之前的人工要好不少。

如前所述,如果机器做事成本更低这件事成立,要么是工人们的工作量减少,要么是工人们的数量减少。以目前来看,情况可能更像是后者。这会是“消失的人”。

最后再来个简短的案例,是安防。相信你今年应该看过好几次这样的新闻:在张学友的巡回演唱会上(南昌、赣州、嘉兴、金华四场),警方通过人脸识别技术,一共抓获5名在逃犯人。

当逃犯们兴冲冲地拿着票走过摄像头,将要入场,此时他们的面部信息已经被抽取出来,实时传到云端,和后端数据库飞速地进行比对。

2018-12-18-10-42-46

你能看到:机器不需要模仿人做事的方式,机器只需要模仿,甚至超越人做事的结果,这就够了。

你还能看到:同样是一个图像识别的技术,它可以被应用进各种看上去毫不相干的场景中去。此时,它能创造出巨大的价值。我们可以得到一个等式:人工智能=算法+数据+应用。

2018-12-18-10-43-07

面对人工智能,我们能做些什么?

根据这个等式,我们可以盘演,在人工智能的这波机遇里,我们能做什么?

算法,这是个好主意。不过门槛挺高。你要去学数学、计算机两个学科的知识,至少得读个研的知识量。从浅到深,相关的内容大概会有:Python编程,爬虫,数据挖掘,高等数学,机器学习,深度学习……

数据……做人工智能的确需要大量、规整的数据。但,普通人手里,很难有可以训练算法的大量数据。这些数据,往往掌握在大型互联网公司里,如:谷歌/百度有搜索数据,facebook/腾讯有社交数据,亚马逊/阿里有商业行为数据……

前阵子我看过一个报道,说在中国的河南、山东、河北等地的四五线小城里,存在着一种“数据车间”,整个车间看上去仿佛是个网吧的模样,年轻的员工们窝在柔软的沙发里,对着电脑勾勾画画:将一张张图片里的梯子、玫瑰、地毯;梯子、玫瑰、地毯;梯子、玫瑰、地毯;梯子……给标注出来。

他们把这些标注好的数据,发送给大公司。大公司们,会用这些数据去训练算法。一张图,给两分五。

大公司们用高薪聘请到做算法的人才,大公司里有数据。所以,今天的你能够看到,人工智能技术基本都是由这些大公司提供。借助数据和算法,谷歌和facebook提供着精准广告,每年获得百亿美元利润;亚马逊的云计算为无数中小公司提供技术服务,支撑起近万亿美元的市值。

但这并不意味着,普通人在人工智能面前就没有机会。至少做应用,还大有可为。而且,越早去参与,越具备先发优势。

你只需要懂得一些基础的编程能力,就可以调用已经研发好的人工智能技术,把它应用到自己所处的行业中去。让技术,去替代、帮助人来工作。它能降低成本,提高收益,它有利可图。就像把图像识别用进农业、医疗、安防……等等,一样的。

这就好比:不是每个人都可以成为马云,但每个人都可以是淘宝卖家。应用阿里巴巴的技术,去开店铺,能创造价值。应用人工智能技术,也能创造价值。

在浙江省的一所中学,有位李老师发觉到一个现象:有些学生十分内向,不好意思向老师提问,加上老师分配给每个学生的时间有限,很难满足每个学生的学习需求。

他萌生了,去做一个自主答疑机的想法:学生将试卷、习题放在答疑机上扫描,系统便可快速识别题目,给出详细的解析和视频讲解,甚至还可以获得同一道题的多种学习思路。

2018-12-18-10-44-09

没过多久,这台机器就被做了出来。因为它应用到的原理非常简单。如果是用Python语言来写,核心代码可能不超过20行。

首先,是把试卷拍张照。接着,调用专门做搜题功能的产品,所提供的接口,把试卷的图片,转换成文字。然后,从海量的试题库当中,找到这个题目的答案和解析,通过显示屏呈现出来。

这就是个很棒的案例。

做技术,还是做应用?是我们现在需要考虑的一个问题。但有一个命题是确定的——编程,是该学一学。你不需要担心它难,我教过了上万人学编程,我知道:如果我们的目标是学会调用已有技术,培养编程思维。那其实还挺简单……

而且学会编程,不只是可以做人工智能。你可以使用代码,让自己平时的许多工作,都自动化完成:图像处理、文档处理、市场分析、网页爬虫、数据分析……

选择Python

编程语言那么多种,该选哪一把铁锹?

答,就是你已经接触过的,Python。

编程语言是有很多没错,但如果我们学编程的目的,是为了参与进人工智能的浪潮,那么首选只能是Python。选择Python不但是安全的,还是必须的。

毕竟,它是人工智能时代的头牌语言,这是在技术界已经达成共识的事。

Python语言帮助人工智能发展更快,人工智能的发展带动更多人去学Python。它们自始至终,都是相辅相成的关系。

2018-12-18-10-46-40

(国际电子和电气工程师联合会发布的第五届年度编程语言排行榜,Python名列榜首。)

不仅如此,Python在大数据分析、机器学习、云计算系统、web开发(比如Facebook/Google/豆瓣/知乎,都用Python开发)、游戏脚本……等时下最热门的应用里,都占据着主导地位。

造成这结果的原因,是由Python语言的特性决定的:

  1. 它够简洁

    实现同样的功能,C++需要1000行,java需要300行,但python可能只需要20行。 曾经有个段子是这样描述:

    你遇到了一群敌人! 你要怎么办呢?问问你的大将吧! C:拿出一根棍子,一个一个把敌人砸死。 C++:用机关枪。 java:我打电话叫十万个基佬! perl:我会功夫! ruby大喊着拿着武士刀冲上去了。 lisp:我先把敌人分组一下吧! haskell:我们可以用歼星舰啊! PHP:让我们把敌人老死吧! python:用氢弹。

  2. 它易学,易读

    Python语言和人类语言高度相似,掌握Python的基础语法,快则几天,慢则1-2周就够。几乎不需要注释,就能让你读懂Python代码。 接下来,你就可以用它来调用已有技术,去实现自己的项目。

  3. 它作为胶水语言,便于不同行业的人协作

    人工智能的研发,需要来自不同行业的人协作,不只是开发人员,还需要不同领域的科研人员、创意人才参与其中。

    Python它跨平台,在windows、mac、linux……等系统上都能运行。 它特别好学。 每个人都可以非常方便地打包自己的代码,别人无需读懂,就能特别方便的调用。

    这些特性,让协作的成本变得极低。

学人工智能,从Python开始。

未来已来(一)——技术变革

在上个周末,我去了一趟沃尔玛,发现两件神奇的事:

  1. 买菜称重不需要人,顾客自助。

  2. 扫码买单不需要人,用小程序。

卖菜的大妈很开心:现在大家都自助了,工作变轻松。

我不知道该怎么告诉她:这份工作,马上就要消失了。

这一幕让我想到许多东西。

不只是沃尔玛,这个世界最新一批的互联网公司在推进这一些炽热的变革,这是新的浪潮。

不只是卖菜大妈,还有许多传统行业的员工,甚至是传统互联网公司的员工,都会成为这一浪潮的受害者。

未来已来,事情在发生一些变化。

(一)抖音和微视

未来已来。

以技术做驱动,用算法做决策的公司正野蛮生长,让老牌的互联网巨头心生惶恐。

用算法替代人,这事正在发生。

说抖音和微视,刚刚,我去搜索了这两家的招聘需求。

2018-12-18-10-01-12
2018-12-18-10-01-20

根据搜索结果不严谨的对比,可以得出:

微视:总计28个职位描述,9个技术类,8个产品/项目类,2个市场类,9个内容编辑类。

抖音:总计59个职位描述,40个技术类,5个产品/设计类,1个市场/销售类,14个运营/编辑类。

这的确像腾讯的作风,虽然有着足够庞大的用户数据,包含一个人的方方方面,但各个部门之间的数据并不打通。

在算法上,各团队常去做重复工作,这和它的内部赛马机制不无关系:对内孵化也好,对外投资也好,腾讯都只做两件事:给钱,给流量。一个项目,多个团队去做。谁成了,算谁的。典型如微信,王者荣耀,都是这样诞生。

一个经典的吐槽是公众号体系,如果你去注册腾讯的公众号,你能发现:微信公众号、企鹅号、QQ公众号三大体系,彼此数据互不相通,许多媒体人要把一个稿件发生这三个平台,因为它们分属于三个不同的团队。

腾讯会花比较多的精力,做产品、运营、交互设计。他们看中用户体验,或说“产品经理,人为的用户体验”。

其中运营,很多时候工作内容是:流量。

内部合作流量,外部投放流量……等等。

然后招聘需求,就如你所见。

最后的结果,引用最近的一篇文章《全面反思腾讯的战略》,里面是这样描述的:

……近两年由于抖音发展非常迅猛,腾讯下了很大决心重启微视,抽调精兵强将,并出重金奖励优质内容(曾有传言说本年度会补贴30亿元),同时通过QQ、QQ空间、大王卡以各种奖励形式强推微视,上个月还把时下最火爆的综艺节目《创造101》的点赞机制引入微视,可以说传统上最强的拉新手段全都用上了,效果如何呢?

曾经有几天时间上了iOS免费榜的前几名,但可惜昙花一现,很快又跌回到100名以外。为什么效果这么差呢?最重要的原因是微视的算法还不行,用户画像还不精准,内容与用户的匹配并不精准,微视用户的粘性就培养不起来。

同样的内容,在抖音的分发效果就比在微视里要好得多。腾讯强推微视的决心不可谓不大,但是在算法没有突破的情况下,再砸钱,哪怕是100亿,其实都是扔到水里去的。

但是在抖音,是另一种做事方式。

据报导,2017年时,公司一共有1500名工程师,其中算法工程师占了800名,而且还表示愿意以300万美元的薪水(主要是期权)招聘最顶尖的算法工程师。

最后的结果显而易见,抖音占据了很长一阵app store的免费排行榜第一名。

而身边很少有人提起微视。

在今日头条的早期,就有说法:这家公司,没有编辑,一切基于算法。

直到后来,迫于政策压力。才加了编辑,但主要工作是负责审核敏感内容。薪资是非常低的,而且远离总部。这和其他门户网站的人力结构,完全不同。

(二)三个结论

我们可以得到三个结论。

  1. 替代就是替代,不需要通过模仿。

    之前我们看新闻,阿尔法狗围棋击败人类,人工智能玩dota击败准职业玩家。

    我们一方面担心被人工智能所替代。一方面我们觉得被替代这一天很遥远:人工智能下围棋行,但距离好多好多领域的生产力,还不行。

    “很遥远”的前提是:人工智能想要模仿人,然后超越人,这很难。因为人的情感,思考都是机器很难模拟的事。

    人类在此,傲慢了。

    因为只要一种生产力比旧的更高效,那么旧的就会被替代。

    算法超越人类,就是超越人类,根本不用模仿人类。

  2. “流量”的技术变革

    关于“流量”问题,在最近的二三十年,有三个明显的阶段。

    (1)第一站,传统媒体大水漫灌

    上世纪九十年代,是报纸、电视媒体的黄金时代。哪家企业占领了央视,哪家企业的次年销量必然爆炸。这是最早期,人们接触的媒介单一。

    那段时光,媒体、广告公司是最风光的地方。大把人才都在那里。

    年纪大一些的朋友可能还记得这些名字:孔府宴酒,秦池酒,爱多VCD, 步步高……

    (2)第二站,有人开始思考场景和体验

    在此,独领风骚的会是产品经理,他们开始思考“场景”,思考“交互”——我觉得用户在这种情况下,应该怎样,才会有更好的体验。
    2018-12-18-10-12-12
    (▲“如果你是微信的产品经理/交互设计师,请为微信的看一看做一次改版”——这是腾讯内部的一节产品经理基础课)

    这依赖天才型的产品经理出现。如马化腾,张小龙,乔布斯……

    他们负责思考:我觉得用户在这种情况下,应该怎样,才会有更好的体验。

    甚至,他们说:用户不知道自己想要什么,我来定义用户想要什么。

    定义用户想要什么。而且还定义成功了,就是天才。

    做产品,要依凭“用户觉得这个更好”,而不能依凭“我觉得,用户会觉得这个更好”。

    那么,如何感知到“用户觉得”?三种方式:

    ① 和用户谈。

    ② 自己作为用户,去亲身体验。

    ③ 用户的行为数据。

    传统的互联网公司,是利用 ① 和 ② 的,他们把这叫做“用户调研”。

    他们用“真正的聪明人,都在下笨功夫。”来赞美优秀的产品经理。意思是越是聪明,越是经验丰富,就越要走进用户,去了解他们。

    不然,容易陷入经验判断——“我觉得,用户会觉得”。

    而这种判断,很多时候都不可信。

    这是因为,用户的行为数据收集得不够多,不够好,算法设计得不够漂亮。他们相信自己眼睛和心的判断,胜过数据算法的判断。

    但是,数据会变好,因为它变好的速度比人的成长速度更快。

    当它变得比人的经验判断更可信,我们会来到第三站。

    (3)第三站,算法驱动。

    我们前面谈的微视、抖音、头条案例正是如此。

    他们可能会更多地思考:如果你是微信的算法工程师,请为微信的看一看做一次改版。

    这就会更多从数据取样,数据利用,算法搭建的层面去做设计。

    这是一种变化:

    ① 产品思考场景和交互;工程师去实现;用户给反馈;返回第一步。

    ② 工程师设计算法;工程师索要数据;产品思考如何拿到数据;产品设计场景和交互;工程师去实现;数据给反馈;返回前面的某一步。

    后面,我们还会接着举例。

  3. 技术变革发生在当下

    当算法的能力越来越强,直到有天它突破一个阈值,这个阈值是人类工作的平均效果。

    那么算法,就会在一瞬间,摧枯拉朽地干掉大部分人的工作。

    而剩下的那一小撮人,也会被算法一点点干掉。

    因为算法的进化速度,比人类的学习速度更快。

    旧的生产力,被摧枯拉朽地替代掉。这种事,在人类历史上,尤其是近几年,已经发生了太多次。

    弄死一个钱包生产公司的不是一个更好的钱包公司,是微信支付和支付宝。

    人们不再需要钱包。

    弄死服装店的不是一个更大的服装店,是淘宝。

    人们开始去线上消费。

    事情在一开始是温和的:一些公司,开始更努力地招聘算法工程师。

    就像现在,正发生的事情。

    许多人今天不喜欢今日头条,觉得它low。

    但这就像多年前我们看腾讯,说它抄。腾讯的本质是产品驱动,是社交。

    今日头条的本质是字节跳动,是算法。

    他们的公司名已经说明一切:字节跳动。而字节,是计算机数据最基础的组成单元。

(三)一个预告

这篇稿件我们讲了许多内容,但核心就一句:算法替代人,发生在当下。

我会在下一篇里去讲:

如果被替代是不可逃避的宿命。那么作为个体,应该如何应对此事。——拥抱技术。

(四)补一个案例

补充一个案例,Netflix。

可能你没听说过它,简单说就是拍《纸牌屋》的那家。

但这家公司不简单,在今年6月它的市值最高超过1800亿美元,市盈率超过300倍。

与之对比,腾讯今天的市值换算美元大概是4000多亿,京东480多亿,阿里4300多亿。

即便是同行业,传统的剧透迪士尼,市值是1680亿美元。

2018-12-18-10-21-03

这是关于市盈率的解释。一般的科技公司市盈率就几十。

但netflix能到三百。

背后的含义是一边是高风险,另一边是:它被资本高估,资本喜欢它。

那么问题来了,这样一个娱乐巨头做的是什么生意?

我用大家比较容易理解的方式来总结,它是:今日头条+爱奇艺+豆瓣。

netflix最早是做租碟生意的。后来,转型成现在的样子。

它给人看剧,也自制剧,比如纸牌屋这种剧。这是它像爱奇艺的地方。

不同之处是它的所有用户,都是付费用户。只不过你有一个月的免费试用。

然后它也像豆瓣(豆瓣电影)。让你写评论,让你给打分。

最后,是它做了非常好的推荐算法。根据你所看过的,根据你的喜好,根据你的身份信息……去推荐给你内容。这是它像今日头条的地方。

2018-12-18-10-21-29

我花了很多篇幅,去讲这家公司的状态。现在要去讲它用算法做了哪些事。

  1. 利用算法,干预内容选择和生产。

    导演大卫•芬奇曾拿着《纸牌屋》的改编剧本,找过美国多家电视台,却没有一家敢掏钱,谁也说不准一部20年前的老剧是否还有市场。

    Netflix进行了“电视剧消费习惯数据库”分析,他们发现:喜欢观看1990年BBC版本《纸牌屋》的观众,同样是《社交网络》、《七宗罪》鬼才导演大卫•芬奇的拥趸同时,他们还是奥斯卡影帝凯文•史派西的忠实影迷。有了强大的大数据分析支持,Netflix已经完全可以预测受众和市场的反应,将原版《纸牌屋》的粉丝和凯文•史派西与大卫•芬奇的粉丝整合在一起,投拍新版《纸牌屋》,一炮而红。

    他们统计“暂停/快进”来寻找剧情尿点,利用“分享/回放”寻找传播点,干涉剧情创作。

  2. 利用算法,做兴趣推荐。

    Netflix一直举办大型比赛招贤纳士,来提高自己的数据挖掘处理能力。2005年底,Netflix设立百万美元奖金征集能使其推荐系统性能上升10%的算法和架构。最终,一个由工程师、统计学家、研究专家组成的团队BPC夺得了百万奖金,成功地将Netflix影片推荐引擎的推荐效率提高了10%。

    与利用算法相对应。许多时候,也是算法在利用人。

    人需要效益,算法需要数据——大量的、便于计算的数据。

netflix也做了很多努力,来喂数据给算法。

  1. 基础设施建设

    2010年,Netflix完成了两次数据迁,移一次是将Netflix数据中心迁移到亚马逊ASW之上,另一次就是将Oracle数据库迁移到SimpleDB。到了2011年,又从SimpleDB迁移到Cassandra,利用Cassandra提供的路由配置,集群可以被部署在多个大洲。

  2. 产品形态的修改

    他们干掉了五星打分机制,改成了好和不好,单一判断。

    他们取消用户评论功能。

    这样做,都是为了数据更加干净,减少干扰因素。

    这在传统的产品经理眼里,都属于大胆的决策。

    但netflix做了,因为出发点不同。netflix要规整的数据,喂给算法,让算法来生产效益。

    他们信任算法,更胜过人的判断。

    然后,他们获得成功。