我想讲一个现象,它每时每刻在你身边发生着,但却很少被你所注意,这个现象叫做“无人化”。
“无人化”和一个选择
就像我在《未来已来(一)——技术变革》中说的一样:深圳华侨城的沃尔玛里,人没了。我平时会喜欢下厨,下厨要买菜,买菜要称重,称重从前需要人。但是,现在却是我自己在做这件事。更甚至,买单也是我在机器的帮助下自己完成。
我翻过超市的发展史。它是一个存在了上百年的那么个东西。在最开始,我们在一个大商超买买买,再推到买单的地方付钱结账;后来,我们在一个大商超买买买,再推到买单的地方刷卡结账;再后来,我们用手机支付……但这一切,都没离开“人”的存在。
今天,事情却发生了变化。
超市里没人了并不怎么可怕,可怕的是我们对类似的事情习以为常,以至于很少在这件事上投入更多的思考。
我大学时,有念物流工程的朋友,总开玩笑说自己要不要考一个叉车证,去仓库里扒拉货。但是今天,亚马逊、优衣库这些对仓库有高度依赖的企业,它们的仓库早已换副光景:
![2](https://res.pandateacher.com/2.gif
机器人来来去去,没有人的踪影。
如果说我们刚才的举例,它们本身就是一些比较简单可重复的工作。那么,坐在办公室里的白领就与之无关?
我们最先看到的岗位是“编辑”,这是一个有着悠久历史的白领岗位,许多新闻门户网站都有这样的岗位设立。他们工作内容,有很重要的一部分是【编辑推荐】:我觉得这部分用户会对这部分内容感兴趣,我把内容推荐给这些用户让他们看到。
但是,后来有了今日头条、抖音这样的产品出现。它们本身不生产内容,它们做平台。用算法而非人工,去做兴趣推荐:机器推算出这个用户喜欢这个,所以推送给这个用户这个。这种产品,活得反而比传统的新闻、视频产品更好。
无人驾驶,无人货架、无人旅馆、无人港口……如是种种。
我们身边的所有一切,都在向“无人化”的方向推演。这是此时此刻,正在发生的,你我都有目睹却又熟视无睹的,“消失的人”。
这一切的发生,并非无规律可循。接下来的篇幅里,我会为你讲述:为什么会在短短几年里,事情变成这样,在未来,它还会变成怎样。
在听完这些内容之后,你会明白这个世界在发生些什么。但更重要的是,你会面临一个选择:像过去一样,普普通通地生活下去,成为那个“消失的人”;还是成为一个被技术赋能的“超人”,创造更多、更大的价值。这个选择,它会影响你未来至少十年的人生路径。
什么是人工智能?
是什么在让人消失?
答:是人工智能。
在这几年你在许多不同的地方都听过“人工智能”这四个字:阿尔法狗,它能下围棋;谷歌的语音助理,能打电话订餐了;微软的小冰,能写诗能猜谜,能成语接龙……
但其实挺少有人站出来解释清楚,人工智能究竟是什么?
一个精简的答案是这样:人工智能,就是用机器去做,在过去只有人能做的事。科学家们把这些事进行了分类:推理、规划、学习、交流、感知、运动。
用机器去做,在过去只有人能做的事。这句话听起来简单,但如果你看一看历史,就不会这样想。
从人类文明诞生以来,我们大约经历了:石器时代、铁器时代、机器时代、电器时代……今天来看,最关键的里程碑应该是“机器时代”,也就是我们常在历史课本里见到的“工业革命”。
为什么这么讲?一直以来,我们人作为价值的创造者,一直以来有两种创造价值的方式:一个是体力劳动,一个是脑力劳动。当工业革命来临,我们进入机器时代,体力劳动就没那么重要,脑力劳动者的收入得到提升。大家开始进工厂,进办公室。
我还记得小学课本里有这样一句童谣,叫:“人有两件宝,双手和大脑。”当我们进入机器时代,我们就已经把手上的老茧逐渐放下。“机器去做,在过去只有人能做的事”,人工只能打起了脑力劳动的算盘。人何以为人,成为一件我们需要花更多时间思考的事。
你有没有试图追溯过:人工智能技术,是如何一夜之间恰如千树万树梨花开?
我追溯过。在上世纪四十年代,差不多和计算机被发明的同时,就已经有人开始着手研究这个领域。此后,一直一直一直默默无闻。
技术发展有一个规律:上一个月还是默默无闻,可是一旦它突破了某个临界点,下一个月你就能在生活中看到它的身影。
事情是在十多年前开始发生巨变的。2006年,深度学习算法出现,它推动着人工智能往前走了一大步。因为这一大步,人工智能如井喷一般飞速发展,就仿佛一夜之间,就走进了千家万户。我们前面所举的全部案例,全都来源于此。
其实自2006年后,再也没具有这样巨大影响力的底层技术出现。但是,我们却在最近几年越来越高频地听到“人工智能”相关的信息。这就是因为,技术被应用到了生活当中。
在未来,还会有更多的应用出现。这里面,它蕴藏着巨大的机遇。
我们来举一个例子:前面我们说,人工智能要让机器去做,从前只有人能做的事。其中里边有一个部分叫“感知”。在“感知”里,有一个非常重要的部分是“图像识别”,通俗来说,就是让计算机能像人一样,去“感知”图像,它能看懂图片。
从前的相机,它看不懂图片,在它的眼里:玫瑰花不过是一堆图像和形状的组合,和月亮没有区别,和狗熊没有区别。
你可能会好奇,算法是个什么东西?做个比方:我们人类学习东西,需要“学习方法”。计算机也是如此,我们可以把“深度学习算法”理解为计算机的“学习方法”。从前它一直没有一个好的学习方法,现在有了,我们就可以拿东西给它学。
我们去拿一万张玫瑰的照片给计算机去看,告诉它:记住了,这是玫瑰。计算机在算法的帮助下,计算这一万张玫瑰,有什么共性的规律。它学习,记住这个规律。当我们去拿第一万零一张照片给计算机看。它做出判断:这张图基本符合之前我记住的那个规律,它有99%的概率是玫瑰。
于是,它说:这是玫瑰。
让计算机说出来一句:这是玫瑰。这看上去像是一件微不足道的小事,但它是一个开端。
我们喂给它更多的数据:玫瑰、月季、牡丹、梯子、人脸、面包……让它计算,学习,记忆。图像识别,就这么成了:从此以后,计算机能读懂图。
单是让计算机能读懂图片不成,我们还要想办法把技术应用到生活场景里面去,这样它才能创造价值。
就像我们前面说的,无人购物,要用到图像识别技术:负责识别顾客取走的货物,识别顾客的人脸用于安防,负责扫码完成付费……下面,我要为你举几个案例:单是一个图像识别技术,还可以用在哪些领域。
它可以拿来打农药。
在传统的农田里,我们常看到一个农民老伯,背一只药筒,手持喷头,从田里走过去,地毯式喷洒农药。
但是,有了图像识别技术。你可以改用装载了摄像头的无人机来喷洒农药。
在我们眼里,农田是长这个样子:
但是在无人机眼里,事情是这个样子:
谁是杂草,谁是庄稼,一目了然。农药只打在该打的地方。这样做,一个是效率的提升,两架无人机完成一块100亩左右的农田农药喷洒,大概只需要2个小时左右。一个是降低农药残留,相比从前大水漫灌式的方案,它可以节省农药90%以上。
还有一个场景是医疗。随着我们生活水平变更好,人均寿命被延长,癌症的发病率也随之上升。常规,我们去检查身体,是去拍个片,然后医生拿着看,告诉你:这怕不是肿瘤吧。
但是现在,我们可以让计算机去做看片这件事。在事实上,目前人工智能在识别早期癌症上,已经比人类更厉害。腾讯,已经就有一个团队在做这件事。
这里面我们要思考件事:一个医生要成长到能诊断癌症,他要读好多年的书,积累好多年的临床经验。但是机器,这个成本太低。
如果机器做事成本更低这件事成立,要么是医生们的工作量减少,要么是医生的数量减少。以目前来看,情况尚且乐观,事情可能在向前者的方向发展。但其它工作,却不见得。
这个案例,可能你很难想象。这也是我前几天看到的,是在一个做地板的厂子。
他们厂子有一项拳头业务是做高端木质地板,有个很重要的工作是筛选木板。这得雇一个熟练的老工人,工作流程是:有虫眼的放左边,好的放右边;有裂痕的放左边,好的放右边;有毛面的放右边,好的放左边……诶?错了,掉过来。好的放右边,有毛面的放左边。
但是现在不了,他们引入一条流水线,这条流水线没什么特别,只是比平常的多加了个摄像头。摄像头会自动识别毛面/裂纹/结疤/虫眼……的问题木板,去左边,好的放右边。
这让生产效率直接翻倍。成本……几乎没有成本,一点点的电费和网费罢了,比之前的人工要好不少。
如前所述,如果机器做事成本更低这件事成立,要么是工人们的工作量减少,要么是工人们的数量减少。以目前来看,情况可能更像是后者。这会是“消失的人”。
最后再来个简短的案例,是安防。相信你今年应该看过好几次这样的新闻:在张学友的巡回演唱会上(南昌、赣州、嘉兴、金华四场),警方通过人脸识别技术,一共抓获5名在逃犯人。
当逃犯们兴冲冲地拿着票走过摄像头,将要入场,此时他们的面部信息已经被抽取出来,实时传到云端,和后端数据库飞速地进行比对。
你能看到:机器不需要模仿人做事的方式,机器只需要模仿,甚至超越人做事的结果,这就够了。
你还能看到:同样是一个图像识别的技术,它可以被应用进各种看上去毫不相干的场景中去。此时,它能创造出巨大的价值。我们可以得到一个等式:人工智能=算法+数据+应用。
面对人工智能,我们能做些什么?
根据这个等式,我们可以盘演,在人工智能的这波机遇里,我们能做什么?
算法,这是个好主意。不过门槛挺高。你要去学数学、计算机两个学科的知识,至少得读个研的知识量。从浅到深,相关的内容大概会有:Python编程,爬虫,数据挖掘,高等数学,机器学习,深度学习……
数据……做人工智能的确需要大量、规整的数据。但,普通人手里,很难有可以训练算法的大量数据。这些数据,往往掌握在大型互联网公司里,如:谷歌/百度有搜索数据,facebook/腾讯有社交数据,亚马逊/阿里有商业行为数据……
前阵子我看过一个报道,说在中国的河南、山东、河北等地的四五线小城里,存在着一种“数据车间”,整个车间看上去仿佛是个网吧的模样,年轻的员工们窝在柔软的沙发里,对着电脑勾勾画画:将一张张图片里的梯子、玫瑰、地毯;梯子、玫瑰、地毯;梯子、玫瑰、地毯;梯子……给标注出来。
他们把这些标注好的数据,发送给大公司。大公司们,会用这些数据去训练算法。一张图,给两分五。
大公司们用高薪聘请到做算法的人才,大公司里有数据。所以,今天的你能够看到,人工智能技术基本都是由这些大公司提供。借助数据和算法,谷歌和facebook提供着精准广告,每年获得百亿美元利润;亚马逊的云计算为无数中小公司提供技术服务,支撑起近万亿美元的市值。
但这并不意味着,普通人在人工智能面前就没有机会。至少做应用,还大有可为。而且,越早去参与,越具备先发优势。
你只需要懂得一些基础的编程能力,就可以调用已经研发好的人工智能技术,把它应用到自己所处的行业中去。让技术,去替代、帮助人来工作。它能降低成本,提高收益,它有利可图。就像把图像识别用进农业、医疗、安防……等等,一样的。
这就好比:不是每个人都可以成为马云,但每个人都可以是淘宝卖家。应用阿里巴巴的技术,去开店铺,能创造价值。应用人工智能技术,也能创造价值。
在浙江省的一所中学,有位李老师发觉到一个现象:有些学生十分内向,不好意思向老师提问,加上老师分配给每个学生的时间有限,很难满足每个学生的学习需求。
他萌生了,去做一个自主答疑机的想法:学生将试卷、习题放在答疑机上扫描,系统便可快速识别题目,给出详细的解析和视频讲解,甚至还可以获得同一道题的多种学习思路。
没过多久,这台机器就被做了出来。因为它应用到的原理非常简单。如果是用Python语言来写,核心代码可能不超过20行。
首先,是把试卷拍张照。接着,调用专门做搜题功能的产品,所提供的接口,把试卷的图片,转换成文字。然后,从海量的试题库当中,找到这个题目的答案和解析,通过显示屏呈现出来。
这就是个很棒的案例。
做技术,还是做应用?是我们现在需要考虑的一个问题。但有一个命题是确定的——编程,是该学一学。你不需要担心它难,我教过了上万人学编程,我知道:如果我们的目标是学会调用已有技术,培养编程思维。那其实还挺简单……
而且学会编程,不只是可以做人工智能。你可以使用代码,让自己平时的许多工作,都自动化完成:图像处理、文档处理、市场分析、网页爬虫、数据分析……
选择Python
编程语言那么多种,该选哪一把铁锹?
答,就是你已经接触过的,Python。
编程语言是有很多没错,但如果我们学编程的目的,是为了参与进人工智能的浪潮,那么首选只能是Python。选择Python不但是安全的,还是必须的。
毕竟,它是人工智能时代的头牌语言,这是在技术界已经达成共识的事。
Python语言帮助人工智能发展更快,人工智能的发展带动更多人去学Python。它们自始至终,都是相辅相成的关系。
(国际电子和电气工程师联合会发布的第五届年度编程语言排行榜,Python名列榜首。)
不仅如此,Python在大数据分析、机器学习、云计算系统、web开发(比如Facebook/Google/豆瓣/知乎,都用Python开发)、游戏脚本……等时下最热门的应用里,都占据着主导地位。
造成这结果的原因,是由Python语言的特性决定的:
- 它够简洁
实现同样的功能,C++需要1000行,java需要300行,但python可能只需要20行。 曾经有个段子是这样描述:
你遇到了一群敌人! 你要怎么办呢?问问你的大将吧! C:拿出一根棍子,一个一个把敌人砸死。 C++:用机关枪。 java:我打电话叫十万个基佬! perl:我会功夫! ruby大喊着拿着武士刀冲上去了。 lisp:我先把敌人分组一下吧! haskell:我们可以用歼星舰啊! PHP:让我们把敌人老死吧! python:用氢弹。
- 它易学,易读
Python语言和人类语言高度相似,掌握Python的基础语法,快则几天,慢则1-2周就够。几乎不需要注释,就能让你读懂Python代码。 接下来,你就可以用它来调用已有技术,去实现自己的项目。
-
它作为胶水语言,便于不同行业的人协作
人工智能的研发,需要来自不同行业的人协作,不只是开发人员,还需要不同领域的科研人员、创意人才参与其中。
Python它跨平台,在windows、mac、linux……等系统上都能运行。 它特别好学。 每个人都可以非常方便地打包自己的代码,别人无需读懂,就能特别方便的调用。
这些特性,让协作的成本变得极低。
学人工智能,从Python开始。
风起于青萍之末
post还是get
lisa,come on
codepostcomment
kankan
ttttteeeesssssstttttttt
fsaafsaasdf
第二次
我来了
测试+2
练习
不错不错
果然,多行换行后的那行内容写入了一个新的元素中
所以如果要取净某个评论的内容
需要遍历tag 下所有的元素
试了一下,发现如果是单行换行
HTML会采用进行分隔
如果是多行换行呢?
如果发表的评论是多行
每行都会写入到一个新的标签内
多个元素才得到完整的评论内容
那么需要用到find_all(‘p’)方法
再遍历所有元素,提取文本内容
提取的内容要使用\n换行符进行拼接