Facebook的4种惊世骇俗的人工智能方法

2017-01-04 10:00:00 作者:佚名 分类 : 人工智能

  在早些时候,我写过几篇文章,对人工智能进行了基本的介绍,如机器学习和深度学习。那么接下来我将结合一些例子,阐述如何在实践中使用人工智能。

  Facebook通过了解用户信息来为广告商提供数据来构建其业务。然后再用从广告商赚到的钱为用户提供有用的新功能,例如视频和购物。接着,它还会利用这些功能来进一步了解用户信息。

  Facebook构建了一种新的人与人之间沟通和交流的方式,我们越来越离不开它。它掌握着大量关于我们的数据,数据涉及我们是谁,我们把时间花在哪儿,我们喜欢什么。对于Facebook的数据科学家来说,最大的问题是,大部分数据都是混乱的非结构化数据。

  虽然Facebook上每分钟有12亿人上传13.6万张照片,更新状态达293000次,但是直到最近,Facebook还只能从这些非结构化数据的一小部分获取价值。这些数据很难被量化成为计算机易于分析的矩阵。

  深度学习正在改变这种状况。深度学习技术使机器能够自己学习如何对数据进行分类。深度学习图像分析工具就是一个简单的例子,它可以在不被具体地告知猫是什么样子的情况下,学习识别包含猫的图像。通过分析大量的图像,它可以从图像的上下文中学习猫的图像中可能存在什么特征?什么样的文本或元数据可能表明图像包含猫?

  通过对数据的量化,并将数据表示为分析工具能理解的形式,可以为非结构化数据提供结构。它们试图回答这样的问题,例如,公司的产品是否经常出现在包含猫的照片中?我们应该专注于向喜欢猫的人展示我们的广告吗?

  这是深度学习(DL)应用于Facebook的基本原理,随着DL算法变得越来越复杂,它们可以越来越多地应用于文本、图片和视频等数据。

  下面是几个DL的具体用例,用于帮助Facebook实现其目标,为用户提供更大的便利,并使他们能够更深入的了解我们。

  1.文本分析

  在Facebook上分享的大部分数据仍然是文本。视频可能涉及以兆字节为单位的更大的数据量,但就表达内容而言,文本也可以表达同样丰富的内容。一张图片的大小等同于1000个词,但如果你只想回答一个简单的问题,你通常不需要1000个词。每一位与你问题无关的数据都是噪音,它们是对资源的一种浪费。

  Facebook拥有一个他们自己开发的工具,叫做DeepText,这个工具通过学习和分析词的上下文来提取它们的含义。神经网络会分析词之间的关系,以了解它们的含义是如何根据周围的其他词而变化。因为这是半监督学习,所以算法并不需要具有像字典一样的能解释每个单词含义的参考数据。相反,它是基于单词如何使用来进行自我学习。

  这意味着它不会因为语言使用的拼写,俚语或个人喜欢的变化而受到影响。事实上,Facebook说技术是“与语言无关”的——由于它将标签分配给单词的方式,它能够轻松地在不同的人类语言中切换,并将从一种语言中学到的东西应用于另一种语言。

  目前,该工具被用于根据人们的对话内容来分析它们可能想要购买的产品。Facebook曾发布的一个视频解释了DeepText是如何根据上下文来决定为用户提供的购物链接是否合适。

  2.人脸识别

  Facebook使用叫做DeepFace的DL应用程序来教它识别照片中的人。该公司表示,其最先进的图像识别工具比人类能更准确地识别两个不同的图像是否是相同的人。DeepFace的识别成功率为97%,而人类则是96%。

  使用这种技术仍然存在争议。隐私权拥护者表示,因为这种技术允许Facebook基于人群的高分辨率照片给很多面孔贴上名字的标签,这显然会对我们在公开场合的匿名活动的自由造成障碍。欧盟立法者对此表示认同,并说服Facebook在2013年从欧洲公民的帐户中删除该功能。当时Facebook使用的是人脸识别工具的早期版本,该版本还没有采用深度学习。Facebook一直没有透漏这种技术的进展,人们猜测该公司可能在等一些隐私案的裁决结果,然后才能公布和说明它的进一步推出计划。

  3.定向广告

  Facebook利用深度神经网络(深度学习的基石)来决定向哪些用户展示哪些广告。一直以来,这都是该公司的业务基石。通过让任务机器本身尽可能多地了解我们,才能在为我们推送广告时,以最富有洞察力的方式将我们聚集在一起。该公司希望继续保持对谷歌等其他高科技竞争对手的竞争优势,它们正在争夺同一市场。

  4.设计AI应用程序

  Facebook甚至决定,用机器来处理能通过AI和深度学习改进的任务。它已经实现了一个名为Flow的系统,该系统使用深度学习每个月对30万个机器学习模型进行模拟,以便让工程师能够测试他们的想法,并找到提高效率的方法。

  开源

  Facebook非常支持开源,其AI实验室Facebook人工智能研究(FAIR)的大部分研究成果都免费让任何人使用或修改。大多数Facebook的深度学习建立在Torch平台上,这是一个专注于深度学习技术和神经网络发展的开发环境。

  Facebook甚至将其图形处理器单元(GPU)驱动的AI硬件的设计开源。超高速计算机为执行深度学习任务而进行了优化,因为涉及大量计算和速度,这些任务通常是处理能源密集型的输入数据。

  展望未来

  深度学习可能继续在Facebook未来发展中发挥关键作用。虽然Facebook目前对于其潜在的新应用程序继续保密,但是它已经提出的想法包括自动生成图片的语音描述以辅助视觉受损的人,并且预测在其任务中需要更大范围的网络覆盖,以将互联网访问服务推向世界。他们资源丰富的AI和深度学习实验室的工作成果,会让无数机构组织获益,不管是通过直接使用他们的服务,还是间接得益于他们对开源原则的支持。

相关推荐

最近更新
科普

邮件订阅

软件信息化周刊
比特软件信息化周刊提供以数据库、操作系统和管理软件为重点的全面软件信息化产业热点、应用方案推荐、实用技巧分享等。以最新的软件资讯,最新的软件技巧,最新的软件与服务业内动态来为IT用户找到软捷径。
商务办公周刊
比特商务周刊是一个及行业资讯、深度分析、企业导购等为一体的综合性周刊。其中,与中国计量科学研究院合力打造的比特实验室可以为商业用户提供最权威的采购指南。是企业用户不可缺少的智选周刊!
网络周刊
比特网络周刊向企业网管员以及网络技术和产品使用者提供关于网络产业动态、技术热点、组网、建网、网络管理、网络运维等最新技术和实用技巧,帮助网管答疑解惑,成为网管好帮手。
服务器周刊
比特服务器周刊作为比特网的重点频道之一,主要关注x86服务器,RISC架构服务器以及高性能计算机行业的产品及发展动态。通过最独到的编辑观点和业界动态分析,让您第一时间了解服务器行业的趋势。
存储周刊
比特存储周刊长期以来,为读者提供企业存储领域高质量的原创内容,及时、全面的资讯、技术、方案以及案例文章,力求成为业界领先的存储媒体。比特存储周刊始终致力于用户的企业信息化建设、存储业务、数据保护与容灾构建以及数据管理部署等方面服务。
安全周刊
比特安全周刊通过专业的信息安全内容建设,为企业级用户打造最具商业价值的信息沟通平台,并为安全厂商提供多层面、多维度的媒体宣传手段。与其他同类网站信息安全内容相比,比特安全周刊运作模式更加独立,对信息安全界的动态新闻更新更快。
新闻中心热点推荐
新闻中心以独特视角精选一周内最具影响力的行业重大事件或圈内精彩故事,为企业级用户打造重点突出,可读性强,商业价值高的信息共享平台;同时为互联网、IT业界及通信厂商提供一条精准快捷,渗透力强,覆盖面广的媒体传播途径。
云计算周刊
比特云计算周刊关注云计算产业热点技术应用与趋势发展,全方位报道云计算领域最新动态。为用户与企业架设起沟通交流平台。包括IaaS、PaaS、SaaS各种不同的服务类型以及相关的安全与管理内容介绍。
CIO俱乐部周刊
比特CIO俱乐部周刊以大量高端CIO沙龙或专题研讨会以及对明星CIO的深入采访为依托,汇聚中国500强CIO的集体智慧。旨为中国杰出的CIO提供一个良好的互融互通 、促进交流的平台,并持续提供丰富的资讯和服务,探讨信息化建设,推动中国信息化发展引领CIO未来职业发展。
IT专家网
IT专家新闻邮件长期以来,以定向、分众、整合的商业模式,为企业IT专业人士以及IT系统采购决策者提供高质量的原创内容,包括IT新闻、评论、专家答疑、技巧和白皮书。此外,IT专家网还为读者提供包括咨询、社区、论坛、线下会议、读者沙龙等多种服务。
X周刊
X周刊是一份IT人的技术娱乐周刊,给用户实时传递I最新T资讯、IT段子、技术技巧、畅销书籍,同时用户还能参与我们推荐的互动游戏,给广大的IT技术人士忙碌工作之余带来轻松休闲一刻。