多年来,机器学习一直被认为是一个值得关注的趋势。但我们完全有理由在2020年的背景下讨论这个问题。得益于TensorFlow的发展。这是一个端到端的开源机器学习库,可以在web浏览器中直接运行预先训练好的AI。
为什么激动?这意味着人工智能正在成为网络更完整的一部分;一个看似小而古怪的细节可能会产生深远的影响。
当然,我们有很多使用人工智能的网络工具的例子。语音识别、情感分析、图像识别、自然语言处理不再是惊天动地的新事物。但是,这些工具通常将机器学习任务转移到服务器,等待它计算,然后返回结果。
(资料图片)
对于那些可以原谅小延迟的任务来说,这是一个很好的选择(你知道这个场景:你用英语输入一个文本,然后耐心等待一两秒钟将其翻译成另一种语言)。但是这种从浏览器到服务器再到浏览器的延迟对于更复杂更有创意的应用程序来说是致命的。
比如基于人脸的AR镜头需要实时、连续地跟踪用户的脸部,所以绝对不允许有任何延迟。然而,对于更简单的应用程序,延迟也是一个主要问题。
前不久,我尝试开发一款web应用,不断通过手机后置摄像头搜索logos。这个想法是,当人工智能识别标志时,网站就解锁了。很简单,对吧?你这么认为。但是,即使是这个看似简单的任务,也意味着拍摄相机快照并发布到服务器,这样人工智能就可以识别徽标。
这项任务必须以极快的速度完成,这样用户在移动手机时才不会错过logo。这导致每两秒钟就有数十千字节的数据从用户的手机上传。完全浪费带宽和性能杀手。
然而,TensorFlow.js将TensorFlow的服务器端AI解决方案直接带到了网络上。如果我今天构建这个项目,我可以运行一个预训练的模型,让人工智能在用户的移动浏览器中识别给定的徽标。不需要上传数据,检测可以每秒运行几次,而不是每两秒一次。
机器学习应用程序越复杂和有趣,我们需要的延迟就越接近零。因此,消除了延迟张力流。JS和AI的创作画布突然变宽;谷歌发起的实验完美证明了这一点。它的人骨追踪和表情寻宝项目表明,当机器学习成为网络的一个适当的集成部分时,开发人员可以变得更有创造力。
骨架跟踪特别有意思。它不仅为微软Kinect提供了廉价的替代品,还将其直接带到了网络上。我们甚至可以开发一种使用网络技术和标准网络摄像头来响应运动的物理设备。
另一方面,表情寻宝展示了运行TensorFlow.js的移动网站如何在手机的用户环境面前,突然意识到自己在哪里,看到了什么。因此,它可以培养结果所显示的信息。
这也可能产生深远的文化影响。为什么呢?因为人们很快就会开始把移动网站理解为“助手”,而不仅仅是“数据提供者”。这一趋势始于谷歌助手和支持siri的移动设备。
但现在,由于真正的网络人工智能,一旦网站——,尤其是移动网站——开始实施即时机器学习,这种以手机为助手的倾向就会根深蒂固。它可能会引发社会观念的转变。人们会期望网站在任何给定的时刻提供完全相关的信息,但干预和指导的程度将被最小化。
假设我们也可以用真实的网络人工智能来开发适合人们使用的网站。将TensorFlow.js与Web存储API相结合,网站可以逐渐个性化其调色板,以满足每个用户的偏好。网站的布局可以调整为更有用。甚至它的内容也可以调整,以更好地满足每个人的需求。一切都在进行中。
或者想象一个移动零售网站,通过摄像头观察用户的环境,然后根据用户的情况调整其产品?以及分析你声音的创造性在线活动,比如谷歌的弗雷迪米特尔?
随着所有这些吸引人的可能性成为现实,很遗憾我们不得不等待如此长的时间来寻找一个合适的网络端机器学习解决方案。再一次,正是这款移动设备缺乏人工智能性能,才使得TensorFlow产品开发(就像服务器端TensorFlow——.js版本的前身一样)成为真正的web集成部分。现在我们终于有了真正的网络机器学习的礼物,2020年很可能是开发者释放人工智能创造力的一年。