深度学习属于机器学习范畴下的一个子集,其利用多种方法以实现人工智能研究当中的一大核心目标:让计算机对我们的世界进行充分建模,从而展现我们理解当中的“智能”。
从基本概念角度出发,深度学习方法往往具备非常基础的共通特征。深度学习算法通过多个处理层对原始数据进行解释。其中每个处理层皆将前一处理层的输出结果作为输入结果,同时创建出更为抽象的表达。因此,只要将更多数据馈送至正确的算法当中,则算法通常能够给出更多与相关规则及特征紧密关联的推理与情景,并据此在处理新的类似情况时作为参考。
谷歌翻译提供的类似于科幻小说般的Word Lens功能正是一套深度学习算法支持下的产物。而Deep Mind最近广受关注之AlphaGo亦凭借着深度学习的强大能力横扫围棋界——不过具体来讲,AlphaGo的取胜算法并不属于纯粹的神经网络,而属于一套将深度加强学习与树搜索这一经典AI基础技术相结合的产物。
深度学习属于解决计算问题的一种充分方法,主要面向各类太过复杂而无法凭借图像分类或者自然语言处理等简单算法直接解决的任务。然而,目前深度学习的实际用途仍然非常有限。当下利用机器学习技术的行业大多未能充分发挥深度学习以及相关方法的发展潜能,而仅仅是借用了其中的一部分最佳实践。举例来说,关注近期深度学习变革动态的朋友可以已经听说,谷歌公司前任AI负责人John Giannandrea已经接管了该公司的搜索部门(这甚至可能彻底颠覆整个SEO领域)。
深度学习技术支持下的推荐系统——个性化的未来解决方案
可以肯定的是,深度学习亦将推动个性化领域迎来下一轮重大的跨越式发展。个性化对于电子商务企业、发行商以及营销机构而言皆已成为一大核心领域,因为事实证明其确实有能力提升销售效果、增加参与度并改善整体用户体验。如果说数据是个性化的燃料,那么推荐系统就是其出力引擎。此类算法的进步对于这一领域以及平台用户的在线体验必将产生深远的影响。
在这里,我们将着眼于三个具体领域,探讨深度学习如何对现有推荐系统作出补充及改进。
将内容纳入推荐流程
条目到条目推荐属于推荐系统中的一种标准化处理方式。这意味着当电子商务网站或者发行商网站作出推荐时,其推荐的结果源自用户此前曾经查看的其它类似条目。解决此类需求的一种典型方法为基于元数据的业务逻辑(另一种典型数据源为用户交互,即Amazon上提供的“买过此商品的用户还买了……”)。然而,元数据质量低下成为制约其实际效果的常见瓶颈,这主要源于元数据存在价值缺失或者缺少系统分配。在这种情况下,即使拥有完美的元标签,这样的数据也仅能够表达实际条目之间的间接性关联。而在深度学习的帮助之下,我们则可将内容(包括图像、视频与文本)等实际内容属性纳入推荐流程。利用深度学习,条目到条目间的关系将匹配算法对于产品更为全面的理解,且更少依赖于手动标记以及广泛的交互历史记录。
在这方面,Spotify的推荐系统相当值得肯定。该公司在2014年的研究当中将深度学习引入推荐系统,旨在提供更为多元的歌曲推荐,同时帮助用户创造出经过改进的个性化体验。这项音乐流服务以往曾在其推荐系统中采用协同过滤方法。但Spotify公司实习员工Sander Dieleman这位博士生却将此视为当前功能中的最大缺陷,因为这种高度依赖于数据的作法将不可避免地错失某些人气不高、刚刚崭露头角的艺术家及其不为大众所知的歌曲。因此,Dieleman本人采用一种深度学习算法从50万首歌曲当中各自挑选时长30秒的摘录,并对音乐本身进行分析。这种连续多层学习网络能够掌握更为复杂且恒定的歌曲特征,其基本思路与图像分类非常相似。事实上,“立足于这套网络中高于输出层的完全连接层,经过学习的过滤器最终能够更具选择性地把握音乐中的某些子类”,包括福音音乐、中国流行音乐或者深屋音乐等。在实践当中,这意味着此类系统能够仅基于歌曲的相似性(这种特性对于用户组合个性化播放列表非常重要)以有效进行音乐推荐。尽管我们尚不清楚Spotify公司是否会将这些发现纳入实际算法,但这项实验本身的意义仍然值得高度肯定。
解决冷启动难题
冷启动可谓推荐系统的天敌,其可能对用户及条目产生严重影响。对于用户而言,冷启动意味着当前系统几乎甚至完全不具备任何与客户行为及偏好相关的信息。而条目冷启动则代表其缺少能够指导用户互动的条目到条目间关联数据(虽然我们仍然拥有元数据,但这并不足以提供真正的细致建议)。而利用上述基于内容的方法,条目冷启动的实际效果将得到明显改善,因为其能够保证推荐系统较少依赖于事务及交互数据。
然而,为新用户创造有意义的个性化体验又是另一个棘手的问题,而且很难通过简单收集更多信息加以解决。这种状况在电子商务网站或者包含广泛产品组合的在线商店系统中普遍存在,客户会随着时间推移而随意访问完全不同的浏览目标。他们可能最初决定购买微波炉,但却在下一次访问时查找手机。在这种情况下,第一次会话收集到的数据与第二次会话几乎完全无关。
解决用户冷启动问题的一种有趣思路在于建立基于会话或者条目到会议的推荐。简单来讲,这意味着系统不再依赖于客户的整体交互历史,而是将相关数据分解成多个不同会话,同时立足于特定会话的点击流为用户建立兴趣模型。通过这种方式,未来的推荐系统可能将不再依赖于数月甚至数年之内收集到的、经过精心设计的客户资料,而完全可以在用户进行一段时间的网站操作之后为其提供合理的相关建议。
尽管这一领域尚未得到彻底研究,但确实有可能带来巨大的个性化在线体验提升机遇。Gravity R&D公司的研究人员们在参与欧盟资助的CrowdRec项目时共同撰写了一篇论文,其中介绍了如何利用一种卷积神经网络(简称RNN)方法提供基于会话的建议。这是第一篇利用深度学习技术通过基于会话方式实现推荐功能的研究论文,而结果表明他们的方法拥有优于当前最新算法技术的实效。
真理四时刻
所谓真理四时刻,是指客户在根据企业沟通与相关可用信息作出决定的四段短暂时间。这些决定虽然受到长期考量、个人喜欢以及品牌忠诚度等因素的严重影响,但同时也受到瞬时印象的引导。面对这些真理时刻,强大的深度学习系统很可能带来足以左右人类决策流程的可行方法——这样的见解无疑相当新颖。
举例来说,我们都知道漂亮的产品图片能够促进销售(整个行业都在想办法为出租房屋或者食物拍摄美观的图像)。但在另一方面,我们也期待着能够利用基于深度学习的图像分析方法来评估产品图像中的视觉特性到底如何对销售活动产生显著的积极影响。
诚然,本篇文章所涉及的内容并不详尽。个性化无疑是当今互联网行业最为迫切的需求之一,而深度学习技术几乎必然在这一领域拥有着巨大的潜能。因此,希望保持自身竞争优势的企业自然也有必要时刻关注这项技术的发展与动向。