强化站内搜寻与推荐服务痞客邦运用云端技术加速AI演算法上线

每日动态2021-02-22 08:02:46
最佳答案

当使用AI打造更多元的服务,成为现在企业的常态,企业不再只是关注AI可以应用的面向,更是进入到如何做可以更好的阶段。台湾知名的社群网路平台「痞客邦」(PIXNET)就是一例,近年他们不仅是开发各式AI服务与演算法,例如,个人化文章推荐的演算法、兴趣族群演算法等,为使用者推荐感兴趣的主题,也让拥有相同兴趣的人,能有更好的交流与互动方式,甚至他们为了让AI服务上线可以更即时,增加社群网站竞争力,因此希望缩短演算法部署上线的过程。

鉴于AI的需求,痞客邦已经成立研究团队,负责相关演算法的开发工作。在今年5月中举行的台湾云端大会上,PIXNET研发中心资深高级工程师赖义伟,更是进一步揭露了他们的团队的组成,目前他们共有5位演算法工程师、2位资料分析师,以及1位数据工程师。而他们的任务,就是开发各式AI服务和演算法。

目前,在痞客邦社群网站上,已经有不少他们团队的成果上线,赖义伟举例说明,像是他们开发了垃圾(Spam)文章侦测演算法,原因在于,痞客邦目前站上有超过8亿篇文章,每天新增就有40几万篇,若是要人力一个个审核显然不太可能,因此利用演算法去侦测这些文章相当重要,快速判断那些是垃圾文章,或者是优质文章。

最近,他们开发了个人化文章推荐演算法,当用户进入痞客邦首页时,将可以看到一个兴趣墙的文章建议,这是根据用户追随与兴趣主题所推荐出来。另外,他们也开发图片辨识的演算法,目的是为了想要知道,那些图片呈现在预览页面的效果较好,并且研究图片风格转换的演算法,希望能进一步丰富部落格所呈现的内容。

此外,还有像是关键字的主题分析服务、文章标记(Tag)搜寻服务、Chatbot数据指令服务,以及性别年龄预测演算法与兴趣族群演算法等。

为加速服务部署上线,借助SRE介入程度低的App Engine

值得注意的是,在这次台湾云端大会上,赖义伟特别分享了使用云端技术,来加速AI服务上线过程的经验。

在AI服务上线流程方面,过去他们的流程较为繁琐。当研究人员开发了一套最新的演算法,需要机器提供上线服务,这时在流程上会需要向SRE(Site Reliability Engineer)工程师申请,但往往过程会花上不少沟通时间。例如,询问需要的机器规格?预期负载流量、花费成本是多少,还有服务部署、监控与安全性设定的问题等。

赖义伟说明,由于SRE的工作常常处于到处救火的状态,再加上开发人员也要对他们的网路架构系统有一定了解,而团队也有一些非本科系出身的成员,在这些因素之下,沟通更花时间,因此,若是新的演算法服务上线,开发人员往往都要七天或是更久,才能拿到要的资源。

而在使用的云端服务方面,由于Pixnet使用的是Google Cloud Platform(GCP)平台,因此他们是以此平台来说明,在他们的AI服务应用与人力配置情况下,选择GCP平台服务的经验。

基本上,GCP平台主要服务包括Compute Engine、App Engine与Kubernetes Engine这三大类型。大约在两年前,他们开始採用最新的Kubernetes,只是,他们遇到几个挑战,例如,因为一些分析服务只有在工作时间使用,造成资源利用率不佳,而且他们对Kubernetes的特性还不是那么熟悉,更关键的是,在演算法开发工程师开发完要部署时,流程不够简洁。

因此,他们再次思考加速开发方法,进而发现App Engine的一些特性,其实很适合让开发者将AI演算法直接上线。其中最重要的就是,这是全代管的环境,并可以减少SRE人员的介入,最终让他们新开发的AI演算法,能在一天内就能完成上线。

赖义伟并表示,现在他们已经藉此方式优化搜寻服务,期望能提升站内搜寻点击率,创造更多自主流量。

儘管各业者使用的云端平台,以及开发政策与人员编制都不尽相同,但以Pixnet的经验而言,在开发AI服务与演算法这一方面,不仅是加速服务部署上线,赖义伟更是指出,开发快速且部署方便,这意谓着可以容易产生大量测试版本,因此他们能够每日观察AI演算法各版本的表现,以挖掘问题。如此一来,也等于是让AI服务要做到更精準的过程可以更简便。

免责声明:本文由用户上传,如有侵权请联系删除!