阅读提示:为防止内容获取不全,请勿使用浏览器阅读模式。
我们建议采用实时训练,实时训练省资源并且反馈快,这对信息流产品非常重要,用户需要行为信息可以被模型快速捕捉并反馈至下一刷的推荐效果。”
“我们目前计划采用基于stor集群实时处理样本数据,包括点击、展现、收藏、分享等动作类型。”
“整体的训练过程是线上服务器记录实时特征,导入到Kafka文件队列中,然后进一步导入Stor集群消费Kafka数据,客户端回传推荐的label构造训练样本,随后根据最新样本进行在线训练更新模型参数,最终线上模型得到更新。这个过程中主要的延迟在用户的动作反馈延时,因为模型推荐后用户不一定马上看,不考虑这部分时间,整个系统是几乎实时的。”
“当然,这会产生非常庞大的信息数据,我们需要对目前的系统底层做一定的优化,完善运维工具。”
赵睿对着自己做的一份界面很是简陋的演示文件,对着袁旭和宋瑞一众人一顿输出。
袁旭的感觉,嗯,听不懂,但是看上去,好像挺像那么一回事的,逻辑能够自洽。
“那么,现在的主要问题有什么呢?”
虽然具体原理听不懂,没关系,作为一名合格的老板,善于提出问题并给予解决才是最重要的不是吗?
“模型需要找一个场景进行训练,运行一段时间我们才能发现是否有问题,是否能够完整的实现我们理论上的理想结果。”赵睿说道。
“我明白了,你们是需要找一个机会来对这个模型进行测试对吧?”
“是的,也不完全是测试,它也需要学习,所以,需要找一个用户数量比较大的场景进行试验。”
“用户数量比较大?”袁旭略一沉吟,“倒也不用多费心,眼前不就有一个么,爱家网么!”
作为目前华夏第一大购物网站,爱家网连同爱家商城目前光卖家就有600余万,年成交金额高达1.1万亿,合1775亿美金。
这不正是推荐模型的最好的试验场么?
再者说了,爱家也需要这种推荐模型么!
“就是在收集用户信息方面会有一定的风险。”
赵睿末了提醒了一句。
“模型开始测试前一天,想办法让所有的爱家用户强制下线,重新登录,登录界面增加修改后的用户协议,协议中注明将会自动收集顾客浏览商品信息,便于更好的对客户进行更有针对性的推荐。”
对于个人隐私,袁旭倒不是很在意,收集用户的信息并加以分析,这几乎是所有的网站都在搞的动作,也没见闹出来过什么事情。
为了以防万一,打个补丁也能说得过去。
然而,接下来发生的事情就让袁旭有些尴尬了。
这边刚决定打一个不起眼的小补丁,便于收集用户信息被告了之后作为自己已经告知的凭证。
那边,就有一位“老朋友”控诉天工科技“恃强凌弱”,随意下架其公司产品。
这位“老朋友”,就是36圈的老板,周红衣。
2013年9月10日,教师节。
周红衣在自己的说说上发了一篇小短文。
“又一次,蛮横的天工科技又一次将36圈的全部产品全部从其软件商店中下架,所有使用天工手机的朋友都无法下载和使用36圈公司的产品了。”
从周红衣的“又”字里,可以看出,这样的被下架,并不是第一次了。
2012年的12月,36圈公司的全部7款产品,全部被天工科技方面从软件商店中下架,原因是运营主管发现那几天36圈公司的那几部产品的投票数有异常增长,运营判定36圈公司在进行刷票,因此将其公司的全部产品进行下架处理。
到了2013年9月初,天工科技的技术人员发现
本章未完,请点击下一页继续阅读》》