日平均使用时长达53分钟,技术派今日头条是怎么做到的?

日平均使用时长达53分钟,技术派今日头条是怎么做到的?

今日头条创始人、CEO 张一鸣

“当互联网、移动互联网出现后,媒体的变革比从前要大的多。不可回避的是,‘一纸风行’的日子一去不复返了。”在 1月15日“今日头条未来媒体峰会”上,创始人张一鸣这样评价媒体业。

张一鸣笃信:“每次技术的变革,都带来传播的变革,从而带来内容的变革。”他创办的今日头条作为数字内容分发渠道代表之一,不仅仅想做新时代里的“纸”,还要利用技术以及算法来替代“快递员”,让内容更好地传递到对它感兴趣的用户手中。

虽然这是一项浩大的工程,但今日头条已经在做了,先来看看它的数据:

到 2015年,今日头条用户日平均使用时长达 53 分钟。

今日头条已经与超过2000家媒体机构展开了合作,超过了现有的门户网站合作规模。媒体在今日头条每天新增被推荐出的内容达到22613篇次,历史累计阅读量达到1亿次的媒体已经有74家,超过5亿的有10家,其中1家超过30亿次。

由媒体机构生产,在今日头条平台上分发的内容,共有60375篇阅读总量达到10万+。在今日头条上,爆款的底线是“100万+”,2015年,媒体机构产生的100万+内容数量有4612篇。

这是成立不到4年的今日头条交出的成绩,它是怎么做到的?

超过6000台服务器进行运算,保证秒级速度反应

“用户的信息越多,推荐的内容会越准确。”今日头条副总裁赵添在接受《二十一世纪商业评论》(下称《21CBR》)记者专访时说。

一般地,今日头条新用户“冷启动”情况分为两种:若基于社交平台如微博、微信等ID登录,在获取其互联网行为数据后,系统会为用户推荐可能感兴趣的内容;

若没有社交信息可借鉴的用户,今日头条会主动测试用户的“阅读行为”,第一次推送数十条内容,用户只要产生任何阅读相关的行为,如长时间停留、点击、评论、点赞,再次刷新内容时,内容就出现变化,其后不断优化。

这种基于用户“阅读行为”的推荐算法,正是今日头条的产品灵魂,算法模型的决策维度,取决于用户性别、年龄、兴趣等数百种特征以及复杂的逻辑联系。个性化推荐大大增加了用户黏性,赵添有信心半年内单用户每日时长可达到1个小时。

用户越喜欢的内容越推荐,是否意味着推荐内容的单一性?其实不会,今日头条系统设有快速提权和衰减的机制,由一系列的算法组合起效。

比如,赵添本人曾订阅一个专注多肉植物的账号,今日头条此后不断推荐与之相关的内容,每8个推荐中有1个相关,“大约坚持10次没有点开内容,之后就不再 出现了,”赵添解释说,“系统能够判断这是你的长期兴趣或是短期兴趣,屠呦呦获得诺贝尔奖,系统可分析出这是由热点带来的阅读,用户看了不代表就喜欢科 学。”

日平均使用时长达53分钟,技术派今日头条是怎么做到的?

不断“学习”人对信息获取的规律,了解用户信息偏好,再刷新时,系统会判断哪些内容有资格进入推荐候选,这被称为“召回模型”,帮助过滤大部分无效信息;而用户量越大、阅读时间越长,系统越有机会进行交叉验证,了解用户真正的喜好,用户画像也越准确。

凭借先发优势以及技术资源的持续投入,今日头条的“护城河”正越来越宽。事实上,任何一个被互联网改造的领域往往以数据先行,考验的核心就在于数据处理能力。今日头条3500万日活跃用户,每天推荐文章数量在数十万量级,怎么实现最短时间内为海量用户进行个性化推荐?

据了解,现在今日头条共有超过6000台服务器进行运算,保证以秒级速度收集信息、对用户特征做出反应,而若采用传统客户端模式,服务器数量约只需其十分之一;

而且,今日头条投入大量财务资源用于技术研发和人才招聘,其核心技术团队不少来自谷歌、微软、百度等技术顶尖的公司。在一则招聘广告上,今日头条标榜自己 是“一家极其重视机器学习的移动互联网公司”,其为资深工程师、架构师提供的年薪标准为10万—100万,单位是美元。

如今,亚洲范围内已有Smart News、Gunosy等多款应用,学习今日头条的模式,哪怕只有中文版,也不妨碍日本等国的工程师体验和研究这款中国产品。

建内容库、商业变现

今日头条基于机器学习技术进行个性化信息推荐,自身不生产内容,2014年C轮融资后,版权争论不断,张一鸣曾回应说,今日头条是导流模式,并不存在版权问题,而同时,今日头条着手建立自身的内容体系。

2014年6月,“头条号”推出,邀请各大媒体、自媒体、机构等入驻,截至2015年12月,头条号总数已达4.1万,其中传统媒体身份入驻的约1500 家。赵添告诉《21CBR》记者,现在今日头条73%的信息内容来自头条号,只有27%来自签约媒体,较之18个月前,今日头条已大大增强了内容端的话语 权。

“我们的优势是分发,要求在上游内容尽可能多地覆盖。”赵添告诉《21CBR》记者,今日头条正在抓紧建设内容生态。

为鼓励内容生产,2015年9月头条号推出“千人万元”计划,以鼓励高质量内容生产者在平台上的发展,计划签约1000人(机构),月收入保底1万元,70%以上内容若为原创,经审核会授予“原创”标识,提供200%的广告补贴。

赵添透露,截至2015年12月,头条号的4.1万个内容生产商每天创作文章约4.8万篇;2015年9月启动原创计划,2500个账号已拥有“原创”标识,“千人万元”计划已签约了130家左右,“收入最高的月入约七八万元”。

内容商的痛点不外乎流量与盈利两方面,在赵添看来,“今日头条采用机器算法推荐的机制,机器客观分析点击量、收藏、转发、评论等,好内容流量可以很快提高”。

其中,越是涉及长尾的内容,借助今日头条的个性化推荐,优势更明显,比如红茶可能是一个小众领域,过往专业性内容的分发效率非常低,现在则可更高效地建立用户和信息之间的连接。

除了利用技术外,今日头条还引入像林楚方(前《壹读iRead》主编,现今日头条副总裁)等有着传统媒体工作经验的人,建立专业的内容运营团队帮助算法去发现、判断内容的价值。“我们很在意发挥人的智慧和品位,一直在寻找算法和人工之间的最佳结合点”,张一鸣说。

与此同时,在今日头条这样的中心化流量分发平台上,相较于微信,粉丝数量及其在阅读量中的占比较低,某种程度上局限了内容方商业模式的扩展,而头条号与粉丝相关的游戏规则据传将会重新设计。