新闻客户端市场,新闻大数据与深度神经网络
2018-03-18 16:49:55
  • 0
  • 0
  • 0


一.用户需求分析:

①了解实时新闻,有一个与外界的信息沟通渠道

②能够将自己投入新闻热点的讨论与分析中去,自我表达的需求

③假新闻爆炸时代用户可以得到真实的新闻

④深度学习技术提供的个性化新闻引荐

对应的KANO模型

二.用户分析(基于大数据)

①用户使用场景:

工作之余(例:下班坐地铁和公交,梳理心情和了解一下有趣的新闻,消磨时光)

休息前后(例:睡觉前和起床后,懵懂状态过度到精神振奋状态的一个媒介,看看今天会有什么头条还有总结今天的讯息)

工作,学习中(例:工作累了放松心情,学习累了放松心情寻找灵感)

②各个年龄阶段对新闻的需求

  • 小孩子:第一个想到的肯定就是动画片了。这是每一个小孩子的爱好。当然还有一些小孩子会看其他的,比如什么画画之类的,围棋,跳舞,唱歌等等。这是针对大多数小孩子观众的。
  • 学生:一天接触手机比较少。但是还是有一些不好好学习的学生就会偷着玩手机。那么他们一般会找一些游戏的视频,或者电影的片段来看看。并且有些学生由于自控力不好,也许还会看一些比较有挑逗意味的新闻图片之类的。这都是正常的。当然这也是针对大多数,不排除个别人会有自己的喜好。
  • 中青年人群:这个群体是很庞大的。他们一般都是一些没有家室或工作的人,或者是结婚过日子的人。他们关注的就更广泛了。像男生,一般会看一些体育新闻之类的,还有影视剧,当然美女是他们无法避免的。女生一般就会看一些化妆品,衣服之类的。这是针对大多数,有少数人可能会有自己的爱好,他们会照着自己的喜好来观看。
  • 老年人:老年人一般会去看一些在我们看来是过去的东西,比如戏曲,或者是当下的一些时政要闻,还有养生,健康之类的东西。

③不同性别对于新闻资讯的使用

④不同地域的人对新闻客户端使用率

三.技术背景

①基于深度学习的推荐算法

新闻推荐是现在新闻媒体普遍使用的功能,主流媒体应用的都是基于特征的推荐:对于新闻推荐,物品的属性则有可能是新闻的文本内容、关键词、时间等,同时包括用户的点击、收藏和浏览行为等等。在电商网站上,还可能包含很多信息评论文本(Review Text)、用户查看的历史记录、用户购买的记录等。还可能获得用户的反馈信息,总体上可以分为两类:一是显式的用户反馈(Explicit Feedback),这是用户对商品或信息给出的显式反馈信息,评分、评论属于该类;另一类是隐式的用户反馈(Implicit Feedback),这类一般是用户在使用网站的过程中产生的数据,它们也反映了用户对物品的喜好,比如用户查看了某物品的信息,用户在某一页面上的停留时间,等等。对于基于背景敏感的推荐,可以使用SVD++ [2], SVDFeature [3], libFM [4]等基于特征的推荐算法。

推荐算法可以被理解为一个极端的multiclass classification;我们要做的是,在某一个时间(t),从所有的新闻里面(V),对于某一个新闻(i),这个用户(U)在这个context下(C)会不会去选择看这个新闻(Wt = i),通过以下算法进行学习用户植入内容。

此算法实现的内容是根据时间,评论,新闻特征的推荐。

②新闻大数据

现在新闻大数据的利用率低下,推荐系统较为成熟,但是对于推荐的新闻价值无法考量,垃圾数据冗余量大,大数据的价值不明显,发展方向清晰。

  • 为客户端推荐算法的模型训练提供数据原型
  • 为垃圾数据检索提供大数据模型
  • 为分析各行各业的动态提供大数据来源
  • 为原始新闻提高价值转化率

③垃圾新闻筛选

KNN算法:通过从数据集中找到和此新闻最接近的k条记录,然后根据他们的主要分类来决定新的新闻类型

贝叶斯:对于给定的待分类项,求解在此项出现的条件下各个类别新闻出现的概率哪个最大,就把此待分类项归属于哪个类别

SVM(支持向量机):建立一个超平面作为决策平面,使得正例与反例之间的间隔最大化,这两类样本中离决策平面最近的训练样本就叫做支持向量

总结:现阶段SVM算法在新闻的过滤上面效果最佳(不过好像也没好到哪里去。。。),贝叶斯算法其次,KNN算法的区分度不高,在这个垃圾新闻筛选领域还有很多的工作要做。

四、市场分析

互联网新闻产业链日渐完善,在新闻生产、渠道分发环节都形成了相对成熟的发展机制,市场监管日益完善,参与主体日趋多元。生产模式上,UGC用户生产方式逐渐向机构化过渡,形成了专业新闻生产业与用户生产相融合的发展趋势;分发模式上,“算法分发”逐渐成为网络新闻主要的分发方式;传播模式上,媒体“去中心化”和传播“多层次化”的特征日渐显现;商业模式上,呈现出商业广告为主,多样化模式探索并存的局面。

市场占有率方面,腾讯新闻和今日头条占有率最高,移动端对新闻的需求量大于PC端,各大公司都把技术和产品投身于移动端。

用户的角度,对于评论,分享,新闻获取的需求更多,而且多为社交媒体为主。

五、用户体验分析

六、发展方向

①增强推荐的准确率和推荐的有效性

②提高大数据的利用效率,以数据为核心,但不同的途径获取获取到的数据,可能存在着条目重复性、文件格式的杂乱性、空白值等问题,需用 Excel、Spss、Clementine 等软件对不完整的数据、重复的数据进行“清洗”。解决新闻呈现形式单调的缺点,数据新闻与当下最新的新闻生产技术和理念相结合,形成独具匠心的报道。

③垃圾筛选(标题党,垃圾评论)加强,尽量提供给用户纯净优质的内容。新闻媒体业要抓住“质”和“量”两个关键,丢失任何一种都会让用户体验下降,“质”方面就要通过更多技术手段进行数据处理和新闻过滤,“量”方面也要不光考虑推荐给用户的用户经常浏览的内容,也要分析用户长时间没有涉及的一个领域,“新”新闻会让用户的浏览范围更广,也会满足用户多方面浏览的需要。

④客户端的离线使用:在这方面可能很多新闻客户端没有注意到,离线使用关系到数据缓冲流,缓存的使用,也在一定程度上影响着用户体验,用户在某些时候(可能为了省流量)避免不了离线使用客户端,离线不能单纯只是提醒用户没有连接网络,而是应该用一种引导式的思想去引导用户通过流量使用客户端,这时候缓冲的作用就体现的非常明显了,如果用户离线可以看到图片和文字介绍的话,用户对感兴趣的新闻会下意识地点击然后意识到没有使用流量,这时候做为客户端要想办法引导用户使用流量,对于离线用户的使用也是不单单新闻客户端,所有客户端需要考虑的一个问题,让用户离线使用的功能最大化和优化用户体验。

总结起来,新闻客户端其实接触面比较广,对于群体的思想个渗透较深,如果内容质量无法提升,会潜移默化地影响人们的认知,不能为了流量玩而牺牲用户体验和用户对信息的真实性需求。

 
最新文章
相关阅读