jnan77 发布于 06月26, 2017 0 comments Apache SystemML基于大数据的机器学习 原文 目前支持的机器学习算法有: 描述性统计 Descriptive Statistics 该类中的算法用于描述数据集的主要特征。它们提供了对不同观察或数据记录计算的有意义的摘要收集在研究中。这些摘要... 阅读全文 »
jnan77 发布于 06月20, 2017 0 comments 皮尤报告:算法时代七大主题,数据与模型将操控人类 全球权威调查机构皮尤研究所日前发布报告《算法时代》,采访千余专家,分7大主题探讨算法对生活各方各面的影响。报告的目标是客观全面反映当前人们对即将到来的算法时代的看法,结果仅38%的特定受访者预测算法的... 阅读全文 »
jnan77 发布于 06月19, 2017 0 comments 机器学习之文本特征选择的评估算法对比 文本特征选择的评估算法 TF-IDF 单词权重最为有效的实现方法就是TF-IDF它是由Salton在1988年提出的。其中TF称为词频,用于计算该词描述文档内容的能力。IDF称为反文档频率,用于计... 阅读全文 »
jnan77 发布于 05月03, 2017 0 comments 【转】魅族推荐平台架构解析(三) 近线模块该层主要是利用流式处理的技术对用户实时产生的行为日志进行加工,利用一些高效、高性能的算法生产有价值的数据,如处理算法数据召回、实时数据统计等等。如图,近线模块-流式日志数据传输分为以下几个部分... 阅读全文 »