在机器学习技能自学成才的过程中,我们必须对自身的教育和启蒙负责。本文列出了十条不应掉以轻心的戒律。前车之鉴,后车之师。
1. 数学、代码和数据是“三位一体” 的
任何行之有效的机器学习流水线,都是数学、编程和数据的三位一体。三个方面同等重要。
如果数据质量不高,那么数学公式再漂亮,代码再高效,也于事无补。
即便有了高质量的数据,但如果我们对数学一窍不通,那么就会给出令人失望,甚至是南辕北辙的结果。
即便具有世界一流的数学基础和数据,但是面对低效的编程代码实现,我们依然无法实现大规模的收益。
数据提供了一处富含天然瑰宝的矿场,数学就是挖掘工具,而编码则提供了一队挖掘机。
数学、编程和数据的“三位一体”,构成了系统输入(即手头具有的数据)和输出(即期望的结果)之间的桥梁。
Comments