微软Excel还可以入门机器学习? 可别低估了这个上分利器

TechBeat社区 · 2021-01-21
Excel被低估了???

编者按:本文来自微信公众号“将门创投”(ID:thejiangmen),作者:VentureBeat;,编译: Shelly,36氪经授权发布。

不会编程?从微软的Excel开始机器学习之旅吧!对许多人来说,Microsoft Excel是一个电子表格应用程序,它以表格存储数据,执行非常基本的数学运算。但实际上,Excel不仅仅是计算工具,还能解决更强大更复杂的问题,用户可以直接在工作簿中创建机器学习模型。

近年来,快速发展的机器学习已经涵盖了生活中的众多领域。许多企业将机器学习算法整合到运营和生产中,从而蓬勃发展;也有一些公司因为低估了人工智能的作用,没有及时把握住发展机遇,而落后于对手。

当然,掌握机器学习并不是一个简单的过程,仅线性代数和微积分就可以过滤掉一大批人!再加上学习编程语言(如Python),熟练使用数据科学和机器学习库(如Numpy、Scikit-learn、TensorFlow和PyTorch),如果你还想做能集成的大规模机器学习系统,就还得学习云平台(如亚马逊aws、微软Azure和谷歌云)……

不少初学者一定已经在心里打退堂鼓了吧。

要想很好地理解数据科学和机器学习,确实需要一些算法方面的实际经验。幸运的是,在这方面,一个非常有价值的工具是Microsoft Excel,正因为它很常见,人们往往低估了它的大用处。

对大多数人来说,Excel只是一个电子表格,它以表格存储数据,并执行基本的数学运算。但实际上,Excel的功能远不止这些,你甚至可以直接在工作簿中创建机器学习模型!

在机器学习上,虽然Excel不会取代Python,但它是一个学习AI基础知识和解决许多基本问题的好窗口,在掌握了它的使用技巧后,你甚至不需要编写一行代码就可以实现自己的目的。

使用Excel进行线性回归机器学习

线性回归是一种简单的机器学习算法,在分析数据和预测结果方面有许多用途。当数据以表格形式整齐排列时,线性回归就特别能打了。用户可以直接用Excel电子表格创建回归模型。

其中最直观的是数据图表工具,它有强大的数据可视化功能,比如说,将散点图中的数据显示到直角坐标系中。除了显示数据分布之外,Excel图表还可以创建机器学习模型来预测数据值的变化,这就是趋势线(Trendline)功能。用户可以将趋势线设置为线性、多项式、对数和指数等回归算法,不仅可以配置图表来显示机器学习模型的参数,而且能使用该模型来预测新的观测结果。

添加多条趋势线还能快速测试和比较不同机器学习模型的性能。

虽然这并非数据科学工作最有效的方式,但它绝对称得上是入门机器学习算法的一个非常好的途径。

Excel表格与其他机器学习算法

除了回归模型,用户还可以使用Excel学习其他机器学习算法,比如,监督与非监督机器学习算法,包括k均值聚类、最邻近方法、朴素贝叶斯分类和决策树。

这个过程有时可能会有点复杂,但如果坚持学习,逻辑就自然地连贯起来。譬如,在k均值聚类学习中,用户将会在多个工作表中大量使用Excel公式(INDEX、IF、AVERAGEIF、ADDRESS等)来计算聚类中心。这种数据分类的方法虽然不是很有效,但因为它们在每个表单中都得到了改进,所以便于跟踪和研究。

再比如说,在决策树/决策图表学习中,用户会学习计算熵和机器学习模型的分支选择特征。整个学习过程是手动的,所以会很缓慢,但这将成为日后学习机器学习算法的有益经验。

在Excel中,用户还可以使用求解工具(Solver)来最小化丢失函数。但这也暴露了Excel的局限性:即使是一个只带十几个参数的简单模型也会大大降低计算机的速度,尤其是当数据样本有几百行时,计算机运行速度的下降就更明显了。而微调模型参数的求解器正是非常庞大的工具,不得不说,这会有些麻烦。

Excel的求解工具微调模型参数,并使损失函数最小化

使用Excel进行深度学习和自然语言处理

Excel还可以表达更高级的机器学习算法。拿深度学习来说,首先,需要创建一个只有不到12个参数的单层人工神经网络;然后扩展概念,来创建一个隐藏层的深度学习模型。尽管计算缓慢而低效,但它是可以运行的,组件就是单元格值、公式和强大的求解器。

微软Excel的深度学习帮助用户更好地理解深度神经网络的运作过程。

在自然语言处理这部分,使用Excel还可以创建情感分析机器学习模型。如果要处理某家酒店的住客点评数据,用户可以使用公式来创建一个“单词包”模型,预处理和标记酒店评论,并根据评论的正面影响和负面影响对它们分类。在这个过程中,用户会学到很多关于现代人工智能如何处理语言的方法,并且认识到它与人类处理书面和口头语言的方式有多么不同。

作为机器学习工具的Excel:职场人的上分利器

无论你是在公司做C级决策,做人力资源,还是管理供应链和生产设施,如果你要与数据科学家和AI研究员一起工作,学习机器学习的基本知识就至关重要。同样,如果你是一个报道AI新闻的记者或一家AI公司的公关代表,也最好对机器学习有个一知半解。

也许Excel就能帮助你获得重要的知识,虽然它不适合处理大数据集和复杂的算法,但它可以帮助可视化和分析小批量数据,从快速的Excel挖掘中获得的结果可以为正确的决策提供见解!

ref:

https://venturebeat.com/2020/12/30/you-dont-code-do-machine-learning-straight-from-microsoft-excel/

+1
7

好文章,需要你的鼓励

参与评论
登录后才能参与讨论哦...
后参与讨论
提交评论0/1000

请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

为你推送和解读最前沿、最有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚集全球最优秀的创业者,项目融资率接近97%,领跑行业