EN

ITC

4月26日晚,千赢游戏官网手机版迎来了一场科技感十足的读书会,由王夺为大家讲解《数据挖掘导论》一书。

          

什么是数据挖掘?

在大数据时代,数据量呈几何式增长,传统的数据分析技术已经无法对数据深度价值挖掘。而近些年随着存储技术和计算机性能的增长,基于大数据的数据挖掘技术应运而生。数据挖掘是一门技术,从真实世界的数据中识别出有用的路径,进而获取新的知识,最终落实到决策制定。

          
数据挖掘最主要的技术为分类技术和关联技术。

分类技术

这是一个普遍存在的问题,有许多不同的应用。例如:根据电子邮件的标题和内容检查出垃圾邮件,根据核磁共振扫描的结果区分肿瘤是恶性的还是良性的,根据星系的形状对它们进行分析。具体分类方法包括:1)决策树:通过一些精心设计的问题,有层次的检验数据集属性,从而解决分类问题。例如:一名24岁的单身女性就可以根据决策树法来缩减自己未来配偶的筛选范围
          

2)贝叶斯分类器:以贝叶斯定理为基础,通过比较在已知属性集的情况下,不同类标号出现的概率来进行分类。“三门问题“即是非常知名的案例。

          

          

3)神经网络,它可以看成是一种仿生的结构,通过模拟人脑神经元传递信息的方式来进行复杂模型的构建。

          

其关键就是模型的层数与激活函数的选择。

          

关联技术

即在大量集中的数据里,通过关联分析,发现隐藏在数据中的有意义的联系。比如:在购物习惯中是否买尿布的人会有更高概率买啤酒呢?

          

读书会思考

设想未来某一天你吃什么做什么都有一份参考指南,这是根据你过去的人生轨迹进行分析得来的,顺从你过去的心意,这是否会是一份完美的决策建议?

          
设想未来某一天你吃什么做什么都有一份参考指南,这是根据你过去的人生轨迹进行分析得来的,顺从你过去的心意,这是否会是一份完美的决策建议?

阿法狗在战胜柯洁之后,人工智能已经从历史数据的监督学习上升到自我训练的强化学习, 如果人工智能比你还了解自己,人类是否还存在自由意志?