使用机器学习和大数据预测心脏病
副标题[/!--empirenews.page--]
编者按: 现在公众号有置顶功能了,大家把微信更新到最新版本,点开“大数据实验室”公众号。点“置顶公众号”键,就可以置顶了,这样。不管我们什么时候更新,您都能容易找到。 大数据和机器学习的组合是一项革命性的技术,如果以恰当的方式使用它,它可以在任何工业上产生影响。在医疗保健领域,它在很多情况下都有重要的使用,例如疾病检测、找到流行病早期爆发的迹象、使用集群来找到瘟疫流行的地区(例如寨卡(zika)易发区),或者在空气污染严重的国家找到空气质量最好的地带。在这篇文章里,我尝试用标准的机器学习算法和像 Apache Spark、parquet、Spark mllib和Spark SQL这样的大数据工具集,来探索已知的心脏疾病的预测。 源代码这篇文章的源代码可以在GitHub的这里找到。此外,你可以从这里check out出整个eclipse项目。 使用的数据集心脏疾病数据集是一个已经被机器学习研究人员深入研究过的数据集,它可以在UCI机器学习数据集仓库的这里免费获取。在这里有4个数据集,我已经使用了有14个主要特点的克利夫兰的数据集。这个数据集的的功能或属性如下:
使用的技术
金融投资数据大全——Choice金融终端年终大回馈 (编辑:广州站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |