加入收藏 | 设为首页 | 会员中心 | 我要投稿 通化站长网 (https://www.0435zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长资讯 > 外闻 > 正文

用机器学习备忘单解决艰巨问题

发布时间:2021-02-25 16:00:29 所属栏目:外闻 来源:互联网
导读:要考虑的因素 有几个因素会影响你的选择。有一些问题较为特殊,需要专门的方法解决。例如,推荐系统可用于解决此类问题。虽然某些类型的问题是开放的,但它们需要反复试验、排除错误。监督学习、分类和回归是解决开放类问题的方案。 你想对数据执行什么操作

要考虑的因素

有几个因素会影响你的选择。有一些问题较为特殊,需要专门的方法解决。例如,推荐系统可用于解决此类问题。虽然某些类型的问题是开放的,但它们需要反复试验、排除错误。监督学习、分类和回归是解决开放类问题的方案。

  • 你想对数据执行什么操作—分类、回归还是聚类?
  • 大小:在选择算法时,数据集的大小(无论大小)很重要。
  • 质量:你的数据集中有多少变化,数据集是否平衡。
  • 数据性质:我们是否标记了数据?模型的输入和输出如何表示?
  • 时间可用性:你需要花费多少时间来构建和训练模型。某些模型可以更快地构建,但准确性会逊色一些。
  • 速度或准确性:对于可用于生产的模型,你可能对准确性有较高的要求,但有时计算速度更快的快速工作模型就可以满足你的需求。

若想使用备忘单,你只需查看图表上的选择标签,然后移向回答问题的箭头。例如:

  • 如果你想减少维度数量并且不需要主题建模,请使用PCA。
  • 如果要预测某个变量的数值,且需要较高的准确性,则应尝试使用“随机森林”、“神经网络”或“梯度提升”树。
  • 如果你没有标记数据并想执行聚类,则可以使用k-近邻聚类算法。

选择正确的算法

值得一提的是,即使是经验丰富的数据科学家也无法在不尝试其他算法的情况下分辨出哪种算法效果最好。条条大路通罗马,该备忘单可能不是解决问题的唯一方法。该备忘单仅希望为你提供基于已知因素可以使用哪些算


(编辑:通化站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读